База ответов ИНТУИТ

Машинное обучение

<<- Назад к вопросам

Что означает, если веса
w_j h
между входными и скрытым слоем будут обнулены?

(Отметьте один правильный вариант ответа.)

Варианты ответа
после стабилизации функционала ошибки Q вектор весов w находится в локальном минимуме.
h-ый нейрон скрытого слоя не будет учитывать j-й признак.(Верный ответ)
диагональные элементы доминируют в гессиане.
информация, накопленная в сети, является полезной и не теряется при добавлении новых нейронов.
Похожие вопросы
Что означает обнуление веса
w_{hm}
между скрытым и входным слоями?
Какой получится алгоритм, если
h
определить как наибольшее число, при котором ровно
k
ближайших соседей объекта
u
получают нулевые веса:
h(u)=\rho(u,x_u^{(k+1)})
.
Если известны
P_y = P(y)
и
P_y(x) = p(x|y)
, и
\lambda_{yy} = 0
, а
\lambda_{ys} = \lambda_y
для всех
y
,
s \in Y
, то минимум среднего риска
R(a)
достигается при:
Если выполнены условия: 1) выборка
X^m
простая, получена из плотности распределения
p(x)
; 2) ядро
K(z)
непрерывно, его квадрат ограничен:
\int_x k^z (z)dz<\infty
; 3) последовательность
h_m
такова, что
\lim_{\limits {m \to \infty}} h_m = 0
и
\lim _{\limits{m \to \infty}} mh_m = \infty
, тогда:
Если в корректирующей операции
b(x) = F(b_1(x),g_1(x),...,b_r(x), g_r(x)) = \sum_{t=1}^T gt(x) b_t(x)
функция
gt(x)
принимает только два значения
\{0,1\}
, то множество всех
x \in X
, для которых
gt(x) = 1
, называется:
Какой получится алгоритм, если ввести функцию ядра
k(z)
невозрастающую на
[0, \infty)
и положив
w(i,u)=k(\frac{1}{h} \rho(u, x_u^{(i)}))
в формуле
a(u;X^l) = \arg \max_{y \in Y} Г_y(u;X^l)
?
Что не является входными данными в алгоритме синтеза бинарного решающего дерева
ID3
?
Выберите верный вариант. Если для каждого класса
c \in Y
построено множество логических правил, специализирующихся на различении объектов данного класса
R_c=\{\varphi_c^t:X \to \{0,1\}|t=1,...,T_c\}
и если
\varphi_c^t(x)=0
, то:
Выберите верный вариант. Если для каждого класса
c \in Y
построено множество логических правил, специализирующихся на различении объектов данного класса
R_c=\{\varphi_c^t:X \to \{0,1\}|t=1,...,T_c\}
и если
\varphi_c^t(x)=1
, то:
Как будет называться предикат
\varphi(x)
, если
E_c(\varphi,X^l) \le \varepsilon
и
D_c(\varphi, X^l) \ge \delta
при заданных достаточно малом
\varepsilon
и достаточно большом
\delta
из отрезка [0,1]?