Машинное обучение

<<- Назад к вопросам

Что означает, если веса
между входными и скрытым слоем будут обнулены?

(Отметьте один правильный вариант ответа.)

Варианты ответа

после стабилизации функционала ошибки Q вектор весов w находится в локальном минимуме.

h-ый нейрон скрытого слоя не будет учитывать j-й признак.(Верный ответ)

диагональные элементы доминируют в гессиане.

информация, накопленная в сети, является полезной и не теряется при добавлении новых нейронов.

Похожие вопросы

Что означает обнуление веса

$w_{hm}$

между скрытым и входным слоями?

Перейти

Какой получится алгоритм, если

определить как наибольшее число, при котором ровно

ближайших соседей объекта

получают нулевые веса:

$h(u)=\rho(u,x_u^{(k+1)})$

.

Перейти

Если известны

P_y = P(y)

и

P_y(x) = p(x|y)

, и

$\lambda_{yy} = 0$

, а

$\lambda_{ys} = \lambda_y$

для всех

,

$s \in Y$

, то минимум среднего риска

R(a)

достигается при:

Перейти

Если выполнены условия: 1) выборка

X^m

простая, получена из плотности распределения

p(x)

; 2) ядро

K(z)

непрерывно, его квадрат ограничен:

$\int_x k^z (z)dz<\infty$

; 3) последовательность

h_m

такова, что

$\lim_{\limits {m \to \infty}} h_m = 0$

и

$\lim _{\limits{m \to \infty}} mh_m = \infty$

, тогда:

Перейти

Если в корректирующей операции

$b(x) = F(b_1(x),g_1(x),...,b_r(x), g_r(x)) = \sum_{t=1}^T gt(x) b_t(x)$

функция

gt(x)

принимает только два значения

$\{0,1\}$

, то множество всех

$x \in X$

, для которых

gt(x) = 1

, называется:

Перейти

Какой получится алгоритм, если ввести функцию ядра

k(z)

невозрастающую на

$[0, \infty)$

и положив

$w(i,u)=k(\frac{1}{h} \rho(u, x_u^{(i)}))$

в формуле

$a(u;X^l) = \arg \max_{y \in Y} Г_y(u;X^l)$

?

Перейти

Что не является входными данными в алгоритме синтеза бинарного решающего дерева

ID3

?

Перейти

Выберите верный вариант. Если для каждого класса

$c \in Y$

построено множество логических правил, специализирующихся на различении объектов данного класса

$R_c=\{\varphi_c^t:X \to \{0,1\}|t=1,...,T_c\}$

и если

$\varphi_c^t(x)=0$

, то:

Перейти

Выберите верный вариант. Если для каждого класса

$c \in Y$

построено множество логических правил, специализирующихся на различении объектов данного класса

$R_c=\{\varphi_c^t:X \to \{0,1\}|t=1,...,T_c\}$

и если

$\varphi_c^t(x)=1$

, то:

Перейти

Как будет называться предикат

$\varphi(x)$

, если

$E_c(\varphi,X^l) \le \varepsilon$

и

$D_c(\varphi, X^l) \ge \delta$

при заданных достаточно малом

$\varepsilon$

и достаточно большом

$\delta$

из отрезка [0,1]?

Перейти