Машинное обучение

<<- Назад к вопросам

Какой получится алгоритм, если
определить как наибольшее число, при котором ровно
ближайших соседей объекта
получают нулевые веса:
$h(u)=\rho(u,x_u^{(k+1)})$
.

(Отметьте один правильный вариант ответа.)

Варианты ответа

$a(u;X^l,k) = \arg\max_{y \in Y}\sum_{i=1}^k[y_u^{(i)} = y]k(\frac{\rho(u,x_u^{(i)})}{\rho(u,x_u^{(k+1)})})$

(Верный ответ)

$a(u;X^l,k) = \arg \max_{y \in Y} \sum_{i=1}^k[y_u^{(i)} = y]$

$a(u;X^l,k) = \arg \max_{y \in Y} \sum_{i=1}^l [y_u^{(i)} = y]w_i$

$a(u;X^l,h) = \arg \max_{y \in Y} \sum_{i=1}^l [y_u^{(i)} = y]k(\frac{\rho(u,x_u^{(i)})}{h})$

Похожие вопросы

Какой получится алгоритм, если ввести функцию ядра

k(z)

невозрастающую на

$[0, \infty)$

и положив

$w(i,u)=k(\frac{1}{h} \rho(u, x_u^{(i)}))$

в формуле

$a(u;X^l) = \arg \max_{y \in Y} Г_y(u;X^l)$

?

Перейти

Если известны

P_y = P(y)

и

P_y(x) = p(x|y)

, и

$\lambda_{yy} = 0$

, а

$\lambda_{ys} = \lambda_y$

для всех

,

$s \in Y$

, то минимум среднего риска

R(a)

достигается при:

Перейти

Если выполнены условия: 1) выборка

X^m

простая, получена из плотности распределения

p(x)

; 2) ядро

K(z)

непрерывно, его квадрат ограничен:

$\int_x k^z (z)dz<\infty$

; 3) последовательность

h_m

такова, что

$\lim_{\limits {m \to \infty}} h_m = 0$

и

$\lim _{\limits{m \to \infty}} mh_m = \infty$

, тогда:

Перейти

Если в корректирующей операции

$b(x) = F(b_1(x),g_1(x),...,b_r(x), g_r(x)) = \sum_{t=1}^T gt(x) b_t(x)$

функция

gt(x)

принимает только два значения

$\{0,1\}$

, то множество всех

$x \in X$

, для которых

gt(x) = 1

, называется:

Перейти

Какой алгоритм представляет функцию

$a:X \to Y$

, которая любому объекту

$x \in X$

ставит в соответствие метку кластера

$y \in Y$

?

Перейти

Плотность распределения на

имеет вид смеси

распределений

$p(x) = \sum_{j=1}^k w_j p_j(x), \sum_{j=1}^k w_j = 1, w_j \ge 0$

, где

w_j(x)

- это:

Перейти

Плотность распределения на

имеет вид смеси

распределений

$p(x) = \sum_{j=1}^k w_j p_j(x), \sum_{j=1}^k w_j = 1, w_j \ge 0$

, где

p_j(x)

- это:

Перейти

Определите название данной задачи: имеется метод обучения

$\mu_G$

использующий только признаки из заданного набора признаков

$G \subseteq F=\{f_1,...,f_n\}$

. Требуется найти набор признаков, при котором алгоритм

$a=\mu_G(X^l)$

имеет наилучшую обобщающую способность.

Перейти

Как будет называться предикат

$\varphi(x)$

, если

$E_c(\varphi,X^l) \le \varepsilon$

и

$D_c(\varphi, X^l) \ge \delta$

при заданных достаточно малом

$\varepsilon$

и достаточно большом

$\delta$

из отрезка [0,1]?

Перейти

Как называется величина

M_i(w) = y_if(x_i,w)

объекта

x_i

относительно алгоритма классификации

a(x, w) = sign f(x, w)

?

Перейти