Машинное обучение

<<- Назад к вопросам

Верно ли, что метод
$SARSA(\lambda)$
не принимает в расчет все будущие ситуации вплоть до конца эпизода при выполнении дублирования?

(Отметьте один правильный вариант ответа.)

Варианты ответа

Да

Нет(Верный ответ)

Похожие вопросы

Какая идея, из ниже перечисленных, описывает идею алгоритма

$SARSA(\lambda)$

?

Перейти

Если в корректирующей операции

$b(x) = F(b_1(x),g_1(x),...,b_r(x), g_r(x)) = \sum_{t=1}^T gt(x) b_t(x)$

функция

gt(x)

принимает только два значения

$\{0,1\}$

, то множество всех

$x \in X$

, для которых

gt(x) = 1

, называется:

Перейти

Какая идея, из ниже перечисленных, описывает метод

$Q(\lambda)$

Уоткинса?

Перейти

Если известны

P_y = P(y)

и

P_y(x) = p(x|y)

, и

$\lambda_{yy} = 0$

, а

$\lambda_{ys} = \lambda_y$

для всех

,

$s \in Y$

, то минимум среднего риска

R(a)

достигается при:

Перейти

Если выполнены условия: 1) выборка

X^m

простая, получена из плотности распределения

p(x)

; 2) ядро

K(z)

непрерывно, его квадрат ограничен:

$\int_x k^z (z)dz<\infty$

; 3) последовательность

h_m

такова, что

$\lim_{\limits {m \to \infty}} h_m = 0$

и

$\lim _{\limits{m \to \infty}} mh_m = \infty$

, тогда:

Перейти

Определите название данной задачи: имеется метод обучения

$\mu_G$

использующий только признаки из заданного набора признаков

$G \subseteq F=\{f_1,...,f_n\}$

. Требуется найти набор признаков, при котором алгоритм

$a=\mu_G(X^l)$

имеет наилучшую обобщающую способность.

Перейти

Верно ли, что любая непрерывная функция n аргументов на единичном кубе

[0,1]^n

представлена в виде суперпозиции непрерывных функций одного аргумента и операции сложения:

$f(x^1,x^2,...,x^n)=\sum_{k=1}^{2n+1}h_k(\sum_{i=1}^n \varphi_i k(x^i))$

?

Перейти

Верно ли, что при частичном обучении можно получить метки

$\{ y_{l+1},...,y_{l+k} \}$

зная все

$\{ y_{l+1},...,y_{l+k} \}$

?

Перейти

Какой получится алгоритм, если ввести функцию ядра

k(z)

невозрастающую на

$[0, \infty)$

и положив

$w(i,u)=k(\frac{1}{h} \rho(u, x_u^{(i)}))$

в формуле

$a(u;X^l) = \arg \max_{y \in Y} Г_y(u;X^l)$

?

Перейти

Какой получится алгоритм, если

определить как наибольшее число, при котором ровно

ближайших соседей объекта

получают нулевые веса:

$h(u)=\rho(u,x_u^{(k+1)})$

.

Перейти