База ответов ИНТУИТ

Машинное обучение

<<- Назад к вопросам

Верно ли, что метод
SARSA(\lambda)
не принимает в расчет все будущие ситуации вплоть до конца эпизода при выполнении дублирования?

(Отметьте один правильный вариант ответа.)

Варианты ответа
Да
Нет(Верный ответ)
Похожие вопросы
Какая идея, из ниже перечисленных, описывает идею алгоритма
SARSA(\lambda)
?
Если в корректирующей операции
b(x) = F(b_1(x),g_1(x),...,b_r(x), g_r(x)) = \sum_{t=1}^T gt(x) b_t(x)
функция
gt(x)
принимает только два значения
\{0,1\}
, то множество всех
x \in X
, для которых
gt(x) = 1
, называется:
Какая идея, из ниже перечисленных, описывает метод
Q(\lambda)
Уоткинса?
Если известны
P_y = P(y)
и
P_y(x) = p(x|y)
, и
\lambda_{yy} = 0
, а
\lambda_{ys} = \lambda_y
для всех
y
,
s \in Y
, то минимум среднего риска
R(a)
достигается при:
Если выполнены условия: 1) выборка
X^m
простая, получена из плотности распределения
p(x)
; 2) ядро
K(z)
непрерывно, его квадрат ограничен:
\int_x k^z (z)dz<\infty
; 3) последовательность
h_m
такова, что
\lim_{\limits {m \to \infty}} h_m = 0
и
\lim _{\limits{m \to \infty}} mh_m = \infty
, тогда:
Определите название данной задачи: имеется метод обучения
\mu_G
использующий только признаки из заданного набора признаков
G \subseteq F=\{f_1,...,f_n\}
. Требуется найти набор признаков, при котором алгоритм
a=\mu_G(X^l)
имеет наилучшую обобщающую способность.
Верно ли, что любая непрерывная функция n аргументов на единичном кубе
[0,1]^n
представлена в виде суперпозиции непрерывных функций одного аргумента и операции сложения:
f(x^1,x^2,...,x^n)=\sum_{k=1}^{2n+1}h_k(\sum_{i=1}^n \varphi_i k(x^i))
?
Верно ли, что при частичном обучении можно получить метки
\{ y_{l+1},...,y_{l+k} \}
зная все
\{ y_{l+1},...,y_{l+k} \}
?
Какой получится алгоритм, если ввести функцию ядра
k(z)
невозрастающую на
[0, \infty)
и положив
w(i,u)=k(\frac{1}{h} \rho(u, x_u^{(i)}))
в формуле
a(u;X^l) = \arg \max_{y \in Y} Г_y(u;X^l)
?
Какой получится алгоритм, если
h
определить как наибольшее число, при котором ровно
k
ближайших соседей объекта
u
получают нулевые веса:
h(u)=\rho(u,x_u^{(k+1)})
.