База ответов ИНТУИТ

Машинное обучение

<<- Назад к вопросам

Какую функцию называют функцией ценности состояния для стратегии
\pi
?

(Отметьте один правильный вариант ответа.)

Варианты ответа
Ф^{\pi}_t
;
Q^{\pi}
;
Q^{\pi}(s,a)
.
V^{\pi}
;
(Верный ответ)
E_{\pi}
;
Похожие вопросы
Какую функцию называют функцией ценности действия для стратегии
\pi
?
Предположим, что требуется оценить величину
V^{\pi}(s)
, имея набор эпизодов, полученных при применении стратегии
\pi
и прохождении через состояние s. Как тогда будет называться каждое появление состояния s в эпизоде?
Какую функцию невозможно реализовать одним нейроном с 2-мя входами
x^'
и
x^2
?
Какой получится алгоритм, если ввести функцию ядра
k(z)
невозрастающую на
[0, \infty)
и положив
w(i,u)=k(\frac{1}{h} \rho(u, x_u^{(i)}))
в формуле
a(u;X^l) = \arg \max_{y \in Y} Г_y(u;X^l)
?
Что называют
n
-мерным нормальным (гауссовским) распределением с вектором матожидания
\mu \in R^n
и ковариационной матрицей
\sum \in R^{n \times n}
?
Если объекты
x_i
либо лежат внутри разделяющей полосы, но классифицируются правильно
(0 < \xi_i < 1, 0 < m_i < 1)
, либо попадают на границу классов
(\xi_i = 1, m_i = 0)
, либо вообще относятся к чужому классу
(\xi_i > 1, m_i < 0)
, то их называют:
Функционал
Q_{int}(\mu, X^l)
, характеризующий качество метода
\mu
по обучающей выборке
X^l
называют:
Какой алгоритм представляет функцию
a:X \to Y
, которая любому объекту
x \in X
ставит в соответствие метку кластера
y \in Y
?
Если известны
P_y = P(y)
и
P_y(x) = p(x|y)
, и
\lambda_{yy} = 0
, а
\lambda_{ys} = \lambda_y
для всех
y
,
s \in Y
, то минимум среднего риска
R(a)
достигается при:
В формуле совместной плотности
p(x,y) = p(x) P(y|x) = P(y)p(x|y)
функцией апостеорной вероятности класса
y
будет функция: