Ответы на ИНТУИТ

ИНТУИТ ответы на тесты

Решение тестов / курсов
База ответов ИНТУИТ.RU
Заказать решение курсов или тестов:
https://vk.com/id358194635
https://vk.com/public118569203

Машинное обучение

Заказать решение
Количество вопросов 525

Действительно ли то, что ёмкость однопараметрического семейства может быть бесконечной?

перейти к ответу ->>

Какие данные не используют в картах Кохонена в качестве входных?

перейти к ответу ->>

Выберите правильный ответ. Задача ранжирования - это:

перейти к ответу ->>

Верно ли утверждение. Наивный байесовский классификатор может быть как параметрическим, так и непараметрическим.

перейти к ответу ->>

Как будет называться закономерность
\varphi
, если
n_c(\varphi)>0
?

перейти к ответу ->>

Какой алгоритм позволяет найти пару вершин
(x_i, x_j) \in X^{l+k}
с наименьшим
\rho(x_i, y_i)
и соединить их ребром?

перейти к ответу ->>

Как называется операция, отбирающая
N
наиболее адаптивных индивидов популяции
П
в алгоритме CCEL?

перейти к ответу ->>

Какой пример, из ниже перечисленных, является примером смеси алгоритмов?

перейти к ответу ->>

Выберите неверные утверждения:

перейти к ответу ->>

Семейство линейных решающих правил будет выглядеть как:

перейти к ответу ->>

Что, из ниже перечисленного, называется областью компетенции базового алгоритма
b_t(x)
?

перейти к ответу ->>

Как называется величина
M_i(w) = y_if(x_i,w)
объекта
x_i
относительно алгоритма классификации
a(x, w) = sign f(x, w)
?

перейти к ответу ->>

Этап обучения - это:

перейти к ответу ->>

Отступ показывает:

перейти к ответу ->>

Какой алгоритм удаляет, те связи, к изменению которых функционал Q наименее чувствителен?

перейти к ответу ->>

Чему соответствует прямоугольное ядро
k(z)=\frac{1}{2}[|z|<1]

перейти к ответу ->>

Чему способствует увеличение параметра
\lambda
?

перейти к ответу ->>

Вероятность правильной классификации имеет вид:

перейти к ответу ->>

Что называют эффективной размерностью задачи?

перейти к ответу ->>

Как формула подходит для абсолютного значения ошибки для задач регрессии?

перейти к ответу ->>

Что называют
n
-мерным нормальным (гауссовским) распределением с вектором матожидания
\mu \in R^n
и ковариационной матрицей
\sum \in R^{n \times n}
?

перейти к ответу ->>

Что означает запись
n_w = \sum_{d \in D} nd_w
?

перейти к ответу ->>

Как называется основная процедура в алгоритме КОРА?

перейти к ответу ->>

Правильнее и надежнее классификация объекта
x_i
будет, если:

перейти к ответу ->>

За что штрафует функция потерь
\alpha(M) = (1 - |M|)_+
?

перейти к ответу ->>

Что означает
C_m
в правиле справедливой конкуренции CWTA?

перейти к ответу ->>

Что должно поступать на вход в алгоритме поочередного добавления и удаления?

перейти к ответу ->>

По какой из формул вычисляются веса в областях локальных сгущений оптимальна меньшая ширина окна?

перейти к ответу ->>

Что называют многослойной сетью?

перейти к ответу ->>

Определите название данной задачи: имеется метод обучения
\mu_G
использующий только признаки из заданного набора признаков
G \subseteq F=\{f_1,...,f_n\}
. Требуется найти набор признаков, при котором алгоритм
a=\mu_G(X^l)
имеет наилучшую обобщающую способность.

перейти к ответу ->>

Объекты состоят из признаков?

перейти к ответу ->>

Что является квадратичной ошибкой для задачи регрессии?

перейти к ответу ->>

Если происходит средняя потеря на всех объектах, то это есть:

перейти к ответу ->>

Верно ли следующее утверждение? Многие виды задач медицинской диагностики решаются задачами классификации.

перейти к ответу ->>

Какие задачи, из ниже перечисленных, являются задачами прогнозирования?

перейти к ответу ->>

Какие, из ниже перечисленных задач, являются задачами классификации?

перейти к ответу ->>

Какой тип экспериментального исследования имеет цель - понимание, на что влияют параметры метода обучения?

перейти к ответу ->>

Метод обучения - это:

перейти к ответу ->>

Функционал среднего риска - это:

перейти к ответу ->>

Если известны
P_y = P(y)
и
P_y(x) = p(x|y)
, то минимум среднего риска
R(a)
достигается при:

перейти к ответу ->>

Формула восстановления смеси распределений может выглядеть как:

перейти к ответу ->>

На какой из теории основан байесовский подход?

перейти к ответу ->>

Общий вид равновероятных классов будет выглядеть:

перейти к ответу ->>

Выберите правильный ответ. Эмперическая оценка среднего риска вычисляется по:

перейти к ответу ->>

В формуле совместной плотности
p(x,y) = p(x) P(y|x) = P(y)p(x|y)
функцией априорной вероятности класса
y
будет функция:

перейти к ответу ->>

На локальной аппроксимации плотности
p(x)
в окрестности классифицируемого объекта
x \in X
основано:

перейти к ответу ->>

Что, из ниже перечисленного, относится к недостаткам квадратичного дискриминанта?

перейти к ответу ->>

Верно ли, что если классы имеют нормальные функции правдоподобия, то байесовское решающее правило имеет квадратичную разделяющую поверхность.

перейти к ответу ->>

Если при переобучении: на
X^l
всё хорошо, на
X^k
всё плохо, то это проявление:

перейти к ответу ->>

Что применяют для проверки на равенство нулю элементов
\sigma_{ij}
ковариационной матрицы
\hat \Sigma
.

перейти к ответу ->>

В какой из выборок
x_i
является гистограммой значений для оценки плотности:

перейти к ответу ->>

Если выполнены условия: 1) выборка
X^m
простая, получена из плотности распределения
p(x)
; 2) ядро
K(z)
непрерывно, его квадрат ограничен:
\int_x k^z (z)dz<\infty
; 3) последовательность
h_m
такова, что
\lim_{\limits {m \to \infty}} h_m = 0
и
\lim _{\limits{m \to \infty}} mh_m = \infty
, тогда:

перейти к ответу ->>

Верно ли утверждение. Функции правдоподобия принадлежат параметрическому семейству распределений
\varphi(x;\Theta)
и отличаются только значениями параметра
p_j(x) = \varphi(x;\Theta)
.

перейти к ответу ->>

Выберите верные утверждения:

перейти к ответу ->>

Константы смеси имеют
n
-мерные нормальные распределения
\varphi(x;\Theta_j) = N(x;\mu_j,\Sigma_j)
с параметрами
\Theta_j = (\mu_j,\Sigma_j)
, где
\Sigma_j \in R^{n \times n}
- это:

перейти к ответу ->>

Весовой функцией является функция:

перейти к ответу ->>

Какой алгоритм относит классифицируемый объект
u \in X^l
к тому классу, которому принадлежит обучающий объект?

перейти к ответу ->>

К какому алгоритму можно отнести формулу:
w(i,u)=[i=1]; a(u;X^l)=y_u^{(1)}
?

перейти к ответу ->>

Какой получится алгоритм, если ввести функцию ядра
k(z)
невозрастающую на
[0, \infty)
и положив
w(i,u)=k(\frac{1}{h} \rho(u, x_u^{(i)}))
в формуле
a(u;X^l) = \arg \max_{y \in Y} Г_y(u;X^l)
?

перейти к ответу ->>

Какие, ниже перечисленные, недостатки можно отнести к метрическим алгоритмам
kNN
?

перейти к ответу ->>

Отступом (margin) объекта
x_i \in X^l
относительно алгоритма классификации, имеющего вид
a(u) = \arg \max_{y \in Y} Г_y(u)
называется величина:

перейти к ответу ->>

Большой положительный отступ, плотно окруженный объектами своего класса имеют:

перейти к ответу ->>

Как называется функция
f(x,w)
?

перейти к ответу ->>

Пусть есть задача с 2-мя классами
Y = {-1, +1}
. К какому классу будет относится алгоритм, если
f(x,w) > 0
?

перейти к ответу ->>

Правильнее и надежнее классификация объекта
x_i
будет, если:

перейти к ответу ->>

Какая, из перечисленных ниже функций, соответствует методу опорных векторов?

перейти к ответу ->>

Для чего вводится параметрическое семейство априорных распределений
p(w; \gamma)
?

перейти к ответу ->>

Что, из ниже перечисленного, относится к недостаткам метода SG?

перейти к ответу ->>

Какой вид будет иметь правило обновления весов на каждой итерации метода стохастического градиента?

перейти к ответу ->>

Какая функция, из ниже перечисленных, является функцией активации?

перейти к ответу ->>

Как называется функция
f(x,w)
?

перейти к ответу ->>

Пусть есть задача с 2-мя классами
Y = {-1, +1}
. К какому классу будет относится алгоритм, если
f(x,w) = 0
?

перейти к ответу ->>

Будет ли алгоритм допускать ошибку на объекте
x_i
, если
M_i(w) < 0
?

перейти к ответу ->>

Какая, из перечисленных ниже функций, соответствует линейному дискриминанту Фишера?

перейти к ответу ->>

Для чего вводится параметрическое семейство априорных распределений
p(w; \gamma)
?

перейти к ответу ->>

Что, из ниже перечисленного, относится к недостаткам метода SG?

перейти к ответу ->>

Какой вид будет иметь правило обновления весов на каждой итерации метода стохастического градиента?

перейти к ответу ->>

Какая функция, из ниже перечисленных, является функцией активации?

перейти к ответу ->>

Действительно ли что, ширина полосы минимальна, когда норма вектора w минимальна?

перейти к ответу ->>

Что следует из формулы
w = \sum_{i=1}^l \lambda_i y_i x_i
?

перейти к ответу ->>

Какие объекты называются опорными?

перейти к ответу ->>

Если объекты
x_i
либо лежат внутри разделяющей полосы, но классифицируются правильно
(0 < \xi_i < 1, 0 < m_i < 1)
, либо попадают на границу классов
(\xi_i = 1, m_i = 0)
, либо вообще относятся к чужому классу
(\xi_i > 1, m_i < 0)
, то их называют:

перейти к ответу ->>

Действительно ли, что построение адекватного ядра является искусством и, как правило, опирается на априорные знания о предметной области?

перейти к ответу ->>

Что, из ниже перечисленного, не является входными данными в последовательном методе активных ограничений?

перейти к ответу ->>

Выберите верное утверждение.

перейти к ответу ->>

Какая функция не считает за ошибки отклонения
a(x_i)
от
y_i
, меньшие
\varepsilon
?

перейти к ответу ->>

Какая функция позволяет говорить о "близости" объектов, на множестве
X
?

перейти к ответу ->>

На что влияет выбор ядра K?

перейти к ответу ->>

При каком размере окна h функция чрезмерно сглаживается?

перейти к ответу ->>

Формула скользящего контроля с исключением объектов по одному выглядит:

перейти к ответу ->>

Как называются методы восстановления регрессии, устойчивые к шуму в исходных данных?

перейти к ответу ->>

Что будет являтся решением нормальной системы?

перейти к ответу ->>

Что надо добавить для решения проблемы мультиколлинеарности?

перейти к ответу ->>

Как выглядит гессиан функционала Q в точке
\alpha^t
?

перейти к ответу ->>

В какой из формул указан итерационный процесс уточнения вектора коэффициентов
w^{t+1}
?

перейти к ответу ->>

Что представляет собой матрица
\tilde F = ГF
?

перейти к ответу ->>

Что получают на выходе в алгоритме IRLS?

перейти к ответу ->>

Набор функций
F \subseteq C(x)
будет называться замкнутым относительно функции
\varphi : R \to R
, если:

перейти к ответу ->>

Как называется метод, который позволял вычислять градиент, при котором каждый градиентный шаг выполняется за число операций, лишь немногим больше, чем при обычном вычислении сети на одном объекте?

перейти к ответу ->>

Верно ли что, если обучающая выборка имеет большой объем, то можно использовать метод Хебба?

перейти к ответу ->>

Процесс упрощения сети, в алгоритме OBD, останавливается, когда:

перейти к ответу ->>

Что, из ниже перечисленного, не относится к целям кластеризации?

перейти к ответу ->>

Какую функцию невозможно реализовать одним нейроном с 2-мя входами
x^'
и
x^2
?

перейти к ответу ->>

Какие слои в нейронной сети называются скрытыми?

перейти к ответу ->>

Что такое
\eta
в формуле:
w_m:=w_m + \eta(x_i - w_m)[a(x_i) = m]
?

перейти к ответу ->>

Что называют нейронами Кохонена?

перейти к ответу ->>

Какое правило означает следующая формула
a(x)=arg \min_{m \in Y} \rho(x,w_m)
?

перейти к ответу ->>

Самоорганизующиеся карты Кохонена применяются для:

перейти к ответу ->>

Как выглядет формула стресса в задаче многомерного шкалирования?

перейти к ответу ->>

Верно ли, что при n=3 многомерное шкалирование позволяет отобразить выборку в виде множества точек на плоскости?

перейти к ответу ->>

От чего зависит функционал стресса
S(X^l)
?

перейти к ответу ->>

Верно ли, что при частичном обучении можно получить метки
\{ y_{l+1},...,y_{l+k} \}
зная все
\{ y_{l+1},...,y_{l+k} \}
?

перейти к ответу ->>

Какой алгоритм является self-traning для композиции простого голосования базовых алгоритмов
a_1,...,a_T
?

перейти к ответу ->>

Какая из формул позволит решить задачу с помощью алгоритма co-learning?

перейти к ответу ->>

Какой алгоритм имеет процедуру удаления k-1 самых длинных ребер?

перейти к ответу ->>

К какому алгоритму относится недостаток неустойчивого решения, если нет области разреженности?

перейти к ответу ->>

Верно ли, что оценить вероятность
P(y|b_j(x) = 1)
можно, только с помощью эмпирической оценкой по различным данным?

перейти к ответу ->>

Оценка расстояний между двумя распределениями с помощью дивергенции Кульбака-Лейблера будет выглядеть:

перейти к ответу ->>

Как называется функция
b:X \to R
в алгоритмах имеющих вид суперпозиции
a(x) = C(b(x))
?

перейти к ответу ->>

Как называется алгоритм
a:X \to Y
вида
a(x) = C(F(b_1(x), ..., b_r(x))), x \in X
?

перейти к ответу ->>

Что из ниже перечисленного относится к корректирующим операциям?

перейти к ответу ->>

Какой пример, из ниже перечисленных, является примером простого голосования?

перейти к ответу ->>

Если в корректирующей операции
b(x) = F(b_1(x),...,b_r(x)) = \sum_{t=1}^T \alpha_t b_t(x)
, параметры
\alpha_t
неотрицательны и нормированы,
\sum_{t=1} \alpha_t = 1
, то композиция называется:

перейти к ответу ->>

Чему эквивалентна минимизация функционала
Q(a) = Q(F(b_1,...,b_t))
по базовому алгоритму
b_t
?

перейти к ответу ->>

Что не способствует уменьшению параметра
\lambda
?

перейти к ответу ->>

Что из ниже перечисленного относится к недостаткам алгоритма AdaBoost?

перейти к ответу ->>

Какой алгоритм предпочтительней, когда признаков больше, чем объектов?

перейти к ответу ->>

Какие параметры участвуют в алгоритмической композиции CCEL?

перейти к ответу ->>

В каком методе из исходной обучающей выборки длины l формируются различные обучающие подвыборки той же длины l с помощью случайного выбора с возвращениями?

перейти к ответу ->>

Сколько популяций строится на t-м поколении алгоритма CCEL?

перейти к ответу ->>

Что такое селекция
(П, N)
в методе CCEL?

перейти к ответу ->>

Действительно ли, что беггинг работает лучше на больших обучающих выборках?

перейти к ответу ->>

Какие параметры используются в алгоритме последовательного построения смеси?

перейти к ответу ->>

Как определяется индикатор ошибки в задачах обучения по прецедентам?

перейти к ответу ->>

Что называют частотой ошибок алгоритма a на произвольной подвыборке
U \subseteq X^l
?

перейти к ответу ->>

Как определить функционал в качестве вероятности частоты ошибок на контроле превышающее заданное число
\epsilon \in [0,1]
?

перейти к ответу ->>

Как будет выглядеть формула вероятности ошибки в интерпретации обобщающей способности метода
\mu
?

перейти к ответу ->>

Алгоритмы
a
и
a'
неразличимы на выборке
X^l
, если:

перейти к ответу ->>

Верно ли, что функция роста не зависит ни от выборки, ни от метода обучения?

перейти к ответу ->>

Верно ли утверждение, что ёмкость семейства линейных решающих правил А равна размерности пространства n?

перейти к ответу ->>

Что называют выбором структуры модели?

перейти к ответу ->>

Что называют моделью алгоритмов?

перейти к ответу ->>

Определите название данной задачи: имеется конечное множество альтернативных моделей
A_1,...,A_T
, каждая со своим методом обучения,
M=\{\mu_1,...,\mu_T\}
. Требуется найти модель, наиболее адекватную для данной выборки.

перейти к ответу ->>

Функционал
Q_{int}(\mu, X^l)
, характеризующий качество метода
\mu
по обучающей выборке
X^l
называют:

перейти к ответу ->>

Как называется функционал
CV(\mu, X^l)=\frac{1}{N}\sum_{n=1}^{N}Q(\mu(X_n^l), X_n^k)
?

перейти к ответу ->>

Как называется критерий
BIC(\mu,X^l)=\frac{l}{\hat \delta^2}(Q(\mu(X^l), X^l)+\frac{\hat\delta^2 ln l}{l} n)
?

перейти к ответу ->>

Выберите правильную характеристику для внешнего критерия.

перейти к ответу ->>

Что должно поступать на вход в алгоритме полного перебора?

перейти к ответу ->>

Как называется алгоритм, который осуществляет полный перебор всевозможных наборов признаков G в порядке возрастания сложности?

перейти к ответу ->>

Как будет называться предикат
\varphi(x)
, если
E_c(\varphi,X^l) \le \varepsilon
и
D_c(\varphi, X^l) \ge \delta
при заданных достаточно малом
\varepsilon
и достаточно большом
\delta
из отрезка [0,1]?

перейти к ответу ->>

Что, из ниже перечисленного характеризует энтропийное определение информативности?

перейти к ответу ->>

Что, из ниже перечисленного характеризует взвешенную информативность?

перейти к ответу ->>

Какая формула характерна, если
f
представляет количественный признак?

перейти к ответу ->>

Что называют рангом в форме конъюнкций?

перейти к ответу ->>

Какие данные подаются на вход "градиентного" алгоритма синтеза конъюнкции?

перейти к ответу ->>

Какой алгоритм использует только операцию добавления термов?

перейти к ответу ->>

По какой из формул параметрическое семейство Ф можно отнести к параметрическому семейству шаров?

перейти к ответу ->>

Какой входной набор данных характерен для жадного алгоритма построения решающего списка?

перейти к ответу ->>

К чему приводит уменьшение параметра
E_{max}
при оптимизации сложности решающего списка?

перейти к ответу ->>

Что такое бинарное решающее дерево?

перейти к ответу ->>

Что является выходными данными в алгоритме синтеза бинарного решающего дерева
ID3
?

перейти к ответу ->>

Что, из ниже перечисленного характерно для предредукции?

перейти к ответу ->>

Какой алгоритм строит набор конъюнктивных закономерностей?

перейти к ответу ->>

Что, из ниже перечисленного является достоинством алгоритма КОРА?

перейти к ответу ->>

При каком условии множество
w \subseteq \{1,...,n\}
будет называться тестом?

перейти к ответу ->>

Выберите верный вариант. Если для каждого класса
c \in Y
построено множество логических правил, специализирующихся на различении объектов данного класса
R_c=\{\varphi_c^t:X \to \{0,1\}|t=1,...,T_c\}
и если
\varphi_c^t(x)=0
, то:

перейти к ответу ->>

Выберите правило, при голосовании которым берётся взвешенная сумма голосов?

перейти к ответу ->>

Что делает конъюнкция
\varphi
в алгоритме КОРА, если она выделяет слишком мало объектов своего класса?

перейти к ответу ->>

Что из ниже перечисленного не относится к задачам коллаборативной фильтрации?

перейти к ответу ->>

В какой модели по данным
D
оцениваются векторы: профили клиентов и профили объектов?

перейти к ответу ->>

Что является основой латентного семантического анализа?

перейти к ответу ->>

Какие данные в качестве входных применяются в алгоритме двухступенчатой симметризации?

перейти к ответу ->>

Что из ниже перечисленного не относится к моделям основанным на хранении исходных данных?

перейти к ответу ->>

Что является недостатком модели от клиента?

перейти к ответу ->>

Что из ниже перечисленного не является типом латентной модели?

перейти к ответу ->>

Что из ниже перечисленного является функционалом качества кластеризации?

перейти к ответу ->>

Что из ниже перечисленного не относится к вероятностной модели коллекции документов?

перейти к ответу ->>

Что означает запись
n = \sum_{d \in D} \sum_{w \in d} nd_w
?

перейти к ответу ->>

Какая запись соответствует числу троек, связанных с темой t?

перейти к ответу ->>

Какое обозначение соответствует задаче приближенного представления заданной матрицы частот?

перейти к ответу ->>

Как будет называться модель, в которой учитывается 11 слов?

перейти к ответу ->>

Приведение каждого слова в документе к его нормальной форме называется:

перейти к ответу ->>

Что является элементами кластеров?

перейти к ответу ->>

Какая компонента, из ниже перечисленных, является шумовой компонентой?

перейти к ответу ->>

Как называют априорную вероятность вида:
q_r = \frac{1}{1+\gamma+\varepsilon}
?

перейти к ответу ->>

Что из ниже перечисленного не определяет метаинформацию?

перейти к ответу ->>

Что характеризует гипотеза условной независимости вида:
p(w|t,c,d) = p(w|t)
?

перейти к ответу ->>

Какие модели, из ниже перечисленных относятся к динамическим тематическим моделям?

перейти к ответу ->>

Что называют обучением с подкреплением?

перейти к ответу ->>

Как называется метод, который использует жадные действия большую часть времени?

перейти к ответу ->>

Какое соотношение позволяет реализовать идею, согласно которой высокие вознаграждения должны увеличивать вероятность повторного выбора предпринятого действия?

перейти к ответу ->>

Что называется вероятностями перехода?

перейти к ответу ->>

Какую функцию называют функцией ценности состояния для стратегии
\pi
?

перейти к ответу ->>

Какой метод усредняет выгоды, соответствующие только первым посещениям s?

перейти к ответу ->>

Какая форма будет называться Q-обучением?

перейти к ответу ->>

Какая идея, из ниже перечисленных, описывает метод
Q(\lambda)
Уоткинса?

перейти к ответу ->>

Что будет градиентным шагом в формуле
w_m:=w_m + \eta(x_i - w_m)[a(x_i) = m]
?

перейти к ответу ->>

Каким способом можно получить гребневую регрессию?

перейти к ответу ->>

Выберите, что подходит под определение коэффициента разнообразия
\Delta^A(X^L)
множества алгоритмов А на выборке
X^L
?

перейти к ответу ->>

Какая оценка справедлива для функции роста, если множество А конечно, а число алгоритмов, попарно неразличимы на выборке
X^L
?

перейти к ответу ->>

Чему соответствует точечное ядро
k(z)=[z=0]
при единичной ширине окна
h=1
:

перейти к ответу ->>

Выберите правильный ответ. Задача классификации - это:

перейти к ответу ->>

Что из ниже перечисленного представления описывает процесс порождения коллекции D?

перейти к ответу ->>

Есть гипотеза, где классы имеют
n
-мерные гауссовские плотности:
p_y(x) = N(x; \mu_y; \sum y) = \frac {e^{-\frac{1}{2}(x-\mu_y)^T \sum \limits_ {y}^{-1} (x-\mu_y) } }{\sqrt {(2\pi)^n det \sum_y}}
, где -
y \in Y
, то вектором матожидания класса
y \in Y
будет:

перейти к ответу ->>

Выберите верные утверждения.

перейти к ответу ->>

Как будет называться закономерность
\varphi
, если
n_c(\varphi)=0
?

перейти к ответу ->>

Эмпирической оценкой плотности является функция:

перейти к ответу ->>

Что из ниже перечисленного является типом латентной модели?

перейти к ответу ->>

Какая из формул позволит решить задачу частичного обучения?

перейти к ответу ->>

Верно ли, что при n=1 многомерное шкалирование позволяет отобразить выборку в виде множества точек на плоскости?

перейти к ответу ->>

В задачах классификации признаки могут быть строковыми, вещественными, числовыми.

перейти к ответу ->>

В зависимости от значений отступа обучающие объекты условно делятся на:

перейти к ответу ->>

Что, из ниже перечисленного является достоинством алгоритма ТЭМП?

перейти к ответу ->>

Какое выражение, из перечисленных ниже, называется байесовским решающим правилом:

перейти к ответу ->>

Какой получится алгоритм, если
h
определить как наибольшее число, при котором ровно
k
ближайших соседей объекта
u
получают нулевые веса:
h(u)=\rho(u,x_u^{(k+1)})
.

перейти к ответу ->>

Локальную аппроксимацию выборки
X^l
строит алгоритм:

перейти к ответу ->>

Какой метод оценивает
V^{\pi}(S)
как среднее значение выгод, соответствующих всем посещениям s в некоторой совокупности эпизодов?

перейти к ответу ->>

Как будет выглядеть формула вероятности, когда переобученность превышает допустимый порог
\epsilon
?

перейти к ответу ->>

Если функция
g(x,a)
достаточное число раз дифференцируема по
\alpha
, то:

перейти к ответу ->>

Что, из ниже перечисленного характерно для постредукции?

перейти к ответу ->>

Что, из ниже перечисленного, не подается на вход в алгоритме IRLS?

перейти к ответу ->>

Что из ниже перечисленного не является элементом обучения с подкреплением?

перейти к ответу ->>

Какая форма является TD-ошибкой?

перейти к ответу ->>

За что штрафует функция
\alpha(M) = (1 - |M|)_+
?

перейти к ответу ->>

Какие пространства признаков называются спрямляющими?

перейти к ответу ->>

Действительно ли, что метод INCAS позволяет решать задачи, в которых нет линейной разделимости?

перейти к ответу ->>

Какой алгоритм имеет такое условие, что пока есть путь между двумя вершинами разных классов, то удалить самое длинное ребро на этом пути?

перейти к ответу ->>

Верно ли, что трансдуктивное обучение - это построение алгоритма классификации
a:X \to Y
?

перейти к ответу ->>

К какому алгоритму относится недостаток настройки двух параметров
C, \gamma
?

перейти к ответу ->>

Что называют данными в машинном обучении?

перейти к ответу ->>

Что служит индикатором ошибки для задач классификации?

перейти к ответу ->>

Эмпирический риск - это средняя потеря на одном объекте.

перейти к ответу ->>

Какие задачи из ниже перечисленных относятся к задачам классификации?

перейти к ответу ->>

Что, из ниже перечисленного, не относится к типу экспериментального исследования?

перейти к ответу ->>

Апостеорной вероятностью класса
y
для объекта
x
называется:

перейти к ответу ->>

Формула параметрического оценивания плотности может выглядеть как:

перейти к ответу ->>

Если байесовское решающее правило написать через апостериорные вероятности, то получится формула вида:

перейти к ответу ->>

В формуле совместной плотности
p(x,y) = p(x) P(y|x) = P(y)p(x|y)
функцией правдоподобия класса
y
будет функция:

перейти к ответу ->>

Выберите неверные утверждения:

перейти к ответу ->>

Если матрица
\hat \Sigma
близка к вырожденной, то это называется:

перейти к ответу ->>

Идея EM-алгоритма с последовательным длбавлением компоненты заключается в следующем:

перейти к ответу ->>

Константы смеси имеют
n
-мерные нормальные распределения
\varphi(x;\Theta_j) = N(x;\mu_j,\Sigma_j)
с параметрами
\Theta_j = (\mu_j,\Sigma_j)
, где
\mu_j \in R^n
- это:

перейти к ответу ->>

Выберите какие недостатки относятся не к алгоритму ближайшего соседа?

перейти к ответу ->>

К какому алгоритму можно отнести формулу:
w(i,u) = [i \le k]w_i; a(u;X^l,k) = \arg \max_{y \in Y}\sum_{i=1}^k [y_{(n)}^{(i)} = y]
?

перейти к ответу ->>

Отрицательные отступы и классифицирующиеся неверно имеют:

перейти к ответу ->>

Что будет называться в параметрическом семействе отображений:
a(x,w) = sign f(x,w)
, вектором параметров?

перейти к ответу ->>

Будет ли алгоритм допускать ошибку на объекте
x_i
, если
M_i(w) < 0
?

перейти к ответу ->>

Какая, из перечисленных ниже функций, соответствует алгоритму бустинга Ada Boost?

перейти к ответу ->>

Какой эвристический приём характеризует нормализацию признаков?

перейти к ответу ->>

Что будет называться в параметрическом семействе отображений:
a(x,w) = sign f(x,w)
, вектором параметров?

перейти к ответу ->>

Пусть есть задача с 2-мя классами
Y = {-1, +1}
. К какому классу будет относится алгоритм, если
f(x,w) < 0
?

перейти к ответу ->>

Какая, из перечисленных ниже функций, соответствует алгоритму бустинга Ada Boost?

перейти к ответу ->>

В формуле
\ln p(w, \sigma)
, что будет выступать в роли гиперпараметра?

перейти к ответу ->>

Что получится, если дискриминантная функция определяется как скалярное произведение вектора
x
и вектора параметров
w \in R^n
?

перейти к ответу ->>

Какое условие называют условием дополняющей нежёсткости?

перейти к ответу ->>

Объекты называются периферийными?

перейти к ответу ->>

Если объекты
x_i
классифицируется правильно и находятся далеко от разделяющей полосы, то их называют:

перейти к ответу ->>

В чем преимущества SVM перед метдом стохастического градиента?

перейти к ответу ->>

Что, из ниже перечисленного, является входными данными в последовательном методе активных ограничений?

перейти к ответу ->>

При каком размере окна h функция в пределе
h \to \infty
вырождается в константу?

перейти к ответу ->>

Вычисление оценки скользящего контроля на каждом объекте выглядит следующим образом:

перейти к ответу ->>

Каким способом можно уменьшить норму вектора коэффициентов?

перейти к ответу ->>

Как будет выглядеть градиент функционала Q в точке
\alpha^t
?

перейти к ответу ->>

Выражение для градиента будет выглядеть:

перейти к ответу ->>

Функция F будет называться разделяющими точками множества X, если:

перейти к ответу ->>

Какие будут входные данные, если сеть обучать методом обратного распространения ошибки?

перейти к ответу ->>

Верно ли что, если обучающая выборка имеет большой объем или если решается задача классификации, то можно использовать метод стохастического градиента с адаптивным шагом?

перейти к ответу ->>

Что означает, если веса
w_j h
между входными и скрытым слоем будут обнулены?

перейти к ответу ->>

Как называют выражение
a(x) = arg \min_{m \in Y} \rho (x,w_m)
?

перейти к ответу ->>

Какой нейрон называют нейроном-победителем?

перейти к ответу ->>

Какое правило означает следующая формула
w_m:=w_m + \eta (x_i - w_m) K(\rho(x_i, w_m))
?

перейти к ответу ->>

Какие входные данные нужны для карт Кохонена?

перейти к ответу ->>

Формула гладкой аппроксимации имеет вид:

перейти к ответу ->>

Верно ли, что при n=2 многомерное шкалирование позволяет отобразить выборку в виде множества точек на плоскости?

перейти к ответу ->>

Верно ли, что частичное обучение - это построение алгоритма классификации
a:X \to Y
?

перейти к ответу ->>

Степень доверия классификации
a(x_i):M_i(a) = Гy_i(x_i) - \max_{y \in Y \setminus y_i} Г_y(x_i)
называется:

перейти к ответу ->>

За что штрафует функция
\alpha(M) = (1 - M)_+
?

перейти к ответу ->>

Действительно ли, что метод XR слабо чувствителен к выбору
C, \gamma
?

перейти к ответу ->>

С помощью какой формулы можно оценить вероятность
P(y|b_j (x) = 1)
по размеченным данным
X^l
?

перейти к ответу ->>

Оценка расстояний между двумя распределениями с помощью расстояния Хелингера будет выглядеть:

перейти к ответу ->>

В каком алгоритме встречается алгоритмический оператор
b:X \to R
?

перейти к ответу ->>

Как называются операторы
b_t(x)
при фиксированном решающем правиле?

перейти к ответу ->>

К какому классу отнесет объект решающее правило С:
C(b) \equiv C(b^{(1)},...,b^\mu) = \arg \max_{y \in Y} b^{(y)}
?

перейти к ответу ->>

Как называют произведения
g_t(x) b_t(x)
в смесях алгоритмов?

перейти к ответу ->>

Что объясняет эффективность бустинга?

перейти к ответу ->>

Какие алгоритмы лучше работают на больших обучающих выборках?

перейти к ответу ->>

Какие параметры участвуют в алгоритме RSM?

перейти к ответу ->>

В каком методе базовые алгоритмы обучаются на различных подмножествах признакового описания, которые выделяются случайным образом?

перейти к ответу ->>

Что такое рекомбинация
(П, N_1)
в методе CCEL?

перейти к ответу ->>

К любым ли базовым алгоритмам и их методам обучения применим алгоритм CCEL?

перейти к ответу ->>

Что, из ниже перечисленного называют компонентами смеси?

перейти к ответу ->>

Что будет на выходе в алгоритме M2E?

перейти к ответу ->>

Что называют разностью
\delta(\mu, X^l, X^k) = \nu (a, X^k) - \nu (a,X^l)
?

перейти к ответу ->>

Как определяется функционал полного скользящего контроля?

перейти к ответу ->>

Что называют синтезом признаков?

перейти к ответу ->>

Какой метод строит алгоритм, доставляющий минимальное значение внутреннему критерию:
\mu(X^l) = arg \min_{a\in A}Q(a,X^l)
?

перейти к ответу ->>

Как называется критерий:
LOO(\mu,X^l)=\frac{1}{L}\sum_{i=1}^kQ(\mu(X^l\backslash \{x_i\}, \{x_i\}))
?

перейти к ответу ->>

Как называется критерий
Q(\mu(X^l), X^k) < Q(\mu(X^l),X^l) + \sqrt{\frac{h}{l}(ln \frac{2l}{n}+1)-\frac{ln n}{l}}
?

перейти к ответу ->>

Как называется алгоритм, который добавляет к набору G по одному признаку, каждый раз выбирая тот признак, который приводит к наибольшему уменьшению внешнего критерия?

перейти к ответу ->>

Что, из ниже перечисленного характеризует энтропийный критерий?

перейти к ответу ->>

Какая формула характерна, если
f
представляет порядковый признак?

перейти к ответу ->>

Что называют зонами значений признака
f
?

перейти к ответу ->>

Какие данные подаются на вход жадного алгоритма слияния зон?

перейти к ответу ->>

По какой из формул параметрическое семейство Ф можно отнести к параметрическому семейству областей?

перейти к ответу ->>

Что, из ниже перечисленного является недостатком решающих списков?

перейти к ответу ->>

Что такое решающий список?

перейти к ответу ->>

Какой алгоритм подсчитывает долю правил в наборах
R_c
, относящих объект
x
к каждому из классов?

перейти к ответу ->>

При каком условии представительный набор
\langle w,i \rangle
называется тупиковым?

перейти к ответу ->>

Определите какая из формул не участвует ни в простом ни взвешенном голосовании:

перейти к ответу ->>

Задача выявления содержательно интерпретируемых латентных характеристик клиентов и ресурсов относится к задаче коллаборативной фильтрации?

перейти к ответу ->>

Как называется вектор условных вероятностей
q_{t_r} = q(t|r)
, если данный ресурс
r
соответствует теме
t \in T
?

перейти к ответу ->>

Что является основой анамнестических алгоритмов?

перейти к ответу ->>

Что из ниже перечисленного не относится к латентной модели?

перейти к ответу ->>

Являются ли вероятностные модели типом латентных моделей?

перейти к ответу ->>

Что из ниже перечисленного является Е-шагом ЕМ-алгоритма?

перейти к ответу ->>

Что означает запись
nd = \sum_{w \in W} nd_w
?

перейти к ответу ->>

Какая запись соответствует числу троек, в которых термин w связан с темой t?

перейти к ответу ->>

Какое обозначение соответствует матрице тем документов
\varTheta
?

перейти к ответу ->>

Как будет называться модель, в которой учитывается пара слов?

перейти к ответу ->>

Что определяет векторный параметр
\alpha
?

перейти к ответу ->>

Какая компонента, из ниже перечисленных, является файловой компонентой?

перейти к ответу ->>

Какие модели, из ниже перечисленных относятся к многоязычным тематическим моделям?

перейти к ответу ->>

Какие элементы, из ниже перечисленных относятся к обучению с подкреплением?

перейти к ответу ->>

Как называется метод, который применяют для оценивания ценности?

перейти к ответу ->>

Что называют финитным марковским процессом принятия решений?

перейти к ответу ->>

Какую величину называют относительной ценностью?

перейти к ответу ->>

Какая идея, из ниже перечисленных, описывает идею алгоритма
SARSA(\lambda)
?

перейти к ответу ->>

Что показывает величина
E(m) = \frac{||GU^T-F||^2}{||F||^2} = \frac{\lambda_{m+1}+...+\lambda_n}{\lambda_1+...+\lambda_n}\le \varepsilon
?

перейти к ответу ->>

Чему способствует уменьшение параметра
\lambda
?

перейти к ответу ->>

Какой входной набор данных является лишним для жадного алгоритма построения решающего списка?

перейти к ответу ->>

Что называют в теории нейронных сетей сокращением весов?

перейти к ответу ->>

Идея алгоритма EM заключается в следующем:

перейти к ответу ->>

Радиальными функциями принято называть функции:

перейти к ответу ->>

Верно ли, что по мере увеличения сложности модели
|G|
внутренний критерий возрастает?

перейти к ответу ->>

Какой алгоритм представляет функцию
a:X \to Y
, которая любому объекту
x \in X
ставит в соответствие метку кластера
y \in Y
?

перейти к ответу ->>

Что такое мутация (П) в методе CCEL?

перейти к ответу ->>

Как называется функция вида:
a_t(x) = C(b_t(x))
?

перейти к ответу ->>

Этап тестирования - это:

перейти к ответу ->>

Оценка расстояния между двух распределений с помощью статистики
xu
- квадрат будет выглядеть:

перейти к ответу ->>

Что получается на выходе в алгоритме жадного построения решающего списка?

перейти к ответу ->>

Разделяющая поверхность
\{ x \in X | \lambda_y P_y p_y(x)=\lambda_s P_s p_s (x) \}
квадратичная для всех
y
,
s \in Y, y \ne s
будет вырождена в линейную, если:

перейти к ответу ->>

Какой алгоритм на каждом шаге отбирает целые популяции?

перейти к ответу ->>

По какой формуле определяется энтропия?

перейти к ответу ->>

Выберите верный вариант. Если для каждого класса
c \in Y
построено множество логических правил, специализирующихся на различении объектов данного класса
R_c=\{\varphi_c^t:X \to \{0,1\}|t=1,...,T_c\}
и если
\varphi_c^t(x)=1
, то:

перейти к ответу ->>

Если в корректирующей операции
b(x) = F(b_1(x),g_1(x),...,b_r(x), g_r(x)) = \sum_{t=1}^T gt(x) b_t(x)
функция
gt(x)
принимает только два значения
\{0,1\}
, то множество всех
x \in X
, для которых
gt(x) = 1
, называется:

перейти к ответу ->>

Величина потери от ошибки - это:

перейти к ответу ->>

Что поступает на вход рекурсивного алгоритма синтеза бинарного решающего дерева
ID3
?

перейти к ответу ->>

Какие ценности действий называют методами Монте-Карло?

перейти к ответу ->>

Что, из ниже перечисленного, относится к обучающей выборке?

перейти к ответу ->>

Верно ли утверждение? Всякая оптимизация по неполной информации и избыточная сложность параметров приводит в переобучению.

перейти к ответу ->>

Какая, из ниже перечисленных задач, является задачей классификации на 4 класса?

перейти к ответу ->>

Если известны
P_y = P(y)
и
P_y(x) = p(x|y)
, и
\lambda_{yy} = 0
, а
\lambda_{ys} = \lambda_y
для всех
y
,
s \in Y
, то минимум среднего риска
R(a)
достигается при:

перейти к ответу ->>

Какие, из ниже перечисленных подходов, относятся к подходам оцениванию:

перейти к ответу ->>

Выберите правильный ответ. По контрольной выборке вычисляется:

перейти к ответу ->>

В формуле совместной плотности
p(x,y) = p(x) P(y|x) = P(y)p(x|y)
функцией апостеорной вероятности класса
y
будет функция:

перейти к ответу ->>

Если нормаль разделяет гиперплоскость
\alpha_y = \hat\Sigma^{-1} \hat\mu_y
неустойчива, то это проявление:

перейти к ответу ->>

Чтобы использовать расстояние Махаланобиса в задаче определения принадлежности заданной точки одному из
N
классов, нужно найти матрицы ковариации всех классов.

перейти к ответу ->>

Если объекты описываются
n
числовыми признаками
f_i:X \to R, i=1,...,n
, тогда:

перейти к ответу ->>

Плотность распределения на
X
имеет вид смеси
k
распределений
p(x) = \sum_{j=1}^k w_j p_j(x), \sum_{j=1}^k w_j = 1, w_j \ge 0
, где
w_j(x)
- это:

перейти к ответу ->>

Выберите, какие недостатки относятся к алгоритму ближайшего соседа?

перейти к ответу ->>

Как называется параметр
h
в формуле
a(u; X^l,h) = \arg \max_{y \in Y} \sum_{i=1}^l[y_n^{(i)}=y] k(\frac{\rho(u,x_u^{(i)})}{h})
?

перейти к ответу ->>

Какие преимущества, из ниже перечисленных, относятся к преимуществам метода SG?

перейти к ответу ->>

Что называют в теории нейронных сетей сокращением весов?

перейти к ответу ->>

Что получится, если дискриминантная функция определяется как скалярное произведение вектора
x
и вектора параметров
w \in R^n
?

перейти к ответу ->>

С чем, из ниже перечисленного сравнивают линейный классификатор?

перейти к ответу ->>

Какая, из перечисленных ниже функций, соответствует методу опорных векторов?

перейти к ответу ->>

Какая величина называется гиперпараметром?

перейти к ответу ->>

Действительно ли что, ширина полосы максимальна, когда норма вектора w максимальна?

перейти к ответу ->>

Какие объекты не являются опорными?

перейти к ответу ->>

В ядре
w_i(x) = K(\frac{\rho(x,x_i)}{h})
, параметр
h
- называется:

перейти к ответу ->>

Что будет называться псевдообратной для прямоугольной матрицы F?

перейти к ответу ->>

Выражение для гессиана будет выглядеть:

перейти к ответу ->>

Что подается на вход в алгоритме IRLS?

перейти к ответу ->>

Какая сеть будет называться полносвязной?

перейти к ответу ->>

Что означает обнуление веса
w_{hm}
между скрытым и входным слоями?

перейти к ответу ->>

Дробление крупных кластеров на более мелкие называется задачей:

перейти к ответу ->>

С помощью какой формулы решается задача исключающего ИЛИ?

перейти к ответу ->>

Каким способом можно избавиться от неинформативного пустого кластера?

перейти к ответу ->>

С помощью какого правила можно построить гладкую аппроксимацию?

перейти к ответу ->>

Какая из формул позволит решить задачу кластеризации?

перейти к ответу ->>

Как называется функция
C:R \to Y
в алгоритмах имеющих вид суперпозиции
a(x) = C(b(x))
?

перейти к ответу ->>

Что из ниже перечисленного не относится к корректирующим операциям?

перейти к ответу ->>

Какой пример, из ниже перечисленных, является примером взвешенного голосования?

перейти к ответу ->>

Какой алгоритм позволяет получить на выходе алгоритмическую композицию
F(b_1,...,b_r)
?

перейти к ответу ->>

Что из ниже перечисленного является достоинством алгоритма AdaBoost?

перейти к ответу ->>

Какие алгоритмы лучше работают на коротких обучающих выборках?

перейти к ответу ->>

Какая функция, из ниже перечисленных, представляет собой квазилинейную корректирующую операцию?

перейти к ответу ->>

Что получается на выходе при построении 2-х базовых алгоритмов?

перейти к ответу ->>

Что называют методом обучения?

перейти к ответу ->>

Определите название данной задачи: имеется одна модель А, и один метод обучения
\mu_w
с параметром
w
, который не может быть настроен по обучающей выборке. Требуется подобрать наиболее подходящие значения гиперпараметра.

перейти к ответу ->>

Как называется критерий, который характеризует качество метода
\mu
по тем данным, которые не использовались в процессе обучения?

перейти к ответу ->>

Выберите правильную характеристику для внутреннего критерия.

перейти к ответу ->>

Как называется алгоритм, который последовательно удаляет избыточные признаки?

перейти к ответу ->>

Что, из ниже перечисленного характеризует эффективное вычисление информативности с применением формулы Стирлинга?

перейти к ответу ->>

Выберите верное утверждение:

перейти к ответу ->>

Что не является входными данными в алгоритме синтеза бинарного решающего дерева
ID3
?

перейти к ответу ->>

Что из ниже перечисленного относится к задачам коллаборативной фильтрации?

перейти к ответу ->>

Какие данные не являются входными в алгоритме двухступенчатой симметризации?

перейти к ответу ->>

Что из ниже перечисленного представления называется гипотезой условной независимости?

перейти к ответу ->>

Какая запись соответствует числу троек, в которых термин документа d связан с темой t?

перейти к ответу ->>

Какое обозначение соответствует матрице терминов тем Ф?

перейти к ответу ->>

Отбрасывание изменяемых частей слов, главным образом, окончаний называется:

перейти к ответу ->>

Какая компонента, из ниже перечисленных, является тематической компонентой?

перейти к ответу ->>

Как называют априорную вероятность вида:
q_Ф = \frac{\varepsilon}{1+\gamma+\varepsilon}
?

перейти к ответу ->>

Что, из ниже перечисленного называют метаинформацией?

перейти к ответу ->>

Какие модели, из ниже перечисленных относятся к многомодальным тематическим моделям?

перейти к ответу ->>

Как называется метод, который варьирует вероятность действий, представляемых посредством некоторой функции от предполагаемых значений ценности?

перейти к ответу ->>

Верно ли, что метод
SARSA(\lambda)
не принимает в расчет все будущие ситуации вплоть до конца эпизода при выполнении дублирования?

перейти к ответу ->>

Пусть есть задача с 2-мя классами
Y = {-1, +1}
. К какому классу будет относится алгоритм, если
f(x,w) > 0
?

перейти к ответу ->>

Что из ниже перечисленного относится к моделям основанным на хранении исходных данных?

перейти к ответу ->>

Что называют методом обучения?

перейти к ответу ->>

Какую функцию называют функцией ценности действия для стратегии
\pi
?

перейти к ответу ->>

Верно ли утверждение? Метод SG позволяет настраивать веса на избыточно больших выборках, за счет того, что случайной подвыборки может оказаться достаточно для обучения.

перейти к ответу ->>

Какой тип экспериментального исследования имеет цель - либо решение конкретной прикладной задачи, либо выявление «слабых мест»?

перейти к ответу ->>

Что, из ниже перечисленного, является функцией активации?

перейти к ответу ->>

В чем недостатки SVN?

перейти к ответу ->>

Какие задачи, из ниже перечисленных, являются задачами ранжирования?

перейти к ответу ->>

Какой пример подходит для задачи восстановления регрессии?

перейти к ответу ->>

На предположении, что плотность распределения известна с точностью до параметра,
p(x) = \varphi (x, \Theta)
, где
\varphi
- фиксированная функция, основано:

перейти к ответу ->>

Есть гипотеза, где классы имеют
n
-мерные гауссовские плотности:
p_y(x) = N(x; \mu_y; \sum y) = \frac {e^{-\frac{1}{2}(x-\mu_y)^T \sum \limits_ {y}^{-1} (x-\mu_y) } }{\sqrt {(2\pi)^n det \sum_y}}
, где -
y \in Y
, то ковариационной матрицей класса
y \in Y
будет:

перейти к ответу ->>

К какому алгоритму можно отнести формулу:
w(i,u) = [i \le k]w_i; a(u;X^l,k) = \arg \max_{y \in Y}\sum_{i=1}^k [y_{(n)}^{(i)} = y]w_i
?

перейти к ответу ->>

Что, из нижк перечисленного, можно назвать достоинством метода потенциальных функций?

перейти к ответу ->>

Пусть есть задача с 2-мя классами
Y = {-1, +1}
. К какому классу будет относится алгоритм, если
f(x,w) < 0
?

перейти к ответу ->>

Какие преимущества, из ниже перечисленных, относятся к преимуществам метода SG?

перейти к ответу ->>

Какой эвристический приём характеризует нормализацию признаков?

перейти к ответу ->>

Действительно ли что, ширина полосы максимальна, когда норма вектора w минимальна?

перейти к ответу ->>

Какое условие называют опорным вектором?

перейти к ответу ->>

Какие объекты называются нарушителем?

перейти к ответу ->>

Выберите противоречивое утверждение.

перейти к ответу ->>

Какие объекты являются опорными?

перейти к ответу ->>

Что называют задачей восстановления регрессии?

перейти к ответу ->>

Следующая формула
a_h(x;X^l) = \frac{\sum_{i=1}^l y_iw_i(x)}{\sum_{i=1}^lw_i(x)} = \frac{\sum_{i=1}^ly_iK(\frac{\rho(x,x_i)}{h})}{\sum_{i=1}^lK(\frac{\rho(x,x_i)}{h})}
, называется:

перейти к ответу ->>

При каком размере окна h функция
a_h(x)
стремится пройти через все точки выборки?

перейти к ответу ->>

Если используется квартическое ядро
\hat K(\varepsilon) = K_Q(\frac{\varepsilon}{6med\{ \varepsilon_i \}})
, где
med\{ \varepsilon_i \}
- медиана вариационного ряда ошибок, то это называют:

перейти к ответу ->>

Что называют линейной комбинацией признаков с коэффициентами
\alpha \in R^n:g(x,a)=\sum_{j=1}^n \alpha_j f_j(x)
?

перейти к ответу ->>

Верно ли, что любая непрерывная функция n аргументов на единичном кубе
[0,1]^n
представлена в виде суперпозиции непрерывных функций одного аргумента и операции сложения:
f(x^1,x^2,...,x^n)=\sum_{k=1}^{2n+1}h_k(\sum_{i=1}^n \varphi_i k(x^i))
?

перейти к ответу ->>

Когда появляется неинформативный пустой кластер при конкурентном обучении по правилу WTA?

перейти к ответу ->>

Каким способом можно избавиться от медленной скорости сходимости в правиле WTA?

перейти к ответу ->>

С помощью какой формулы можно оценить вероятность
P(y|b_j (x) = 1)
по неразмеченным данным
X^k
и линейной модели?

перейти к ответу ->>

Чтобы оценить качество алгоритмических операторов
Q(b; X^l, Y^l, W^l) = \sum_{i=1}^l w_i  \tilde L (b(x_i), y_i)
надо:

перейти к ответу ->>

Какие параметры участвуют в алгоритме Беггинга?

перейти к ответу ->>

Действительно ли, что RSM выполняется строго последовательно не допуская эффективного распространения?

перейти к ответу ->>

Как будет выглядеть формула вероятности ошибки в интерпретации обобщающей способности метода
\mu
, если взять матожидание по выборке
X^l
от функционала
Q_с
?

перейти к ответу ->>

Если алгоритмы a и a' допускают ошибки на одних и тех же объектах, то их называют:

перейти к ответу ->>

Что называется переобучением?

перейти к ответу ->>

Что называют выбором метода?

перейти к ответу ->>

Какой алгоритм пытается улучшить конъюнкцию
\varphi
, удаляя или заменяя по одному терму?

перейти к ответу ->>

Какой алгоритм каждому правилу
\varphi_c^t
приписывает вес
\alpha_c^t \ge 0
, и при голосовании берётся взвешенная сумма голосов
Г_c(x)=\sum_{t=1}^{T_c} \alpha_c^t \varphi_c^t(x), \alpha_c^t \ge 0
?

перейти к ответу ->>

При каком условии совокупность
\langle w,i \rangle
будет называться представительным набором?

перейти к ответу ->>

На что, из ниже перечисленного, влияют параметры
D_{min}
и
E_{max}
?

перейти к ответу ->>

Какие данные являются выходными в алгоритме двухступенчатой симметризации?

перейти к ответу ->>

Что из ниже перечисленного не относится к недостаткам тривиальной рекомендующей системой?

перейти к ответу ->>

Как будет называться модель, в которой учитывается тройка слов?

перейти к ответу ->>

Как называют априорную вероятность вида:
q_m = \frac{\gamma}{1+\gamma+\varepsilon}
?

перейти к ответу ->>

Относится ли список ярлыков
L_d
, присвоенных пользователями документу d к метаинформации?

перейти к ответу ->>

Что характеризует гипотеза условной независимости вида:
p(c|t,d) = p(c|t)
?

перейти к ответу ->>

С какой вероятностью осуществляется выбор действия
\alpha
в t-й игре?

перейти к ответу ->>

Предположим, что требуется оценить величину
V^{\pi}(s)
, имея набор эпизодов, полученных при применении стратегии
\pi
и прохождении через состояние s. Как тогда будет называться каждое появление состояния s в эпизоде?

перейти к ответу ->>

Верно ли утверждение? Метод SG позволяет настраивать веса на избыточно больших выборках, за счет того, что случайной подвыборки может оказаться достаточно для обучения.

перейти к ответу ->>

Что называют марковским процессом принятия решений?

перейти к ответу ->>

Какая формула характерна, если
f
представляет номинальный признак?

перейти к ответу ->>

Выберите правильный ответ. Задача регрессии - это:

перейти к ответу ->>

Вероятность ошибочной классификации имеет вид:

перейти к ответу ->>

Выберите правильный ответ. По обучающей выборке
X^l
настраивается:

перейти к ответу ->>

С помощью чего, из ниже перечисленного, можно определить сходство неизвестной и известной выборки?

перейти к ответу ->>

Плотность распределения на
X
имеет вид смеси
k
распределений
p(x) = \sum_{j=1}^k w_j p_j(x), \sum_{j=1}^k w_j = 1, w_j \ge 0
, где
p_j(x)
- это:

перейти к ответу ->>

Выберите верные утверждения:

перейти к ответу ->>

С чем, из ниже перечисленного сравнивают линейный классификатор?

перейти к ответу ->>

Пусть есть задача с 2-мя классами
Y = {-1, +1}
. К какому классу будет относится алгоритм, если
f(x,w) = 0
?

перейти к ответу ->>

Какая, из перечисленных ниже функций, соответствует линейному дискриминанту Фишера?

перейти к ответу ->>

В формуле
\ln p(w, \sigma)
, что будет выступать в роли гиперпараметра?

перейти к ответу ->>

Как называется величина
M_i(w) = y_if(x_i,w)
объекта
x_i
относительно алгоритма классификации
a(x, w) = sign f(x, w)
?

перейти к ответу ->>

Если объекты
x_i
классифицируется правильно и лежат в точности на границе разделяющей полосы, то их нахывают:

перейти к ответу ->>

Какая формула, из ниже перечисленных, позволяет организовать итерационный процесс?

перейти к ответу ->>

Что представляет собой матрица
F_{l\times n}=(f_i(x_i))
?

перейти к ответу ->>

Как называется метод, который удаляет те связи, к изменению которых функционал Q наименее чувствителен?

перейти к ответу ->>

При каком условии в субквадратичном алгоритме многомерного шкалирования все точки будут "скелетными"?

перейти к ответу ->>

Если есть два существенно различных метода обучения использующих разные наборы признаков, то это алгоритм:

перейти к ответу ->>

Как определяется следующий функционал
Q_c (\mu, X^l) = E_n V_n^k = \frac{1}{N}\sum_{n=1}^N V_n^k
?

перейти к ответу ->>

Какие входные данные являются лишние в алгоритме жадного слияния зон?

перейти к ответу ->>

По какой из формул параметрическое семейство Ф можно отнести к параметрическому семейству полуплоскостей?

перейти к ответу ->>

Верно ли, что если правило
\varphi_c^t(x)=1
, то объект будет определен в другом классе?

перейти к ответу ->>

Выберите правило, которое подсчитывает долю голосов, относящих объект
x
к каждому из классов:

перейти к ответу ->>

Что из ниже перечисленного является моделью усреднения по блокам?

перейти к ответу ->>

Какое условие, из ниже перечисленных, должно выполнятся, чтобы обеспечить достаточную величину шага, позволяющую справится с начальными условиями?

перейти к ответу ->>

Что называют индикатором ошибки?

перейти к ответу ->>

Что, из ниже перечисленного является достоинством алгоритма бустинга?

перейти к ответу ->>

Укажите, что входит в преимущества байесовского подхода.

перейти к ответу ->>

Какая функция, из перечисленных ниже, является кусочно-постоянной?

перейти к ответу ->>

Какая величина называется гиперпараметром?

перейти к ответу ->>

Что, из ниже перечисленного, является функцией активации?

перейти к ответу ->>

Если строится вариационный ряд ошибок
\varepsilon^{(1)} \le ... \le \varepsilon^{(l)}
и отбрасывается некоторое количество t объектов с наибольшей ошибкой, тогда это называют:

перейти к ответу ->>

Что называют функцией роста множества алгоритмов А?

перейти к ответу ->>

Функция роста множества всех конъюнкций ранга не выше K будет выглядеть как:

перейти к ответу ->>

Как называется критерий, для которого выборка случайным образом разбивается на q непересекающихся блоков одинаковой длины
l_1,...,l_q
?

перейти к ответу ->>

Что, из ниже перечисленного принято решать достоинством решающего списка?

перейти к ответу ->>

Что такое решающее дерево?

перейти к ответу ->>

При каком n в карте сходства отображается результат многомерного шкалирования в виде плоского точечного графика?

перейти к ответу ->>

Оценкой близости объекта
u
к классу
y
называется функция:

перейти к ответу ->>

Что, из ниже перечисленного, является выходными данными в последовательном методе активных ограничений?

перейти к ответу ->>

К какому методу обучения относится метод главных компонент?

перейти к ответу ->>

Как будет выглядеть индикатор ошибки в случае классификации при конечном Y?

перейти к ответу ->>

Что называют размерностью Вапника-Червоненкиса?

перейти к ответу ->>

Если в семействе А выделена последовательность подсемейств возрастающей ёмкости
A_1 \subset A_2 \subset ... \subset A_h = A
и в ней можно выбрать оптимальное подсемейство, для которого достигается минимальное значение правой части из формулы
\nu (\mu(X^l), X^k) < \nu (\mu(X^l), X^l) + \sqrt{\frac{n}{l}(ln \frac{2l}{n}+1) - \frac{ln n}{l}}
, то этот метод называют:

перейти к ответу ->>

Что, из ниже перечисленного характеризует статический критерий?

перейти к ответу ->>

Выберите верное определение коллаборативной фильтрации.

перейти к ответу ->>

Какое правило означает следующая формула
a(x)=arg \min_{m \in Y} Cm \rho(x,w_m)
?

перейти к ответу ->>

Небольшое число объектов с большими отрицательными отступами называют:

перейти к ответу ->>

Что , из ниже перечисленного, служит целями кластеризации?

перейти к ответу ->>

Как называется процедура создающая
N_0
индивидов в алгоритме CCEL?

перейти к ответу ->>

Что должно поступать на вход в алгоритме жадного добавления?

перейти к ответу ->>

Что, из ниже перечисленного является определением критерия замены?

перейти к ответу ->>

Как называется технология основанная на правилах морфологии языка?

перейти к ответу ->>

В чём заключается задача кластеризации?

перейти к ответу ->>

В какой функции множества нулей и единиц линейно неразделимы?

перейти к ответу ->>

Какой метод представляет собой итерационный процесс смены поколений?

перейти к ответу ->>

Что является недостатком тривиальной рекомендующей системой?

перейти к ответу ->>

Что характеризует гипотеза условной независимости вида:
p(t|c,d) = p(t|c)
?

перейти к ответу ->>

Как называется критерий
AIC(\mu,X^l) = Q(\mu(X^l),X^l)+\frac{2\hat\delta^2}{l}n
?

перейти к ответу ->>

Если известны
P_y = P(y)
и
P_y(x) = p(x|y)
, то минимум среднего риска
R(a)
не будет достигнут при:

перейти к ответу ->>

Какие, ниже перечисленные, недостатки можно отнести к методу потенциальных функций?

перейти к ответу ->>

Что представляют векторы
\varphi_t = p(w|t)
в пространстве терминов
R^{|W|}
?

перейти к ответу ->>

Что представляет собой матрица
\tilde y_i = y_i \sqrt{(1-\sigma_i)/ \sigma_i}
?

перейти к ответу ->>