База ответов ИНТУИТ

Интеллектуальный анализ данных средствами MS SQL Server 2008 - ответы

Количество вопросов - 96

Для создания временной структуры интеллектуального анализа данных в операторе CREATE MINING STRUCTURE надо использовать ключевое слово:

Выберите наиболее корректное продолжение фразы "При проведении интеллектуального анализа данных на этапе изучения данных …"

При анализе временных рядов, как правило, предполагается, что предсказываемый атрибут:

В приведенном списке отметьте задачи интеллектуального анализа данных, относящиеся к классу "обучение без учителя":

Используемый SQL Server 2008 (2008 R2) язык запросов интеллектуального анализа данных называется:

Выберите корректное продолжение утверждения: "Модель, использующая алгоритм Microsoft Neural Network, должна содержать, по крайней мере, …"

В языке DMX, если необходимо преобразовать возвращаемый запросом результат в "плоский" набор строк (к табличному виду), оператор SELECT дополняют инструкцией:

Нейронная сеть, формируемая алгоритмом Microsoft Neural Network, может включать:

Укажите параметр алгоритма Microsoft Decision Trees, который определяет метод, используемый для разбиения узлов (использовать бинарное разбиение или полное):

В алгоритме Microsoft Association Rules минимальное количество элементов, допустимых в наборе, можно указать, используя параметр:

Среди перечисленных средств оценки точности, выберите те, что плохо применимы в случае решения описательных задач интеллектуального анализа:

Для алгоритма Microsoft Time Series параметр PREDICTION_SMOOTHING указывает:

Функция DMX, возвращающая истину, если вариант принадлежит обучающему набору данных, это:

Термин "жесткая кластеризация" означает что:

Ключевые слова WITH DRILLTHROUGH указанные при создании модели означают, что:

Флаг моделирования REGRESSOR указывается:

Тип содержимого key sequence может применяться только:

Выберите наиболее точное утверждение относительно алгоритма Microsoft Naive Bayes:

В приведенном списке отметьте все типы данных, поддерживаемых языком DMX

Среди перечисленных алгоритмов, поддерживаемых Microsoft SQL Server 2008, отметьте те, с помощью которых можно решить задачу классификации (прогнозирования дискретного атрибута):

Создаваемый при проведении интеллектуального анализа средствами Microsoft SQL Server объект, представляющий собой сочетание данных, алгоритма интеллектуального анализа, набора параметров и фильтров, называется:

Деревья решений позволяют решать задачи (отметьте все подходящие варианты):

В приведенном списке отметьте два основных формата представления временных рядов, применяемых в ходе интеллектуального анализа данных:

В алгоритме Apriori и основанном на нем алгоритме Microsoft Association Rules, чтобы оценить взаимную зависимость двух элементов используется показатель importance (важность) Importance({A,B})=1 означает что (выберите наиболее точный ответ):

Для алгоритма Microsoft Logistic Regression параметр HIDDEN_NODE_RATIO

В SQL Server 2008 алгоритм Microsoft Clustering содержит реализацию двух алгоритмов кластеризации:

Отметьте версии Microsoft SQL Server 2008 (2008 R2), в которых поддерживается проведение перекрестной проверки:

У алгоритма Microsoft Clustering есть параметр MINIMUM_SUPPORT Он указывает:

В приведенном списке отметьте службы Microsoft SQL Server 2008 (2008 R2), которые содержат реализацию встроенных алгоритмов Data Mining (выберите один вариант):

Задача нахождения групп схожих элементов может быть решена с помощью алгоритма:

В приведенном списке инструментальных средств, входящих в поставку SQL Server 2008 (2008 R2), выберите основное средство разработки решений в области интеллектуального анализа данных:

Процедуру "очистки" исходных данных рекомендуется производить:

Среди представленных в списке алгоритмов интеллектуального анализа выберите наиболее быстрый (требующий наименьшего количества вычислений):

Явление, заключающееся в том, что модель отлично классифицирует данные из обучающего набора, но имеет невысокую точность прогнозирования для новых данных, принято называть:

В Microsoft SQL Server 2008 учет перекрестного влияния временных рядов производится алгоритмом Microsoft Time Series в случае использования (отметьте все подходящие варианты):

В алгоритме Apriori и основанном на нем алгоритме Microsoft Association Rules для измерения популярности набора элементов используется показатель поддержка (англ support) Поддержка набора элементов {A,B} это:

Тип содержимого key time может применяться только:

Создать новую модель интеллектуального анализа данных в существующей структуре можно с помощью оператора:

Если столбец исходных данных, помещаемых в модель или структуру оператором INSERT INTO, не должен использоваться для заполнения структуры или модели (те пропускается), это указывается с помощью:

В результате выполнения оператора DELETE FROM MINING STRUCTURE <имя структуры>CASES

Чтобы оператор DMX SELECT вернул не весь набор записей, а только первые 5, надо использовать формат:

В приведенном списке отметьте все характерные особенности алгоритма Microsoft Naive Bayes:

Выберите правильное продолжение утверждения: "Параметр FORCE_REGRESSOR, требующий от алгоритма обязательно использовать указанные столбцы в качестве регрессоров …"

В приведенном списке отметьте характерные особенности алгоритма Microsoft Linear Regression:

У алгоритма Microsoft Clustering есть параметр, содержащий признак завершения построения модели - оценку максимального числа вариантов, которые могут изменить свое членство в кластерах Этот параметр называется:

Выберите правильное утверждение относительно алгоритма Microsoft Association Rules:

В алгоритме Microsoft Neural Network соотношение числа скрытых, входных и выходных нейронов указывается с помощью параметра:

Если при создании модели интеллектуального анализа для столбца установлен флаг PREDICT, это означает:

В приведенном списке отметьте характерные особенности алгоритма Microsoft Clustering:

Выберите корректное продолжение фразы "Значения в ключе вложенной таблицы должны быть …"

Выберите наиболее точное утверждение относительно алгоритма Microsoft Linear Regression в SQL Server 2008 (2008 R2):

Выберите наиболее корректное продолжение фразы: "При использовании алгоритма Microsoft Naive Bayes числовые входные параметры…"

В качестве функции активации в алгоритме Microsoft Neural Network скрытые нейроны используют:

Выходной числовой параметр алгоритма Microsoft Decision Trees, может быть …:

Если необходимо удалить модель или структуру из базы данных аналитических служб, надо использовать оператор языка DMX:

Для алгоритма Microsoft Time Series значением по умолчанию параметра FORECAST_METHOD является:

При использовании масштабируемого алгоритма максимизации ожидания на больших объемах данных, в SQL Server 2008 по умолчанию сначала анализируется:

По умолчанию алгоритм Microsoft Clustering использует:

Параметр MAXIMUM_STATES указывает максимальное количество состояний атрибута, поддерживаемое алгоритмом Если количество состояний больше, то алгоритм использует наиболее частые состояния атрибутов и считает остальные состояния отсутствующими Значение по умолчанию для этого параметра алгоритма Microsoft Naive Bayes:

Укажите число стандартных алгоритмов интеллектуального анализа данных, включаемых в поставку SQL Server 2008 (2008 R2):

У алгоритма Microsoft Sequence Clustering есть параметр CLUSTER_COUNT, указывающий примерное количество кластеров, создаваемых алгоритмом Его значение по умолчанию:

Пусть необходимо с помощью оператора INSERT INTO обработать структуру, включающую вложенные таблицы В приведенном списке выберите инструкцию, которую нужно использовать для формирования набора данных, помещаемого в структуру:

У многих встроенных в SQL Server 2008 алгоритмов интеллектуального анализа есть параметр MAXIMUM_INPUT_ATTRIBUTES (максимальное количество входных атрибутов, которые алгоритм может обработать перед вызовом процедуры выбора характеристик) со значением по умолчанию:

В приведенном ниже списке выберите алгоритм интеллектуального анализа данных, результаты работы которого при одинаковых настройках и исходных данных могут отличаться в зависимости от используемой редакции SQL Server

В приведенном списке отметьте задачи интеллектуального анализа данных, относящиеся к классу "обучение с учителем":

Среди перечисленных алгоритмов, поддерживаемых Microsoft SQL Server 2008, отметьте те, с помощью которых можно решить задачу нахождения групп общих элементов в транзакциях (например, товаров, часто встречающихся в "одном чеке" в магазине):

В модели, использующей алгоритм Microsoft Neural Network, вложенная таблица…

Выберите правильное продолжение утверждения относительно алгоритма Microsoft Decision Trees: "Если прогнозируемый атрибут дискретен, а входные данные непрерывны, вход непрерывных столбцов автоматически …":

Оператор CREATE MINING MODEL позволяет:

Выберите корректное продолжение фразы: "В структуре интеллектуального анализа данных можно …"

Внешние приложения могут взаимодействовать со службами Analysis Services, используя протокол:

В качестве функции активации в алгоритме Microsoft Neural Network выходные нейроны используют:

В приведенном ниже списке отметьте алгоритмы интеллектуального анализа данных, включаемые в поставку Microsoft SQL Server 2008 (2008 R2):

Отметьте версии Microsoft SQL Server 2008 (2008 R2), в поставку которых включены стандартные алгоритмы интеллектуального анализа данных:

Выберите наиболее точное продолжение фразы: "Перекрёстная проверка может использоваться для оценки точности модели …"

Алгоритм "к-средних" (c-means) относится к алгоритмам …

Корректно завершите утверждение: "Microsoft Sequence Clustering является гибридным алгоритмом, сочетающим методы кластеризации с…":

Указать, что в структуре интеллектуального анализа необходимо резервировать данные для проверочного набора, можно с помощью ключевых слов:

Пусть мы хотим, чтобы при прогнозирующем соединении автоматически сопоставлялись имена столбцов "исходного" запроса (исходных данных) с совпадающими по именам столбцами модели (те предложение ON можно было бы опустить) Для этого надо использовать инструкцию DMX (выберите наиболее точный вариант):

Чтобы на SQL Server 2008 (2008 R2) создать модель интеллектуального анализа, использующую стандартную реализацию упрощенного алгоритма Байеса, в коде на DMX в качестве названия алгоритма надо указать:

Параметр PERIODICITY_HINT алгоритма Microsoft Time Series позволяет:

Выберите наиболее корректное продолжение фразы "Реализация алгоритма ARIMA добавлена в алгоритм Microsoft Time Series, чтобы улучшить…":

Автоматизировать обновление развернутых в производственной среде моделей интеллектуального анализа данных можно, используя службы:

В приведенном списке выберите корректное утверждение относительно структур и моделей интеллектуального анализа

В языке DMX указывать используемый алгоритм интеллектуального анализа надо (выберите наиболее точный ответ):

Сохранить модель или структуру интеллектуального анализа в файл резервной копии служб Analysis Services можно с помощью инструкции:

Выберите корректное утверждение относительно упрощенного алгоритма Байеса:

Определение методами интеллектуального анализа значения непрерывного числового параметра на основании значений независимых переменных производится при решении задачи:

Ниже перечислены рекомендуемые этапы проведения интеллектуального анализа данных Расставьте их в правильной последовательности. Ответ укажите в виде последовательности чисел, например 654321
  • изучение данных
  • подготовка данных
  • постановка задачи
  • развертывание и обновление моделей
  • построение моделей
  • исследование и проверка моделей
  • Корректно завершите утверждение относительно алгоритмов, входящих в стандартную поставку SQL Server 2008: "Алгоритм логистической регрессии, по сути, является …":

    Для алгоритма Microsoft Time Series параметром MISSING_VALUE_SUBSTITUTION определяется:

    В приведенном списке отметьте типы содержимого (Внимание! Не перепутайте с типами данных!), поддерживаемые языком DMX:

    Если надо гарантировать возможность повторного создания такого же разбиения исходных данных на обучающий и проверочный набор (при условии, что исходные данные остались прежними), при создании структуры…

    В алгоритмах регрессии "регрессором" называется:

    Выберите корректное продолжение фразы: "В SQL Server 2008 (2008 R2) типы содержимого Time и Sequence поддерживаются …"

    В запросах к модели, основанной на алгоритме Microsoft Sequence Clustering, в которых требуется получить наиболее вероятное продолжение последовательности, надо использовать функцию: