Интеллектуальный анализ данных средствами MS SQL Server 2008 - ответы
Количество вопросов - 96
Для создания временной структуры интеллектуального анализа данных в операторе CREATE MINING STRUCTURE надо использовать ключевое слово:
Выберите наиболее корректное продолжение фразы "При проведении интеллектуального анализа данных на этапе изучения данных …"
При анализе временных рядов, как правило, предполагается, что предсказываемый атрибут:
В приведенном списке отметьте задачи интеллектуального анализа данных, относящиеся к классу "обучение без учителя":
Используемый SQL Server 2008 (2008 R2) язык запросов интеллектуального анализа данных называется:
Выберите корректное продолжение утверждения: "Модель, использующая алгоритм Microsoft Neural Network, должна содержать, по крайней мере, …"
В языке DMX, если необходимо преобразовать возвращаемый запросом результат в "плоский" набор строк (к табличному виду), оператор SELECT дополняют инструкцией:
Нейронная сеть, формируемая алгоритмом Microsoft Neural Network, может включать:
Укажите параметр алгоритма Microsoft Decision Trees, который определяет метод, используемый для разбиения узлов (использовать бинарное разбиение или полное):
В алгоритме Microsoft Association Rules минимальное количество элементов, допустимых в наборе, можно указать, используя параметр:
Среди перечисленных средств оценки точности, выберите те, что плохо применимы в случае решения описательных задач интеллектуального анализа:
Для алгоритма Microsoft Time Series параметр PREDICTION_SMOOTHING указывает:
Функция DMX, возвращающая истину, если вариант принадлежит обучающему набору данных, это:
Термин "жесткая кластеризация" означает что:
Ключевые слова WITH DRILLTHROUGH указанные при создании модели означают, что:
Флаг моделирования REGRESSOR указывается:
Тип содержимого key sequence может применяться только:
Выберите наиболее точное утверждение относительно алгоритма Microsoft Naive Bayes:
В приведенном списке отметьте все типы данных, поддерживаемых языком DMX
Среди перечисленных алгоритмов, поддерживаемых Microsoft SQL Server 2008, отметьте те, с помощью которых можно решить задачу классификации (прогнозирования дискретного атрибута):
Создаваемый при проведении интеллектуального анализа средствами Microsoft SQL Server объект, представляющий собой сочетание данных, алгоритма интеллектуального анализа, набора параметров и фильтров, называется:
Деревья решений позволяют решать задачи (отметьте все подходящие варианты):
В приведенном списке отметьте два основных формата представления временных рядов, применяемых в ходе интеллектуального анализа данных:
В алгоритме Apriori и основанном на нем алгоритме Microsoft Association Rules, чтобы оценить взаимную зависимость двух элементов используется показатель importance (важность) Importance({A,B})=1 означает что (выберите наиболее точный ответ):
Для алгоритма Microsoft Logistic Regression параметр HIDDEN_NODE_RATIO
В SQL Server 2008 алгоритм Microsoft Clustering содержит реализацию двух алгоритмов кластеризации:
Отметьте версии Microsoft SQL Server 2008 (2008 R2), в которых поддерживается проведение перекрестной проверки:
У алгоритма Microsoft Clustering есть параметр MINIMUM_SUPPORT Он указывает:
В приведенном списке отметьте службы Microsoft SQL Server 2008 (2008 R2), которые содержат реализацию встроенных алгоритмов Data Mining (выберите один вариант):
Задача нахождения групп схожих элементов может быть решена с помощью алгоритма:
В приведенном списке инструментальных средств, входящих в поставку SQL Server 2008 (2008 R2), выберите основное средство разработки решений в области интеллектуального анализа данных:
Процедуру "очистки" исходных данных рекомендуется производить:
Среди представленных в списке алгоритмов интеллектуального анализа выберите наиболее быстрый (требующий наименьшего количества вычислений):
Явление, заключающееся в том, что модель отлично классифицирует данные из обучающего набора, но имеет невысокую точность прогнозирования для новых данных, принято называть:
В Microsoft SQL Server 2008 учет перекрестного влияния временных рядов производится алгоритмом Microsoft Time Series в случае использования (отметьте все подходящие варианты):
В алгоритме Apriori и основанном на нем алгоритме Microsoft Association Rules для измерения популярности набора элементов используется показатель поддержка (англ support) Поддержка набора элементов {A,B} это:
Тип содержимого key time может применяться только:
Создать новую модель интеллектуального анализа данных в существующей структуре можно с помощью оператора:
Если столбец исходных данных, помещаемых в модель или структуру оператором INSERT INTO, не должен использоваться для заполнения структуры или модели (те пропускается), это указывается с помощью:
В результате выполнения оператора DELETE FROM MINING STRUCTURE <имя структуры>CASES
Чтобы оператор DMX SELECT вернул не весь набор записей, а только первые 5, надо использовать формат:
В приведенном списке отметьте все характерные особенности алгоритма Microsoft Naive Bayes:
Выберите правильное продолжение утверждения: "Параметр FORCE_REGRESSOR, требующий от алгоритма обязательно использовать указанные столбцы в качестве регрессоров …"
В приведенном списке отметьте характерные особенности алгоритма Microsoft Linear Regression:
У алгоритма Microsoft Clustering есть параметр, содержащий признак завершения построения модели - оценку максимального числа вариантов, которые могут изменить свое членство в кластерах Этот параметр называется:
Выберите правильное утверждение относительно алгоритма Microsoft Association Rules:
В алгоритме Microsoft Neural Network соотношение числа скрытых, входных и выходных нейронов указывается с помощью параметра:
Если при создании модели интеллектуального анализа для столбца установлен флаг PREDICT, это означает:
В приведенном списке отметьте характерные особенности алгоритма Microsoft Clustering:
Выберите корректное продолжение фразы "Значения в ключе вложенной таблицы должны быть …"
Выберите наиболее точное утверждение относительно алгоритма Microsoft Linear Regression в SQL Server 2008 (2008 R2):
Выберите наиболее корректное продолжение фразы: "При использовании алгоритма Microsoft Naive Bayes числовые входные параметры…"
В качестве функции активации в алгоритме Microsoft Neural Network скрытые нейроны используют:
Выходной числовой параметр алгоритма Microsoft Decision Trees, может быть …:
Если необходимо удалить модель или структуру из базы данных аналитических служб, надо использовать оператор языка DMX:
Для алгоритма Microsoft Time Series значением по умолчанию параметра FORECAST_METHOD является:
При использовании масштабируемого алгоритма максимизации ожидания на больших объемах данных, в SQL Server 2008 по умолчанию сначала анализируется:
По умолчанию алгоритм Microsoft Clustering использует:
Параметр MAXIMUM_STATES указывает максимальное количество состояний атрибута, поддерживаемое алгоритмом Если количество состояний больше, то алгоритм использует наиболее частые состояния атрибутов и считает остальные состояния отсутствующими Значение по умолчанию для этого параметра алгоритма Microsoft Naive Bayes:
Укажите число стандартных алгоритмов интеллектуального анализа данных, включаемых в поставку SQL Server 2008 (2008 R2):
У алгоритма Microsoft Sequence Clustering есть параметр CLUSTER_COUNT, указывающий примерное количество кластеров, создаваемых алгоритмом Его значение по умолчанию:
Пусть необходимо с помощью оператора INSERT INTO обработать структуру, включающую вложенные таблицы В приведенном списке выберите инструкцию, которую нужно использовать для формирования набора данных, помещаемого в структуру:
У многих встроенных в SQL Server 2008 алгоритмов интеллектуального анализа есть параметр MAXIMUM_INPUT_ATTRIBUTES (максимальное количество входных атрибутов, которые алгоритм может обработать перед вызовом процедуры выбора характеристик) со значением по умолчанию:
В приведенном ниже списке выберите алгоритм интеллектуального анализа данных, результаты работы которого при одинаковых настройках и исходных данных могут отличаться в зависимости от используемой редакции SQL Server
В приведенном списке отметьте задачи интеллектуального анализа данных, относящиеся к классу "обучение с учителем":
Среди перечисленных алгоритмов, поддерживаемых Microsoft SQL Server 2008, отметьте те, с помощью которых можно решить задачу нахождения групп общих элементов в транзакциях (например, товаров, часто встречающихся в "одном чеке" в магазине):
В модели, использующей алгоритм Microsoft Neural Network, вложенная таблица…
Выберите правильное продолжение утверждения относительно алгоритма Microsoft Decision Trees: "Если прогнозируемый атрибут дискретен, а входные данные непрерывны, вход непрерывных столбцов автоматически …":
Оператор CREATE MINING MODEL позволяет:
Выберите корректное продолжение фразы: "В структуре интеллектуального анализа данных можно …"
Внешние приложения могут взаимодействовать со службами Analysis Services, используя протокол:
В качестве функции активации в алгоритме Microsoft Neural Network выходные нейроны используют:
В приведенном ниже списке отметьте алгоритмы интеллектуального анализа данных, включаемые в поставку Microsoft SQL Server 2008 (2008 R2):
Отметьте версии Microsoft SQL Server 2008 (2008 R2), в поставку которых включены стандартные алгоритмы интеллектуального анализа данных:
Выберите наиболее точное продолжение фразы: "Перекрёстная проверка может использоваться для оценки точности модели …"
Алгоритм "к-средних" (c-means) относится к алгоритмам …
Корректно завершите утверждение: "Microsoft Sequence Clustering является гибридным алгоритмом, сочетающим методы кластеризации с…":
Указать, что в структуре интеллектуального анализа необходимо резервировать данные для проверочного набора, можно с помощью ключевых слов:
Пусть мы хотим, чтобы при прогнозирующем соединении автоматически сопоставлялись имена столбцов "исходного" запроса (исходных данных) с совпадающими по именам столбцами модели (те предложение ON можно было бы опустить) Для этого надо использовать инструкцию DMX (выберите наиболее точный вариант):
Чтобы на SQL Server 2008 (2008 R2) создать модель интеллектуального анализа, использующую стандартную реализацию упрощенного алгоритма Байеса, в коде на DMX в качестве названия алгоритма надо указать:
Параметр PERIODICITY_HINT алгоритма Microsoft Time Series позволяет:
Выберите наиболее корректное продолжение фразы "Реализация алгоритма ARIMA добавлена в алгоритм Microsoft Time Series, чтобы улучшить…":
Автоматизировать обновление развернутых в производственной среде моделей интеллектуального анализа данных можно, используя службы:
В приведенном списке выберите корректное утверждение относительно структур и моделей интеллектуального анализа
В языке DMX указывать используемый алгоритм интеллектуального анализа надо (выберите наиболее точный ответ):
Сохранить модель или структуру интеллектуального анализа в файл резервной копии служб Analysis Services можно с помощью инструкции:
Выберите корректное утверждение относительно упрощенного алгоритма Байеса:
Определение методами интеллектуального анализа значения непрерывного числового параметра на основании значений независимых переменных производится при решении задачи:
Ниже перечислены рекомендуемые этапы проведения интеллектуального анализа данных Расставьте их в правильной последовательности. Ответ укажите в виде последовательности чисел, например 654321 изучение данныхподготовка данныхпостановка задачиразвертывание и обновление моделейпостроение моделейисследование и проверка моделей
Корректно завершите утверждение относительно алгоритмов, входящих в стандартную поставку SQL Server 2008: "Алгоритм логистической регрессии, по сути, является …":
Для алгоритма Microsoft Time Series параметром MISSING_VALUE_SUBSTITUTION определяется:
В приведенном списке отметьте типы содержимого (Внимание! Не перепутайте с типами данных!), поддерживаемые языком DMX:
Если надо гарантировать возможность повторного создания такого же разбиения исходных данных на обучающий и проверочный набор (при условии, что исходные данные остались прежними), при создании структуры…
В алгоритмах регрессии "регрессором" называется:
Выберите корректное продолжение фразы: "В SQL Server 2008 (2008 R2) типы содержимого Time и Sequence поддерживаются …"
В запросах к модели, основанной на алгоритме Microsoft Sequence Clustering, в которых требуется получить наиболее вероятное продолжение последовательности, надо использовать функцию: