База ответов ИНТУИТ

Data Mining - ответы

Количество вопросов - 429

Характеристики визуализации:

Информация, данные и знания являются:

Период прогнозирования – это …

На рынке инструментов Business Intelligence в последние годы наблюдается:

Объект относится к кластеру, если …

В синхронных нейронных сетях в каждый момент времени свое состояние меняет...

Данные представляют собой:

Какой из перечисленных этапов является первым в процессе Data Mining?

Какие задачи позволяет решать инструмент KXEN?

Выделите два основных направления Web Mining:

Обучение сетей Кохонена заключается ….

С помощью алгоритма Apriori определите часто встречающиеся наборы в базе данных D, состоящие из трех товаров с минимальной поддержкой, равной 2
База данных D
TIDItems
10a,c,d
20b,c,e
30a,b,c,e
40b,e

Архитектура хранилища типа "звезда" в Deductor называется …

Решаются ли задачи классификации и регрессии при помощи метода "ближайшего соседа"?

Любые, неизвестные ранее сведения о каком-либо событии, сущности, процессе и т.п., являющиеся объектом некоторых операций, для которых существует содержательная интерпретация, являются...

Процедура, которая приводит значения всех преобразованных переменных к единому диапазону значений путем выражения через отношение этих значений к некой величине, отражающей определенные свойства, это – …

Область использования Data Mining …

Что требуется от пользователя при работе с KXEN?

Назовите факторы, обусловившие возникновение и развитие Data Mining:

Задачу классификации нельзя решить с помощью...

Охарактеризуйте слабоструктурированные задачи

Какие из перечисленных алгоритмов PolyAnalyst предназначены для решения задач классификации?

Преимущества использования адаптированного программного обеспечения Data Mining по сравнению с готовыми программными продуктами и их самостоятельным использованием является:

Выберите характеристики математических модулей версии PolyAnalyst 4.6

Данные могут быть получены в результате:

Согласно классификации средств очистки данных инструменты Data Mining относятся к классу …

Цены на инструменты Data Mining уровня отдела находятся в диапазоне:

Задачи классификации решаются следующими алгоритмами:

Вероятность того, что из события A следует событие B. Это - …

Заполните пропуски в формулировке: "… - выходная связь нейрона, с которой сигнал (возбуждения или торможения) поступает на… следующих нейронов"

Подготовка данных в процессе Data Mining является:

В процессе работы Data Mining программы пользователь может получить такие результаты:

Закономерности, найденные в процессе использования технологии Data Mining должны обладать такими свойствами:

Какая из перечисленных ниже групп методов достаточно часто использует для выявления взаимосвязей в данных концепцию усреднения по выборке?

Объектом не является:

Порядковая шкала – это шкала, содержащая

Данные — это …

Объект описывается как …

Для какой шкалы применимы только такие операции как равно, не равно, больше, меньше?

На какие две группы подразделяются методы Data Mining по принципу работы с исходными обучающими данными?

Нейронные сети относятся к группам ...

На стадии свободного поиска осуществляется ...

Регрессионный и дискриминантный анализ …

Нечеткая логика и деревья решений …

В ходе решения какой из перечисленных задач устанавливаются закономерности между связанными событиями в наборе данных?

К классу прогнозирующих задач Data Mining относятся такие задачи:

Правильна ли такая формулировка: "Ассоциация является частным случаем последовательности с временным лагом, равным нулю"?

У основания так называемой информационной пирамиды находится категория …

Классификация — это ...

Процесс классификации состоит из следующих этапов:

Множество примеров, используемое для проверки работы сконструированной модели, называется...

Заполните пропуск в формулировке: "Для проведения ... должны присутствовать признаки, характеризующие группу, к которой принадлежит то или иное событие или объект"

Классификация относится к:

В чем сходство задач классификации и прогнозирования?

Какой из параметров является числом периодов в будущем, которые покрывает прогноз?

Преимуществом визуализации является:

Временной ряд — последовательность наблюдаемых значений какого-либо признака,…

Оцените правильность утверждения: "Визуализация направлена исключительно на совершенствование техники анализа"

Какие задачи возникают перед разработчиками при построении системы Web Mining:

Выделите категории задач Web Mining:

Какая из технологий анализирует массивы неструктурированной информации и одним из ее методов является поиск подстроки в строке?

Технология Web mining применяет технологию Data Mining для анализа:

Выделяют такие основные сферы применения технологии Data Mining:

Характеристики измерения центральной тенденции:

Выберите соответствующую характеристику данному варианту связи: малые значения одного набора связаны с большими значениями другого (отрицательная корреляция), и это…

Какая из перечисленных характеристик не является числом, описывающим определенным способом все значения признака набора данных?

Основные особенности регрессионного анализа заключаются в том, что при его помощи можно получить конкретные сведения о том:

Среднее и медиана являются:

Если зависимая переменная принимает дискретные значения, при помощи метода дерева решений решается задача:

Алгоритмы конструирования деревьев решений ...

Лист дерева решений является …

Заполните пропуски в формулировке: "Каждая ветвь дерева, идущая от внутреннего узла, отмечена … , который может относиться лишь к одному … данного узла"

Внутренние узлы дерева решений называют …

В методе опорных векторов для классификации используется …

Классификация методом опорных векторов считается хорошей, если область между границами …

С помощью метода "ближайшего соседа" возможно решение задач:

Назовите свойства наивной байесовской классификации:

В основе метода опорных векторов лежит …

Группа синапсов нейрона – это …

Нейрон имеет аксон, который представляет собой …

В многослойном персептроне …

Главная функция искусственного нейрона - ...

Целевая функция, требующая минимизации в процессе управляемого обучения нейронной сети – это …

Сеть Кохонена представляет собой …

Самоорганизующиеся сети в процессе обучения подстраиваются …

Сети Кохонена относятся к классу:

При … для каждого обучающего входного примера требуется знание правильного ответа или функции оценки качества ответа

При… раскрывается внутренняя структура данных или корреляции между образцами в наборе данных

Спорный объект кластеризации — это объект, который по мере сходства …

Иерархические агломеративные методы характеризуются …

Работа кластерного анализа опирается на предположения:

Характеристикой каких групп методов являются последовательное объединение исходных элементов и соответствующее уменьшение числа кластеров?

Деление одного кластера на меньшие кластеры, в результате чего образуется последовательность расщепляющих групп. Характеристика каких групп методов описана выше?

Основные меры расстояния между объектами при использовании иерархического метода КА:

Какой метод требует априорной информации о количестве кластеров?

К какой группе методов относится алгоритм PAM (partitioning around Medoids)?

Назовите достоинства алгоритма кластеризации k-средних

Назовите сложности иерархических методов кластеризации:

Транзакция – это множество событий, которые произошли …

Выберите правильное утверждение:

Набор ассоциативных правил представляет интерес, если его поддержка …

Каждый этап работы алгоритма Apriori состоит из таких шагов:

Традиционные методы визуализации могут находить следующее применение:

Традиционные методы визуализации могут находить следующее применение:

Традиционные методы визуализации могут находить следующее применение:

Какие из перечисленных средств визуализации помогают интерпретировать полученный результат?

Визуализация в виде "лиц Чернова" является представлением информации в …

Исходные данные при использовании MOLAP архитектуры хранятся:

Исходные данные при использовании ROLAP архитектуры хранятся...

Привязка ко времени хранилища данных означает, что …

EIS (Execution Information System) или информационные системы руководства в большинстве ориентированы на …, основаны на …

ROLAP является:

Наличие дубликатов в наборе данных может быть:

Выберите верную(-ые) формулировку(-и).

Если набор данных не упорядочен, то количество данных, которое необходимо иметь для возможности анализа данных:

Существуют такие типы грязных данных:

Ошибки, которые возникают в процессе использования инструментов очистки (являющиеся двумя крайностями очистки данных) — это:

Ошибка Типа 1 возникает в случае, когда …

Качественная программа очистки данных должна иметь такие характеристики:

Автоматизированный процесс очистки данных … к ошибкам в данных, которых раннее в них не было

Прогнозирующие модели Data Mining …

Преимуществом модели является возможность выделить в объекте …

Модель обладает свойством неполноты.

Экзогенные переменные — это переменные, которые …

Какие модели используются для классификации объектов, при условии, что набор целевых классов неизвестен?

На каком этапе пересекается работа специалиста предметной области и специалиста по добыче данных?

Стандарт PMML относится к группе:

Data Mining — это не только инструмент, но также …

Шаги какой из методологий Data Mining здесь описаны: осмысление бизнеса; осмысление данных; подготовка данных; моделирование; оценка результатов; внедрение?

Анализ требований к данным и сбор данных- это точки соприкосновения таких специалистов как:

Цены на инструменты Data Mining уровня предприятия находятся в диапазоне:

Существуют следующие варианты решений по внедрению инструментов Data Mining:

Для использования технологии Data Mining …

Инструмент Weka относится к категории:

Итогом работ по интеллектуальному анализу данных в SAS Enterprise Miner является …

Разработка проектов Data Mining в SAS Enterprise Miner может выполняться:

Процессы в Enterprise Miner могут работать …

Пакет SAS Enterprise Miner …

Назовите характеристики, присущие SAS Enterprise Miner:

Алгоритмы анализа системы PolyAnalyst данных можно объединить в такие группы по их функциональному назначению:

Выберите характеристики математических модулей версии PolyAnalyst 4.6:

Выберите характеристики математических модулей версии PolyAnalyst 4.6:

Какие из перечисленных модулей PolyAnalyst предназначены для построения числовых моделей и прогноза числовых переменных?

Какие из перечисленных характеристик имеет пользовательский интерфейс PolyAnalyst?

В основу программного продукта Cognos 4Thought положена технология …

Рабочее пространство STATISTICA Data Miner не включает такого элемента:

Инструментальное средство для оперативного анализа данных и формирования отчетов по OLAP-технологии:

Назовите характеристики программного продукта Cognos 4Thought:

Deductor Studio …

Oracle Data Mining поставляется как …

Охарактеризуйте особенности работы алгоритмов, реализованных в Oracle Data Mining:

Oracle Data Mining является ... - куда входят ...

Какой компонент KXEN используется в случаях, когда "сырые" данные содержат одновременно статическую информацию (например, возраст, пол или профессия индивида) и динамические переменные (например, шаблоны покупок или транзакции по кредитной карте)?

Существует ли необходимость временного или постоянного копирования данных для анализа в системе KXEN?

Какой компонент KXEN позволяет выявить естественные группы (кластеры) в наборе данных?

Охарактеризуйте квалификацию, которой требуется обладать пользователю для работы с KXEN

На решение каких трудностей направлен усовершенствованный аналитический процесс KXEN?

Постановка бизнес-задачи – это этап, который …

Слабыми сторонами использования готового программного обеспечения могут быть:

Вариант использования адаптированного программного обеспечения Data Mining …

Какую часть мирового рынка Data Mining занимают услуги или консультации по эффективному внедрению этой технологии для решения актуальных бизнес-задач?

Продолжите фразу: "Прогнозирование будет иметь смысл, если горизонт прогнозирования …

Если набор данных упорядочен и в нем присутствует сезонная или цикличная компонента, то каково минимальное количество данных, которое необходимо иметь для возможности анализа?

Согласно таксономии Web Mining выделяют основные направления:

Такие данные как температура воздуха относятся к …

Data Mining — это процесс обнаружения в сырых данных знаний, необходимых для:

Репрезентативность выборки означает, что …

Могут ли отличаться цены на инструменты Data Mining для различных категорий пользователей?

Обучение самоорганизующихся сетей заключается …

На этапе подготовки данных…

Классификационные модели Data Mining …

Какие методы отказываются от определения числа кластеров, а строят полное дерево вложенных кластеров?

Охарактеризуйте пакет STATISTICA Data Miner по возможностям решения задач прогнозирования:

Охарактеризуйте систему STATISTICA:

Основные задачи регрессионного анализа включают:

Наличие блоков динамической задержки и обратных связей - характерная особенность …

Процесс последовательного укрупнения кластеров лежит в основе работы...

Назовите метод, недостаток которого приведен ниже: "Существует сложность выбора меры "близости", от этой меры главным образом зависит объем множества записей, которые нужно хранить в памяти для достижения удовлетворительной классификации или прогноза"

Web content mining подразумевает …

Если модель с успехом используется определенное время, это означает, что …

При анализе данных в Deductor Studio возможны такие действия:

Медианой для выборки 1,__,3,7,10,15,16,18 является:

Интегрированность хранилища данных означает, что …

Качественная программа очистки данных должна:

Набор называют часто встречающимся (frequent), если:

Явление переобучения характеризуется …

Большинство аналитических методов, используемые в технологии Data mining – это …

Совокупность фактов, закономерностей и эвристических правил, с помощью которых решается поставленная задача, – это ...

МАР-сплайны в системе STATISTICA – это …

Назовите алгоритм, который не осуществляет поиск ассоциативных правил:

В результате использования инструментов Data Mining пользователь может …

Оцените правильность утверждения: "Извлечение полезных сведений невозможно без хорошего понимания сути данных"

К какой категории данных относится вес измеряемых объектов:

Какие из перечисленных ниже пунктов являются названиями стадий Data Mining?

Деревья решений относятся к группе (-ам) …

Формирование какой из перечисленных категорий происходит в процессе сбора и передачи данных, т.е. их обработки?

Согласно классификации по стратегиям, задачи Data Mining подразделяются на:

Задачи Data Mining, в зависимости от используемых моделей подразделяются на:

Задачи классификации решаются следующими алгоритмами:

Изначальная предопределенность классов является характеристикой задачи …

Какой из параметров является основной единицей времени, на которую делается прогноз?

Решение задачи прогнозирования ...

Отличием анализа временных рядов от анализа случайных выборок является:

Какое из перечисленных ниже направлений подразумевает обнаружение закономерностей в действиях пользователя web-узла или их группы?

Медианой для выборки 1,2,3,7,10,__,16 является:

Размах и дисперсия являются:

Алгоритм конструирования дерева решений …

Конечный узел дерева решений называют также ...

Какие модели строят деревья решений?

При помощи метода деревьев решений решаются задачи …

На результат классификации в наивно-байесовском подходе влияют:

Назовите метод, недостаток которого приведен ниже: "Перемножать условные вероятности корректно только тогда, когда все входные переменные действительно статистически независимы"

Многослойный персептрон – это сеть …

Слой нейронной сети – это …

Правило формирования окрестности (несколько нейронов, которые окружают нейрон-победитель):

Какое количество слоев имеет сеть Кохонена?

Сети Кохонена относятся к классам:

Работа кластерного анализа опирается на предположения:

Работа кластерного анализа опирается на следующие предположения (выберите неверный ответ):

Назовите характеристики кластерного анализа:

Назовите характеристики кластерного анализа:

При использовании какого метода необходимо задавать количество кластеров?

Пересчет кластерных центров и перераспределение объектов между кластерными центрами – это шаги...

Какой метод рекомендуется использовать при небольших объемах выборки?

Выберите задачу, которая не решается при помощи поиска ассоциативных правил:

Способы визуального представления могут …

Нахождение шумов и выбросов в данных …

Назовите характеристики одной из основных тенденций в области визуализации:

Существенными концепциями системы поддержки принятия решений являются:

Для какого вида набора данных важно определение наличия сезонной компоненты:

Все типы грязных данных в базе данных могут быть автоматически обнаружены и очищены

Постановка задачи …

Специальные средства очистки служат:

Когда речь идет о создании банков данных всего предприятия и, соответственно, о сплошной очистке данных, имеет смысл пользоваться следующими средствами очистки данных:

Инструменты очистки данных обычно выполняют такие функции:

Характеристиками модели являются …

Использование моделей Data Mining позволяет:

Эндогенные переменные — это переменные, которые …

Специалист по анализу данных, который имеет, как минимум, основы статистических знаний и способен применять технологии Data Mining, а также интерпретировать полученные результаты - это...

Специалист, имеющий знания о окружении бизнеса, процессах, заказчиках, клиентах, потребителях, а также конкурентах - это...

Стандарт CWM (Common Warehouse Metamodel) относится к группе:

Какой стандарт обеспечивает возможности обмена моделями данных между программным обеспечением разных разработчиков?

Какой стандарт обеспечивает поддержку наиболее распространенных прогнозных моделей, созданных при помощи алгоритмов и методов анализа данных?

Существуют следующие варианты решений по внедрению инструментов Data Mining:

Существуют следующие варианты решений по внедрению инструментов Data Mining:

Охарактеризуйте рынок программного обеспечения Data Mining:

Позволяет ли пакет Enterprise Miner производить последовательное сравнение моделей?

Выбор лучшей модели в пакете SAS Enterprise Miner:

Решение каких задач предусматривают алгоритмы анализа данных в PolyAnalyst?

Система Cognos PowerPlay – это инструментальное средство, предназначенное для:

Охарактеризуйте систему Cognos Scenario:

Основные группы алгоритмов пакета Deductor:

Основные группы алгоритмов пакета Deductor:

Опишите возможности пакета Deductor по заполнениию пропусков

Какой компонент позволяет автоматически подготовить данные и трансформировать их в формат, подходящий для использования аналитическими приложениями KXEN?

Реинжиниринг аналитического процесса KXEN …

В чем заключается основная особенность инструмента KXEN?

Data Mining-услуги могут предоставляться …

Какое решение в большей мере требует наличия высококвалифицированных специалистов при внедрении и использования инструмента Data Mining?

Сети с обратными связями – это…

Гибкость инструмента Data Mining означает …

Репозитарий моделей в SAS Enterprise Miner представляет собой …

Преимуществом какой группы методов кластеризации является их наглядность и возможность получить детальное представление о структуре данных

На каких этапах 4Thought поддерживает анализ данных?

Какие методы выявляют более высокую устойчивость по отношению к шумам и выбросам, некорректному выбору метрики, включению незначимых переменных в набор, участвующий в кластеризации?

Основные тенденции в области визуализации:

Cognos 4Thought предназначен для …

Какие компоненты входят в состав Deductor?

DSS (Desicion Support System) ориентированы на …, основаны на …

Качественная программа очистки данных должна:

Алгоритмы анализа системы PolyAnalyst данных можно объединить в следующие группы по их функциональному назначению:

Программный продукт SAS Enterprise Miner создан специально для выявления закономерностей в …

Способы визуального представления могут …

Метод, который делает заключения относительно данной ситуации по результатам поиска аналогий, хранящихся в базе прецедентов относится к категории …

На рынке инструментов Data Mining в последние годы наблюдается:

Подход SAS к созданию информационно-аналитических систем предусматривает:

Строка таблицы также известна как:

Data Mining — это процесс обнаружения в сырых данных

Если сравнивать Data Mining, машинное обучение и статистику, какая из дисциплин сконцентрирована на едином процессе анализа данных, включает очистку данных, обучение, интеграцию и визуализацию результатов:

Оцените правильность утверждения:"Data Mining может заменить аналитика"

Для какой шкалы применимы только такие операции как равно и не равно?

Атрибут – это:

Какой из перечисленных ниже пунктов не является названием стадии Data Mining?

В ходе решения каких из перечисленных задач устанавливаются закономерности между событиями, связанными во времени?

Заполните пропуск в формулировке: "Формирование … происходит в процессе сбора и передачи, т.е. обработки данных"

Множество примеров, используемое для конструирования модели, называется...

Основная характеристика задачи бинарной классификации:

Кластер можно охарактеризовать как …

Задачей классификации часто является предсказание …

Продолжите фразу:"Визуализация …

Какой из параметров является частотой, с которой делается новый прогноз?

В чем состоит основное сходство задач прогнозирования и классификации?

В чем состоит основное отличие задач прогнозирования и классификации?

Какие из перечисленных ниже систем используются в подходе, основанном на агентах:

Какие из перечисленных ниже систем используются в подходе, основанном на базах данных:

Процесс создания дерева …

Заполните пропуски в формулировке: "Если зависимая переменная принимает … значения, при помощи метода дерева решений … "

Все переменные являются одинаково важными и статистически независимыми, т.е. значение одной переменной ничего не говорит о значении другой. Это свойства:

Если область между границами пуста, классификация ...

Синхронные и асинхронные сети отличаются:

Ошибкой обучения нейронной сети называется …

Уникальность метода самоорганизующихся карт состоит в …

Кластерный анализ …

Чувствительность к выбросам – это недостаток...

Назовите недостатки алгоритма быстрой кластеризации

С помощью алгоритма Apriori определите часто встречающиеся наборы в базе данных D, состоящие из трех товаров с минимальной поддержкой, равной 2
База данных D
TIDItems
10l,m,p
20a,d,l
30a,d,l,m
40a,d

С помощью алгоритма Apriori определите часто встречающиеся наборы в базе данных D, состоящие из трех товаров с минимальной поддержкой, равной 2
База данных D
TIDItems
10k,l,m
20l,n,o
30k,l,n,o
40n,o

Назовите алгоритмы, при помощи которых осуществляется поиск ассоциативных правил:

Количество транзакций, содержащих определенный набор данных. Это - …

Основные тенденции в области визуализации:

Визуализация в виде параллельных координат является представлением информации в …

MOLAP является:

Назовите существенные характеристики СППР:

Выберите неверную формулировку

При наличии дубликатов в наборе данных следует использовать такой вариант их обработки:

Ваши действия при обнаружении выбросов в наборе данных:

Качество данных – это критерий, определяющий такие качества данных как:

Согласно классификации ошибок в данных, которые возникают в результате использования средств очистки, выделяют такие их классы:

Дескриптивные модели …

Data Mining — это не только инструмент, но также процесс, который...

Специалист, имеющий знания о том, где и каким образом хранятся данные, как получить к ним доступ, и как связать между собой эти данные - это...

Анализ предметной области и интерпретация результатов, полученных в результате Data Mining - это точки соприкосновения таких специалистов как:

Шаги какой из методологий Data Mining здесь описаны:отбор данных, исследование отношений в данных, модификация данных, моделирование взаимозависимостей, оценка полученных моделей и результатов?

На рынке инструментов Business Intelligence в последние годы наблюдается:

Скоринг в SAS – это …

SAS Enterprise Miner относится к категории:

Алгоритмы анализа системы PolyAnalyst данных можно объединить в такие группы по их функциональному назначению:

Возможно ли решение задач поиска ассоциативных правил в PolyAnalyst?

Интеллектуальное инструментальное средство поиска (разведки) данных (Data Mining), которое позволяет руководителям выявлять скрытые тенденции и модели бизнеса и "извлекать на поверхность" его ранее неизвестные закономерности и корреляционные связи:

Oracle Data Mining является …

Последовательность действий, которые необходимо провести для анализа данных, называется в Deductor…

Какие из представленных алгоритмов реализованы в пакете Deductor?

Постановка задачи, построение оптимальной модели, понимание модели, применение результатов. Перечисленные выше этапы являются этапами:

Преимуществами использования готового программного обеспечения являются:

Традиционно темно-синие участки на карте Кохонена соответствуют ...

Какие из перечисленных средств визуализации служат средством оценки качества построенной модели?

На этапе первичного исследования данных …

Стадия свободного поиска представлена действиями:

Заполните пропуск в формулировке: "Корреляционный анализ применяется для … оценки взаимосвязи двух наборов данных, представленных в безразмерном виде"

Готовые алгоритмы, полная конфиденциальность информации, техническая поддержка производителя, общение с другими пользователями пакета - это преимущества использования …

Data Mining консультирование может включать следующие услуги:

Проект в PolyAnalyst объединяет в себе:

Модуль Oracle Data Mining доступен из таких редакций:

Процесс отсечения ветвей или замена некоторых ветвей поддеревом …

Рынок Business Intelligence, в том числе рынок инструментов Data Mining, ...

Какая из перечисленных дисциплин более сосредоточена на теории проверки гипотез?

Номинальная шкала – это шкала,

Частью какой из перечисленных стадий является валидация закономерностей?

Какая из перечисленных ниже стадий может считаться дополнительной или частью одной из основных стадий Data mining:

Большинство методов Data mining были разработаны в рамках …

В результате использования одних и тех же данных и различных методов…

Метод деревьев решений применяется для решения задач …

Возможности визуализации включают:

Если зависимая переменная принимает непрерывные значения, то дерево решений решает задачу:

Использование байесовских сетей имеет следующие преимущества:

В асинхронных сетях в каждый момент времени свое состояние меняет …

Заполните пропуски в формулировке: "В самой распространенной конфигурации входные сигналы обрабатываются …, затем выходной сигнал сумматора поступает в … , где преобразуется функцией активации, и результат подается на …"

Наиболее распространенное применение сетей Кохонена:

Основные тенденции в области визуализации:

Основными тенденциями в области визуализации являются:

Предметная ориентация хранилища данных означает, что …

Если данные являются неупорядоченными, это означает …

Оцените правильность формулировки: "Инструменты Data Mining служат средством очистки данных"

Простота модели в сравнении с исследуемым объектом является …

Data Mining по стандарту CRISP-DM включает следующие фазы:

Инструмент SPSS относится к категории:

Подход SAS к созданию информационно-аналитических систем предусматривает:

Архитектура системы PolyAnalyst …

Инструмент фирмы Cognos, используемый для построения запросов любой сложности и отчетов произвольного формата пользователями, от которых не требуется навыков программирования:

Системы Impromptu, PowerPlay, Scenario и 4Thought являются…

Подготовка данных в KXEN включает следующие этапы :

Построение модели в KXEN можно охарактеризовать как …

Data Mining консультирование может включать следующие услуги:

Выберите характеристику, наиболее подходящую для Data Mining

Охарактеризуйте неструктурированные задачи

Классификация относится к стратегии:

Какая из перечисленных ниже стадий может считаться дополнительной или частью одной из основных стадий Data mining:

Задачей классификации можно назвать предсказание...

Выберите соответствующую характеристику данному варианту связи: большие значения из одного набора данных связаны с большими значениями другого набора (положительная корреляция), и это…

Характеристики вариации данных:

Выберите соответствующую характеристику данному варианту связи: данные двух диапазонов никак не связаны (нулевая корреляция), и это…

При помощи метода деревьев решений могут решаться задачи:

Однонаправленные входные связи, соединенные с выходами других нейронов – это …

Достоверность ассоциативного правила определяет…

Компактное описание закономерностей, присущих исходному набору данных …

Инструменты ETL предназначены:

Ошибка Типа 2 возникает в случае, когда …

Data Mining это … , который должен быть интегрирован в бизнес.

Инструменты Data Mining могут решать …

Выберите пропущенный этап аналитического процесса KXEN:
  • Постановка задачи
  • Понимание модели
  • Применение результатов
  • Укажите, какие из перечисленных этапов являются этапами подхода KXEN к анализу данных:

    Продолжите фразу: "Кластеризация и классификация относятся к...

    Web Usage Mining подразумевает …

    Внутренний узел дерева решений называют также …

    Метод "ближайшего соседа":

    Дендрограмма – результат работы …

    Создание каких моделей Data Mining означает поиск правил, которые объясняют зависимость выходных параметров от входных?

    На каком этапе пересекается работа специалиста предметной области и администратора баз данных?

    Закончите фразу: "В процессе обучения сетей Кохонена на входы подаются данные, сеть при этом подстраивается…"

    Сети без обратных связей - это …

    Как называется характеристика хранилища данных описанная ниже: "Данные объединены в категории и сохраняются соответственно областям, которые они описывают, а не применениям, их использующим"

    Прогностическое моделирование включает такие действия:

    Назовите причины, из-за которых следует переобучать или обучать модель заново:

    Пакет SAS Enterprise Miner особенно удобен для осуществления анализа данных в …

    Заполните пропуск в формулировке: "Коэффициент корреляции Пирсона, который является безразмерным индексом в интервале … включительно, отражает степень … зависимости между двумя множествами данных"

    Поддержка ассоциативного правила определяет…

    СППР — система, предназначенная для поддержки принятия решений в … проблемах различных видов человеческой деятельности, существенная концепцией которой …

    Построение моделей Data Mining осуществляется с целью:

    Единицей Data Mining исследования в PolyAnalyst является…

    Опишите возможности текстового анализа в PolyAnalyst

    Достаточно высокая стоимость, невозможность добавлять свои функции, сложность подготовки данных, практическое отсутствие в интерфейсе терминов предметной области – это слабые стороны …

    К классу описательных задач Data Mining относятся такие задачи:

    Параметрами прогнозирования являются:

    Иерархические дивизимные методы характеризуются …

    При применении кластерного анализа переменные …

    Исходные данные при использовании HOLAP архитектуры хранятся:

    Назовите основные концепции хранилища данных:

    При использовании какого из перечисленных ниже направлений выделяют подход, основанный на агентах, и подход, основанных на базах данных:

    Пакет SAS Enterprise Miner обеспечивает сравнение результатов различных методов моделирования:

    Основные группы алгоритмов пакета Deductor:

    Медианой для выборки 1,2,3,__,__,15,16,18 является:

    К какой группе методов относится метод k-средних?

    Интервальная шкала – это шкала,

    К какой группе методов относится метод ближнего соседа?

    На каком(-их) этапе(-ах) пересекается работа администратора баз данных и специалиста по добыче данных

    Перед началом кластеризации все объекты считаются отдельными кластерами, которые в ходе алгоритма объединяются. Это характеристика...

    Инструменты Data Mining:

    Иерархические алгоритмы применяются для решения задач …

    Какое из перечисленных ниже направлений подразумевает автоматический поиск и извлечение качественной информации разнообразных источников Интернета, перегруженных "информационным шумом":