Data Mining - ответы
Количество вопросов - 429
Характеристики визуализации:
Информация, данные и знания являются:
Период прогнозирования – это …
На рынке инструментов Business Intelligence в последние годы наблюдается:
Объект относится к кластеру, если …
В синхронных нейронных сетях в каждый момент времени свое состояние меняет...
Данные представляют собой:
Какой из перечисленных этапов является первым в процессе Data Mining?
Какие задачи позволяет решать инструмент KXEN?
Выделите два основных направления Web Mining:
Обучение сетей Кохонена заключается ….
С помощью алгоритма Apriori определите часто встречающиеся наборы в базе данных D, состоящие из трех товаров с минимальной поддержкой, равной 2
База данных DTID | Items |
---|
10 | a,c,d |
20 | b,c,e |
30 | a,b,c,e |
40 | b,e |
Архитектура хранилища типа "звезда" в Deductor называется …
Решаются ли задачи классификации и регрессии при помощи метода "ближайшего соседа"?
Любые, неизвестные ранее сведения о каком-либо событии, сущности, процессе и т.п., являющиеся объектом некоторых операций, для которых существует содержательная интерпретация, являются...
Процедура, которая приводит значения всех преобразованных переменных к единому диапазону значений путем выражения через отношение этих значений к некой величине, отражающей определенные свойства, это – …
Область использования Data Mining …
Что требуется от пользователя при работе с KXEN?
Назовите факторы, обусловившие возникновение и развитие Data Mining:
Задачу классификации нельзя решить с помощью...
Охарактеризуйте слабоструктурированные задачи
Какие из перечисленных алгоритмов PolyAnalyst предназначены для решения задач классификации?
Преимущества использования адаптированного программного обеспечения Data Mining по сравнению с готовыми программными продуктами и их самостоятельным использованием является:
Выберите характеристики математических модулей версии PolyAnalyst 4.6
Данные могут быть получены в результате:
Согласно классификации средств очистки данных инструменты Data Mining относятся к классу …
Цены на инструменты Data Mining уровня отдела находятся в диапазоне:
Задачи классификации решаются следующими алгоритмами:
Вероятность того, что из события A следует событие B. Это - …
Заполните пропуски в формулировке: "… - выходная связь нейрона, с которой сигнал (возбуждения или торможения) поступает на… следующих нейронов"
Подготовка данных в процессе Data Mining является:
В процессе работы Data Mining программы пользователь может получить такие результаты:
Закономерности, найденные в процессе использования технологии Data Mining должны обладать такими свойствами:
Какая из перечисленных ниже групп методов достаточно часто использует для выявления взаимосвязей в данных концепцию усреднения по выборке?
Порядковая шкала – это шкала, содержащая
Для какой шкалы применимы только такие операции как равно, не равно, больше, меньше?
На какие две группы подразделяются методы Data Mining по принципу работы с исходными обучающими данными?
Нейронные сети относятся к группам ...
На стадии свободного поиска осуществляется ...
Регрессионный и дискриминантный анализ …
Нечеткая логика и деревья решений …
В ходе решения какой из перечисленных задач устанавливаются закономерности между связанными событиями в наборе данных?
К классу прогнозирующих задач Data Mining относятся такие задачи:
Правильна ли такая формулировка: "Ассоциация является частным случаем последовательности с временным лагом, равным нулю"?
У основания так называемой информационной пирамиды находится категория …
Процесс классификации состоит из следующих этапов:
Множество примеров, используемое для проверки работы сконструированной модели, называется...
Заполните пропуск в формулировке: "Для проведения ... должны присутствовать признаки, характеризующие группу, к которой принадлежит то или иное событие или объект"
Классификация относится к:
В чем сходство задач классификации и прогнозирования?
Какой из параметров является числом периодов в будущем, которые покрывает прогноз?
Преимуществом визуализации является:
Временной ряд — последовательность наблюдаемых значений какого-либо признака,…
Оцените правильность утверждения: "Визуализация направлена исключительно на совершенствование техники анализа"
Какие задачи возникают перед разработчиками при построении системы Web Mining:
Выделите категории задач Web Mining:
Какая из технологий анализирует массивы неструктурированной информации и одним из ее методов является поиск подстроки в строке?
Технология Web mining применяет технологию Data Mining для анализа:
Выделяют такие основные сферы применения технологии Data Mining:
Характеристики измерения центральной тенденции:
Выберите соответствующую характеристику данному варианту связи: малые значения одного набора связаны с большими значениями другого (отрицательная корреляция), и это…
Какая из перечисленных характеристик не является числом, описывающим определенным способом все значения признака набора данных?
Основные особенности регрессионного анализа заключаются в том, что при его помощи можно получить конкретные сведения о том:
Среднее и медиана являются:
Если зависимая переменная принимает дискретные значения, при помощи метода дерева решений решается задача:
Алгоритмы конструирования деревьев решений ...
Лист дерева решений является …
Заполните пропуски в формулировке: "Каждая ветвь дерева, идущая от внутреннего узла, отмечена … , который может относиться лишь к одному … данного узла"
Внутренние узлы дерева решений называют …
В методе опорных векторов для классификации используется …
Классификация методом опорных векторов считается хорошей, если область между границами …
С помощью метода "ближайшего соседа" возможно решение задач:
Назовите свойства наивной байесовской классификации:
В основе метода опорных векторов лежит …
Группа синапсов нейрона – это …
Нейрон имеет аксон, который представляет собой …
В многослойном персептроне …
Главная функция искусственного нейрона - ...
Целевая функция, требующая минимизации в процессе управляемого обучения нейронной сети – это …
Сеть Кохонена представляет собой …
Самоорганизующиеся сети в процессе обучения подстраиваются …
Сети Кохонена относятся к классу:
При … для каждого обучающего входного примера требуется знание правильного ответа или функции оценки качества ответа
При… раскрывается внутренняя структура данных или корреляции между образцами в наборе данных
Спорный объект кластеризации — это объект, который по мере сходства …
Иерархические агломеративные методы характеризуются …
Работа кластерного анализа опирается на предположения:
Характеристикой каких групп методов являются последовательное объединение исходных элементов и соответствующее уменьшение числа кластеров?
Деление одного кластера на меньшие кластеры, в результате чего образуется последовательность расщепляющих групп. Характеристика каких групп методов описана выше?
Основные меры расстояния между объектами при использовании иерархического метода КА:
Какой метод требует априорной информации о количестве кластеров?
К какой группе методов относится алгоритм PAM (partitioning around Medoids)?
Назовите достоинства алгоритма кластеризации k-средних
Назовите сложности иерархических методов кластеризации:
Транзакция – это множество событий, которые произошли …
Выберите правильное утверждение:
Набор ассоциативных правил представляет интерес, если его поддержка …
Каждый этап работы алгоритма Apriori состоит из таких шагов:
Традиционные методы визуализации могут находить следующее применение:
Традиционные методы визуализации могут находить следующее применение:
Традиционные методы визуализации могут находить следующее применение:
Какие из перечисленных средств визуализации помогают интерпретировать полученный результат?
Визуализация в виде "лиц Чернова" является представлением информации в …
Исходные данные при использовании MOLAP архитектуры хранятся:
Исходные данные при использовании ROLAP архитектуры хранятся...
Привязка ко времени хранилища данных означает, что …
EIS (Execution Information System) или информационные системы руководства в большинстве ориентированы на …, основаны на …
Наличие дубликатов в наборе данных может быть:
Выберите верную(-ые) формулировку(-и).
Если набор данных не упорядочен, то количество данных, которое необходимо иметь для возможности анализа данных:
Существуют такие типы грязных данных:
Ошибки, которые возникают в процессе использования инструментов очистки (являющиеся двумя крайностями очистки данных) — это:
Ошибка Типа 1 возникает в случае, когда …
Качественная программа очистки данных должна иметь такие характеристики:
Автоматизированный процесс очистки данных … к ошибкам в данных, которых раннее в них не было
Прогнозирующие модели Data Mining …
Преимуществом модели является возможность выделить в объекте …
Модель обладает свойством неполноты.
Экзогенные переменные — это переменные, которые …
Какие модели используются для классификации объектов, при условии, что набор целевых классов неизвестен?
На каком этапе пересекается работа специалиста предметной области и специалиста по добыче данных?
Стандарт PMML относится к группе:
Data Mining — это не только инструмент, но также …
Шаги какой из методологий Data Mining здесь описаны: осмысление бизнеса; осмысление данных; подготовка данных; моделирование; оценка результатов; внедрение?
Анализ требований к данным и сбор данных- это точки соприкосновения таких специалистов как:
Цены на инструменты Data Mining уровня предприятия находятся в диапазоне:
Существуют следующие варианты решений по внедрению инструментов Data Mining:
Для использования технологии Data Mining …
Инструмент Weka относится к категории:
Итогом работ по интеллектуальному анализу данных в SAS Enterprise Miner является …
Разработка проектов Data Mining в SAS Enterprise Miner может выполняться:
Процессы в Enterprise Miner могут работать …
Пакет SAS Enterprise Miner …
Назовите характеристики, присущие SAS Enterprise Miner:
Алгоритмы анализа системы PolyAnalyst данных можно объединить в такие группы по их функциональному назначению:
Выберите характеристики математических модулей версии PolyAnalyst 4.6:
Выберите характеристики математических модулей версии PolyAnalyst 4.6:
Какие из перечисленных модулей PolyAnalyst предназначены для построения числовых моделей и прогноза числовых переменных?
Какие из перечисленных характеристик имеет пользовательский интерфейс PolyAnalyst?
В основу программного продукта Cognos 4Thought положена технология …
Рабочее пространство STATISTICA Data Miner не включает такого элемента:
Инструментальное средство для оперативного анализа данных и формирования отчетов по OLAP-технологии:
Назовите характеристики программного продукта Cognos 4Thought:
Oracle Data Mining поставляется как …
Охарактеризуйте особенности работы алгоритмов, реализованных в Oracle Data Mining:
Oracle Data Mining является ... - куда входят ...
Какой компонент KXEN используется в случаях, когда "сырые" данные содержат одновременно статическую информацию (например, возраст, пол или профессия индивида) и динамические переменные (например, шаблоны покупок или транзакции по кредитной карте)?
Существует ли необходимость временного или постоянного копирования данных для анализа в системе KXEN?
Какой компонент KXEN позволяет выявить естественные группы (кластеры) в наборе данных?
Охарактеризуйте квалификацию, которой требуется обладать пользователю для работы с KXEN
На решение каких трудностей направлен усовершенствованный аналитический процесс KXEN?
Постановка бизнес-задачи – это этап, который …
Слабыми сторонами использования готового программного обеспечения могут быть:
Вариант использования адаптированного программного обеспечения Data Mining …
Какую часть мирового рынка Data Mining занимают услуги или консультации по эффективному внедрению этой технологии для решения актуальных бизнес-задач?
Продолжите фразу: "Прогнозирование будет иметь смысл, если горизонт прогнозирования …
Если набор данных упорядочен и в нем присутствует сезонная или цикличная компонента, то каково минимальное количество данных, которое необходимо иметь для возможности анализа?
Согласно таксономии Web Mining выделяют основные направления:
Такие данные как температура воздуха относятся к …
Data Mining — это процесс обнаружения в сырых данных знаний, необходимых для:
Репрезентативность выборки означает, что …
Могут ли отличаться цены на инструменты Data Mining для различных категорий пользователей?
Обучение самоорганизующихся сетей заключается …
На этапе подготовки данных…
Классификационные модели Data Mining …
Какие методы отказываются от определения числа кластеров, а строят полное дерево вложенных кластеров?
Охарактеризуйте пакет STATISTICA Data Miner по возможностям решения задач прогнозирования:
Охарактеризуйте систему STATISTICA:
Основные задачи регрессионного анализа включают:
Наличие блоков динамической задержки и обратных связей - характерная особенность …
Процесс последовательного укрупнения кластеров лежит в основе работы...
Назовите метод, недостаток которого приведен ниже: "Существует сложность выбора меры "близости", от этой меры главным образом зависит объем множества записей, которые нужно хранить в памяти для достижения удовлетворительной классификации или прогноза"
Web content mining подразумевает …
Если модель с успехом используется определенное время, это означает, что …
При анализе данных в Deductor Studio возможны такие действия:
Медианой для выборки 1,__,3,7,10,15,16,18 является:
Интегрированность хранилища данных означает, что …
Качественная программа очистки данных должна:
Набор называют часто встречающимся (frequent), если:
Явление переобучения характеризуется …
Большинство аналитических методов, используемые в технологии Data mining – это …
Совокупность фактов, закономерностей и эвристических правил, с помощью которых решается поставленная задача, – это ...
МАР-сплайны в системе STATISTICA – это …
Назовите алгоритм, который не осуществляет поиск ассоциативных правил:
В результате использования инструментов Data Mining пользователь может …
Оцените правильность утверждения: "Извлечение полезных сведений невозможно без хорошего понимания сути данных"
К какой категории данных относится вес измеряемых объектов:
Какие из перечисленных ниже пунктов являются названиями стадий Data Mining?
Деревья решений относятся к группе (-ам) …
Формирование какой из перечисленных категорий происходит в процессе сбора и передачи данных, т.е. их обработки?
Согласно классификации по стратегиям, задачи Data Mining подразделяются на:
Задачи Data Mining, в зависимости от используемых моделей подразделяются на:
Задачи классификации решаются следующими алгоритмами:
Изначальная предопределенность классов является характеристикой задачи …
Какой из параметров является основной единицей времени, на которую делается прогноз?
Решение задачи прогнозирования ...
Отличием анализа временных рядов от анализа случайных выборок является:
Какое из перечисленных ниже направлений подразумевает обнаружение закономерностей в действиях пользователя web-узла или их группы?
Медианой для выборки 1,2,3,7,10,__,16 является:
Размах и дисперсия являются:
Алгоритм конструирования дерева решений …
Конечный узел дерева решений называют также ...
Какие модели строят деревья решений?
При помощи метода деревьев решений решаются задачи …
На результат классификации в наивно-байесовском подходе влияют:
Назовите метод, недостаток которого приведен ниже: "Перемножать условные вероятности корректно только тогда, когда все входные переменные действительно статистически независимы"
Многослойный персептрон – это сеть …
Слой нейронной сети – это …
Правило формирования окрестности (несколько нейронов, которые окружают нейрон-победитель):
Какое количество слоев имеет сеть Кохонена?
Сети Кохонена относятся к классам:
Работа кластерного анализа опирается на предположения:
Работа кластерного анализа опирается на следующие предположения (выберите неверный ответ):
Назовите характеристики кластерного анализа:
Назовите характеристики кластерного анализа:
При использовании какого метода необходимо задавать количество кластеров?
Пересчет кластерных центров и перераспределение объектов между кластерными центрами – это шаги...
Какой метод рекомендуется использовать при небольших объемах выборки?
Выберите задачу, которая не решается при помощи поиска ассоциативных правил:
Способы визуального представления могут …
Нахождение шумов и выбросов в данных …
Назовите характеристики одной из основных тенденций в области визуализации:
Существенными концепциями системы поддержки принятия решений являются:
Для какого вида набора данных важно определение наличия сезонной компоненты:
Все типы грязных данных в базе данных могут быть автоматически обнаружены и очищены
Специальные средства очистки служат:
Когда речь идет о создании банков данных всего предприятия и, соответственно, о сплошной очистке данных, имеет смысл пользоваться следующими средствами очистки данных:
Инструменты очистки данных обычно выполняют такие функции:
Характеристиками модели являются …
Использование моделей Data Mining позволяет:
Эндогенные переменные — это переменные, которые …
Специалист по анализу данных, который имеет, как минимум, основы статистических знаний и способен применять технологии Data Mining, а также интерпретировать полученные результаты - это...
Специалист, имеющий знания о окружении бизнеса, процессах, заказчиках, клиентах, потребителях, а также конкурентах - это...
Стандарт CWM (Common Warehouse Metamodel) относится к группе:
Какой стандарт обеспечивает возможности обмена моделями данных между программным обеспечением разных разработчиков?
Какой стандарт обеспечивает поддержку наиболее распространенных прогнозных моделей, созданных при помощи алгоритмов и методов анализа данных?
Существуют следующие варианты решений по внедрению инструментов Data Mining:
Существуют следующие варианты решений по внедрению инструментов Data Mining:
Охарактеризуйте рынок программного обеспечения Data Mining:
Позволяет ли пакет Enterprise Miner производить последовательное сравнение моделей?
Выбор лучшей модели в пакете SAS Enterprise Miner:
Решение каких задач предусматривают алгоритмы анализа данных в PolyAnalyst?
Система Cognos PowerPlay – это инструментальное средство, предназначенное для:
Охарактеризуйте систему Cognos Scenario:
Основные группы алгоритмов пакета Deductor:
Основные группы алгоритмов пакета Deductor:
Опишите возможности пакета Deductor по заполнениию пропусков
Какой компонент позволяет автоматически подготовить данные и трансформировать их в формат, подходящий для использования аналитическими приложениями KXEN?
Реинжиниринг аналитического процесса KXEN …
В чем заключается основная особенность инструмента KXEN?
Data Mining-услуги могут предоставляться …
Какое решение в большей мере требует наличия высококвалифицированных специалистов при внедрении и использования инструмента Data Mining?
Сети с обратными связями – это…
Гибкость инструмента Data Mining означает …
Репозитарий моделей в SAS Enterprise Miner представляет собой …
Преимуществом какой группы методов кластеризации является их наглядность и возможность получить детальное представление о структуре данных
На каких этапах 4Thought поддерживает анализ данных?
Какие методы выявляют более высокую устойчивость по отношению к шумам и выбросам, некорректному выбору метрики, включению незначимых переменных в набор, участвующий в кластеризации?
Основные тенденции в области визуализации:
Cognos 4Thought предназначен для …
Какие компоненты входят в состав Deductor?
DSS (Desicion Support System) ориентированы на …, основаны на …
Качественная программа очистки данных должна:
Алгоритмы анализа системы PolyAnalyst данных можно объединить в следующие группы по их функциональному назначению:
Программный продукт SAS Enterprise Miner создан специально для выявления закономерностей в …
Способы визуального представления могут …
Метод, который делает заключения относительно данной ситуации по результатам поиска аналогий, хранящихся в базе прецедентов относится к категории …
На рынке инструментов Data Mining в последние годы наблюдается:
Подход SAS к созданию информационно-аналитических систем предусматривает:
Строка таблицы также известна как:
Data Mining — это процесс обнаружения в сырых данных
Если сравнивать Data Mining, машинное обучение и статистику, какая из дисциплин сконцентрирована на едином процессе анализа данных, включает очистку данных, обучение, интеграцию и визуализацию результатов:
Оцените правильность утверждения:"Data Mining может заменить аналитика"
Для какой шкалы применимы только такие операции как равно и не равно?
Какой из перечисленных ниже пунктов не является названием стадии Data Mining?
В ходе решения каких из перечисленных задач устанавливаются закономерности между событиями, связанными во времени?
Заполните пропуск в формулировке: "Формирование … происходит в процессе сбора и передачи, т.е. обработки данных"
Множество примеров, используемое для конструирования модели, называется...
Основная характеристика задачи бинарной классификации:
Кластер можно охарактеризовать как …
Задачей классификации часто является предсказание …
Продолжите фразу:"Визуализация …
Какой из параметров является частотой, с которой делается новый прогноз?
В чем состоит основное сходство задач прогнозирования и классификации?
В чем состоит основное отличие задач прогнозирования и классификации?
Какие из перечисленных ниже систем используются в подходе, основанном на агентах:
Какие из перечисленных ниже систем используются в подходе, основанном на базах данных:
Процесс создания дерева …
Заполните пропуски в формулировке: "Если зависимая переменная принимает … значения, при помощи метода дерева решений … "
Все переменные являются одинаково важными и статистически независимыми, т.е. значение одной переменной ничего не говорит о значении другой. Это свойства:
Если область между границами пуста, классификация ...
Синхронные и асинхронные сети отличаются:
Ошибкой обучения нейронной сети называется …
Уникальность метода самоорганизующихся карт состоит в …
Чувствительность к выбросам – это недостаток...
Назовите недостатки алгоритма быстрой кластеризации
С помощью алгоритма Apriori определите часто встречающиеся наборы в базе данных D, состоящие из трех товаров с минимальной поддержкой, равной 2
База данных DTID | Items |
---|
10 | l,m,p |
20 | a,d,l |
30 | a,d,l,m |
40 | a,d |
С помощью алгоритма Apriori определите часто встречающиеся наборы в базе данных D, состоящие из трех товаров с минимальной поддержкой, равной 2
База данных DTID | Items |
---|
10 | k,l,m |
20 | l,n,o |
30 | k,l,n,o |
40 | n,o |
Назовите алгоритмы, при помощи которых осуществляется поиск ассоциативных правил:
Количество транзакций, содержащих определенный набор данных. Это - …
Основные тенденции в области визуализации:
Визуализация в виде параллельных координат является представлением информации в …
Назовите существенные характеристики СППР:
Выберите неверную формулировку
При наличии дубликатов в наборе данных следует использовать такой вариант их обработки:
Ваши действия при обнаружении выбросов в наборе данных:
Качество данных – это критерий, определяющий такие качества данных как:
Согласно классификации ошибок в данных, которые возникают в результате использования средств очистки, выделяют такие их классы:
Data Mining — это не только инструмент, но также процесс, который...
Специалист, имеющий знания о том, где и каким образом хранятся данные, как получить к ним доступ, и как связать между собой эти данные - это...
Анализ предметной области и интерпретация результатов, полученных в результате Data Mining - это точки соприкосновения таких специалистов как:
Шаги какой из методологий Data Mining здесь описаны:отбор данных, исследование отношений в данных, модификация данных, моделирование взаимозависимостей, оценка полученных моделей и результатов?
На рынке инструментов Business Intelligence в последние годы наблюдается:
SAS Enterprise Miner относится к категории:
Алгоритмы анализа системы PolyAnalyst данных можно объединить в такие группы по их функциональному назначению:
Возможно ли решение задач поиска ассоциативных правил в PolyAnalyst?
Интеллектуальное инструментальное средство поиска (разведки) данных (Data Mining), которое позволяет руководителям выявлять скрытые тенденции и модели бизнеса и "извлекать на поверхность" его ранее неизвестные закономерности и корреляционные связи:
Oracle Data Mining является …
Последовательность действий, которые необходимо провести для анализа данных, называется в Deductor…
Какие из представленных алгоритмов реализованы в пакете Deductor?
Постановка задачи, построение оптимальной модели, понимание модели, применение результатов. Перечисленные выше этапы являются этапами:
Преимуществами использования готового программного обеспечения являются:
Традиционно темно-синие участки на карте Кохонена соответствуют ...
Какие из перечисленных средств визуализации служат средством оценки качества построенной модели?
На этапе первичного исследования данных …
Стадия свободного поиска представлена действиями:
Заполните пропуск в формулировке: "Корреляционный анализ применяется для … оценки взаимосвязи двух наборов данных, представленных в безразмерном виде"
Готовые алгоритмы, полная конфиденциальность информации, техническая поддержка производителя, общение с другими пользователями пакета - это преимущества использования …
Data Mining консультирование может включать следующие услуги:
Проект в PolyAnalyst объединяет в себе:
Модуль Oracle Data Mining доступен из таких редакций:
Процесс отсечения ветвей или замена некоторых ветвей поддеревом …
Рынок Business Intelligence, в том числе рынок инструментов Data Mining, ...
Какая из перечисленных дисциплин более сосредоточена на теории проверки гипотез?
Номинальная шкала – это шкала,
Частью какой из перечисленных стадий является валидация закономерностей?
Какая из перечисленных ниже стадий может считаться дополнительной или частью одной из основных стадий Data mining:
Большинство методов Data mining были разработаны в рамках …
В результате использования одних и тех же данных и различных методов…
Метод деревьев решений применяется для решения задач …
Возможности визуализации включают:
Если зависимая переменная принимает непрерывные значения, то дерево решений решает задачу:
Использование байесовских сетей имеет следующие преимущества:
В асинхронных сетях в каждый момент времени свое состояние меняет …
Заполните пропуски в формулировке: "В самой распространенной конфигурации входные сигналы обрабатываются …, затем выходной сигнал сумматора поступает в … , где преобразуется функцией активации, и результат подается на …"
Наиболее распространенное применение сетей Кохонена:
Основные тенденции в области визуализации:
Основными тенденциями в области визуализации являются:
Предметная ориентация хранилища данных означает, что …
Если данные являются неупорядоченными, это означает …
Оцените правильность формулировки: "Инструменты Data Mining служат средством очистки данных"
Простота модели в сравнении с исследуемым объектом является …
Data Mining по стандарту CRISP-DM включает следующие фазы:
Инструмент SPSS относится к категории:
Подход SAS к созданию информационно-аналитических систем предусматривает:
Архитектура системы PolyAnalyst …
Инструмент фирмы Cognos, используемый для построения запросов любой сложности и отчетов произвольного формата пользователями, от которых не требуется навыков программирования:
Системы Impromptu, PowerPlay, Scenario и 4Thought являются…
Подготовка данных в KXEN включает следующие этапы :
Построение модели в KXEN можно охарактеризовать как …
Data Mining консультирование может включать следующие услуги:
Выберите характеристику, наиболее подходящую для Data Mining
Охарактеризуйте неструктурированные задачи
Классификация относится к стратегии:
Какая из перечисленных ниже стадий может считаться дополнительной или частью одной из основных стадий Data mining:
Задачей классификации можно назвать предсказание...
Выберите соответствующую характеристику данному варианту связи: большие значения из одного набора данных связаны с большими значениями другого набора (положительная корреляция), и это…
Характеристики вариации данных:
Выберите соответствующую характеристику данному варианту связи: данные двух диапазонов никак не связаны (нулевая корреляция), и это…
При помощи метода деревьев решений могут решаться задачи:
Однонаправленные входные связи, соединенные с выходами других нейронов – это …
Достоверность ассоциативного правила определяет…
Компактное описание закономерностей, присущих исходному набору данных …
Инструменты ETL предназначены:
Ошибка Типа 2 возникает в случае, когда …
Data Mining это … , который должен быть интегрирован в бизнес.
Инструменты Data Mining могут решать …
Выберите пропущенный этап аналитического процесса KXEN: Постановка задачи…Понимание моделиПрименение результатов
Укажите, какие из перечисленных этапов являются этапами подхода KXEN к анализу данных:
Продолжите фразу: "Кластеризация и классификация относятся к...
Web Usage Mining подразумевает …
Внутренний узел дерева решений называют также …
Метод "ближайшего соседа":
Дендрограмма – результат работы …
Создание каких моделей Data Mining означает поиск правил, которые объясняют зависимость выходных параметров от входных?
На каком этапе пересекается работа специалиста предметной области и администратора баз данных?
Закончите фразу: "В процессе обучения сетей Кохонена на входы подаются данные, сеть при этом подстраивается…"
Сети без обратных связей - это …
Как называется характеристика хранилища данных описанная ниже: "Данные объединены в категории и сохраняются соответственно областям, которые они описывают, а не применениям, их использующим"
Прогностическое моделирование включает такие действия:
Назовите причины, из-за которых следует переобучать или обучать модель заново:
Пакет SAS Enterprise Miner особенно удобен для осуществления анализа данных в …
Заполните пропуск в формулировке: "Коэффициент корреляции Пирсона, который является безразмерным индексом в интервале … включительно, отражает степень … зависимости между двумя множествами данных"
Поддержка ассоциативного правила определяет…
СППР — система, предназначенная для поддержки принятия решений в … проблемах различных видов человеческой деятельности, существенная концепцией которой …
Построение моделей Data Mining осуществляется с целью:
Единицей Data Mining исследования в PolyAnalyst является…
Опишите возможности текстового анализа в PolyAnalyst
Достаточно высокая стоимость, невозможность добавлять свои функции, сложность подготовки данных, практическое отсутствие в интерфейсе терминов предметной области – это слабые стороны …
К классу описательных задач Data Mining относятся такие задачи:
Параметрами прогнозирования являются:
Иерархические дивизимные методы характеризуются …
При применении кластерного анализа переменные …
Исходные данные при использовании HOLAP архитектуры хранятся:
Назовите основные концепции хранилища данных:
При использовании какого из перечисленных ниже направлений выделяют подход, основанный на агентах, и подход, основанных на базах данных:
Пакет SAS Enterprise Miner обеспечивает сравнение результатов различных методов моделирования:
Основные группы алгоритмов пакета Deductor:
Медианой для выборки 1,2,3,__,__,15,16,18 является:
К какой группе методов относится метод k-средних?
Интервальная шкала – это шкала,
К какой группе методов относится метод ближнего соседа?
На каком(-их) этапе(-ах) пересекается работа администратора баз данных и специалиста по добыче данных
Перед началом кластеризации все объекты считаются отдельными кластерами, которые в ходе алгоритма объединяются. Это характеристика...
Иерархические алгоритмы применяются для решения задач …
Какое из перечисленных ниже направлений подразумевает автоматический поиск и извлечение качественной информации разнообразных источников Интернета, перегруженных "информационным шумом":