База ответов ИНТУИТ

Проектирование хранилищ данных для приложений систем деловой осведомленности (Business Intelligence Systems) - ответы

Количество вопросов - 290

При оптимизации запросов, основанных на вычислении стоимости, отличается от оптимизации, основанной на правилах, в том, что …

К какой нормальной форме приведено исходное отношение?

Исходное отношение:

Преподаватель (Личный_#, Фамилия, Должность, Оклад, Кафедра, Телефон )

Результирующие отношения:/

Преподаватель(Личный_#, Фамилия, Должность, Кафедра)

Должность (Должность, Оклад)

Кафедра (Кафедра, Телефон)

Комментарий к ответу: Отношение Преподаватель содержит транзитивные зависимости: Личный_#→​Кафедра→​Телефон и Личный_#→​Должность→​Оклад. Это может привести к следующим аномалиям:

  • дублирование данных о Телефоне для каждой Кафедры
  • проблема контроля избыточности данных: обновление Телефона
  • проблема нуль-значений: данные о новой Кафедре не могут быть включены до появления первого преподавателя
  • Устранение аномалий заключается в выполнении трех проекций отношения.

    Физическая модель реляционной базы данных есть

    Основными характеристиками таблицы измерений являются следующие:

    Укажите правильное соответствие между этапами бизнес - модели создания хранилища данных и главными задачами каждого этапа.
    ЭтапыЗадача этапа
    1.Формулирование требованийAпроектирование и разработка аналитических отчетов на спроектированной структуре данных.
    2.Создание вычислительной среды для хранилища данныхBформирование программной среды, в которой пользователи будут извлекать данные из ХД и просматривать предопределенные отчеты.
    3.Моделирование данныхCдобиться оптимальной производительности ETL-процессов, производства отчетов и их доставки конечному пользователю.
    4.Определение процедур извлечения, преобразования и загрузки данных Dразработка логической и физической моделей данных для ХД.
    5.Проектирование аналитических отчетов Eидентификация и определение процедур извлечения, очистки (фильтрации), преобразования и загрузки данных.
    6.Разработка приложений хранилища данныхFидентификация требований заказчика ХД и оформление их в виде документа "Каталог требований".
    7.Настройка производительностиGубедиться, что ХД готово к эксплуатации. Как правило, проверка качества выполняется отдельной группой специалистов, не входящих в состав команды разработчиков
    8.Проверка качестваHсоздание информационно-вычислительной среды, в которой будет разрабатываться ХД.

    Укажите правильное соответствие между этапами алгоритма преобразования корпоративной модели в модель хранилища данных и их названиями.
    ЭтапыНаименования этапов
    1.I.AПреобразовать взаимосвязи между данными.
    2.II.BОпределить уровень структуризации (гранулированности) данных в ХД.
    3.III.CОбъединить данные из таблиц корпоративной модели данных в таблицах выбранной схемы ХД.
    4.IV.DВыбрать данные данных корпоративной модели, которые следует хранить в ХД.
    5.V.EНахождение периодических групп данных или массивов данных и представление их в модели ХД.
    6.VI.FДобавить в модель производные элементы данных.
    7.VII.GИсследовать временные зависимости данных и, если необходимо, добавить элемента времени в ключи сущностей ХД.
    8.VIII.HРазделение атрибутов согласно параметрам стабильности.

    Клиентские OLAP-средства представляют собой…

    MOLAP как способ хранения данных …

    Information Liquidity Model (ILM) является графическим инструментом моделирования движения данных, которое позволяет построить модели

    Оператор
    SELECT AVG(Col1) AS "?????" FROM Table WHERE ID BETWEEN MAX(ID) / 2 AND (MAX(ID) / 2) + SIGN(MAX{(ID) +1 % 2)				
    вычисляет …

    Сущности-концентраторы или просто хабы (hubs), являются…

    Какой из ниже перечисленных объектов может быть материальной сущностью?

    Система бизнес–аналитики должна предоставлять…

    Укажите правильное соответствие между предикатами сравнения периодов времени и их определениями. Пусть Р1 есть временной интервал (P1Start, Р1End), а P2 - временной интервал (P2Start, Р2End).
    Темпоральный предикатОпределения
    1."Меньше чем"A(P1End = P2Start – 1) OR (P2End = P1Start – 1)
    2."Предшествует"B(P1Start <= P2Start) OR (P1End <= P2End)
    3."Встречаются"C(P1Start <= P2End) OR (P2Start <=P1End)
    4."Перекрывает"DP1Start < P2Start
    5."Содержится"EP1End < P2Start

    Уровень структуризации данных -

    Основными характеристиками таблицы фактов являются следующие

    Данные в системах складирования данных выступают как …

    Дано отношение ОТГРУЗКА (корабль, дата отправления, грузополучатель, 1 партия грузов, 2 партия грузов, 3 партия грузов, объявленная стоимость, застрахованная стоимость). Использование этого отношения в реляционной базе данных может породить следующие проблемы:

    FASMI означает быстрый анализ разделяемой многомерной информации, включающий следующие требования к приложениям для многомерного анализа …

    Очистку данных можно разделить на следующие типы:

    Сущности должны создаваться в следующем порядке:

    Полуаддитвный факт – это

    Вырожденным измерением называется …

    Оцените в терминах операций ввода вывода следующий запрос, который делает выборку данных из таблиц PRODUCT (50 строк) и VENDOR (1000):
    SELECT VENDOR_CODE, PRODUCT_CODE, PRODUCT_DESCFROM VENDOR, PRODUCTWHERE VENDOR.VENDOR_CODE = PRODUCT.VENDOR_CODE AND VENDOR.VENDOR_CODE = "100";				
    По следующему пути доступа:
  • Ограничение по условию поиска в второй таблице (VENDOR_CODE = "100").
  • Выполнение соединения полученной на 1 шаге результирующей таблицы с таблицей VENDOR.
  • если 20 строк удовлетворяют условиям поиска

    Метаданные хранилища данных определяются как …

    При приятии решении о денормализации определите, что является наиболее важным для приложения базы данных?

    Запрос к схеме "звезда": "Пусть руководству компании требуется отчет о прибыли по всем регионам по всем отделам продаж за 2007-08 гг. без итоговой суммы прибыли". Укажите правильный ответ.

    Классификации метаданных по их функциональному назначению не включает следующий класс …

    Какое свойство не входит в классическое определение хранилища данных?

    Временные метки -

    Данные в информационных системах выступают как …

    Основной целью создания информационных систем является …

    Какое свойство данных является общим для систем складирования данных и операционных систем обработки данных?

    Какое свойство не входит в классическое определение хранилища данных?

    Операционные системы обработки данных создаются с учетом следующих значений параметров:

    Системы складирования данных создаются с учетом следующих значений параметров:

    Среди факторов, влияющих на принятие решений о выборе способа реализации хранилища данных, укажите наиболее критические.

    Аналитические CRM системы собирают информацию

    Укажите правильное соответствие между преимуществами, которые получает организация от внедрения хранилищ данных и их расшифровкой.
    ПреимуществаРасшифровка
    1.Взгляд на данные организации, как на единое целое. AСроки исполнения от 6 месяцев до 2-х лет в зависимости от объема хранилища данных, при следующем распределении затрат: для небольшого подразделения $ 400000-600000, для большого подразделения - $800000-1500000, для большой корпорации - $15000000.
    2.400% возврат инвестиций, вложенный в создание хранилища данных.BАнализ такой информации имеет решающее значение в принятие решений по всем вопросам, связанным с географией бизнеса.
    3.Возрастает надежность данных для принятия решений. CЭто ответы на такие вопросы, как -сколько продуктов реально производится? Что влияет на изменение спроса? Какие товары или услуги приносят наибольший доход? А также особенности и пристрастия своих клиентов.
    4.Геопространственный анализ данных. DДанные, загружаемые в хранилище данных, подвергаются очистке - согласуются, проверяются, уточняются.
    5.Исследование трендов и колебаний в бизнес-данных. организации во времени.EПозволяет достаточно надежно прогнозировать развитие бизнес-процессов

    Укажите, какие из ниже перечисленных компонент не являются составными частями архитектуры хранилища данных?

    К какому из перечисленных методологических подходов к реализации хранилища данных относится следующая характеристика?

    "У него есть и недостатки - данные могут дублироваться и быть несогласованными в разных киосках данных".

    Какие из ниже перечисленных операций не входят в этап проектирования логической модели хранилища данных?

    Какое из ниже перечисленных действий не относится к проверке правильности логической модели хранилища данных?

    Укажите правильное соответствие между этапами бизнес - модели создания хранилища данных и рисками, которые имеют место быть на каждом этапе.
    ЭтапДокументы
    1.Формулирование требованийAИспользование одного сервера БД для моделирования различных вычислительных сред, например, вычислительной среды разработки и вычислительной среды тестирования, или, что еще хуже, для вычислительной среды разработки и вычислительной среды эксплуатации ХД, особенно, если на этом сервере работает уже существующая информационная система.
    2.Создание вычислительной среды для хранилища данныхBКонфликт внутрикорпоративных интересов и в необходимости наладить коммуникации для успешного выполнения и этапа и проекта в целом.
    3.Моделирование данныхCНедооценка временных параметров и стремление команды разработчиков сделать процесс ETL как можно более всеобъемлющим, мотивируя свои действия стремлением обеспечить качество данных
    4.Определение процедур извлечения, преобразования и загрузки данных DСамоуверенность проектировщиков ХД.
    5.Проектирование аналитических отчетов EЛожное представление о достаточной квалификации пользователей ХД в ИТ - технологиях.
    6.Разработка приложений хранилища данныхFНе уделяется достаточного внимания оптимизации времени получения отчета.
    7.Настройка производительностиGЭто люди: их квалификация, амбиции, заинтересованность в деле, мотивы и т.д.
    8.Проверка качестваHИспользование вычислительной среды разработки ХД, которая не масштабируется к вычислительной среде эксплуатации ХД.

    Укажите, какие из ниже перечисленных объектов относятся к результатам проектирования физической модели хранилища данных.

    На этапе формулирования требований к хранилищу данных определяются …

    Термин "Business Intelligence" означает …

    Система деловой осведомленности или бизнес – аналитики (BI System) - …

    Система бизнес-аналитики является …

    При рассмотрении задач безопасности данных следует задаться следующими вопросами:

    Какое из приведенных ниже определений является определением предметной области?

    Какую из перечисленных ситуаций следует отнести к динамической ситуации?

    Укажите правильное соответствие между элементами логической модели и их определениями.
    Элементы моделиОпределения
    1.Отношение (связь)A- это характер участия сущности в связи.
    2.Уникальный идентификатор связиB– это соотношение между числом сущностей, участвующих в образовании связи.
    3.Степень (мощность) связиC– это сущность, которая не может присутствовать в базе данных, пока не существует связанного с ней экземпляра другой сущности.
    4.Класс принадлежности сущностиD– это сущность, которая порождает непересекающиеся подмножества экземпляров (категории сущности), связанных с сущностью через значения своего атрибута.
    5.Рефлексивное отношениеE– это категория порождающей сущности (сущности- супертипа).
    6.Слабая сущностьFпредставляет собой соединение (взаимоотношение) между двумя или более сущностями.
    7.СупертипG- это супертип с порожденными им подтипами.
    8.ПодтипH- это атрибут для однозначной идентификации отношения.
    9.Составная сущностьJ- это отношение, связывающее сущность саму с собой.

    При каких условиях нормализация не нужна?

    Предположим, что атрибуты сущности зависят друг от друга следующим образом из X следует Y, а из Y следует A

    К какой нормальной форме приведено исходное отношение?

    Исходное отношение:

    Курсовой_проект (Преподаватель - Предмет - Студент)

    Иванов - Тема1 - Петрова

    Фролов - Тема1 - Исаев

    Антонов - Тема1 - Сидоров

    Иванов - Тема2 - Ивлева

    Фролов - Тема2 - Степанов

    Фролов - Тема3 - Мусин

    Антонов - Тема3 - Сац

    Результирующие отношения:

    Руководство (Преподаватель, Предмет)

    Выполнение (Студент, Предмет)

    Комментарий к ответу: На роль ключа отношения Курсовой_проект претендует набор атрибутов {Преподаватель, Предмет}. Студент выполняет только один проект, один и тот же проект может выполняться несколькими студентами у разных преподавателей. Отношение содержит следующие ФЗ: {Преподаватель, Предмет} -> Студент и Студент -> Предмет.

    Отношение находится в 3НФ и не содержит частичных и транзитивных ФЗ. Однако наличие ФЗ части составного ключа от неключевого атрибута может привести к следующим аномалиям:

  • проблема контроля избыточности данных: замена студента требует просмотра всего отношения, чтобы изменить данные о преподавателе для него
  • проблема нуль-значений: данные о проекте студента не могут быть внесены, пока не назначен преподаватель
  • Устранение аномалий заключается в удалении ФЗ ключа от неключевого атрибута.

    Рассмотрим схему отношения R(город, адрес, почтовый_индекс). Ключами отношения являются:

    Отметьте характерные основные виды данных для хранилищ данных:

    Гранулярность времени показывает ...

    Установите соответствие между понятиями, связанными с временными метками.
    ПонятиеОпределение
    1.Время фиксации события или фактаA- это временная метка, связанная со временем загрузки данных в ХД.
    2.Время операцииB- это временная метка, представляющая время, когда данные были извлечены или собраны из источника данных.
    3.Время сбора данныхC- это временная метка, представляющая время, когда была выполнена операцию хозяйственной деятельности организации.
    4.Время актуализации данныхD- это временная метка, которая представляет время события или состояния предметной области.

    Упорядоченным темпоральным запросом называется …

    На практике проектировщики темпоральных моделей данных используют следующие классы временной зависимости атрибутов:

    Для группировки классов атрибутов зависимых от времени проектировщиками ХД используется

    Многомерное моделирование является …

    Схема "звезда" имеет …

    Агрегатами являются …

    Таблицей – мостом называется …

    Установите соответствие между объектами реляционной базы данных и их определениями.
    ОбъектОпределение
    1.Кластер А- это группа каталогов, к которым можно обращаться через одно соединение с сервером базы данных
    2.Каталог Б- это базовая структура реляционной базы данных, которая представляет собой единицу хранения данных.
    3.Схема В- это поименованная динамически поддерживаемая СУБД выборка из одной или нескольких таблиц базы данных.
    4.Таблица Г- это группа схем
    5.Представление Д- это контейнер для таблиц, представлений и других структурных элементов реляционной базы данных.
    6.Пользователь Е- это объект, обладающий возможностью создавать или использовать другие объекты базы данных и запрашивать выполнение функций СУБД таких, как организация сеанса работы, изменение состояние базы данных и т. д.
    7.Синоним Ж- это объект базы данных, создаваемый для повышения производительности выборки данных и контроля уникальности первичного ключа (если он задан для таблицы).
    8.Индекс З- это альтернативное имя объекта (псевдоним) реляционной базы данных, которое позволяет иметь доступ к данному объекту

    Какой из перечисленных ниже объектов является обязательным элементам стандарта SQL-92?

    В контексте проектирования физической модели реляционной базы данных ограничение – это …

    Какое из перечисленных ниже бизнес-правил не относится к правилам ссылочной целостности?

    В контексте проектирования физической модели реляционной базы данных имя – это …

    Установите соответствие между типами данных для представления чисел и значениями, которые они определяют.
    Тип данныхЗначение
    1.IntegerАЦелое
    2.Smallint БЧисла с заданной точностью
    3.Number [(точность [, масштаб])]ВЧисла с заданной точностью
    4.Decimal[(точность [, масштаб])]ГМаленькое целое
    5.tinyintДЧисла от 0 до 255
    6.Float (точность)ЕЧисла с плавающей запятой одинарной точности
    7.RealЖЧисла с плавающей запятой заданной точности

    Метаданные хранилища данных отвечают на вопросы …

    Какие из перечисленных ниже функций относятся к основным функциям метаданных в ХД?

    Дополните состав описания преобразований данных, приведенный ниже, из указанного в ответах списка.
  • Идентификацию полей источников данных
  • Соответствие между атрибутами сущностей источников данных и атрибутами объектов ХД
  • Преобразования атрибутов
  • Физические характеристики преобразований
  • Преобразования таблиц кодировки и ссылочных таблиц
  • Алгоритмы трансформации данных и т. д.
  • Логическая структура метаданных измерений, как правило, не включает в себя …

    Установите соответствие между процессом и его определением.
    ПроцессОпределение
    Извлечение данныхAНа этой стадии релевантные данные преобразуются в формат представления данных в ХД, правила преобразования сохраняются в метаданных ХД, формируются ключевые поля таблиц физической структуры ХД, выполняется очистка данных.
    Преобразование данныхBНа этой стадии данные загружаются в ХД, выполняется построение агрегатов.
    Загрузка данныхCНа этой стадии отбираются и описываются данные внешних источников (начинают формироваться метаданные ХД), которые должны быть храниться в ХД (релевантные данные).

    Не корпоративные источники данных: …

    Установите соответствие между дигарммами ILM модели и их определением.
    ПроцессОпределение
    Диаграмма движения данныхA– это диаграмма высокого уровня, которая позволяет моделировать преобразование данных посредством определения
    Диаграмма преобразования данныхB- это диаграмма низкого уровня, которая позволяет моделировать конкретные задачи преобразования посредством определения того, как данные извлекаются из входного источника данных, как преобразуются и как загружаются в выходной источник данных.
    Диаграмма управления преобразованиемC- это диаграмма низкого уровня модели, которая позволяет определить последовательность выполнения серии задач преобразования.

    При проектировании процессов преобразования данных проектировщик ХД должен решить следующие задачи:

    Корпоративная модель данных, как правило, имеет … уровней представления.

    С точки зрения проектирования хранилищ данных корпоративная модель данных содержит в себе …

    Идентификация бизнес- процессов предметной области позволяет определить ….

    Указать трудности применения известных методик проектирования к разработке модели ХД масштаба предприятия с точки зрения проведения нормализации:

    Сущности-связи являются …

    При создании связей в структуре "Свода данных" следует соблюдать Х правил поддержки ссылочной целостности

    Процесс преобразования нормализованной модели в модель "Свод данных" включает следующие этапы:

    Относятся ли следующие правила поддержки ссылочной целостности:

    Какая из ниже перечисленных команд SQL относится к термину запрос?

    Установите соответствие между элементом определения транзакции и его смыслом.
    ЭлементОпределение
    1.Имя транзакции и номер транзакцииАуникальная идентификация каждой транзакции базы данных.
    2.Описание транзакцииБонлайновая транзакция или пакетная транзакция, высокая, средняя, низкая.
    3.Характер транзакции и ее сложностьВперечень операций предметной области, которые выполняются транзакцией.
    4.Объем транзакцииГсредняя частота и пиковая частота использования.
    5.Требования к производительности транзакцииДколичество секунд, необходимое для завершения транзакции в режиме эксплуатации базы данных.
    6.Относительный приоритетЕнасколько важна настоящая транзакция для предметной области по сравнению с другими.
    7.Время выполнения транзакцииЖколичества секунд, требуемых для выполнения транзакции

    В контексте физического проектирования реляционных баз данных денормализация – это …

    Какой из перечисленных ниже факторов не пытаются устранить в процессе денормализации?

    Для случая горизонтального разбиения таблицы в тексте лекции были разобраны примеры поддержки ссылочной целостности для новой таблицы. В качестве какой таблицы выступала таблицы, которая подвергалась разбиению?

    В контексте проектирования физической модели данных ХД кластеризация – это …

    Установите соответствие между терминами и их определениями.
    ТерминОпределение
    1Локально секционированный индекс Аимеет такой же ключ секционирования, количество табличных пространств и правила секционирования, что и отвечающая ему базовая таблица.
    2Глобально секционированный индексБключ секционирования секционирование выполняется по значениям, отличным от значений колонки индексирования.
    3Префиксный секционированный индекс Возначает, что индекс имеет то же число секций и те же правила секционирования, что и его базовая таблица.
    4Непрефиксный секционированный индексГсодержит предложение PARTITION BY RANGE, в котором задаются параметры секционирования, отличные от параметров секционирования соответствующей базовой таблицы.
    5Локально равносекционированный секционированный индекс Гсекционирование производится по ключу секционирования, который содержит основную часть индексного ключа.

    Какой из перечисленных ниже типов колонок является плохим кандидатом для построения индекса?

    Укажите, какое из ниже перечисленных утверждений не относится к недостаткам кластеризации?

    Укажите недостаток секционирование представлений с помощью ограничения CHECK.

    . Рассмотрим базу данных обработки заказов и создадим индексный кластер для хранения одной из таблиц базы данных - Customer.
    CREATE CLUSTER cust_c (cust_id varchar(8))INDEX;CREATE INDEX cust_c_id ON CLUSTER cust_c;CREATE TABLE cust (cust_id 	varchar2(8) NOT NULL REFERENCES customers,ent#		number	NOT NULL,date_ent	date		NOT NULL,comment	varchar2(60)	NOT NULL,…PRIMARY KEY(cust_id, ent#)) CLUSTER cust_c (cust_id);		
    Созданная таблица кластеризована по колонке cust_id, и все специальные записи о клиента в колонке comment будут расположены в одной странице физической базы данных, либо в смежных страницах. Их можно выбрать за одну операцию поиска по индексу:
    SELECT date_ent, comment FROM cust_c WHERE cust_id=:cur_cust;		
    Комментарий. На ограничение первичного ключа в операторе CREATE сделан, чтобы избежать создания второго индекса.

    Является ли такое решение преимуществом с точки зрения утверждения: "Все записи о клиентах выбираются для ежегодного отчета".

    Результат выполнения оператора SELECT называется …

    Запрос к схеме "звезда": "Определить, сколько нереализованных подушек было в сети магазинов торговой организации в январе 2009 года.". Укажите правильный вариант ответа.

    Запрос к схеме "звезда": "Пусть руководству компании требуется отчет о прибыли по всем регионам по всем отделам продаж за 2007-08 гг. без итоговой суммы прибыли". Укажите правильный ответ.

    Запрос к схеме "звезда": "Пусть руководству компании требуется перекрестный отчет о прибыли по всем регионам по всем отделам продаж за 2007-08 гг.". Укажите правильный ответ.

    Задан оператор
    SELECT Time, Region, Department, SUM(Profit) AS Profit FROM sales   GROUP BY Time, ROLLUP (Region, Department);				
    Укажите правильное результирующее множество.

    Окно определяет …

    Оконные функции …

    Оператор
    SELECT OrderID, ProductID, OrderQty	,SUM(OrderQty) OVER(PARTITION BY OrderID) AS 'Итого'	,AVG(OrderQty) OVER(PARTITION BY OrderID) AS 'Среднее'FROM OrderDetailWHERE OrderID IN(43659,43664);			
    вычисляет …

    Задан оператор
    SELECT р_productkey, SUM(s_amount) as 'Суммарное количество',   RANK() OVER (ORDER BY SUM(s_amount) DESC) AS 'rank_all',   DENSE_RANK() OVER (ORDER BY SUM(s_amount) DESC) AS 'rank_dense'FROM salesGROUP BY р_productkey;			
    Укажите правильное результирующее множество.

    Установите соответствие между некоторыми функциями построения линейной регрессии и их определениями.
    ФункцияВозвращаемое значение
    REGR_SLOPEAФункция вычисляет отсечение на оси Y
    REGR_INTERCEPTBФункция вычисляет тангенс угла наклона линии регрессии, соответствующей ненулевым парам (e1, e2).
    REGR_R2CФункция возвращает количество ненулевых пар, которые участвуют в построении линии регрессии.
    REGR_COUNTCФункция вычисляет коэффициент детерминации для линии регрессии (после проверки пар (e1, e2) на нуль).

    Концепция независимости прикладных программ от физической структуры данных не дает следующих преимуществ:

    Оптимизатором запросов называется …

    Оцените в терминах операций ввода вывода следующий запрос, который делает выборку данных из таблиц PRODUCT (50 строк) и VENDOR (1000):
    SELECT VENDOR_CODE, PRODUCT_CODE, PRODUCT_DESCFROM VENDOR, PRODUCTWHERE VENDOR.VENDOR_CODE = PRODUCT.VENDOR_CODE AND VENDOR.VENDOR_CODE = "100";				
    По следующему пути доступа:
  • Формируем декартово произведение таблиц PRODUCT и VENDOR.
  • Ограничиваемся в результирующей таблице строками, которые удовлетворяют условию поиска в предложении WHERE.
  • Выполняем проекцию результирующей таблицы на список колонок, указанный в предложении SELECT.
  • если 20 строк удовлетворяют условиям поиска

    При оптимизации запросов, основанных на правилах, …

    Какие из ниже перечисленных причин приводят к нецелесообразности к созданию индексов для каждого оператора SELECT?

    Серверные OLAP-средства представляют собой …

    HOLAP как способ хранения данных …

    FASMI означает быстрый анализ разделяемой многомерной информации, включающий следующие требования к приложениям для многомерного анализа …

    OLAP хранилища данных заполняются данными из…

    Элементами многомерной диаграммы являются …

    Сбалансированная иерархия – это иерархия, …

    Какое из перечисленных ниже вопросно-ответных отношений нельзя реализовать в информационной системе обслуживания счетов клиентов банка?

    ROLAP как способ хранения данных …

    Задана команда:
    SELECT Time, Region, Department, SUM(Profit) AS Profit,  GROUPING (Time) as T,   GROUPING (Region) as R,   GROUPING (Department) as D  FROM SalesGROUP BY ROLLUP (Time, Region, Department);		
    Какое из ниже перечисленных утверждений является для нее правильным?

    Разбиение сущностей корпоративной модели на транзакционные и не транзакционные позволяет определить …

    Классификации метаданных по их функциональному назначению не включает следующий класс …

    В контексте проектирования физической модели реляционной базы данных домен – это …

    Что не включает типовая модель бизнес-процессов разработки ХД?

    Оптимизация запросов может быть определена как …

    В корпоративную модель данных, как правило, включается …

    Данные, подвергающиеся как процессу сбора, так и преобразования, также образуют "точки риска":

    Сущности-сателлиты содержат...

    Сколько этапов алгоритма преобразования корпоративной модели данных в модель хранилища данных являются обязательными (т.е. практически всегда имеют место быть)?

    Укажите правильное соответствие между типовыми архитектурными элементами логической структуры CIF и их характеристиками
    ЭлементыХарактеристики
    1.Системы, доставшиеся «по наследству» (Legacy Systems)AЗдесь накапливается детальная информация, необходимая для выполнения анализа. Данные перегружаются в корпоративное хранилище из оперативных элементов — унаследованных систем, автоматизированных банковских систем или оперативных складов данных. Как правило обновление информации в EDW происходит с большой задержкой. Для разрешения этой проблемы используются ODS-элементы.
    2.Приложения оперативного управления организацией (OLTP)BПредназначены для хранения аналитической информации уровня подразделения или направления бизнеса.
    3.Оперативные склады данных (Operational Data Store — ODS)CDSS, примером функционала которых могут быть системы анализа клиентской базы банка, обеспечивают поддержку принятия решений. Разнообразный статистический анализ выполняется в DM.
    4.Компоненты преобразования данных (ETL-tools, Staging Area, Near-line Storage)DЭтот элемент наделяется свойствами как оперативных, так и аналитических систем. Основное его назначение — обеспечить осуществление анализа информации практически сразу после ее обновления в оперативных системах
    5.Корпоративное хранилище данных (Enterprise Data Warehouse)EСлужат для перегрузки данных из одних программных компонентов в другие (с промежуточной очисткой и согласованием данных, получаемых из различных источников).
    6.Витрины данных (Data Marts)FПоддерживают бизнес-функции, которые были созданы в организации ранее. В таких системах обычно компоненты, обеспечивающие формирование отчетов и ввод и передачу данных, реализуются в рамках единого программного блока, что затрудняет решение задач по интеграции и преобразованию данных в соответствие с новыми требованиями бизнеса.
    7.Приложения поддержки принятия решений (DSS) и приложения анализа данных (DM)GОбеспечивает публикацию данных в сети Интранет (Интернет), а также обработку результатов ввода информации пользователями.
    8.Инфраструктура сетевых коммуникацийHОбеспечивают быструю обработку данных в рамках бизнес - направлений деятельности организации. Как правило, такие системы приобретаются у компании-разработчика, которая осуществляет их техническую поддержку.

    Какая из ниже перечисленных функций не является функцией системы бизнес - аналитики?

    При проектировании корпоративной модели данных, обычно, предпринимается попытка создать на основе …

    Установите соответствие между объектами реляционной базы данных, относящимися к так называемому серверному коду, и их определениями
    ОбъектОпределение
    1.Хранимая процедураА- это объект базы данных, представляющий поименованный набор команд SQL и/или операторов специализированных языков программирования базы данных
    2.ФункцияБ- это поименованный оператор SQL, который заранее откомпилирован и сохраняется в базе данных. Скорость обработки команды выше, чем у соответствующего ему оператора SQL, т.к. при этом не выполняются фазы синтаксического разбора и компиляции.
    3.Команда В- это объект базы данных, представляющий поименованный набор команд SQL и/или операторов специализированных языков обработки программирования базы данных, который при выполнении возвращает значение - результат вычислений.
    4.Триггер Г- это объект базы данных, который представляет собой специальную хранимую процедуру. Эта процедура запускается автоматически, когда происходит связанное с триггером событие (например, до вставки строки в таблицу).
    5.ТаймерД- это объект базы данных, который состоит из поименованного, структурированного набора переменных, процедур и функций.
    6.ПакетЕ- это триггер, с запускающимся событием таймера.

    Какая из ниже перечисленных команд SQL не относится к командам манипулирования данными?

    Какая характеристика транзакции задается ниже следующей спецификацией? "Онлайновые транзакции низкой сложности должны выполнятся не более 4 с."

    Под корпоративной моделью данных понимают

    Классом временной зависимости называется

    Медленно меняющимся измерениями называются …

    Задан оператор
    SELECT р_productkey, SUM(s_amount) as 'Суммарное количество',   RANK() OVER (ORDER BY SUM(s_amount) DESC) AS 'rank_all',   DENSE_RANK() OVER (ORDER BY SUM(s_amount) DESC) AS 'rank_dense'FROM salesGROUP BY р_productkey;			
    Укажите правильное результирующее множество.

    В контексте проектирования физической модели данных ХД секционирование – это …

    Установите соответствие между ограничениями и их содержанием.
    ОграничениеОписание
    1.CHECKАГарантирует, что колонка всегда содержит значение и оно и уникально в таблице.
    2.DEFAULTБПомещает значение по умолчанию в колонку. Гарантирует, что колонка всегда имеет значение.
    3.FOREING KEYВГарантирует, что значения существую, как значение в колонке первичного ключа другой таблицы. Обеспечивает процедуры удаления дочерних строк при удалении связанных с ней родительских.
    4.NOT NULLГГарантирует, что значение будет уникальным в таблице
    5.PRIMARY KEYДГарантирует, что значения находятся в границах специфицированного интервала, задаваемого предикатом.
    6.UNIQUEЕГарантирует, что колонка всегда содержит значение.

    Метод моделирования "Свод данных" - это…

    Темпоральные базы данных …

    Данные в операционных системах обработки данных выступают как …

    Основной целью создания систем складирования данных является …

    Системы складирования данных создаются с учетом следующих значений параметров:

    Под архитектурой ХД понимают …

    Укажите правильное соответствие между вариантами реализации хранилища данных и их характеристиками
    Варианты реализацииХарактеристики
    1.Виртуальное хранилище данныхAАрхитектура представляет собой единый источник интегрированных данных организации
    2.Глобальное хранилище данныхBАрхитектура является разновидностью глобального ХД, в которую технологически реализуются три уровня (На первом уровне располагается корпоративное ХД организации. На втором уровне поддерживаются связанные киоски данных тематической направленности на основе многомерной СУБД. На третьем уровне находятся клиентские приложения пользователей с установленными на них средствами анализа данных
    3.Хранилища данных с многоуровневой (в основном трехзвенной) архитектурой или корпоративные ХДCАрхитектура обеспечивает доступ к "живым" данным в режиме реального времени через программное обеспечение промежуточного слоя. В основе такого решения лежит репозитарий метаданных, который описывает источники данных, процедуры их предварительной обработки и форматы представления информации конечному пользователю. Недостаток такого решения - интенсивный сетевой трафик, снижение производительности несущей системы, угроза нарушения целостности данных в случае неудачных действий пользователей ХД
    4.Встроенные (комбинированные) хранилища данных. DВ этой архитектуре ХД не является единым физическим репозиторием (в отличие от CIF). Это "виртуальное" ХД, представляющее коллекцию витрин данных, каждая из которых имеет архитектуру типа "звезда".
    5.Корпоративная информационная фабрика (Corporate Information Factory, CIF). EАрхитектура представляет собой ХД, которые органически встраиваются в виртуальное предприятие (Enterprise Information Factory, EIF) или используются как компонент аналитической поддержки в информационной реализации бизнес-функций.
    6.Хранилище данных с архитектурой шины данных (Data Warehouse Bus).FАрхитектура является развитием архитектуры корпоративного ХД (enterprise data warehouse, EDW). Использование данной архитектуры предполагает скоординированное извлечение данных из источников, загрузку их в реляционную БД со структурой в третьей нормальной форме, использование построенного ХД для наполнения дополнительных репозиториев презентационных данных.
    7.Объединенное (федеративное) ХД. GАрхитектура представляет собой облегченный вариант ХД тематической направленности.
    8.Киоски данных.HВ этой архитектуре ХД состоит из ряда экземпляров ХД, которые функционируют на полуавтономной основе и, как правило, организационно или географически разнесены, однако могут рассматриваться и управляться как одно большое ХД.

    К какому из перечисленных методологических подходов к реализации хранилища данных относится следующая характеристика?

    "Достоинством такого подхода является получение более согласованных определений данных и бизнес-правил организации в самом начале работы над созданием ХД. Стоимость начального планирования и проектирования может оказаться достаточно высокой. Для этого подхода характерны большие затраты времени, что откладывает начало реализации и задерживает возврат инвестиций. Этот подход хорошо работает в организациях с хорошо организованной информационно-вычислительной структурой, когда программно-аппаратная платформа определена, существуют слаженно работающие источники данных".

    Укажите правильное соответствие между этапами проектирования хранилища данных и их кратким содержанием.
    ЭтапСодержание
    1.На этапе планирования AРешаются задачи: определение требований владельца ХД; определение требований конечных пользователей; определение технологических требований; определение архитектурных требований
    2.На этапе разработки требованийBРешаются задачи: выбор стратегии реализации и методологии разработки, анализ задач, для решения которых создается ХД, анализ ресурсов разработки с технологической точки зрения и с точки зрения задач бизнеса, выбор архитектуры ХД, определяется бюджет проекта, разрабатываются возможные сценарии использования ХД, начинается сбор метаданных для ХД
    3.На этапе анализаCРешаются задачи разработки физической модели ХД, проектирования процедур поступления данных в него и проектирования архитектуры приложений
    4.На этапе проектированияDРешаются задачи построения согласованной по источникам логической модели и определения набора инструментальных средств для работы с ХД.
    5.На этапе внедренияEРешаются задачи поддержки работоспособности и масштабируемости программно-аппаратного обеспечения ХД; сбора, очистки, преобразования, загрузки и актуализации данных в соответствии с установленными бизнес - процедурами.
    6.На этапе поддержкиFРешаются задачи начальной инсталляции, включающей начальную загрузку хранилища из источников данных, и тестирования процедур обновления и синхронизации данных.

    Обычно информационная пирамида имеет следующие уровни:

    Какая из ниже перечисленных функций является функцией системы бизнес - аналитики?

    При рассмотрении топологии данных с точки зрения безопасности необходимо изучить следующие вопросы:

    Установите соответствие между понятиями, связанными с предметной областью, и их определениями.
    ПонятиеОпределение
    1.Ядро предметной областиAв каждый конкретный момент времени представляет собой выделенную совокупность определенных объектов и ситуаций.
    2.ОбъектBвзаимосвязи, выражающие взаимоотношения между объектами.
    3.Класс ситуацийCявляется результатом абстрагирования реального объекта путем выделения и фиксации набора его свойств.
    4.Состояние предметной области (снимок)Dсовокупность объектов (реалий внешнего мира), о которых можно задавать вопросы.

    Рассмотрим схему отношения ПРЕПОДАВАТЕЛЬ_ПРЕДМЕТ (Личный номер, Предмет, Фамилия, Должность, Оклад, Часы). Ключами отношения являются:

    Учет временных зависимостей проектировщик ХД выполняет посредством

    Неаддитивный факт – это

    Укажите правильное соответствие между таблицами фактов и их определениями.
    Элементы моделиОпределения
    1.Транзакционная таблица фактовAВ такой таблице собирают факты, фиксирующие текущее состояние определенного направления бизнеса.
    2.Таблица фактов куммулятивных моментальных снимковBВ такой таблице фактов сохраняют факты, которые фиксируют определенные события бизнеса.
    3.Таблица фактов периодических моментальных снимковCВ такой таблице собирают факты, фиксирующие некоторое итоговое состояние определенного направления бизнеса на текущий момент времени.

    Таблицей агрегатов фактов называется …

    Логическая структура метаданных фактов, как правило, не включает в себя …

    Корпоративные источники данных …

    Укажите правильное соответствие между этапами алгоритма преобразования корпоративной модели данных в модель хранилища данных и их целями.
    Элементы моделиОпределения
    1.I.AОпределить грануллированость данных для представления фактов модели ХД.
    2.II.BПреобразовать взаимосвязи между данными для представления их в модели ХД.
    3.III.CПеренести атрибуты из таблиц корпоративной модели данных в таблицы ХД.
    4.IV.DОпределить массивы данных модели ХД.
    5.V.EСгруппировать данные по частоте их использования.
    6.VI.FПолучить список сущностей и их атрибутов для представления в модели ХД.
    7.VII.GВыполнить секционирование таблиц ХД.
    8.VIII.HДобавить в модель или определить временные метки для представления истории объектов ХД.

    Выявление отношений "многие ко многим" в корпоративной модели данных позволяют определить …

    Изменения в данных в "Своде данных" собираются …

    Относятся ли следующие правила поддержки ссылочной целостности:

    Установите соответствие между типами денормализации и их определениями.
    Тип денормализацииОпределение
    1.нисходящая денормализация А- это процесс введения избыточных колонок в одной таблице с целью увеличения производительности запроса строки по производному значению.
    2.восходящая денормализация Б– это процесс введения избыточных колонок в родительских таблицах с целью устранения операций соединения с операциями агрегирования.
    3.Внутритабличная денормализация В– это процесс введения избыточных колонок в подчиненных таблицах с целью устранения операций соединения.
    4.Денормализация методом разделяй и властвуй Г– это процесс объединения одной или более нормализованных таблиц с целью устранения операций соединений или уменьшения в некоторых случаях числа операций вставки.
    5.Денормализация методом слияния таблиц Д– это процесс разбиения нормализованной таблицы на две и более таблиц и создание между ними отношения "один к одному" с целью устранения дополнительных операций ввода-вывода или по техническим причинам.

    В контексте физического проектирования реляционных баз данных горизонтальное разбиение таблицы – это …

    Установите соответствие между терминами и их определениями.
    ТерминОпределение
    1Кластер А- это значение колонок, общих для кластеризуемых таблиц.
    2Индексный кластерБ-это кластер, для физической организации которого используется индекс со структурой B-Tree
    3Хеш-кластерВ - это кластер, для физической организации которого использует структура на основе преобразования ключа.
    4Кластерный ключ Г- это группа таблиц, которая разделяет общие физические страницы данных при совместном использовании в запросах общих колонок этих таблиц.

    Укажите, какая модификация индекса со структурой B-Tree не поддерживается в СУБД Oracle?

    Рассмотрим фрагмент определения преставления
    SELECT * FROM east_sales@icp.ac.ru WHERE LOC = 'EAST'UNION ALLSELECT * FROM west_sales@ioc.ac.ru WHERE LOC = 'WEST';		
    Если заменить предложение WHERE на ограничение CHECK, то в таком случае …

    Рассмотрим базу данных обработки заказов и создадим индексный кластер для хранения одной из таблиц базы данных - Customer.
    CREATE CLUSTER cust_c (cust_id varchar(8))INDEX;CREATE INDEX cust_c_id ON CLUSTER cust_c;CREATE TABLE cust (cust_id 	varchar2(8) NOT NULL REFERENCES customers,ent#		number	NOT NULL,date_ent	date		NOT NULL,comment	varchar2(60)	NOT NULL,…PRIMARY KEY(cust_id, ent#)) CLUSTER cust_c (cust_id);		
    Созданная таблица кластеризована по колонке cust_id, и все специальные записи о клиента в колонке comment будут расположены в одной странице физической базы данных, либо в смежных страницах. Их можно выбрать за одну операцию поиска по индексу:
    SELECT date_ent, comment FROM cust_c WHERE cust_id=:cur_cust;		
    Комментарий. На ограничение первичного ключа в операторе CREATE сделан индекс первичного ключа, чтобы избежать создания второго индекса.

    Является ли такое решение преимуществом с точки зрения утверждения: "Строки, имеющие специальные записи о клиенте, имеют более одной записи о клиенте".

    Задан оператор
    SELECT Time, Region, Department, SUM(Profit) AS Profit FROM sales   GROUP BY CUBE(Time, Region, Department);				
    Укажите правильное результирующее множество.

    Секционирование результирующего множества – это …

    Оператор
    SELECT Region. MIN(Population) AS Minimum, MAX(Populations)AS Maximum, AVG(Population) AS Average. VAR(Population) AS VarianceFROM Region GROUP BY Region ORDER BY Maximum DESC;				
    вычисляет …

    Процедурные языки обработки данных требуют …

    Оцените в терминах операций ввода вывода следующий запрос, который делает выборку данных из таблиц PRODUCT (50 строк) и VENDOR (1000):
    SELECT VENDOR_CODE, PRODUCT_CODE, PRODUCT_DESCFROM VENDOR, PRODUCTWHERE VENDOR.VENDOR_CODE = PRODUCT.VENDOR_CODE AND VENDOR.VENDOR_CODE = "100";			
    По следующему пути доступа:
  • Формируем декартово произведение таблиц PRODUCT и VENDOR.
  • Выполняем проекцию результирующей таблицы на список колонок, указанный в предложении SELECT.
  • Ограничиваемся в результирующей таблице строками, которые удовлетворяют условию поиска в предложении WHERE.
  • если 20 строк удовлетворяют условиям поиска

    Какие из ниже перечисленных причин приводят к нецелесообразности к созданию индексов для каждого оператора SELECT?

    Куб данных является …

    Элементами многомерной диаграммы являются …

    В чем состоит эмпирическое правило Д. Энсора?

    Установите соответствие между типами приложений и их определениями.
    Тип приложенияОпределение
    1.OLTP-система А- это такое приложение обработки данных, для которого база данных растет или сжимается в размерах периодически в зависимости от характера обработки данных.
    2.DSS-система Б– это приложение, которое обеспечивает аналитическую обработку данных, включающую математический, статистический или иной анализ данных.
    3.BATCH-системы В– это такое приложение, которое работает с базой данных в не интерактивном режиме.
    4.OLAP-система Г– это такое приложение, которое работает с очень большой базой данных в режиме только чтение.
    5.VCDB-система Д– это такое приложение, которое содержит в основном транзакции вставки, обновления и удаления, с высокой частотой преимущественно транзакций обновления.

    К основным технологическим средствам реализации функциональности систем–бизнес – аналитики не относят …

    Модель проектирования "Свод данных" имеет новые структурные элементы:

    Статистические функции …

    Основной целью систем бизнес – аналитики является …

    Одной из главных целей разработки ХД является

    Установите соответствие между статистическими функциями и их определениями.
    ФункцияВозвращаемое значение
    STDEVAВозвращает статистическое среднеквадратичное отклонение совокупности всех значений в указанном выражении.
    STDEVPBВозвращает статистическую дисперсию для заполнения всех значений в указанном выражении.
    VARCВозвращает статистическую дисперсию всех значений в указанном выражении.
    VARPCВозвращает статистическое стандартное отклонение всех значений в указанном выражении.

    Путь доступа - это …

    Нормализация отношений информационной модели предметной области является

    Числовая мера интенсивности – это

    Для достижения 3НФ необходимо, чтобы:

    Квалифицируемые имена - это

    К какой нормальной форме приведено исходное отношение?

    Исходное отношение:

    Преподаватель (Фамилия, Группа, Предмет )

    Результирующие отношения:

    Преподаватель_группа (Фамилия, Группа )

    Преподаватель_предмет (Фамилия, Предмет )

    Комментарий к ответу: Отношение Преподаватель содержит две многозначные ФЗ: Фамилия ->-> Группа и Фамилия ->-> Предмет. Это приводит к аномалии включения: если у преподавателя появляется новая группа, в отношение приходится добавлять несколько кортежей (по числу читаемых им предметов). Устранение аномалии заключается в выделении МФЗ в отдельное отношение.

    Модель движения данных или ILM модель содержит следующие элементы:

    К основным типам языков манипулирования данными в базах данных относят …

    Какие из перечисленных ниже элементов не являются элементами метаданных ХД?

    Установите соответствие между агрегатной функцией и ее определением.
    ФункцияОпределение
    1AVG(X)АВычисляет среднее значение аргумента, который может быть выражением любого типа.
    2COUNT(X)БВычисляет число итемов.
    3MAX(X)ВВычисляет максимальное значение аргумента, который может быть выражением любого типа.
    4MIN(X)ГВычисляет минимальное значение аргумента, который может быть выражением любого типа.
    5SUM(X)ДВычисляет сумму значений аргумента, который может быть выражением любого типа.
    6STDEV(Х)ЕВычисляет стандартное отклонение на множестве значений аргумента, который может быть выражением любого типа.
    7VAR(X)ЖВычисляет квадрат дисперсии.

    Корпоративная модель данных создается …

    В значения какого типа данных не могут быть преобразованы данные строкового типа?

    Какой вид ограничений не рассматривается в рамках физической модели базы данных?

    Рассмотрим схему отношения ПРОДУКТ (Номер_модели, Производитель, Тип_модели, Цена). Ключами отношения являются:

    Будет ли ниже приведенный запрос при выборке данных обращаться к таблице данных? Колонка Ename проиндексирована.
    SELECT COUNT(*) FROM EMPLOYEE WHERE Ename LIKE 'C%';		

    Аналитические SRM системы предназначены для …

    Укажите ответы на какой вопрос не относится к решению задач управления хранилищем данных?

    Укажите, какие объекты не являются результатами логического проектирования хранилища данных.

    На основе каких понятий аналитик выделяет предметную область базы данных?

    Укажите правильное соответствие между элементами логической модели и их определениями.
    Элементы моделиОпределения
    1.Сущность предметной областиA- это атрибут сущности, позволяющий отличать одну сущность от другой.
    2.Атрибут сущностиB- это атрибут конкретного экземпляра сущности, у которого может быть только одно значение.
    3.Экземпляры сущностиC- это атрибут конкретного экземпляра сущности, у которого может быть несколько значений.
    4.Уникальный идентификатор сущностиD- это класс объектов или явлений предметной области базы данных.
    5.Однозначный атрибутE- это выражение, определяющее значения, разрешенные для данного атрибута; область значений атрибута.
    6.Многозначный атрибутF- это реализации сущности, отличающиеся друг от друга и допускающие однозначную идентификацию.
    7.Домен атрибутаG- это свойство или характеристика сущности.

    Установите правильное соответствие между нормальными формами и некоторыми аспектами их определения.
    Нормальная формаОпределение
    1.Первая нормальная форма (1НФ) Aотношение должно удовлетворять зависимости по соединению относительно своих проекций.
    2.Вторая нормальная форма (2НФ)Bвсе неключевые атрибуты отношения функционально полно зависят от составного ключа отношения; отношение не должно содержать частичных ФЗ.
    3.Третья нормальная форма (3НФ)Cнеключевые атрибуты отношения не зависят от ключей; отношение допускает наличия только таких нетривиальных ФЗ, в которых ключ определяет один или более других атрибутов: из Х следует А, где А не входит в Х, Х включает некоторый ключ.
    4.Нормальная форма Бойса-Кодда (НФБК) Dвсе неключевые атрибуты отношения зависят только от первичного ключа; отношение не должно содержать транзитивных ФЗ неключевых атрибутов от ключа.
    5.Четвертая нормальная форма (4НФ)Eотношение не должно содержать независимых многозначных ФЗ.
    6.Пятая нормальная форма (5НФ) Fвсе атрибуты отношения являются простыми, т.е. не имеют компонентов.

    К какой нормальной форме приведено исходное отношение?

    Исходное отношение:

    Преподаватель_предмет (Личный_#, Предмет, Часы, Фамилия, Должность, Оклад, Кафедра, Телефон )

    Результирующие отношения:

    Преподаватель (Личный_#, Фамилия, Должность, Оклад, Кафедра, Телефон )

    Предмет(Личный_#, Предмет, Часы )

    Комментарий к ответу: Отношение Преподаватель_Предмет содержит частичные ФЗ: пять последних неключевых атрибутов зависят от части ключа Личный_#. Это может привести к следующим аномалиям:

  • дублирование данных о преподавателе в случае, если он читает несколько предметов
  • проблема контроля избыточности данных: обновление значения "Оклад"
  • проблема нуль-значений: данные о преподавателе не могут быть включены, если они в настоящий момент не ведут обучения
  • Устранение аномалий заключается в выполнении двух проекций отношения.

    Архитектура данных -

    Интервальнаяе временная метка отличается от моментной временной метки тем, что …

    Укажите правильное соответствие между подходами к построению логической темпоральной модели данных и их определениями.
    ПодходОпределение
    1.Подход, основанный на накоплении моментальных снимковAсостоит в добавлении временной метки фиксации события (факта) как атрибута экземпляра сущности предметной области и отражении момента времени в таблице БД как истории жизни данных предметной области
    2.Подход, основанный на фиксации событий предметной областиBсостоит в добавлении временных меток для фиксации начала и завершения определенного состояния как атрибутов экземпляра сущности предметной области экземпляров сущности, и отражении моментов времени начала и завершения определенного состояния сущности в таблице БД как истории жизни данных предметной области
    3.Подход, основанный на фиксации состояний предметной областиCсостоит в сборе снимков фрагмента предметной области и накоплении таких снимков в различных фрагментах БД или другой БД как истории жизни данных предметной области

    На основе каких понятий выполняется многомерное моделирование?

    Какой из ниже перечисленных категорий таблиц нет в стандарте SQL-92?

    Какие из перечисленных ниже элементов не являются элементами метаданных ХД?

    Классификации метаданных по их функциональному назначению не включает следующий класс …

    Установите соответствие между процессом и его определением.
    ПроцессОпределение
    Планирование ETL процесса Aвключает разработку и верификацию процесса заполнения статических таблиц измерений, разработку и верификацию механизмов изменения для каждой таблицы измерений.
    Конструирование процесса заполнения таблиц измеренийBвключает в себя разработку диаграммы потоков данных от систем источников, определение преобразований, метода генерации ключей и последовательности операций для каждой таблицы назначения.
    Конструирование процесса заполнения таблиц фактов Cвключает разработку и верификацию процесса первоначального заполнения таблиц фактов, разработку и верификацию процесса периодического дополнения таблиц фактов, построение агрегатов и разработку процедур автоматизации процесса ETL.

    Пусть, для таблицы базы данных EMPLOYEE
    1.Номер личной карточкиEMPNO (PK)
    2.ФамилияENAME
    3.ИмяLNAME
    4.СтраховкаSSECNO
    5.Номер подразделенияDEPNO (FK)
    6.ДолжностьJOB
    7.ВозрастAGE
    8.СтажHIREDATE
    9.ДоплатыCOMM
    10ЗарплатаSAL
    11ШтрафыFINE
    12АвтобиографияBiog
    13ФотографияFoto
    задана следующая матрица распределения (использования) колонок таблицы (пронумерованы) по 10 транзакциям.
    12345678910111213
    1+++++++++++++
    2+++++++++++++
    3+++++++++++++
    4+++++++++++++
    5+++--+--+++--
    6+++--+----+--
    7+++--+---+---
    8+++--+--+----
    9+++-+--------
    10+++-+--------
    Как следует изменить предложенное в примере лекции вертикальное разбиение данной таблицы?

    Запрос к схеме "звезда": "Пусть требуется просмотреть данные о продажах товара с идентификационным номером 33 за месяцы с мая по август текущего года по региону "Москва" с идентификационным номером 81". Укажите правильный вариант ответа.

    Запрос к схеме "звезда": "Пусть руководству компании требуется отчет о прибыли по всем регионам по всем отделам продаж за 2007-08 гг". Укажите правильный ответ.

    Задан оператор
    SELECT Time, Region, Department, SUM(Profit) AS Profit FROM sales   GROUP BY ROLLUP(Time, Region, Department);		
    Укажите правильное результирующее множество.

    К аналитическим функциям в SQL относят …

    Функции ранжирования …

    Задан оператор
    SELECT r_regionkey, p_productkey, s_amount, s_profit,   RANK() OVER (ORDER BY s_amount DESC, s_profit DESC) AS 'Ранг по востоку'FROM region, product, salesWHERE region.r_regionkey = sales.s_regionkey AND product.p_productkey = sales.s_productkey AND r_regionkey = 'Восток';			
    Укажите правильное результирующее множество.

    При оптимизации запросов, основанных на вычислении стоимости, …

    Какие из ниже перечисленных причин приводят к нецелесообразности к созданию индексов для каждого оператора SELECT?

    OLAP можно определить, как.…

    Многомерная диаграмма (multidimensional diagram) представляет собой …

    Элементами многомерной диаграммы являются …

    Укажите правильное соответствие между этапами бизнес - модели создания хранилища данных и документами, которые создаются на каждом этапе.
    ЭтапДокументы
    1.Формулирование требованийAСпецификации на программно-аппаратное обеспечение, а также скрипты и установки для программного обеспечения
    2.Создание вычислительной среды для хранилища данныхBПеречень источников данных и их описание, а также логическая и физическая модели данных.
    3.Моделирование данныхCКаталог требований, утвержденный заказчиком и уточненный план проекта, который точно определяет используемые ресурсы и даты контрольных точек ходы выполнения проекта
    4.Определение процедур извлечения, преобразования и загрузки данных DДокументация, описывающая механизм доставки пользователям отчетов и спецификации экранных форм.
    5.Проектирование аналитических отчетов EСхема соответствия данных подающих систем и ХД, программы или ETL - инструменты.
    6.Разработка приложений хранилища данныхFСпецификация кубов данных (измерения и метрики) и разработанные отчеты.
    7.Настройка производительностиGПлан тестирования ХД и заключение о готовности ХД к эксплуатации.
    8.Проверка качестваHПеречень рекомендаций по настойке производительности.

    В контексте проектирования физической модели данных ХД индексирование – это …

    Какие из перечисленных ниже функций относятся к основным функциям метаданных в ХД?

    Какое из ниже приведенных определений не связано с термином транзакция? Транзакция – это …

    Относятся ли следующие правила поддержки ссылочной целостности:

    Рассмотрим базу данных обработки заказов и создадим индексный кластер для хранения одной из таблиц базы данных - Customer.
    CREATE CLUSTER cust_c (cust_id varchar(8))INDEX;CREATE INDEX cust_c_id ON CLUSTER cust_c;CREATE TABLE cust (cust_id 	varchar2(8) NOT NULL REFERENCES customers,ent#		number	NOT NULL,date_ent	date		NOT NULL,comment	varchar2(60)	NOT NULL,…PRIMARY KEY(cust_id, ent#)) CLUSTER cust_c (cust_id);		
    Созданная таблица кластеризована по колонке cust_id, и все специальные записи о клиента в колонке comment будут расположены в одной странице физической базы данных, либо в смежных страницах. Их можно выбрать за одну операцию поиска по индексу:
    SELECT date_ent, comment FROM cust_c WHERE cust_id=:cur_cust;		
    Комментарий. На ограничение первичного ключа в операторе CREATE сделан индекс первичного ключа, чтобы избежать создания второго индекса.

    Является ли такое решение преимуществом с точки зрения утверждения: "При выборке специальных записей о клиенте для клиента выбираются все такие записи".

    Установите соответствие между понятиями, связанными с многомерным моделированием, и их определениями.
    ПонятиеОпределение
    1.ФактA- это числовая характеристика факта, который определяет эффективность деятельности или бизнес - действия организации с точки зрения измерения.
    2.ИзмерениеB- это интерпретация факта с некоторой точки зрения в реальном мире.
    3.АтрибутC– это описание характеристики реального объекта предметной области.
    4.ПараметрD- это набор связанных элементов данных, содержащих метрики и описательные данные.
    5.ИерархияE– это уровень детализации данных, сохраняемых в ХД.
    6.ГранулированностьF- это отношение часть-целое или родитель - потомок

    Запрос к схеме "звезда": "Пусть руководству компании требуется перекрестный отчет о прибыли по всем регионам по всем отделам продаж за 2007-08 гг без вывода частичных сумм". Укажите правильный ответ.

    Какое свойство данных не характерно для операционных систем обработки данных?

    Какое свойство не входит в классическое определение хранилища данных?

    Операционные системы обработки данных создаются с учетом следующих значений параметров:

    Аналитические SCM системы – это …

    К какому из перечисленных методологических подходов к реализации хранилища данных относится следующая характеристика?

    "Этот подход требует детального планирования и проектирования ХД в рамках ИТ – проекта до начала выполнения проекта".

    Укажите, какие объекты не являются входными данными для проектирования хранилища данных.

    Укажите правильное соответствие между этапами бизнес - модели создания хранилища данных и временными затратами, которые имеют место быть на каждом этапе.
    ЭтапыВременные затраты
    1.Формулирование требованийA- от двух недель до полутора месяцев.
    2.Создание вычислительной среды для хранилища данныхB- от двух недель до двух месяцев.
    3.Моделирование данныхC- от одной недели до полутора месяцев.
    4.Определение процедур извлечения, преобразования и загрузки данных D- от двух недель до двух месяцев.
    5.Проектирование аналитических отчетов E- от одной недели до месяца.
    6.Разработка приложений хранилища данныхFзависит от числа разрабатываемых отчетов.
    7.Настройка производительностиG- от одной до четырех недель.
    8.Проверка качестваHне должно превышать одну-две недели.

    Под жизненным циклом продукта понимается …

    Системы бизнес-аналитики позволяют …

    Временной зависимостью будем называть …

    Установите уровень иерархии объектов реляционной базы данных, согласно стандарту SQL-92.
    Уровень иерархииОбъект
    1.IАКластеры
    2.IIБПредставления
    3.IIIВСтолбцы
    4.IYГТаблицы
    5.IYДКаталоги
    6.VЕСтроки
    7.VЖСхемы

    Для каких из перечисленных ниже объектов реляционной базы данных не используются квалифицируемые имена?

    В реляционной базе данных синоним - это …?

    Какие из перечисленных ниже функций относятся к основным функциям метаданных в ХД?

    Логическая структура метаданных метрик, как правило, не включает в себя …

    Под аббревиатурой ETL — …

    Разработка ETL процесса включает в себя следующие основные стадии:

    "Свод данных" - есть …

    Установите соответствие между терминами и их определениями.
    ТерминОпределение
    1Ключ секционированияАколонка таблицы, относительно значений которых СУБД будет делать физическое разнесение таблицы по различным табличным пространствам на жестких дисках.
    2Секционирование по диапазону Бозначает распределение строк таблицы на различные предопределенные табличные пространства в зависимости от значения ключа секционирования.
    3Хеш-секционирование Возначает, что таблица сначала распределяется среди табличных пространств на основе диапазона значений ключа секционирования, далее каждая из полученных секций диапазонов делится на подчиненные секции или подсекции, и затем строки равномерно распределяются среди подчиненных секций по значению хеш-ключа.
    4Составное секционирование Гозначает равномерное распределение строк таблицы по назначенным табличным пространствам в зависимости от значения ключа секционирования, который в данном случае хешируется.

    Нужно ли в СУБД Oracle при определении кластерного ключа индексного кластера на первичном ключе одной из таблиц оставлять ограничение первичного ключа в определении колонки этого ключа?

    FASMI означает быстрый анализ разделяемой многомерной информации, включающий следующие требования к приложениям для многомерного анализа …:

    Какое свойство данных не характерно для систем складирования данных?

    При конструировании процесса заполнения таблиц фактов проектировщик решает следующие основные задачи:

    Относятся ли следующие правила поддержки ссылочной целостности:

    Элементами многомерной диаграммы являются …

    Сколько основных конструкций используется в логической модели предметной области?

    Темпоральные данные -

    Установите соответствие между фазами обработки команды SQL и действиями СУБД.
    Тип данныхЗначение
    1фаза синтаксического разбораАвключает проверку синтаксиса команды, проверку имен таблиц и колонок в базе данных, а также подготовку исходных данных для оптимизатора.
    2фаза оптимизацииБвключает подстановку действительных имен таблиц и колонок базы данных в представление, идентификацию возможных вариантов выполнения команды, определения стоимости выполнения каждого варианта, выбор наилучшего варианта на основе внутренней статистики.
    3фаза генерации исполняемого кодаВвключает выполнение кода команды.
    4фаза выполнения командыГвключает построение выполняемого кода команды.

    Выделение классов зависимых от времени атрибутов используется проектировщиков ХД для …

    Основной целью создания операционных систем обработки данных является …

    Многомерные "информационные кубы" …

    Какое из ниже перечисленных ограничений не относится к ограничениям целостности данных?

    (data integrity constraints) относятся к значениям данных в некоторых колонках и определяются в спецификации колонки с помощью элементов SQL

    Установите соответствие между терминами и их определениями.
    ТерминОпределение
    1ИндексА- это физический объект реляционной базы данных, организованный по принципу сбалансированной иерархической структуры.
    2Ключевые поля или ключиБ- это колонки, входящие в индекс.
    3Индекс B-Tree В- это объект в реляционной базе данных, который предназначен для организации быстрого доступа к строкам таблицы по значениям одной или более колонок этих строк.
    4Составной индексГ- это индекс типа B-Tree базы данных, который одновременно выполняет роль таблицы.
    5Исключительно индексная таблица Д- это индекс, построенный для нескольких колонок таблицы.
    6Кардинальность колонки Е- это число дискретных различных значений колонки, которые встречаются в строках таблицы.

    Относятся ли следующие правила поддержки ссылочной целостности:

    В контексте физического проектирования реляционных баз данных вертикальное разбиение таблицы – это …

    Укажите, какой вид работы не входит в этап проектирования физической модели хранилища данных

    Укажите правильное соответствие между типами архитектур хранилищ данных и их определениями.
    АрхитектураОпределение
    1.Глобальное хранилище данных (Global data warehouse) или хранилище данных масштаба организацииAуправляются рабочими группами, отделами или направлениями бизнеса, и разрабатываются исключительно для реализации аналитических потребностей последних
    2.Независимые киоски данных (Stand-alone Data Marts)Bуправляются рабочими группами, отделами или направлениями бизнеса, но разрабатываются в рамках единой для организации схемы удовлетворения информационных и аналитических потребностей
    3.Связанные киоски данныхCэто такое ХД, в котором будут поддерживаться все, или большая часть, данных организации

    К основным технологическим средствам реализации функциональности систем–бизнес – аналитики относят …

    Схема "снежинка" имеет …

    При проектировании метаданных хранилища данных не выполняется следующее действие …

    Дополнительными элементами модели "Свод данных" являются …

    Какое из перечисленных ниже словосочетаний не является синонимом?

    Укажите преимущество секционирование представлений с помощью предложения WHERE?

    Рассмотрим базу данных обработки заказов и создадим индексный кластер для хранения одной из таблиц базы данных - Customer.
    CREATE CLUSTER cust_c (cust_id varchar(8))INDEX;CREATE INDEX cust_c_id ON CLUSTER cust_c;CREATE TABLE cust (cust_id 	varchar2(8) NOT NULL REFERENCES customers,ent#		number	NOT NULL,date_ent	date		NOT NULL,comment	varchar2(60)	NOT NULL,…PRIMARY KEY(cust_id, ent#)) CLUSTER cust_c (cust_id);		
    Созданная таблица кластеризована по колонке cust_id, и все специальные записи о клиента в колонке comment будут расположены в одной странице физической базы данных, либо в смежных страницах. Их можно выбрать за одну операцию поиска по индексу:
    SELECT date_ent, comment FROM cust_c WHERE cust_id=:cur_cust;		
    Комментарий. На ограничение первичного ключа в операторе CREATE сделан, чтобы избежать создания второго индекса.

    Является ли такое решение преимуществом с точки зрения утверждения: "Очень немного строк о клиентах имеют специальные записи о клиенте".

    Укажите свойство, которое не является свойством индекса со структурой B-Tree?

    Какие из ниже перечисленных объектов относятся к результатам проектирования логической модели хранилища данных?

    Аддитивный факт - это

    Операционные системы обработки данных создаются с учетом следующих значений параметров:

    Установите соответствие между ранжируюoими функциями и их определениями.
    ФункцияВозвращаемое значение
    RANKAВозвращает ранг строк в секции результирующего набора без промежутков в ранжировании. Ранг строки равен количеству различных значений рангов, предшествующих строке, увеличенному на единицу. Возвращаемый тип данных bigint.
    DENSE_RANKBРаспределяет строки упорядоченной секции в заданное количество групп. Группы нумеруются, начиная с единицы. Для каждой строки функция возвращает номер группы, которой принадлежит строка.
    NTILECВозвращает последовательный номер строки в секции результирующего набора, 1 соответствует первой строке в каждой из секций. Возвращаемый тип данных bigint.
    ROW_NUMBERDВозвращает ранг каждой строки в секции результирующего набора. Ранг строки вычисляется как единица плюс количество рангов, находящихся до этой строки. Возвращаемый тип данных bigint.