Проектирование хранилищ данных для приложений систем деловой осведомленности (Business Intelligence Systems)

При оптимизации запросов, основанных на вычислении стоимости, отличается от оптимизации, основанной на правилах, в том, что …

К какой нормальной форме приведено исходное отношение?
Исходное отношение:

Преподаватель (Личный_#, Фамилия, Должность, Оклад, Кафедра, Телефон )

Результирующие отношения:/

Преподаватель(Личный_#, Фамилия, Должность, Кафедра)

Должность (Должность, Оклад)

Кафедра (Кафедра, Телефон)

Комментарий к ответу: Отношение Преподаватель содержит транзитивные зависимости: Личный_#→Кафедра→Телефон и Личный_#→Должность→Оклад. Это может привести к следующим аномалиям:

дублирование данных о Телефоне для каждой Кафедры
проблема контроля избыточности данных: обновление Телефона
проблема нуль-значений: данные о новой Кафедре не могут быть включены до появления первого преподавателя

Устранение аномалий заключается в выполнении трех проекций отношения.

Физическая модель реляционной базы данных есть

Основными характеристиками таблицы измерений являются следующие:

Укажите правильное соответствие между этапами бизнес - модели создания хранилища данных и главными задачами каждого этапа.
Этапы Задача этапа
1. Формулирование требований A проектирование и разработка аналитических отчетов на спроектированной структуре данных.
2. Создание вычислительной среды для хранилища данных B формирование программной среды, в которой пользователи будут извлекать данные из ХД и просматривать предопределенные отчеты.
3. Моделирование данных C добиться оптимальной производительности ETL-процессов, производства отчетов и их доставки конечному пользователю.
4. Определение процедур извлечения, преобразования и загрузки данных D разработка логической и физической моделей данных для ХД.
5. Проектирование аналитических отчетов E идентификация и определение процедур извлечения, очистки (фильтрации), преобразования и загрузки данных.
6. Разработка приложений хранилища данных F идентификация требований заказчика ХД и оформление их в виде документа "Каталог требований".
7. Настройка производительности G убедиться, что ХД готово к эксплуатации. Как правило, проверка качества выполняется отдельной группой специалистов, не входящих в состав команды разработчиков
8. Проверка качества H создание информационно-вычислительной среды, в которой будет разрабатываться ХД.

	Этапы		Задача этапа
1.	Формулирование требований	A	проектирование и разработка аналитических отчетов на спроектированной структуре данных.
2.	Создание вычислительной среды для хранилища данных	B	формирование программной среды, в которой пользователи будут извлекать данные из ХД и просматривать предопределенные отчеты.
3.	Моделирование данных	C	добиться оптимальной производительности ETL-процессов, производства отчетов и их доставки конечному пользователю.
4.	Определение процедур извлечения, преобразования и загрузки данных	D	разработка логической и физической моделей данных для ХД.
5.	Проектирование аналитических отчетов	E	идентификация и определение процедур извлечения, очистки (фильтрации), преобразования и загрузки данных.
6.	Разработка приложений хранилища данных	F	идентификация требований заказчика ХД и оформление их в виде документа "Каталог требований".
7.	Настройка производительности	G	убедиться, что ХД готово к эксплуатации. Как правило, проверка качества выполняется отдельной группой специалистов, не входящих в состав команды разработчиков
8.	Проверка качества	H	создание информационно-вычислительной среды, в которой будет разрабатываться ХД.

Укажите правильное соответствие между этапами алгоритма преобразования корпоративной модели в модель хранилища данных и их названиями.
Этапы Наименования этапов
1. I. A Преобразовать взаимосвязи между данными.
2. II. B Определить уровень структуризации (гранулированности) данных в ХД.
3. III. C Объединить данные из таблиц корпоративной модели данных в таблицах выбранной схемы ХД.
4. IV. D Выбрать данные данных корпоративной модели, которые следует хранить в ХД.
5. V. E Нахождение периодических групп данных или массивов данных и представление их в модели ХД.
6. VI. F Добавить в модель производные элементы данных.
7. VII. G Исследовать временные зависимости данных и, если необходимо, добавить элемента времени в ключи сущностей ХД.
8. VIII. H Разделение атрибутов согласно параметрам стабильности.

	Этапы		Наименования этапов
1.	I.	A	Преобразовать взаимосвязи между данными.
2.	II.	B	Определить уровень структуризации (гранулированности) данных в ХД.
3.	III.	C	Объединить данные из таблиц корпоративной модели данных в таблицах выбранной схемы ХД.
4.	IV.	D	Выбрать данные данных корпоративной модели, которые следует хранить в ХД.
5.	V.	E	Нахождение периодических групп данных или массивов данных и представление их в модели ХД.
6.	VI.	F	Добавить в модель производные элементы данных.
7.	VII.	G	Исследовать временные зависимости данных и, если необходимо, добавить элемента времени в ключи сущностей ХД.
8.	VIII.	H	Разделение атрибутов согласно параметрам стабильности.

Клиентские OLAP-средства представляют собой…

MOLAP как способ хранения данных …

Information Liquidity Model (ILM) является графическим инструментом моделирования движения данных, которое позволяет построить модели

Оператор

SELECT AVG(Col1) AS "?????" FROM Table WHERE ID BETWEEN MAX(ID) / 2 AND (MAX(ID) / 2) + SIGN(MAX{(ID) +1 % 2)

вычисляет …

Сущности-концентраторы или просто хабы (hubs), являются…

Какой из ниже перечисленных объектов может быть материальной сущностью?

Система бизнес–аналитики должна предоставлять…

Укажите правильное соответствие между предикатами сравнения периодов времени и их определениями. Пусть Р1 есть временной интервал (P1Start, Р1End), а P2 - временной интервал (P2Start, Р2End).
Темпоральный предикат Определения
1. "Меньше чем" A (P1End = P2Start – 1) OR (P2End = P1Start – 1)
2. "Предшествует" B (P1Start <= P2Start) OR (P1End <= P2End)
3. "Встречаются" C (P1Start <= P2End) OR (P2Start <=P1End)
4. "Перекрывает" D P1Start < P2Start
5. "Содержится" E P1End < P2Start

	Темпоральный предикат		Определения
1.	"Меньше чем"	A	(P1End = P2Start – 1) OR (P2End = P1Start – 1)
2.	"Предшествует"	B	(P1Start <= P2Start) OR (P1End <= P2End)
3.	"Встречаются"	C	(P1Start <= P2End) OR (P2Start <=P1End)
4.	"Перекрывает"	D	P1Start < P2Start
5.	"Содержится"	E	P1End < P2Start

Уровень структуризации данных -

Основными характеристиками таблицы фактов являются следующие

Данные в системах складирования данных выступают как …

Дано отношение ОТГРУЗКА (корабль, дата отправления, грузополучатель, 1 партия грузов, 2 партия грузов, 3 партия грузов, объявленная стоимость, застрахованная стоимость). Использование этого отношения в реляционной базе данных может породить следующие проблемы:

FASMI означает быстрый анализ разделяемой многомерной информации, включающий следующие требования к приложениям для многомерного анализа …

Очистку данных можно разделить на следующие типы:

Сущности должны создаваться в следующем порядке:

Полуаддитвный факт – это

Вырожденным измерением называется …

Оцените в терминах операций ввода вывода следующий запрос, который делает выборку данных из таблиц PRODUCT (50 строк) и VENDOR (1000):

SELECT VENDOR_CODE, PRODUCT_CODE, PRODUCT_DESCFROM VENDOR, PRODUCTWHERE VENDOR.VENDOR_CODE = PRODUCT.VENDOR_CODE AND VENDOR.VENDOR_CODE = "100";

По следующему пути доступа:

Ограничение по условию поиска в второй таблице (VENDOR_CODE = "100").

Выполнение соединения полученной на 1 шаге результирующей таблицы с таблицей VENDOR.

если 20 строк удовлетворяют условиям поиска

Метаданные хранилища данных определяются как …

При приятии решении о денормализации определите, что является наиболее важным для приложения базы данных?

Запрос к схеме "звезда": "Пусть руководству компании требуется отчет о прибыли по всем регионам по всем отделам продаж за 2007-08 гг. без итоговой суммы прибыли". Укажите правильный ответ.

Классификации метаданных по их функциональному назначению не включает следующий класс …

Какое свойство не входит в классическое определение хранилища данных?

Временные метки -

Данные в информационных системах выступают как …

Основной целью создания информационных систем является …

Какое свойство данных является общим для систем складирования данных и операционных систем обработки данных?

Какое свойство не входит в классическое определение хранилища данных?

Операционные системы обработки данных создаются с учетом следующих значений параметров:

Системы складирования данных создаются с учетом следующих значений параметров:

Среди факторов, влияющих на принятие решений о выборе способа реализации хранилища данных, укажите наиболее критические.

Аналитические CRM системы собирают информацию

Укажите правильное соответствие между преимуществами, которые получает организация от внедрения хранилищ данных и их расшифровкой.
Преимущества Расшифровка
1. Взгляд на данные организации, как на единое целое. A Сроки исполнения от 6 месяцев до 2-х лет в зависимости от объема хранилища данных, при следующем распределении затрат: для небольшого подразделения $ 400000-600000, для большого подразделения - $800000-1500000, для большой корпорации - $15000000.
2. 400% возврат инвестиций, вложенный в создание хранилища данных. B Анализ такой информации имеет решающее значение в принятие решений по всем вопросам, связанным с географией бизнеса.
3. Возрастает надежность данных для принятия решений. C Это ответы на такие вопросы, как -сколько продуктов реально производится? Что влияет на изменение спроса? Какие товары или услуги приносят наибольший доход? А также особенности и пристрастия своих клиентов.
4. Геопространственный анализ данных. D Данные, загружаемые в хранилище данных, подвергаются очистке - согласуются, проверяются, уточняются.
5. Исследование трендов и колебаний в бизнес-данных. организации во времени. E Позволяет достаточно надежно прогнозировать развитие бизнес-процессов

	Преимущества		Расшифровка
1.	Взгляд на данные организации, как на единое целое.	A	Сроки исполнения от 6 месяцев до 2-х лет в зависимости от объема хранилища данных, при следующем распределении затрат: для небольшого подразделения $ 400000-600000, для большого подразделения - $800000-1500000, для большой корпорации - $15000000.
2.	400% возврат инвестиций, вложенный в создание хранилища данных.	B	Анализ такой информации имеет решающее значение в принятие решений по всем вопросам, связанным с географией бизнеса.
3.	Возрастает надежность данных для принятия решений.	C	Это ответы на такие вопросы, как -сколько продуктов реально производится? Что влияет на изменение спроса? Какие товары или услуги приносят наибольший доход? А также особенности и пристрастия своих клиентов.
4.	Геопространственный анализ данных.	D	Данные, загружаемые в хранилище данных, подвергаются очистке - согласуются, проверяются, уточняются.
5.	Исследование трендов и колебаний в бизнес-данных. организации во времени.	E	Позволяет достаточно надежно прогнозировать развитие бизнес-процессов

Укажите, какие из ниже перечисленных компонент не являются составными частями архитектуры хранилища данных?

К какому из перечисленных методологических подходов к реализации хранилища данных относится следующая характеристика?
"У него есть и недостатки - данные могут дублироваться и быть несогласованными в разных киосках данных".

Какие из ниже перечисленных операций не входят в этап проектирования логической модели хранилища данных?

Какое из ниже перечисленных действий не относится к проверке правильности логической модели хранилища данных?

Укажите правильное соответствие между этапами бизнес - модели создания хранилища данных и рисками, которые имеют место быть на каждом этапе.
Этап Документы
1. Формулирование требований A Использование одного сервера БД для моделирования различных вычислительных сред, например, вычислительной среды разработки и вычислительной среды тестирования, или, что еще хуже, для вычислительной среды разработки и вычислительной среды эксплуатации ХД, особенно, если на этом сервере работает уже существующая информационная система.
2. Создание вычислительной среды для хранилища данных B Конфликт внутрикорпоративных интересов и в необходимости наладить коммуникации для успешного выполнения и этапа и проекта в целом.
3. Моделирование данных C Недооценка временных параметров и стремление команды разработчиков сделать процесс ETL как можно более всеобъемлющим, мотивируя свои действия стремлением обеспечить качество данных
4. Определение процедур извлечения, преобразования и загрузки данных D Самоуверенность проектировщиков ХД.
5. Проектирование аналитических отчетов E Ложное представление о достаточной квалификации пользователей ХД в ИТ - технологиях.
6. Разработка приложений хранилища данных F Не уделяется достаточного внимания оптимизации времени получения отчета.
7. Настройка производительности G Это люди: их квалификация, амбиции, заинтересованность в деле, мотивы и т.д.
8. Проверка качества H Использование вычислительной среды разработки ХД, которая не масштабируется к вычислительной среде эксплуатации ХД.

	Этап		Документы
1.	Формулирование требований	A	Использование одного сервера БД для моделирования различных вычислительных сред, например, вычислительной среды разработки и вычислительной среды тестирования, или, что еще хуже, для вычислительной среды разработки и вычислительной среды эксплуатации ХД, особенно, если на этом сервере работает уже существующая информационная система.
2.	Создание вычислительной среды для хранилища данных	B	Конфликт внутрикорпоративных интересов и в необходимости наладить коммуникации для успешного выполнения и этапа и проекта в целом.
3.	Моделирование данных	C	Недооценка временных параметров и стремление команды разработчиков сделать процесс ETL как можно более всеобъемлющим, мотивируя свои действия стремлением обеспечить качество данных
4.	Определение процедур извлечения, преобразования и загрузки данных	D	Самоуверенность проектировщиков ХД.
5.	Проектирование аналитических отчетов	E	Ложное представление о достаточной квалификации пользователей ХД в ИТ - технологиях.
6.	Разработка приложений хранилища данных	F	Не уделяется достаточного внимания оптимизации времени получения отчета.
7.	Настройка производительности	G	Это люди: их квалификация, амбиции, заинтересованность в деле, мотивы и т.д.
8.	Проверка качества	H	Использование вычислительной среды разработки ХД, которая не масштабируется к вычислительной среде эксплуатации ХД.

Укажите, какие из ниже перечисленных объектов относятся к результатам проектирования физической модели хранилища данных.

На этапе формулирования требований к хранилищу данных определяются …

Термин "Business Intelligence" означает …

Система деловой осведомленности или бизнес – аналитики (BI System) - …

Система бизнес-аналитики является …

При рассмотрении задач безопасности данных следует задаться следующими вопросами:

Какое из приведенных ниже определений является определением предметной области?

Какую из перечисленных ситуаций следует отнести к динамической ситуации?

Укажите правильное соответствие между элементами логической модели и их определениями.
Элементы модели Определения
1. Отношение (связь) A - это характер участия сущности в связи.
2. Уникальный идентификатор связи B – это соотношение между числом сущностей, участвующих в образовании связи.
3. Степень (мощность) связи C – это сущность, которая не может присутствовать в базе данных, пока не существует связанного с ней экземпляра другой сущности.
4. Класс принадлежности сущности D – это сущность, которая порождает непересекающиеся подмножества экземпляров (категории сущности), связанных с сущностью через значения своего атрибута.
5. Рефлексивное отношение E – это категория порождающей сущности (сущности- супертипа).
6. Слабая сущность F представляет собой соединение (взаимоотношение) между двумя или более сущностями.
7. Супертип G - это супертип с порожденными им подтипами.
8. Подтип H - это атрибут для однозначной идентификации отношения.
9. Составная сущность J - это отношение, связывающее сущность саму с собой.

	Элементы модели		Определения
1.	Отношение (связь)	A	- это характер участия сущности в связи.
2.	Уникальный идентификатор связи	B	– это соотношение между числом сущностей, участвующих в образовании связи.
3.	Степень (мощность) связи	C	– это сущность, которая не может присутствовать в базе данных, пока не существует связанного с ней экземпляра другой сущности.
4.	Класс принадлежности сущности	D	– это сущность, которая порождает непересекающиеся подмножества экземпляров (категории сущности), связанных с сущностью через значения своего атрибута.
5.	Рефлексивное отношение	E	– это категория порождающей сущности (сущности- супертипа).
6.	Слабая сущность	F	представляет собой соединение (взаимоотношение) между двумя или более сущностями.
7.	Супертип	G	- это супертип с порожденными им подтипами.
8.	Подтип	H	- это атрибут для однозначной идентификации отношения.
9.	Составная сущность	J	- это отношение, связывающее сущность саму с собой.

При каких условиях нормализация не нужна?

Предположим, что атрибуты сущности зависят друг от друга следующим образом из X следует Y, а из Y следует A

К какой нормальной форме приведено исходное отношение?
Исходное отношение:

Курсовой_проект (Преподаватель - Предмет - Студент)

Иванов - Тема1 - Петрова

Фролов - Тема1 - Исаев

Антонов - Тема1 - Сидоров

Иванов - Тема2 - Ивлева

Фролов - Тема2 - Степанов

Фролов - Тема3 - Мусин

Антонов - Тема3 - Сац

Результирующие отношения:

Руководство (Преподаватель, Предмет)

Выполнение (Студент, Предмет)

Комментарий к ответу: На роль ключа отношения Курсовой_проект претендует набор атрибутов {Преподаватель, Предмет}. Студент выполняет только один проект, один и тот же проект может выполняться несколькими студентами у разных преподавателей. Отношение содержит следующие ФЗ: {Преподаватель, Предмет} -> Студент и Студент -> Предмет.

Отношение находится в 3НФ и не содержит частичных и транзитивных ФЗ. Однако наличие ФЗ части составного ключа от неключевого атрибута может привести к следующим аномалиям:

проблема контроля избыточности данных: замена студента требует просмотра всего отношения, чтобы изменить данные о преподавателе для него
проблема нуль-значений: данные о проекте студента не могут быть внесены, пока не назначен преподаватель

Устранение аномалий заключается в удалении ФЗ ключа от неключевого атрибута.

Рассмотрим схему отношения R(город, адрес, почтовый_индекс). Ключами отношения являются:

Отметьте характерные основные виды данных для хранилищ данных:

Гранулярность времени показывает ...

Установите соответствие между понятиями, связанными с временными метками.
Понятие Определение
1. Время фиксации события или факта A - это временная метка, связанная со временем загрузки данных в ХД.
2. Время операции B - это временная метка, представляющая время, когда данные были извлечены или собраны из источника данных.
3. Время сбора данных C - это временная метка, представляющая время, когда была выполнена операцию хозяйственной деятельности организации.
4. Время актуализации данных D - это временная метка, которая представляет время события или состояния предметной области.

	Понятие		Определение
1.	Время фиксации события или факта	A	- это временная метка, связанная со временем загрузки данных в ХД.
2.	Время операции	B	- это временная метка, представляющая время, когда данные были извлечены или собраны из источника данных.
3.	Время сбора данных	C	- это временная метка, представляющая время, когда была выполнена операцию хозяйственной деятельности организации.
4.	Время актуализации данных	D	- это временная метка, которая представляет время события или состояния предметной области.

Упорядоченным темпоральным запросом называется …

На практике проектировщики темпоральных моделей данных используют следующие классы временной зависимости атрибутов:

Для группировки классов атрибутов зависимых от времени проектировщиками ХД используется

Многомерное моделирование является …

Схема "звезда" имеет …

Агрегатами являются …

Таблицей – мостом называется …

Установите соответствие между объектами реляционной базы данных и их определениями.
Объект Определение
1. Кластер А - это группа каталогов, к которым можно обращаться через одно соединение с сервером базы данных
2. Каталог Б - это базовая структура реляционной базы данных, которая представляет собой единицу хранения данных.
3. Схема В - это поименованная динамически поддерживаемая СУБД выборка из одной или нескольких таблиц базы данных.
4. Таблица Г - это группа схем
5. Представление Д - это контейнер для таблиц, представлений и других структурных элементов реляционной базы данных.
6. Пользователь Е - это объект, обладающий возможностью создавать или использовать другие объекты базы данных и запрашивать выполнение функций СУБД таких, как организация сеанса работы, изменение состояние базы данных и т. д.
7. Синоним Ж - это объект базы данных, создаваемый для повышения производительности выборки данных и контроля уникальности первичного ключа (если он задан для таблицы).
8. Индекс З - это альтернативное имя объекта (псевдоним) реляционной базы данных, которое позволяет иметь доступ к данному объекту

	Объект		Определение
1.	Кластер	А	- это группа каталогов, к которым можно обращаться через одно соединение с сервером базы данных
2.	Каталог	Б	- это базовая структура реляционной базы данных, которая представляет собой единицу хранения данных.
3.	Схема	В	- это поименованная динамически поддерживаемая СУБД выборка из одной или нескольких таблиц базы данных.
4.	Таблица	Г	- это группа схем
5.	Представление	Д	- это контейнер для таблиц, представлений и других структурных элементов реляционной базы данных.
6.	Пользователь	Е	- это объект, обладающий возможностью создавать или использовать другие объекты базы данных и запрашивать выполнение функций СУБД таких, как организация сеанса работы, изменение состояние базы данных и т. д.
7.	Синоним	Ж	- это объект базы данных, создаваемый для повышения производительности выборки данных и контроля уникальности первичного ключа (если он задан для таблицы).
8.	Индекс	З	- это альтернативное имя объекта (псевдоним) реляционной базы данных, которое позволяет иметь доступ к данному объекту

Какой из перечисленных ниже объектов является обязательным элементам стандарта SQL-92?

В контексте проектирования физической модели реляционной базы данных ограничение – это …

Какое из перечисленных ниже бизнес-правил не относится к правилам ссылочной целостности?

В контексте проектирования физической модели реляционной базы данных имя – это …

Установите соответствие между типами данных для представления чисел и значениями, которые они определяют.
Тип данных Значение
1. Integer А Целое
2. Smallint Б Числа с заданной точностью
3. Number [(точность [, масштаб])] В Числа с заданной точностью
4. Decimal[(точность [, масштаб])] Г Маленькое целое
5. tinyint Д Числа от 0 до 255
6. Float (точность) Е Числа с плавающей запятой одинарной точности
7. Real Ж Числа с плавающей запятой заданной точности

	Тип данных		Значение
1.	Integer	А	Целое
2.	Smallint	Б	Числа с заданной точностью
3.	Number [(точность [, масштаб])]	В	Числа с заданной точностью
4.	Decimal[(точность [, масштаб])]	Г	Маленькое целое
5.	tinyint	Д	Числа от 0 до 255
6.	Float (точность)	Е	Числа с плавающей запятой одинарной точности
7.	Real	Ж	Числа с плавающей запятой заданной точности

Метаданные хранилища данных отвечают на вопросы …

Какие из перечисленных ниже функций относятся к основным функциям метаданных в ХД?

Дополните состав описания преобразований данных, приведенный ниже, из указанного в ответах списка.
Идентификацию полей источников данных
Соответствие между атрибутами сущностей источников данных и атрибутами объектов ХД
Преобразования атрибутов
Физические характеристики преобразований
Преобразования таблиц кодировки и ссылочных таблиц
Алгоритмы трансформации данных и т. д.

Логическая структура метаданных измерений, как правило, не включает в себя …

Установите соответствие между процессом и его определением.
Процесс Определение
Извлечение данных A На этой стадии релевантные данные преобразуются в формат представления данных в ХД, правила преобразования сохраняются в метаданных ХД, формируются ключевые поля таблиц физической структуры ХД, выполняется очистка данных.
Преобразование данных B На этой стадии данные загружаются в ХД, выполняется построение агрегатов.
Загрузка данных C На этой стадии отбираются и описываются данные внешних источников (начинают формироваться метаданные ХД), которые должны быть храниться в ХД (релевантные данные).

	Процесс	Определение
Извлечение данных	A	На этой стадии релевантные данные преобразуются в формат представления данных в ХД, правила преобразования сохраняются в метаданных ХД, формируются ключевые поля таблиц физической структуры ХД, выполняется очистка данных.
Преобразование данных	B	На этой стадии данные загружаются в ХД, выполняется построение агрегатов.
Загрузка данных	C	На этой стадии отбираются и описываются данные внешних источников (начинают формироваться метаданные ХД), которые должны быть храниться в ХД (релевантные данные).

Не корпоративные источники данных: …

Установите соответствие между дигарммами ILM модели и их определением.
Процесс Определение
Диаграмма движения данных A – это диаграмма высокого уровня, которая позволяет моделировать преобразование данных посредством определения
Диаграмма преобразования данных B - это диаграмма низкого уровня, которая позволяет моделировать конкретные задачи преобразования посредством определения того, как данные извлекаются из входного источника данных, как преобразуются и как загружаются в выходной источник данных.
Диаграмма управления преобразованием C - это диаграмма низкого уровня модели, которая позволяет определить последовательность выполнения серии задач преобразования.

	Процесс	Определение
Диаграмма движения данных	A	– это диаграмма высокого уровня, которая позволяет моделировать преобразование данных посредством определения
Диаграмма преобразования данных	B	- это диаграмма низкого уровня, которая позволяет моделировать конкретные задачи преобразования посредством определения того, как данные извлекаются из входного источника данных, как преобразуются и как загружаются в выходной источник данных.
Диаграмма управления преобразованием	C	- это диаграмма низкого уровня модели, которая позволяет определить последовательность выполнения серии задач преобразования.

При проектировании процессов преобразования данных проектировщик ХД должен решить следующие задачи:

Корпоративная модель данных, как правило, имеет … уровней представления.

С точки зрения проектирования хранилищ данных корпоративная модель данных содержит в себе …

Идентификация бизнес- процессов предметной области позволяет определить ….

Указать трудности применения известных методик проектирования к разработке модели ХД масштаба предприятия с точки зрения проведения нормализации:

Сущности-связи являются …

При создании связей в структуре "Свода данных" следует соблюдать Х правил поддержки ссылочной целостности

Процесс преобразования нормализованной модели в модель "Свод данных" включает следующие этапы:

Относятся ли следующие правила поддержки ссылочной целостности:

Какая из ниже перечисленных команд SQL относится к термину запрос?

Установите соответствие между элементом определения транзакции и его смыслом.
Элемент Определение
1. Имя транзакции и номер транзакции А уникальная идентификация каждой транзакции базы данных.
2. Описание транзакции Б онлайновая транзакция или пакетная транзакция, высокая, средняя, низкая.
3. Характер транзакции и ее сложность В перечень операций предметной области, которые выполняются транзакцией.
4. Объем транзакции Г средняя частота и пиковая частота использования.
5. Требования к производительности транзакции Д количество секунд, необходимое для завершения транзакции в режиме эксплуатации базы данных.
6. Относительный приоритет Е насколько важна настоящая транзакция для предметной области по сравнению с другими.
7. Время выполнения транзакции Ж количества секунд, требуемых для выполнения транзакции

	Элемент		Определение
1.	Имя транзакции и номер транзакции	А	уникальная идентификация каждой транзакции базы данных.
2.	Описание транзакции	Б	онлайновая транзакция или пакетная транзакция, высокая, средняя, низкая.
3.	Характер транзакции и ее сложность	В	перечень операций предметной области, которые выполняются транзакцией.
4.	Объем транзакции	Г	средняя частота и пиковая частота использования.
5.	Требования к производительности транзакции	Д	количество секунд, необходимое для завершения транзакции в режиме эксплуатации базы данных.
6.	Относительный приоритет	Е	насколько важна настоящая транзакция для предметной области по сравнению с другими.
7.	Время выполнения транзакции	Ж	количества секунд, требуемых для выполнения транзакции

В контексте физического проектирования реляционных баз данных денормализация – это …

Какой из перечисленных ниже факторов не пытаются устранить в процессе денормализации?

Для случая горизонтального разбиения таблицы в тексте лекции были разобраны примеры поддержки ссылочной целостности для новой таблицы. В качестве какой таблицы выступала таблицы, которая подвергалась разбиению?

В контексте проектирования физической модели данных ХД кластеризация – это …

Установите соответствие между терминами и их определениями.
Термин Определение
1 Локально секционированный индекс А имеет такой же ключ секционирования, количество табличных пространств и правила секционирования, что и отвечающая ему базовая таблица.
2 Глобально секционированный индекс Б ключ секционирования секционирование выполняется по значениям, отличным от значений колонки индексирования.
3 Префиксный секционированный индекс В означает, что индекс имеет то же число секций и те же правила секционирования, что и его базовая таблица.
4 Непрефиксный секционированный индекс Г содержит предложение PARTITION BY RANGE, в котором задаются параметры секционирования, отличные от параметров секционирования соответствующей базовой таблицы.
5 Локально равносекционированный секционированный индекс Г секционирование производится по ключу секционирования, который содержит основную часть индексного ключа.

	Термин		Определение
1	Локально секционированный индекс	А	имеет такой же ключ секционирования, количество табличных пространств и правила секционирования, что и отвечающая ему базовая таблица.
2	Глобально секционированный индекс	Б	ключ секционирования секционирование выполняется по значениям, отличным от значений колонки индексирования.
3	Префиксный секционированный индекс	В	означает, что индекс имеет то же число секций и те же правила секционирования, что и его базовая таблица.
4	Непрефиксный секционированный индекс	Г	содержит предложение PARTITION BY RANGE, в котором задаются параметры секционирования, отличные от параметров секционирования соответствующей базовой таблицы.
5	Локально равносекционированный секционированный индекс	Г	секционирование производится по ключу секционирования, который содержит основную часть индексного ключа.

Какой из перечисленных ниже типов колонок является плохим кандидатом для построения индекса?

Укажите, какое из ниже перечисленных утверждений не относится к недостаткам кластеризации?

Укажите недостаток секционирование представлений с помощью ограничения CHECK.

. Рассмотрим базу данных обработки заказов и создадим индексный кластер для хранения одной из таблиц базы данных - Customer.

CREATE CLUSTER cust_c (cust_id varchar(8))INDEX;CREATE INDEX cust_c_id ON CLUSTER cust_c;CREATE TABLE cust (cust_id 	varchar2(8) NOT NULL REFERENCES customers,ent#		number	NOT NULL,date_ent	date		NOT NULL,comment	varchar2(60)	NOT NULL,…PRIMARY KEY(cust_id, ent#)) CLUSTER cust_c (cust_id);

Созданная таблица кластеризована по колонке cust_id, и все специальные записи о клиента в колонке comment будут расположены в одной странице физической базы данных, либо в смежных страницах. Их можно выбрать за одну операцию поиска по индексу:

SELECT date_ent, comment FROM cust_c WHERE cust_id=:cur_cust;

Комментарий. На ограничение первичного ключа в операторе CREATE сделан, чтобы избежать создания второго индекса.

Является ли такое решение преимуществом с точки зрения утверждения: "Все записи о клиентах выбираются для ежегодного отчета".

Результат выполнения оператора SELECT называется …

Запрос к схеме "звезда": "Определить, сколько нереализованных подушек было в сети магазинов торговой организации в январе 2009 года.". Укажите правильный вариант ответа.

Запрос к схеме "звезда": "Пусть руководству компании требуется отчет о прибыли по всем регионам по всем отделам продаж за 2007-08 гг. без итоговой суммы прибыли". Укажите правильный ответ.

Запрос к схеме "звезда": "Пусть руководству компании требуется перекрестный отчет о прибыли по всем регионам по всем отделам продаж за 2007-08 гг.". Укажите правильный ответ.

Задан оператор

SELECT Time, Region, Department, SUM(Profit) AS Profit FROM sales   GROUP BY Time, ROLLUP (Region, Department);

Укажите правильное результирующее множество.

Окно определяет …

Оконные функции …

Оператор

SELECT OrderID, ProductID, OrderQty	,SUM(OrderQty) OVER(PARTITION BY OrderID) AS 'Итого'	,AVG(OrderQty) OVER(PARTITION BY OrderID) AS 'Среднее'FROM OrderDetailWHERE OrderID IN(43659,43664);

вычисляет …

Задан оператор

SELECT р_productkey, SUM(s_amount) as 'Суммарное количество',   RANK() OVER (ORDER BY SUM(s_amount) DESC) AS 'rank_all',   DENSE_RANK() OVER (ORDER BY SUM(s_amount) DESC) AS 'rank_dense'FROM salesGROUP BY р_productkey;

Укажите правильное результирующее множество.

Установите соответствие между некоторыми функциями построения линейной регрессии и их определениями.
Функция Возвращаемое значение
REGR_SLOPE A Функция вычисляет отсечение на оси Y
REGR_INTERCEPT B Функция вычисляет тангенс угла наклона линии регрессии, соответствующей ненулевым парам (e1, e2).
REGR_R2 C Функция возвращает количество ненулевых пар, которые участвуют в построении линии регрессии.
REGR_COUNT C Функция вычисляет коэффициент детерминации для линии регрессии (после проверки пар (e1, e2) на нуль).

Функция		Возвращаемое значение
REGR_SLOPE	A	Функция вычисляет отсечение на оси Y
REGR_INTERCEPT	B	Функция вычисляет тангенс угла наклона линии регрессии, соответствующей ненулевым парам (e1, e2).
REGR_R2	C	Функция возвращает количество ненулевых пар, которые участвуют в построении линии регрессии.
REGR_COUNT	C	Функция вычисляет коэффициент детерминации для линии регрессии (после проверки пар (e1, e2) на нуль).

Концепция независимости прикладных программ от физической структуры данных не дает следующих преимуществ:

Оптимизатором запросов называется …

Оцените в терминах операций ввода вывода следующий запрос, который делает выборку данных из таблиц PRODUCT (50 строк) и VENDOR (1000):

SELECT VENDOR_CODE, PRODUCT_CODE, PRODUCT_DESCFROM VENDOR, PRODUCTWHERE VENDOR.VENDOR_CODE = PRODUCT.VENDOR_CODE AND VENDOR.VENDOR_CODE = "100";

По следующему пути доступа:

Формируем декартово произведение таблиц PRODUCT и VENDOR.

Ограничиваемся в результирующей таблице строками, которые удовлетворяют условию поиска в предложении WHERE.

Выполняем проекцию результирующей таблицы на список колонок, указанный в предложении SELECT.

если 20 строк удовлетворяют условиям поиска

При оптимизации запросов, основанных на правилах, …

Какие из ниже перечисленных причин приводят к нецелесообразности к созданию индексов для каждого оператора SELECT?

Серверные OLAP-средства представляют собой …

HOLAP как способ хранения данных …

FASMI означает быстрый анализ разделяемой многомерной информации, включающий следующие требования к приложениям для многомерного анализа …

OLAP хранилища данных заполняются данными из…

Элементами многомерной диаграммы являются …

Сбалансированная иерархия – это иерархия, …

Какое из перечисленных ниже вопросно-ответных отношений нельзя реализовать в информационной системе обслуживания счетов клиентов банка?

ROLAP как способ хранения данных …

Задана команда:

SELECT Time, Region, Department, SUM(Profit) AS Profit,  GROUPING (Time) as T,   GROUPING (Region) as R,   GROUPING (Department) as D  FROM SalesGROUP BY ROLLUP (Time, Region, Department);

Какое из ниже перечисленных утверждений является для нее правильным?

Разбиение сущностей корпоративной модели на транзакционные и не транзакционные позволяет определить …

Классификации метаданных по их функциональному назначению не включает следующий класс …

В контексте проектирования физической модели реляционной базы данных домен – это …

Что не включает типовая модель бизнес-процессов разработки ХД?

Оптимизация запросов может быть определена как …

В корпоративную модель данных, как правило, включается …

Данные, подвергающиеся как процессу сбора, так и преобразования, также образуют "точки риска":

Сущности-сателлиты содержат...

Сколько этапов алгоритма преобразования корпоративной модели данных в модель хранилища данных являются обязательными (т.е. практически всегда имеют место быть)?

Укажите правильное соответствие между типовыми архитектурными элементами логической структуры CIF и их характеристиками
Элементы Характеристики
1. Системы, доставшиеся «по наследству» (Legacy Systems) A Здесь накапливается детальная информация, необходимая для выполнения анализа. Данные перегружаются в корпоративное хранилище из оперативных элементов — унаследованных систем, автоматизированных банковских систем или оперативных складов данных. Как правило обновление информации в EDW происходит с большой задержкой. Для разрешения этой проблемы используются ODS-элементы.
2. Приложения оперативного управления организацией (OLTP) B Предназначены для хранения аналитической информации уровня подразделения или направления бизнеса.
3. Оперативные склады данных (Operational Data Store — ODS) C DSS, примером функционала которых могут быть системы анализа клиентской базы банка, обеспечивают поддержку принятия решений. Разнообразный статистический анализ выполняется в DM.
4. Компоненты преобразования данных (ETL-tools, Staging Area, Near-line Storage) D Этот элемент наделяется свойствами как оперативных, так и аналитических систем. Основное его назначение — обеспечить осуществление анализа информации практически сразу после ее обновления в оперативных системах
5. Корпоративное хранилище данных (Enterprise Data Warehouse) E Служат для перегрузки данных из одних программных компонентов в другие (с промежуточной очисткой и согласованием данных, получаемых из различных источников).
6. Витрины данных (Data Marts) F Поддерживают бизнес-функции, которые были созданы в организации ранее. В таких системах обычно компоненты, обеспечивающие формирование отчетов и ввод и передачу данных, реализуются в рамках единого программного блока, что затрудняет решение задач по интеграции и преобразованию данных в соответствие с новыми требованиями бизнеса.
7. Приложения поддержки принятия решений (DSS) и приложения анализа данных (DM) G Обеспечивает публикацию данных в сети Интранет (Интернет), а также обработку результатов ввода информации пользователями.
8. Инфраструктура сетевых коммуникаций H Обеспечивают быструю обработку данных в рамках бизнес - направлений деятельности организации. Как правило, такие системы приобретаются у компании-разработчика, которая осуществляет их техническую поддержку.

	Элементы		Характеристики
1.	Системы, доставшиеся «по наследству» (Legacy Systems)	A	Здесь накапливается детальная информация, необходимая для выполнения анализа. Данные перегружаются в корпоративное хранилище из оперативных элементов — унаследованных систем, автоматизированных банковских систем или оперативных складов данных. Как правило обновление информации в EDW происходит с большой задержкой. Для разрешения этой проблемы используются ODS-элементы.
2.	Приложения оперативного управления организацией (OLTP)	B	Предназначены для хранения аналитической информации уровня подразделения или направления бизнеса.
3.	Оперативные склады данных (Operational Data Store — ODS)	C	DSS, примером функционала которых могут быть системы анализа клиентской базы банка, обеспечивают поддержку принятия решений. Разнообразный статистический анализ выполняется в DM.
4.	Компоненты преобразования данных (ETL-tools, Staging Area, Near-line Storage)	D	Этот элемент наделяется свойствами как оперативных, так и аналитических систем. Основное его назначение — обеспечить осуществление анализа информации практически сразу после ее обновления в оперативных системах
5.	Корпоративное хранилище данных (Enterprise Data Warehouse)	E	Служат для перегрузки данных из одних программных компонентов в другие (с промежуточной очисткой и согласованием данных, получаемых из различных источников).
6.	Витрины данных (Data Marts)	F	Поддерживают бизнес-функции, которые были созданы в организации ранее. В таких системах обычно компоненты, обеспечивающие формирование отчетов и ввод и передачу данных, реализуются в рамках единого программного блока, что затрудняет решение задач по интеграции и преобразованию данных в соответствие с новыми требованиями бизнеса.
7.	Приложения поддержки принятия решений (DSS) и приложения анализа данных (DM)	G	Обеспечивает публикацию данных в сети Интранет (Интернет), а также обработку результатов ввода информации пользователями.
8.	Инфраструктура сетевых коммуникаций	H	Обеспечивают быструю обработку данных в рамках бизнес - направлений деятельности организации. Как правило, такие системы приобретаются у компании-разработчика, которая осуществляет их техническую поддержку.

Какая из ниже перечисленных функций не является функцией системы бизнес - аналитики?

При проектировании корпоративной модели данных, обычно, предпринимается попытка создать на основе …

Установите соответствие между объектами реляционной базы данных, относящимися к так называемому серверному коду, и их определениями
Объект Определение
1. Хранимая процедура А - это объект базы данных, представляющий поименованный набор команд SQL и/или операторов специализированных языков программирования базы данных
2. Функция Б - это поименованный оператор SQL, который заранее откомпилирован и сохраняется в базе данных. Скорость обработки команды выше, чем у соответствующего ему оператора SQL, т.к. при этом не выполняются фазы синтаксического разбора и компиляции.
3. Команда В - это объект базы данных, представляющий поименованный набор команд SQL и/или операторов специализированных языков обработки программирования базы данных, который при выполнении возвращает значение - результат вычислений.
4. Триггер Г - это объект базы данных, который представляет собой специальную хранимую процедуру. Эта процедура запускается автоматически, когда происходит связанное с триггером событие (например, до вставки строки в таблицу).
5. Таймер Д - это объект базы данных, который состоит из поименованного, структурированного набора переменных, процедур и функций.
6. Пакет Е - это триггер, с запускающимся событием таймера.

	Объект		Определение
1.	Хранимая процедура	А	- это объект базы данных, представляющий поименованный набор команд SQL и/или операторов специализированных языков программирования базы данных
2.	Функция	Б	- это поименованный оператор SQL, который заранее откомпилирован и сохраняется в базе данных. Скорость обработки команды выше, чем у соответствующего ему оператора SQL, т.к. при этом не выполняются фазы синтаксического разбора и компиляции.
3.	Команда	В	- это объект базы данных, представляющий поименованный набор команд SQL и/или операторов специализированных языков обработки программирования базы данных, который при выполнении возвращает значение - результат вычислений.
4.	Триггер	Г	- это объект базы данных, который представляет собой специальную хранимую процедуру. Эта процедура запускается автоматически, когда происходит связанное с триггером событие (например, до вставки строки в таблицу).
5.	Таймер	Д	- это объект базы данных, который состоит из поименованного, структурированного набора переменных, процедур и функций.
6.	Пакет	Е	- это триггер, с запускающимся событием таймера.

Какая из ниже перечисленных команд SQL не относится к командам манипулирования данными?

Какая характеристика транзакции задается ниже следующей спецификацией? "Онлайновые транзакции низкой сложности должны выполнятся не более 4 с."

Под корпоративной моделью данных понимают

Классом временной зависимости называется

Медленно меняющимся измерениями называются …

Задан оператор

SELECT р_productkey, SUM(s_amount) as 'Суммарное количество',   RANK() OVER (ORDER BY SUM(s_amount) DESC) AS 'rank_all',   DENSE_RANK() OVER (ORDER BY SUM(s_amount) DESC) AS 'rank_dense'FROM salesGROUP BY р_productkey;

Укажите правильное результирующее множество.

В контексте проектирования физической модели данных ХД секционирование – это …

Установите соответствие между ограничениями и их содержанием.
Ограничение Описание
1. CHECK А Гарантирует, что колонка всегда содержит значение и оно и уникально в таблице.
2. DEFAULT Б Помещает значение по умолчанию в колонку. Гарантирует, что колонка всегда имеет значение.
3. FOREING KEY В Гарантирует, что значения существую, как значение в колонке первичного ключа другой таблицы. Обеспечивает процедуры удаления дочерних строк при удалении связанных с ней родительских.
4. NOT NULL Г Гарантирует, что значение будет уникальным в таблице
5. PRIMARY KEY Д Гарантирует, что значения находятся в границах специфицированного интервала, задаваемого предикатом.
6. UNIQUE Е Гарантирует, что колонка всегда содержит значение.

	Ограничение		Описание
1.	CHECK	А	Гарантирует, что колонка всегда содержит значение и оно и уникально в таблице.
2.	DEFAULT	Б	Помещает значение по умолчанию в колонку. Гарантирует, что колонка всегда имеет значение.
3.	FOREING KEY	В	Гарантирует, что значения существую, как значение в колонке первичного ключа другой таблицы. Обеспечивает процедуры удаления дочерних строк при удалении связанных с ней родительских.
4.	NOT NULL	Г	Гарантирует, что значение будет уникальным в таблице
5.	PRIMARY KEY	Д	Гарантирует, что значения находятся в границах специфицированного интервала, задаваемого предикатом.
6.	UNIQUE	Е	Гарантирует, что колонка всегда содержит значение.

Метод моделирования "Свод данных" - это…

Темпоральные базы данных …

Данные в операционных системах обработки данных выступают как …

Основной целью создания систем складирования данных является …

Системы складирования данных создаются с учетом следующих значений параметров:

Под архитектурой ХД понимают …

Укажите правильное соответствие между вариантами реализации хранилища данных и их характеристиками
Варианты реализации Характеристики
1. Виртуальное хранилище данных A Архитектура представляет собой единый источник интегрированных данных организации
2. Глобальное хранилище данных B Архитектура является разновидностью глобального ХД, в которую технологически реализуются три уровня (На первом уровне располагается корпоративное ХД организации. На втором уровне поддерживаются связанные киоски данных тематической направленности на основе многомерной СУБД. На третьем уровне находятся клиентские приложения пользователей с установленными на них средствами анализа данных
3. Хранилища данных с многоуровневой (в основном трехзвенной) архитектурой или корпоративные ХД C Архитектура обеспечивает доступ к "живым" данным в режиме реального времени через программное обеспечение промежуточного слоя. В основе такого решения лежит репозитарий метаданных, который описывает источники данных, процедуры их предварительной обработки и форматы представления информации конечному пользователю. Недостаток такого решения - интенсивный сетевой трафик, снижение производительности несущей системы, угроза нарушения целостности данных в случае неудачных действий пользователей ХД
4. Встроенные (комбинированные) хранилища данных. D В этой архитектуре ХД не является единым физическим репозиторием (в отличие от CIF). Это "виртуальное" ХД, представляющее коллекцию витрин данных, каждая из которых имеет архитектуру типа "звезда".
5. Корпоративная информационная фабрика (Corporate Information Factory, CIF). E Архитектура представляет собой ХД, которые органически встраиваются в виртуальное предприятие (Enterprise Information Factory, EIF) или используются как компонент аналитической поддержки в информационной реализации бизнес-функций.
6. Хранилище данных с архитектурой шины данных (Data Warehouse Bus). F Архитектура является развитием архитектуры корпоративного ХД (enterprise data warehouse, EDW). Использование данной архитектуры предполагает скоординированное извлечение данных из источников, загрузку их в реляционную БД со структурой в третьей нормальной форме, использование построенного ХД для наполнения дополнительных репозиториев презентационных данных.
7. Объединенное (федеративное) ХД. G Архитектура представляет собой облегченный вариант ХД тематической направленности.
8. Киоски данных. H В этой архитектуре ХД состоит из ряда экземпляров ХД, которые функционируют на полуавтономной основе и, как правило, организационно или географически разнесены, однако могут рассматриваться и управляться как одно большое ХД.

	Варианты реализации		Характеристики
1.	Виртуальное хранилище данных	A	Архитектура представляет собой единый источник интегрированных данных организации
2.	Глобальное хранилище данных	B	Архитектура является разновидностью глобального ХД, в которую технологически реализуются три уровня (На первом уровне располагается корпоративное ХД организации. На втором уровне поддерживаются связанные киоски данных тематической направленности на основе многомерной СУБД. На третьем уровне находятся клиентские приложения пользователей с установленными на них средствами анализа данных
3.	Хранилища данных с многоуровневой (в основном трехзвенной) архитектурой или корпоративные ХД	C	Архитектура обеспечивает доступ к "живым" данным в режиме реального времени через программное обеспечение промежуточного слоя. В основе такого решения лежит репозитарий метаданных, который описывает источники данных, процедуры их предварительной обработки и форматы представления информации конечному пользователю. Недостаток такого решения - интенсивный сетевой трафик, снижение производительности несущей системы, угроза нарушения целостности данных в случае неудачных действий пользователей ХД
4.	Встроенные (комбинированные) хранилища данных.	D	В этой архитектуре ХД не является единым физическим репозиторием (в отличие от CIF). Это "виртуальное" ХД, представляющее коллекцию витрин данных, каждая из которых имеет архитектуру типа "звезда".
5.	Корпоративная информационная фабрика (Corporate Information Factory, CIF).	E	Архитектура представляет собой ХД, которые органически встраиваются в виртуальное предприятие (Enterprise Information Factory, EIF) или используются как компонент аналитической поддержки в информационной реализации бизнес-функций.
6.	Хранилище данных с архитектурой шины данных (Data Warehouse Bus).	F	Архитектура является развитием архитектуры корпоративного ХД (enterprise data warehouse, EDW). Использование данной архитектуры предполагает скоординированное извлечение данных из источников, загрузку их в реляционную БД со структурой в третьей нормальной форме, использование построенного ХД для наполнения дополнительных репозиториев презентационных данных.
7.	Объединенное (федеративное) ХД.	G	Архитектура представляет собой облегченный вариант ХД тематической направленности.
8.	Киоски данных.	H	В этой архитектуре ХД состоит из ряда экземпляров ХД, которые функционируют на полуавтономной основе и, как правило, организационно или географически разнесены, однако могут рассматриваться и управляться как одно большое ХД.

К какому из перечисленных методологических подходов к реализации хранилища данных относится следующая характеристика?
"Достоинством такого подхода является получение более согласованных определений данных и бизнес-правил организации в самом начале работы над созданием ХД. Стоимость начального планирования и проектирования может оказаться достаточно высокой. Для этого подхода характерны большие затраты времени, что откладывает начало реализации и задерживает возврат инвестиций. Этот подход хорошо работает в организациях с хорошо организованной информационно-вычислительной структурой, когда программно-аппаратная платформа определена, существуют слаженно работающие источники данных".

Укажите правильное соответствие между этапами проектирования хранилища данных и их кратким содержанием.
Этап Содержание
1. На этапе планирования A Решаются задачи: определение требований владельца ХД; определение требований конечных пользователей; определение технологических требований; определение архитектурных требований
2. На этапе разработки требований B Решаются задачи: выбор стратегии реализации и методологии разработки, анализ задач, для решения которых создается ХД, анализ ресурсов разработки с технологической точки зрения и с точки зрения задач бизнеса, выбор архитектуры ХД, определяется бюджет проекта, разрабатываются возможные сценарии использования ХД, начинается сбор метаданных для ХД
3. На этапе анализа C Решаются задачи разработки физической модели ХД, проектирования процедур поступления данных в него и проектирования архитектуры приложений
4. На этапе проектирования D Решаются задачи построения согласованной по источникам логической модели и определения набора инструментальных средств для работы с ХД.
5. На этапе внедрения E Решаются задачи поддержки работоспособности и масштабируемости программно-аппаратного обеспечения ХД; сбора, очистки, преобразования, загрузки и актуализации данных в соответствии с установленными бизнес - процедурами.
6. На этапе поддержки F Решаются задачи начальной инсталляции, включающей начальную загрузку хранилища из источников данных, и тестирования процедур обновления и синхронизации данных.

	Этап		Содержание
1.	На этапе планирования	A	Решаются задачи: определение требований владельца ХД; определение требований конечных пользователей; определение технологических требований; определение архитектурных требований
2.	На этапе разработки требований	B	Решаются задачи: выбор стратегии реализации и методологии разработки, анализ задач, для решения которых создается ХД, анализ ресурсов разработки с технологической точки зрения и с точки зрения задач бизнеса, выбор архитектуры ХД, определяется бюджет проекта, разрабатываются возможные сценарии использования ХД, начинается сбор метаданных для ХД
3.	На этапе анализа	C	Решаются задачи разработки физической модели ХД, проектирования процедур поступления данных в него и проектирования архитектуры приложений
4.	На этапе проектирования	D	Решаются задачи построения согласованной по источникам логической модели и определения набора инструментальных средств для работы с ХД.
5.	На этапе внедрения	E	Решаются задачи поддержки работоспособности и масштабируемости программно-аппаратного обеспечения ХД; сбора, очистки, преобразования, загрузки и актуализации данных в соответствии с установленными бизнес - процедурами.
6.	На этапе поддержки	F	Решаются задачи начальной инсталляции, включающей начальную загрузку хранилища из источников данных, и тестирования процедур обновления и синхронизации данных.

Обычно информационная пирамида имеет следующие уровни:

Какая из ниже перечисленных функций является функцией системы бизнес - аналитики?

При рассмотрении топологии данных с точки зрения безопасности необходимо изучить следующие вопросы:

Установите соответствие между понятиями, связанными с предметной областью, и их определениями.
Понятие Определение
1. Ядро предметной области A в каждый конкретный момент времени представляет собой выделенную совокупность определенных объектов и ситуаций.
2. Объект B взаимосвязи, выражающие взаимоотношения между объектами.
3. Класс ситуаций C является результатом абстрагирования реального объекта путем выделения и фиксации набора его свойств.
4. Состояние предметной области (снимок) D совокупность объектов (реалий внешнего мира), о которых можно задавать вопросы.

	Понятие		Определение
1.	Ядро предметной области	A	в каждый конкретный момент времени представляет собой выделенную совокупность определенных объектов и ситуаций.
2.	Объект	B	взаимосвязи, выражающие взаимоотношения между объектами.
3.	Класс ситуаций	C	является результатом абстрагирования реального объекта путем выделения и фиксации набора его свойств.
4.	Состояние предметной области (снимок)	D	совокупность объектов (реалий внешнего мира), о которых можно задавать вопросы.

Рассмотрим схему отношения ПРЕПОДАВАТЕЛЬ_ПРЕДМЕТ (Личный номер, Предмет, Фамилия, Должность, Оклад, Часы). Ключами отношения являются:

Учет временных зависимостей проектировщик ХД выполняет посредством

Неаддитивный факт – это

Укажите правильное соответствие между таблицами фактов и их определениями.
Элементы модели Определения
1. Транзакционная таблица фактов A В такой таблице собирают факты, фиксирующие текущее состояние определенного направления бизнеса.
2. Таблица фактов куммулятивных моментальных снимков B В такой таблице фактов сохраняют факты, которые фиксируют определенные события бизнеса.
3. Таблица фактов периодических моментальных снимков C В такой таблице собирают факты, фиксирующие некоторое итоговое состояние определенного направления бизнеса на текущий момент времени.

	Элементы модели		Определения
1.	Транзакционная таблица фактов	A	В такой таблице собирают факты, фиксирующие текущее состояние определенного направления бизнеса.
2.	Таблица фактов куммулятивных моментальных снимков	B	В такой таблице фактов сохраняют факты, которые фиксируют определенные события бизнеса.
3.	Таблица фактов периодических моментальных снимков	C	В такой таблице собирают факты, фиксирующие некоторое итоговое состояние определенного направления бизнеса на текущий момент времени.

Таблицей агрегатов фактов называется …

Логическая структура метаданных фактов, как правило, не включает в себя …

Корпоративные источники данных …

Укажите правильное соответствие между этапами алгоритма преобразования корпоративной модели данных в модель хранилища данных и их целями.
Элементы модели Определения
1. I. A Определить грануллированость данных для представления фактов модели ХД.
2. II. B Преобразовать взаимосвязи между данными для представления их в модели ХД.
3. III. C Перенести атрибуты из таблиц корпоративной модели данных в таблицы ХД.
4. IV. D Определить массивы данных модели ХД.
5. V. E Сгруппировать данные по частоте их использования.
6. VI. F Получить список сущностей и их атрибутов для представления в модели ХД.
7. VII. G Выполнить секционирование таблиц ХД.
8. VIII. H Добавить в модель или определить временные метки для представления истории объектов ХД.

	Элементы модели		Определения
1.	I.	A	Определить грануллированость данных для представления фактов модели ХД.
2.	II.	B	Преобразовать взаимосвязи между данными для представления их в модели ХД.
3.	III.	C	Перенести атрибуты из таблиц корпоративной модели данных в таблицы ХД.
4.	IV.	D	Определить массивы данных модели ХД.
5.	V.	E	Сгруппировать данные по частоте их использования.
6.	VI.	F	Получить список сущностей и их атрибутов для представления в модели ХД.
7.	VII.	G	Выполнить секционирование таблиц ХД.
8.	VIII.	H	Добавить в модель или определить временные метки для представления истории объектов ХД.

Выявление отношений "многие ко многим" в корпоративной модели данных позволяют определить …

Изменения в данных в "Своде данных" собираются …

Относятся ли следующие правила поддержки ссылочной целостности:

Установите соответствие между типами денормализации и их определениями.
Тип денормализации Определение
1. нисходящая денормализация А - это процесс введения избыточных колонок в одной таблице с целью увеличения производительности запроса строки по производному значению.
2. восходящая денормализация Б – это процесс введения избыточных колонок в родительских таблицах с целью устранения операций соединения с операциями агрегирования.
3. Внутритабличная денормализация В – это процесс введения избыточных колонок в подчиненных таблицах с целью устранения операций соединения.
4. Денормализация методом разделяй и властвуй Г – это процесс объединения одной или более нормализованных таблиц с целью устранения операций соединений или уменьшения в некоторых случаях числа операций вставки.
5. Денормализация методом слияния таблиц Д – это процесс разбиения нормализованной таблицы на две и более таблиц и создание между ними отношения "один к одному" с целью устранения дополнительных операций ввода-вывода или по техническим причинам.

	Тип денормализации		Определение
1.	нисходящая денормализация	А	- это процесс введения избыточных колонок в одной таблице с целью увеличения производительности запроса строки по производному значению.
2.	восходящая денормализация	Б	– это процесс введения избыточных колонок в родительских таблицах с целью устранения операций соединения с операциями агрегирования.
3.	Внутритабличная денормализация	В	– это процесс введения избыточных колонок в подчиненных таблицах с целью устранения операций соединения.
4.	Денормализация методом разделяй и властвуй	Г	– это процесс объединения одной или более нормализованных таблиц с целью устранения операций соединений или уменьшения в некоторых случаях числа операций вставки.
5.	Денормализация методом слияния таблиц	Д	– это процесс разбиения нормализованной таблицы на две и более таблиц и создание между ними отношения "один к одному" с целью устранения дополнительных операций ввода-вывода или по техническим причинам.

В контексте физического проектирования реляционных баз данных горизонтальное разбиение таблицы – это …

Установите соответствие между терминами и их определениями.
Термин Определение
1 Кластер А - это значение колонок, общих для кластеризуемых таблиц.
2 Индексный кластер Б -это кластер, для физической организации которого используется индекс со структурой B-Tree
3 Хеш-кластер В - это кластер, для физической организации которого использует структура на основе преобразования ключа.
4 Кластерный ключ Г - это группа таблиц, которая разделяет общие физические страницы данных при совместном использовании в запросах общих колонок этих таблиц.

	Термин		Определение
1	Кластер	А	- это значение колонок, общих для кластеризуемых таблиц.
2	Индексный кластер	Б	-это кластер, для физической организации которого используется индекс со структурой B-Tree
3	Хеш-кластер	В	- это кластер, для физической организации которого использует структура на основе преобразования ключа.
4	Кластерный ключ	Г	- это группа таблиц, которая разделяет общие физические страницы данных при совместном использовании в запросах общих колонок этих таблиц.

Укажите, какая модификация индекса со структурой B-Tree не поддерживается в СУБД Oracle?

Рассмотрим фрагмент определения преставления

SELECT * FROM east_sales@icp.ac.ru WHERE LOC = 'EAST'UNION ALLSELECT * FROM west_sales@ioc.ac.ru WHERE LOC = 'WEST';

Если заменить предложение WHERE на ограничение CHECK, то в таком случае …

Рассмотрим базу данных обработки заказов и создадим индексный кластер для хранения одной из таблиц базы данных - Customer.

CREATE CLUSTER cust_c (cust_id varchar(8))INDEX;CREATE INDEX cust_c_id ON CLUSTER cust_c;CREATE TABLE cust (cust_id 	varchar2(8) NOT NULL REFERENCES customers,ent#		number	NOT NULL,date_ent	date		NOT NULL,comment	varchar2(60)	NOT NULL,…PRIMARY KEY(cust_id, ent#)) CLUSTER cust_c (cust_id);

Созданная таблица кластеризована по колонке cust_id, и все специальные записи о клиента в колонке comment будут расположены в одной странице физической базы данных, либо в смежных страницах. Их можно выбрать за одну операцию поиска по индексу:

SELECT date_ent, comment FROM cust_c WHERE cust_id=:cur_cust;

Комментарий. На ограничение первичного ключа в операторе CREATE сделан индекс первичного ключа, чтобы избежать создания второго индекса.

Является ли такое решение преимуществом с точки зрения утверждения: "Строки, имеющие специальные записи о клиенте, имеют более одной записи о клиенте".

Задан оператор

SELECT Time, Region, Department, SUM(Profit) AS Profit FROM sales   GROUP BY CUBE(Time, Region, Department);

Укажите правильное результирующее множество.

Секционирование результирующего множества – это …

Оператор

SELECT Region. MIN(Population) AS Minimum, MAX(Populations)AS Maximum, AVG(Population) AS Average. VAR(Population) AS VarianceFROM Region GROUP BY Region ORDER BY Maximum DESC;

вычисляет …

Процедурные языки обработки данных требуют …

Оцените в терминах операций ввода вывода следующий запрос, который делает выборку данных из таблиц PRODUCT (50 строк) и VENDOR (1000):

SELECT VENDOR_CODE, PRODUCT_CODE, PRODUCT_DESCFROM VENDOR, PRODUCTWHERE VENDOR.VENDOR_CODE = PRODUCT.VENDOR_CODE AND VENDOR.VENDOR_CODE = "100";

По следующему пути доступа:

Формируем декартово произведение таблиц PRODUCT и VENDOR.

Выполняем проекцию результирующей таблицы на список колонок, указанный в предложении SELECT.

Ограничиваемся в результирующей таблице строками, которые удовлетворяют условию поиска в предложении WHERE.

если 20 строк удовлетворяют условиям поиска

Какие из ниже перечисленных причин приводят к нецелесообразности к созданию индексов для каждого оператора SELECT?

Куб данных является …

Элементами многомерной диаграммы являются …

В чем состоит эмпирическое правило Д. Энсора?

Установите соответствие между типами приложений и их определениями.
Тип приложения Определение
1. OLTP-система А - это такое приложение обработки данных, для которого база данных растет или сжимается в размерах периодически в зависимости от характера обработки данных.
2. DSS-система Б – это приложение, которое обеспечивает аналитическую обработку данных, включающую математический, статистический или иной анализ данных.
3. BATCH-системы В – это такое приложение, которое работает с базой данных в не интерактивном режиме.
4. OLAP-система Г – это такое приложение, которое работает с очень большой базой данных в режиме только чтение.
5. VCDB-система Д – это такое приложение, которое содержит в основном транзакции вставки, обновления и удаления, с высокой частотой преимущественно транзакций обновления.

	Тип приложения		Определение
1.	OLTP-система	А	- это такое приложение обработки данных, для которого база данных растет или сжимается в размерах периодически в зависимости от характера обработки данных.
2.	DSS-система	Б	– это приложение, которое обеспечивает аналитическую обработку данных, включающую математический, статистический или иной анализ данных.
3.	BATCH-системы	В	– это такое приложение, которое работает с базой данных в не интерактивном режиме.
4.	OLAP-система	Г	– это такое приложение, которое работает с очень большой базой данных в режиме только чтение.
5.	VCDB-система	Д	– это такое приложение, которое содержит в основном транзакции вставки, обновления и удаления, с высокой частотой преимущественно транзакций обновления.

К основным технологическим средствам реализации функциональности систем–бизнес – аналитики не относят …

Модель проектирования "Свод данных" имеет новые структурные элементы:

Статистические функции …

Основной целью систем бизнес – аналитики является …

Одной из главных целей разработки ХД является

Установите соответствие между статистическими функциями и их определениями.
Функция Возвращаемое значение
STDEV A Возвращает статистическое среднеквадратичное отклонение совокупности всех значений в указанном выражении.
STDEVP B Возвращает статистическую дисперсию для заполнения всех значений в указанном выражении.
VAR C Возвращает статистическую дисперсию всех значений в указанном выражении.
VARP C Возвращает статистическое стандартное отклонение всех значений в указанном выражении.

Функция		Возвращаемое значение
STDEV	A	Возвращает статистическое среднеквадратичное отклонение совокупности всех значений в указанном выражении.
STDEVP	B	Возвращает статистическую дисперсию для заполнения всех значений в указанном выражении.
VAR	C	Возвращает статистическую дисперсию всех значений в указанном выражении.
VARP	C	Возвращает статистическое стандартное отклонение всех значений в указанном выражении.

Путь доступа - это …

Нормализация отношений информационной модели предметной области является

Числовая мера интенсивности – это

Для достижения 3НФ необходимо, чтобы:

Квалифицируемые имена - это

К какой нормальной форме приведено исходное отношение?
Исходное отношение:

Преподаватель (Фамилия, Группа, Предмет )

Результирующие отношения:

Преподаватель_группа (Фамилия, Группа )

Преподаватель_предмет (Фамилия, Предмет )

Комментарий к ответу: Отношение Преподаватель содержит две многозначные ФЗ: Фамилия ->-> Группа и Фамилия ->-> Предмет. Это приводит к аномалии включения: если у преподавателя появляется новая группа, в отношение приходится добавлять несколько кортежей (по числу читаемых им предметов). Устранение аномалии заключается в выделении МФЗ в отдельное отношение.

Модель движения данных или ILM модель содержит следующие элементы:

К основным типам языков манипулирования данными в базах данных относят …

Какие из перечисленных ниже элементов не являются элементами метаданных ХД?

Установите соответствие между агрегатной функцией и ее определением.
Функция Определение
1 AVG(X) А Вычисляет среднее значение аргумента, который может быть выражением любого типа.
2 COUNT(X) Б Вычисляет число итемов.
3 MAX(X) В Вычисляет максимальное значение аргумента, который может быть выражением любого типа.
4 MIN(X) Г Вычисляет минимальное значение аргумента, который может быть выражением любого типа.
5 SUM(X) Д Вычисляет сумму значений аргумента, который может быть выражением любого типа.
6 STDEV(Х) Е Вычисляет стандартное отклонение на множестве значений аргумента, который может быть выражением любого типа.
7 VAR(X) Ж Вычисляет квадрат дисперсии.

	Функция		Определение
1	AVG(X)	А	Вычисляет среднее значение аргумента, который может быть выражением любого типа.
2	COUNT(X)	Б	Вычисляет число итемов.
3	MAX(X)	В	Вычисляет максимальное значение аргумента, который может быть выражением любого типа.
4	MIN(X)	Г	Вычисляет минимальное значение аргумента, который может быть выражением любого типа.
5	SUM(X)	Д	Вычисляет сумму значений аргумента, который может быть выражением любого типа.
6	STDEV(Х)	Е	Вычисляет стандартное отклонение на множестве значений аргумента, который может быть выражением любого типа.
7	VAR(X)	Ж	Вычисляет квадрат дисперсии.

Корпоративная модель данных создается …

В значения какого типа данных не могут быть преобразованы данные строкового типа?

Какой вид ограничений не рассматривается в рамках физической модели базы данных?

Рассмотрим схему отношения ПРОДУКТ (Номер_модели, Производитель, Тип_модели, Цена). Ключами отношения являются:

Будет ли ниже приведенный запрос при выборке данных обращаться к таблице данных? Колонка Ename проиндексирована.

SELECT COUNT(*) FROM EMPLOYEE WHERE Ename LIKE 'C%';

Аналитические SRM системы предназначены для …

Укажите ответы на какой вопрос не относится к решению задач управления хранилищем данных?

Укажите, какие объекты не являются результатами логического проектирования хранилища данных.

На основе каких понятий аналитик выделяет предметную область базы данных?

Укажите правильное соответствие между элементами логической модели и их определениями.
Элементы модели Определения
1. Сущность предметной области A - это атрибут сущности, позволяющий отличать одну сущность от другой.
2. Атрибут сущности B - это атрибут конкретного экземпляра сущности, у которого может быть только одно значение.
3. Экземпляры сущности C - это атрибут конкретного экземпляра сущности, у которого может быть несколько значений.
4. Уникальный идентификатор сущности D - это класс объектов или явлений предметной области базы данных.
5. Однозначный атрибут E - это выражение, определяющее значения, разрешенные для данного атрибута; область значений атрибута.
6. Многозначный атрибут F - это реализации сущности, отличающиеся друг от друга и допускающие однозначную идентификацию.
7. Домен атрибута G - это свойство или характеристика сущности.

	Элементы модели		Определения
1.	Сущность предметной области	A	- это атрибут сущности, позволяющий отличать одну сущность от другой.
2.	Атрибут сущности	B	- это атрибут конкретного экземпляра сущности, у которого может быть только одно значение.
3.	Экземпляры сущности	C	- это атрибут конкретного экземпляра сущности, у которого может быть несколько значений.
4.	Уникальный идентификатор сущности	D	- это класс объектов или явлений предметной области базы данных.
5.	Однозначный атрибут	E	- это выражение, определяющее значения, разрешенные для данного атрибута; область значений атрибута.
6.	Многозначный атрибут	F	- это реализации сущности, отличающиеся друг от друга и допускающие однозначную идентификацию.
7.	Домен атрибута	G	- это свойство или характеристика сущности.

Установите правильное соответствие между нормальными формами и некоторыми аспектами их определения.
Нормальная форма Определение
1. Первая нормальная форма (1НФ) A отношение должно удовлетворять зависимости по соединению относительно своих проекций.
2. Вторая нормальная форма (2НФ) B все неключевые атрибуты отношения функционально полно зависят от составного ключа отношения; отношение не должно содержать частичных ФЗ.
3. Третья нормальная форма (3НФ) C неключевые атрибуты отношения не зависят от ключей; отношение допускает наличия только таких нетривиальных ФЗ, в которых ключ определяет один или более других атрибутов: из Х следует А, где А не входит в Х, Х включает некоторый ключ.
4. Нормальная форма Бойса-Кодда (НФБК) D все неключевые атрибуты отношения зависят только от первичного ключа; отношение не должно содержать транзитивных ФЗ неключевых атрибутов от ключа.
5. Четвертая нормальная форма (4НФ) E отношение не должно содержать независимых многозначных ФЗ.
6. Пятая нормальная форма (5НФ) F все атрибуты отношения являются простыми, т.е. не имеют компонентов.

	Нормальная форма		Определение
1.	Первая нормальная форма (1НФ)	A	отношение должно удовлетворять зависимости по соединению относительно своих проекций.
2.	Вторая нормальная форма (2НФ)	B	все неключевые атрибуты отношения функционально полно зависят от составного ключа отношения; отношение не должно содержать частичных ФЗ.
3.	Третья нормальная форма (3НФ)	C	неключевые атрибуты отношения не зависят от ключей; отношение допускает наличия только таких нетривиальных ФЗ, в которых ключ определяет один или более других атрибутов: из Х следует А, где А не входит в Х, Х включает некоторый ключ.
4.	Нормальная форма Бойса-Кодда (НФБК)	D	все неключевые атрибуты отношения зависят только от первичного ключа; отношение не должно содержать транзитивных ФЗ неключевых атрибутов от ключа.
5.	Четвертая нормальная форма (4НФ)	E	отношение не должно содержать независимых многозначных ФЗ.
6.	Пятая нормальная форма (5НФ)	F	все атрибуты отношения являются простыми, т.е. не имеют компонентов.

К какой нормальной форме приведено исходное отношение?
Исходное отношение:

Преподаватель_предмет (Личный_#, Предмет, Часы, Фамилия, Должность, Оклад, Кафедра, Телефон )

Результирующие отношения:

Преподаватель (Личный_#, Фамилия, Должность, Оклад, Кафедра, Телефон )

Предмет(Личный_#, Предмет, Часы )

Комментарий к ответу: Отношение Преподаватель_Предмет содержит частичные ФЗ: пять последних неключевых атрибутов зависят от части ключа Личный_#. Это может привести к следующим аномалиям:

дублирование данных о преподавателе в случае, если он читает несколько предметов
проблема контроля избыточности данных: обновление значения "Оклад"
проблема нуль-значений: данные о преподавателе не могут быть включены, если они в настоящий момент не ведут обучения

Устранение аномалий заключается в выполнении двух проекций отношения.

Архитектура данных -

Интервальнаяе временная метка отличается от моментной временной метки тем, что …

Укажите правильное соответствие между подходами к построению логической темпоральной модели данных и их определениями.
Подход Определение
1. Подход, основанный на накоплении моментальных снимков A состоит в добавлении временной метки фиксации события (факта) как атрибута экземпляра сущности предметной области и отражении момента времени в таблице БД как истории жизни данных предметной области
2. Подход, основанный на фиксации событий предметной области B состоит в добавлении временных меток для фиксации начала и завершения определенного состояния как атрибутов экземпляра сущности предметной области экземпляров сущности, и отражении моментов времени начала и завершения определенного состояния сущности в таблице БД как истории жизни данных предметной области
3. Подход, основанный на фиксации состояний предметной области C состоит в сборе снимков фрагмента предметной области и накоплении таких снимков в различных фрагментах БД или другой БД как истории жизни данных предметной области

	Подход		Определение
1.	Подход, основанный на накоплении моментальных снимков	A	состоит в добавлении временной метки фиксации события (факта) как атрибута экземпляра сущности предметной области и отражении момента времени в таблице БД как истории жизни данных предметной области
2.	Подход, основанный на фиксации событий предметной области	B	состоит в добавлении временных меток для фиксации начала и завершения определенного состояния как атрибутов экземпляра сущности предметной области экземпляров сущности, и отражении моментов времени начала и завершения определенного состояния сущности в таблице БД как истории жизни данных предметной области
3.	Подход, основанный на фиксации состояний предметной области	C	состоит в сборе снимков фрагмента предметной области и накоплении таких снимков в различных фрагментах БД или другой БД как истории жизни данных предметной области

На основе каких понятий выполняется многомерное моделирование?

Какой из ниже перечисленных категорий таблиц нет в стандарте SQL-92?

Какие из перечисленных ниже элементов не являются элементами метаданных ХД?

Классификации метаданных по их функциональному назначению не включает следующий класс …

Установите соответствие между процессом и его определением.
Процесс Определение
Планирование ETL процесса A включает разработку и верификацию процесса заполнения статических таблиц измерений, разработку и верификацию механизмов изменения для каждой таблицы измерений.
Конструирование процесса заполнения таблиц измерений B включает в себя разработку диаграммы потоков данных от систем источников, определение преобразований, метода генерации ключей и последовательности операций для каждой таблицы назначения.
Конструирование процесса заполнения таблиц фактов C включает разработку и верификацию процесса первоначального заполнения таблиц фактов, разработку и верификацию процесса периодического дополнения таблиц фактов, построение агрегатов и разработку процедур автоматизации процесса ETL.

	Процесс	Определение
Планирование ETL процесса	A	включает разработку и верификацию процесса заполнения статических таблиц измерений, разработку и верификацию механизмов изменения для каждой таблицы измерений.
Конструирование процесса заполнения таблиц измерений	B	включает в себя разработку диаграммы потоков данных от систем источников, определение преобразований, метода генерации ключей и последовательности операций для каждой таблицы назначения.
Конструирование процесса заполнения таблиц фактов	C	включает разработку и верификацию процесса первоначального заполнения таблиц фактов, разработку и верификацию процесса периодического дополнения таблиц фактов, построение агрегатов и разработку процедур автоматизации процесса ETL.

Пусть, для таблицы базы данных EMPLOYEE
1. Номер личной карточки EMPNO (PK)
2. Фамилия ENAME
3. Имя LNAME
4. Страховка SSECNO
5. Номер подразделения DEPNO (FK)
6. Должность JOB
7. Возраст AGE
8. Стаж HIREDATE
9. Доплаты COMM
10 Зарплата SAL
11 Штрафы FINE
12 Автобиография Biog
13 Фотография Foto
задана следующая матрица распределения (использования) колонок таблицы (пронумерованы) по 10 транзакциям.
1 2 3 4 5 6 7 8 9 10 11 12 13
1 + + + + + + + + + + + + +
2 + + + + + + + + + + + + +
3 + + + + + + + + + + + + +
4 + + + + + + + + + + + + +
5 + + + - - + - - + + + - -
6 + + + - - + - - - - + - -
7 + + + - - + - - - + - - -
8 + + + - - + - - + - - - -
9 + + + - + - - - - - - - -
10 + + + - + - - - - - - - -
Как следует изменить предложенное в примере лекции вертикальное разбиение данной таблицы?

Запрос к схеме "звезда": "Пусть требуется просмотреть данные о продажах товара с идентификационным номером 33 за месяцы с мая по август текущего года по региону "Москва" с идентификационным номером 81". Укажите правильный вариант ответа.

Запрос к схеме "звезда": "Пусть руководству компании требуется отчет о прибыли по всем регионам по всем отделам продаж за 2007-08 гг". Укажите правильный ответ.

Задан оператор

SELECT Time, Region, Department, SUM(Profit) AS Profit FROM sales   GROUP BY ROLLUP(Time, Region, Department);

Укажите правильное результирующее множество.

К аналитическим функциям в SQL относят …

Функции ранжирования …

Задан оператор

SELECT r_regionkey, p_productkey, s_amount, s_profit,   RANK() OVER (ORDER BY s_amount DESC, s_profit DESC) AS 'Ранг по востоку'FROM region, product, salesWHERE region.r_regionkey = sales.s_regionkey AND product.p_productkey = sales.s_productkey AND r_regionkey = 'Восток';

Укажите правильное результирующее множество.

При оптимизации запросов, основанных на вычислении стоимости, …

Какие из ниже перечисленных причин приводят к нецелесообразности к созданию индексов для каждого оператора SELECT?

OLAP можно определить, как.…

Многомерная диаграмма (multidimensional diagram) представляет собой …

Элементами многомерной диаграммы являются …

Укажите правильное соответствие между этапами бизнес - модели создания хранилища данных и документами, которые создаются на каждом этапе.
Этап Документы
1. Формулирование требований A Спецификации на программно-аппаратное обеспечение, а также скрипты и установки для программного обеспечения
2. Создание вычислительной среды для хранилища данных B Перечень источников данных и их описание, а также логическая и физическая модели данных.
3. Моделирование данных C Каталог требований, утвержденный заказчиком и уточненный план проекта, который точно определяет используемые ресурсы и даты контрольных точек ходы выполнения проекта
4. Определение процедур извлечения, преобразования и загрузки данных D Документация, описывающая механизм доставки пользователям отчетов и спецификации экранных форм.
5. Проектирование аналитических отчетов E Схема соответствия данных подающих систем и ХД, программы или ETL - инструменты.
6. Разработка приложений хранилища данных F Спецификация кубов данных (измерения и метрики) и разработанные отчеты.
7. Настройка производительности G План тестирования ХД и заключение о готовности ХД к эксплуатации.
8. Проверка качества H Перечень рекомендаций по настойке производительности.

	Этап		Документы
1.	Формулирование требований	A	Спецификации на программно-аппаратное обеспечение, а также скрипты и установки для программного обеспечения
2.	Создание вычислительной среды для хранилища данных	B	Перечень источников данных и их описание, а также логическая и физическая модели данных.
3.	Моделирование данных	C	Каталог требований, утвержденный заказчиком и уточненный план проекта, который точно определяет используемые ресурсы и даты контрольных точек ходы выполнения проекта
4.	Определение процедур извлечения, преобразования и загрузки данных	D	Документация, описывающая механизм доставки пользователям отчетов и спецификации экранных форм.
5.	Проектирование аналитических отчетов	E	Схема соответствия данных подающих систем и ХД, программы или ETL - инструменты.
6.	Разработка приложений хранилища данных	F	Спецификация кубов данных (измерения и метрики) и разработанные отчеты.
7.	Настройка производительности	G	План тестирования ХД и заключение о готовности ХД к эксплуатации.
8.	Проверка качества	H	Перечень рекомендаций по настойке производительности.

В контексте проектирования физической модели данных ХД индексирование – это …

Какие из перечисленных ниже функций относятся к основным функциям метаданных в ХД?

Какое из ниже приведенных определений не связано с термином транзакция? Транзакция – это …

Относятся ли следующие правила поддержки ссылочной целостности:

Рассмотрим базу данных обработки заказов и создадим индексный кластер для хранения одной из таблиц базы данных - Customer.

CREATE CLUSTER cust_c (cust_id varchar(8))INDEX;CREATE INDEX cust_c_id ON CLUSTER cust_c;CREATE TABLE cust (cust_id 	varchar2(8) NOT NULL REFERENCES customers,ent#		number	NOT NULL,date_ent	date		NOT NULL,comment	varchar2(60)	NOT NULL,…PRIMARY KEY(cust_id, ent#)) CLUSTER cust_c (cust_id);

Созданная таблица кластеризована по колонке cust_id, и все специальные записи о клиента в колонке comment будут расположены в одной странице физической базы данных, либо в смежных страницах. Их можно выбрать за одну операцию поиска по индексу:

SELECT date_ent, comment FROM cust_c WHERE cust_id=:cur_cust;

Комментарий. На ограничение первичного ключа в операторе CREATE сделан индекс первичного ключа, чтобы избежать создания второго индекса.

Является ли такое решение преимуществом с точки зрения утверждения: "При выборке специальных записей о клиенте для клиента выбираются все такие записи".

Установите соответствие между понятиями, связанными с многомерным моделированием, и их определениями.
Понятие Определение
1. Факт A - это числовая характеристика факта, который определяет эффективность деятельности или бизнес - действия организации с точки зрения измерения.
2. Измерение B - это интерпретация факта с некоторой точки зрения в реальном мире.
3. Атрибут C – это описание характеристики реального объекта предметной области.
4. Параметр D - это набор связанных элементов данных, содержащих метрики и описательные данные.
5. Иерархия E – это уровень детализации данных, сохраняемых в ХД.
6. Гранулированность F - это отношение часть-целое или родитель - потомок

	Понятие		Определение
1.	Факт	A	- это числовая характеристика факта, который определяет эффективность деятельности или бизнес - действия организации с точки зрения измерения.
2.	Измерение	B	- это интерпретация факта с некоторой точки зрения в реальном мире.
3.	Атрибут	C	– это описание характеристики реального объекта предметной области.
4.	Параметр	D	- это набор связанных элементов данных, содержащих метрики и описательные данные.
5.	Иерархия	E	– это уровень детализации данных, сохраняемых в ХД.
6.	Гранулированность	F	- это отношение часть-целое или родитель - потомок

Запрос к схеме "звезда": "Пусть руководству компании требуется перекрестный отчет о прибыли по всем регионам по всем отделам продаж за 2007-08 гг без вывода частичных сумм". Укажите правильный ответ.

Какое свойство данных не характерно для операционных систем обработки данных?

Какое свойство не входит в классическое определение хранилища данных?

Операционные системы обработки данных создаются с учетом следующих значений параметров:

Аналитические SCM системы – это …

К какому из перечисленных методологических подходов к реализации хранилища данных относится следующая характеристика?
"Этот подход требует детального планирования и проектирования ХД в рамках ИТ – проекта до начала выполнения проекта".

Укажите, какие объекты не являются входными данными для проектирования хранилища данных.

Укажите правильное соответствие между этапами бизнес - модели создания хранилища данных и временными затратами, которые имеют место быть на каждом этапе.
Этапы Временные затраты
1. Формулирование требований A - от двух недель до полутора месяцев.
2. Создание вычислительной среды для хранилища данных B - от двух недель до двух месяцев.
3. Моделирование данных C - от одной недели до полутора месяцев.
4. Определение процедур извлечения, преобразования и загрузки данных D - от двух недель до двух месяцев.
5. Проектирование аналитических отчетов E - от одной недели до месяца.
6. Разработка приложений хранилища данных F зависит от числа разрабатываемых отчетов.
7. Настройка производительности G - от одной до четырех недель.
8. Проверка качества H не должно превышать одну-две недели.

	Этапы		Временные затраты
1.	Формулирование требований	A	- от двух недель до полутора месяцев.
2.	Создание вычислительной среды для хранилища данных	B	- от двух недель до двух месяцев.
3.	Моделирование данных	C	- от одной недели до полутора месяцев.
4.	Определение процедур извлечения, преобразования и загрузки данных	D	- от двух недель до двух месяцев.
5.	Проектирование аналитических отчетов	E	- от одной недели до месяца.
6.	Разработка приложений хранилища данных	F	зависит от числа разрабатываемых отчетов.
7.	Настройка производительности	G	- от одной до четырех недель.
8.	Проверка качества	H	не должно превышать одну-две недели.

Под жизненным циклом продукта понимается …

Системы бизнес-аналитики позволяют …

Временной зависимостью будем называть …

Установите уровень иерархии объектов реляционной базы данных, согласно стандарту SQL-92.
Уровень иерархии Объект
1. I А Кластеры
2. II Б Представления
3. III В Столбцы
4. IY Г Таблицы
5. IY Д Каталоги
6. V Е Строки
7. V Ж Схемы

	Уровень иерархии		Объект
1.	I	А	Кластеры
2.	II	Б	Представления
3.	III	В	Столбцы
4.	IY	Г	Таблицы
5.	IY	Д	Каталоги
6.	V	Е	Строки
7.	V	Ж	Схемы

Для каких из перечисленных ниже объектов реляционной базы данных не используются квалифицируемые имена?

В реляционной базе данных синоним - это …?

Какие из перечисленных ниже функций относятся к основным функциям метаданных в ХД?

Логическая структура метаданных метрик, как правило, не включает в себя …

Под аббревиатурой ETL — …

Разработка ETL процесса включает в себя следующие основные стадии:

"Свод данных" - есть …

Установите соответствие между терминами и их определениями.
Термин Определение
1 Ключ секционирования А колонка таблицы, относительно значений которых СУБД будет делать физическое разнесение таблицы по различным табличным пространствам на жестких дисках.
2 Секционирование по диапазону Б означает распределение строк таблицы на различные предопределенные табличные пространства в зависимости от значения ключа секционирования.
3 Хеш-секционирование В означает, что таблица сначала распределяется среди табличных пространств на основе диапазона значений ключа секционирования, далее каждая из полученных секций диапазонов делится на подчиненные секции или подсекции, и затем строки равномерно распределяются среди подчиненных секций по значению хеш-ключа.
4 Составное секционирование Г означает равномерное распределение строк таблицы по назначенным табличным пространствам в зависимости от значения ключа секционирования, который в данном случае хешируется.

	Термин		Определение
1	Ключ секционирования	А	колонка таблицы, относительно значений которых СУБД будет делать физическое разнесение таблицы по различным табличным пространствам на жестких дисках.
2	Секционирование по диапазону	Б	означает распределение строк таблицы на различные предопределенные табличные пространства в зависимости от значения ключа секционирования.
3	Хеш-секционирование	В	означает, что таблица сначала распределяется среди табличных пространств на основе диапазона значений ключа секционирования, далее каждая из полученных секций диапазонов делится на подчиненные секции или подсекции, и затем строки равномерно распределяются среди подчиненных секций по значению хеш-ключа.
4	Составное секционирование	Г	означает равномерное распределение строк таблицы по назначенным табличным пространствам в зависимости от значения ключа секционирования, который в данном случае хешируется.

Нужно ли в СУБД Oracle при определении кластерного ключа индексного кластера на первичном ключе одной из таблиц оставлять ограничение первичного ключа в определении колонки этого ключа?

FASMI означает быстрый анализ разделяемой многомерной информации, включающий следующие требования к приложениям для многомерного анализа …:

Какое свойство данных не характерно для систем складирования данных?

При конструировании процесса заполнения таблиц фактов проектировщик решает следующие основные задачи:

Относятся ли следующие правила поддержки ссылочной целостности:

Элементами многомерной диаграммы являются …

Сколько основных конструкций используется в логической модели предметной области?

Темпоральные данные -

Установите соответствие между фазами обработки команды SQL и действиями СУБД.
Тип данных Значение
1 фаза синтаксического разбора А включает проверку синтаксиса команды, проверку имен таблиц и колонок в базе данных, а также подготовку исходных данных для оптимизатора.
2 фаза оптимизации Б включает подстановку действительных имен таблиц и колонок базы данных в представление, идентификацию возможных вариантов выполнения команды, определения стоимости выполнения каждого варианта, выбор наилучшего варианта на основе внутренней статистики.
3 фаза генерации исполняемого кода В включает выполнение кода команды.
4 фаза выполнения команды Г включает построение выполняемого кода команды.

	Тип данных		Значение
1	фаза синтаксического разбора	А	включает проверку синтаксиса команды, проверку имен таблиц и колонок в базе данных, а также подготовку исходных данных для оптимизатора.
2	фаза оптимизации	Б	включает подстановку действительных имен таблиц и колонок базы данных в представление, идентификацию возможных вариантов выполнения команды, определения стоимости выполнения каждого варианта, выбор наилучшего варианта на основе внутренней статистики.
3	фаза генерации исполняемого кода	В	включает выполнение кода команды.
4	фаза выполнения команды	Г	включает построение выполняемого кода команды.

Выделение классов зависимых от времени атрибутов используется проектировщиков ХД для …

Основной целью создания операционных систем обработки данных является …

Многомерные "информационные кубы" …

Какое из ниже перечисленных ограничений не относится к ограничениям целостности данных?
(data integrity constraints) относятся к значениям данных в некоторых колонках и определяются в спецификации колонки с помощью элементов SQL

Установите соответствие между терминами и их определениями.
Термин Определение
1 Индекс А - это физический объект реляционной базы данных, организованный по принципу сбалансированной иерархической структуры.
2 Ключевые поля или ключи Б - это колонки, входящие в индекс.
3 Индекс B-Tree В - это объект в реляционной базе данных, который предназначен для организации быстрого доступа к строкам таблицы по значениям одной или более колонок этих строк.
4 Составной индекс Г - это индекс типа B-Tree базы данных, который одновременно выполняет роль таблицы.
5 Исключительно индексная таблица Д - это индекс, построенный для нескольких колонок таблицы.
6 Кардинальность колонки Е - это число дискретных различных значений колонки, которые встречаются в строках таблицы.

	Термин		Определение
1	Индекс	А	- это физический объект реляционной базы данных, организованный по принципу сбалансированной иерархической структуры.
2	Ключевые поля или ключи	Б	- это колонки, входящие в индекс.
3	Индекс B-Tree	В	- это объект в реляционной базе данных, который предназначен для организации быстрого доступа к строкам таблицы по значениям одной или более колонок этих строк.
4	Составной индекс	Г	- это индекс типа B-Tree базы данных, который одновременно выполняет роль таблицы.
5	Исключительно индексная таблица	Д	- это индекс, построенный для нескольких колонок таблицы.
6	Кардинальность колонки	Е	- это число дискретных различных значений колонки, которые встречаются в строках таблицы.

Относятся ли следующие правила поддержки ссылочной целостности:

В контексте физического проектирования реляционных баз данных вертикальное разбиение таблицы – это …

Укажите, какой вид работы не входит в этап проектирования физической модели хранилища данных

Укажите правильное соответствие между типами архитектур хранилищ данных и их определениями.
Архитектура Определение
1. Глобальное хранилище данных (Global data warehouse) или хранилище данных масштаба организации A управляются рабочими группами, отделами или направлениями бизнеса, и разрабатываются исключительно для реализации аналитических потребностей последних
2. Независимые киоски данных (Stand-alone Data Marts) B управляются рабочими группами, отделами или направлениями бизнеса, но разрабатываются в рамках единой для организации схемы удовлетворения информационных и аналитических потребностей
3. Связанные киоски данных C это такое ХД, в котором будут поддерживаться все, или большая часть, данных организации

	Архитектура		Определение
1.	Глобальное хранилище данных (Global data warehouse) или хранилище данных масштаба организации	A	управляются рабочими группами, отделами или направлениями бизнеса, и разрабатываются исключительно для реализации аналитических потребностей последних
2.	Независимые киоски данных (Stand-alone Data Marts)	B	управляются рабочими группами, отделами или направлениями бизнеса, но разрабатываются в рамках единой для организации схемы удовлетворения информационных и аналитических потребностей
3.	Связанные киоски данных	C	это такое ХД, в котором будут поддерживаться все, или большая часть, данных организации

К основным технологическим средствам реализации функциональности систем–бизнес – аналитики относят …

Схема "снежинка" имеет …

При проектировании метаданных хранилища данных не выполняется следующее действие …

Дополнительными элементами модели "Свод данных" являются …

Какое из перечисленных ниже словосочетаний не является синонимом?

Укажите преимущество секционирование представлений с помощью предложения WHERE?

Рассмотрим базу данных обработки заказов и создадим индексный кластер для хранения одной из таблиц базы данных - Customer.

CREATE CLUSTER cust_c (cust_id varchar(8))INDEX;CREATE INDEX cust_c_id ON CLUSTER cust_c;CREATE TABLE cust (cust_id 	varchar2(8) NOT NULL REFERENCES customers,ent#		number	NOT NULL,date_ent	date		NOT NULL,comment	varchar2(60)	NOT NULL,…PRIMARY KEY(cust_id, ent#)) CLUSTER cust_c (cust_id);

Созданная таблица кластеризована по колонке cust_id, и все специальные записи о клиента в колонке comment будут расположены в одной странице физической базы данных, либо в смежных страницах. Их можно выбрать за одну операцию поиска по индексу:

SELECT date_ent, comment FROM cust_c WHERE cust_id=:cur_cust;

Комментарий. На ограничение первичного ключа в операторе CREATE сделан, чтобы избежать создания второго индекса.

Является ли такое решение преимуществом с точки зрения утверждения: "Очень немного строк о клиентах имеют специальные записи о клиенте".

Укажите свойство, которое не является свойством индекса со структурой B-Tree?

Какие из ниже перечисленных объектов относятся к результатам проектирования логической модели хранилища данных?

Аддитивный факт - это

Операционные системы обработки данных создаются с учетом следующих значений параметров:

Установите соответствие между ранжируюoими функциями и их определениями.
Функция Возвращаемое значение
RANK A Возвращает ранг строк в секции результирующего набора без промежутков в ранжировании. Ранг строки равен количеству различных значений рангов, предшествующих строке, увеличенному на единицу. Возвращаемый тип данных bigint.
DENSE_RANK B Распределяет строки упорядоченной секции в заданное количество групп. Группы нумеруются, начиная с единицы. Для каждой строки функция возвращает номер группы, которой принадлежит строка.
NTILE C Возвращает последовательный номер строки в секции результирующего набора, 1 соответствует первой строке в каждой из секций. Возвращаемый тип данных bigint.
ROW_NUMBER D Возвращает ранг каждой строки в секции результирующего набора. Ранг строки вычисляется как единица плюс количество рангов, находящихся до этой строки. Возвращаемый тип данных bigint.

1.	Номер личной карточки	EMPNO (PK)
2.	Фамилия	ENAME
3.	Имя	LNAME
4.	Страховка	SSECNO
5.	Номер подразделения	DEPNO (FK)
6.	Должность	JOB
7.	Возраст	AGE
8.	Стаж	HIREDATE
9.	Доплаты	COMM
10	Зарплата	SAL
11	Штрафы	FINE
12	Автобиография	Biog
13	Фотография	Foto

	1	2	3	4	5	6	7	8	9	10	11	12	13
1	+	+	+	+	+	+	+	+	+	+	+	+	+
2	+	+	+	+	+	+	+	+	+	+	+	+	+
3	+	+	+	+	+	+	+	+	+	+	+	+	+
4	+	+	+	+	+	+	+	+	+	+	+	+	+
5	+	+	+	-	-	+	-	-	+	+	+	-	-
6	+	+	+	-	-	+	-	-	-	-	+	-	-
7	+	+	+	-	-	+	-	-	-	+	-	-	-
8	+	+	+	-	-	+	-	-	+	-	-	-	-
9	+	+	+	-	+	-	-	-	-	-	-	-	-
10	+	+	+	-	+	-	-	-	-	-	-	-	-

Функция		Возвращаемое значение
RANK	A	Возвращает ранг строк в секции результирующего набора без промежутков в ранжировании. Ранг строки равен количеству различных значений рангов, предшествующих строке, увеличенному на единицу. Возвращаемый тип данных bigint.
DENSE_RANK	B	Распределяет строки упорядоченной секции в заданное количество групп. Группы нумеруются, начиная с единицы. Для каждой строки функция возвращает номер группы, которой принадлежит строка.
NTILE	C	Возвращает последовательный номер строки в секции результирующего набора, 1 соответствует первой строке в каждой из секций. Возвращаемый тип данных bigint.
ROW_NUMBER	D	Возвращает ранг каждой строки в секции результирующего набора. Ранг строки вычисляется как единица плюс количество рангов, находящихся до этой строки. Возвращаемый тип данных bigint.

	1	2	3	4	5	6	7	8	9	10	11	12	13
1	+	+	+	+	+	+	+	+	+	+	+	+	+
2	+	+	+	+	+	+	+	+	+	+	+	+	+
3	+	+	+	+	+	+	+	+	+	+	+	+	+
4	+	+	+	+	+	+	+	+	+	+	+	+	+
5	+	+	+	-	-	+	-	-	+	+	+	-	-
6	+	+	+	-	-	+	-	-	-	-	+	-	-
7	+	+	+	-	-	+	-	-	-	+	-	-	-
8	+	+	+	-	-	+	-	-	+	-	-	-	-
9	+	+	+	-	+	-	-	-	-	-	-	-	-
10	+	+	+	-	+	-	-	-	-	-	-	-	-

Проектирование хранилищ данных для приложений систем деловой осведомленности (Business Intelligence Systems) - ответы

При оптимизации запросов, основанных на вычислении стоимости, отличается от оптимизации, основанной на правилах, в том, что …

Физическая модель реляционной базы данных есть

Основными характеристиками таблицы измерений являются следующие:

Клиентские OLAP-средства представляют собой…

MOLAP как способ хранения данных …

Information Liquidity Model (ILM) является графическим инструментом моделирования движения данных, которое позволяет построить модели

Оператор SELECT AVG(Col1) AS "?????" FROM Table WHERE ID BETWEEN MAX(ID) / 2 AND (MAX(ID) / 2) + SIGN(MAX{(ID) +1 % 2) вычисляет …

Сущности-концентраторы или просто хабы (hubs), являются…

Какой из ниже перечисленных объектов может быть материальной сущностью?

Система бизнес–аналитики должна предоставлять…

Уровень структуризации данных -

Основными характеристиками таблицы фактов являются следующие

Данные в системах складирования данных выступают как …

FASMI означает быстрый анализ разделяемой многомерной информации, включающий следующие требования к приложениям для многомерного анализа …

Очистку данных можно разделить на следующие типы:

Сущности должны создаваться в следующем порядке:

Полуаддитвный факт – это

Вырожденным измерением называется …

Метаданные хранилища данных определяются как …

При приятии решении о денормализации определите, что является наиболее важным для приложения базы данных?

Классификации метаданных по их функциональному назначению не включает следующий класс …

Какое свойство не входит в классическое определение хранилища данных?

Временные метки -

Данные в информационных системах выступают как …

Основной целью создания информационных систем является …

Какое свойство данных является общим для систем складирования данных и операционных систем обработки данных?

Какое свойство не входит в классическое определение хранилища данных?

Операционные системы обработки данных создаются с учетом следующих значений параметров:

Системы складирования данных создаются с учетом следующих значений параметров:

Среди факторов, влияющих на принятие решений о выборе способа реализации хранилища данных, укажите наиболее критические.

Аналитические CRM системы собирают информацию

Укажите, какие из ниже перечисленных компонент не являются составными частями архитектуры хранилища данных?

Какие из ниже перечисленных операций не входят в этап проектирования логической модели хранилища данных?

Какое из ниже перечисленных действий не относится к проверке правильности логической модели хранилища данных?

Укажите, какие из ниже перечисленных объектов относятся к результатам проектирования физической модели хранилища данных.

На этапе формулирования требований к хранилищу данных определяются …

Термин "Business Intelligence" означает …

Система деловой осведомленности или бизнес – аналитики (BI System) - …

Система бизнес-аналитики является …

При рассмотрении задач безопасности данных следует задаться следующими вопросами:

Какое из приведенных ниже определений является определением предметной области?

Какую из перечисленных ситуаций следует отнести к динамической ситуации?

При каких условиях нормализация не нужна?

Предположим, что атрибуты сущности зависят друг от друга следующим образом из X следует Y, а из Y следует A

Рассмотрим схему отношения R(город, адрес, почтовый_индекс). Ключами отношения являются:

Отметьте характерные основные виды данных для хранилищ данных:

Гранулярность времени показывает ...

Упорядоченным темпоральным запросом называется …

На практике проектировщики темпоральных моделей данных используют следующие классы временной зависимости атрибутов:

Для группировки классов атрибутов зависимых от времени проектировщиками ХД используется

Многомерное моделирование является …

Схема "звезда" имеет …

Агрегатами являются …

Таблицей – мостом называется …

Какой из перечисленных ниже объектов является обязательным элементам стандарта SQL-92?

В контексте проектирования физической модели реляционной базы данных ограничение – это …

Какое из перечисленных ниже бизнес-правил не относится к правилам ссылочной целостности?

В контексте проектирования физической модели реляционной базы данных имя – это …

Метаданные хранилища данных отвечают на вопросы …

Какие из перечисленных ниже функций относятся к основным функциям метаданных в ХД?

Логическая структура метаданных измерений, как правило, не включает в себя …

Не корпоративные источники данных: …

При проектировании процессов преобразования данных проектировщик ХД должен решить следующие задачи:

Корпоративная модель данных, как правило, имеет … уровней представления.

С точки зрения проектирования хранилищ данных корпоративная модель данных содержит в себе …

Идентификация бизнес- процессов предметной области позволяет определить ….

Указать трудности применения известных методик проектирования к разработке модели ХД масштаба предприятия с точки зрения проведения нормализации:

Сущности-связи являются …

При создании связей в структуре "Свода данных" следует соблюдать Х правил поддержки ссылочной целостности

Процесс преобразования нормализованной модели в модель "Свод данных" включает следующие этапы:

Относятся ли следующие правила поддержки ссылочной целостности:

Какая из ниже перечисленных команд SQL относится к термину запрос?

В контексте физического проектирования реляционных баз данных денормализация – это …

Какой из перечисленных ниже факторов не пытаются устранить в процессе денормализации?

В контексте проектирования физической модели данных ХД кластеризация – это …

Какой из перечисленных ниже типов колонок является плохим кандидатом для построения индекса?

Укажите, какое из ниже перечисленных утверждений не относится к недостаткам кластеризации?

Укажите недостаток секционирование представлений с помощью ограничения CHECK.

Результат выполнения оператора SELECT называется …

Оператор
SELECT AVG(Col1) AS "?????" FROM Table WHERE ID BETWEEN MAX(ID) / 2 AND (MAX(ID) / 2) + SIGN(MAX{(ID) +1 % 2)
вычисляет …

Задан оператор
SELECT Time, Region, Department, SUM(Profit) AS Profit FROM sales GROUP BY Time, ROLLUP (Region, Department);
Укажите правильное результирующее множество.

Оператор
SELECT OrderID, ProductID, OrderQty ,SUM(OrderQty) OVER(PARTITION BY OrderID) AS 'Итого' ,AVG(OrderQty) OVER(PARTITION BY OrderID) AS 'Среднее'FROM OrderDetailWHERE OrderID IN(43659,43664);
вычисляет …

	1	2	3	4	5	6	7	8	9	10	11	12	13
1	+	+	+	+	+	+	+	+	+	+	+	+	+
2	+	+	+	+	+	+	+	+	+	+	+	+	+
3	+	+	+	+	+	+	+	+	+	+	+	+	+
4	+	+	+	+	+	+	+	+	+	+	+	+	+
5	+	+	+	-	-	+	-	-	+	+	+	-	-
6	+	+	+	-	-	+	-	-	-	-	+	-	-
7	+	+	+	-	-	+	-	-	-	+	-	-	-
8	+	+	+	-	-	+	-	-	+	-	-	-	-
9	+	+	+	-	+	-	-	-	-	-	-	-	-
10	+	+	+	-	+	-	-	-	-	-	-	-	-