Проектирование хранилищ данных для приложений систем деловой осведомленности (Business Intelligence Systems) - ответы
При оптимизации запросов, основанных на вычислении стоимости, отличается от оптимизации, основанной на правилах, в том, что …
К какой нормальной форме приведено исходное отношение?
Исходное отношение:
Преподаватель (Личный_#, Фамилия, Должность, Оклад, Кафедра, Телефон )
Результирующие отношения:/
Преподаватель(Личный_#, Фамилия, Должность, Кафедра)
Должность (Должность, Оклад)
Кафедра (Кафедра, Телефон)
Комментарий к ответу: Отношение Преподаватель содержит транзитивные зависимости: Личный_#→Кафедра→Телефон и Личный_#→Должность→Оклад. Это может привести к следующим аномалиям:
Устранение аномалий заключается в выполнении трех проекций отношения.
Укажите правильное соответствие между этапами бизнес - модели создания хранилища данных и главными задачами каждого этапа.
Этапы | Задача этапа | ||
---|---|---|---|
1. | Формулирование требований | A | проектирование и разработка аналитических отчетов на спроектированной структуре данных. |
2. | Создание вычислительной среды для хранилища данных | B | формирование программной среды, в которой пользователи будут извлекать данные из ХД и просматривать предопределенные отчеты. |
3. | Моделирование данных | C | добиться оптимальной производительности ETL-процессов, производства отчетов и их доставки конечному пользователю. |
4. | Определение процедур извлечения, преобразования и загрузки данных | D | разработка логической и физической моделей данных для ХД. |
5. | Проектирование аналитических отчетов | E | идентификация и определение процедур извлечения, очистки (фильтрации), преобразования и загрузки данных. |
6. | Разработка приложений хранилища данных | F | идентификация требований заказчика ХД и оформление их в виде документа "Каталог требований". |
7. | Настройка производительности | G | убедиться, что ХД готово к эксплуатации. Как правило, проверка качества выполняется отдельной группой специалистов, не входящих в состав команды разработчиков |
8. | Проверка качества | H | создание информационно-вычислительной среды, в которой будет разрабатываться ХД. |
Укажите правильное соответствие между этапами алгоритма преобразования корпоративной модели в модель хранилища данных и их названиями.
Этапы | Наименования этапов | ||
---|---|---|---|
1. | I. | A | Преобразовать взаимосвязи между данными. |
2. | II. | B | Определить уровень структуризации (гранулированности) данных в ХД. |
3. | III. | C | Объединить данные из таблиц корпоративной модели данных в таблицах выбранной схемы ХД. |
4. | IV. | D | Выбрать данные данных корпоративной модели, которые следует хранить в ХД. |
5. | V. | E | Нахождение периодических групп данных или массивов данных и представление их в модели ХД. |
6. | VI. | F | Добавить в модель производные элементы данных. |
7. | VII. | G | Исследовать временные зависимости данных и, если необходимо, добавить элемента времени в ключи сущностей ХД. |
8. | VIII. | H | Разделение атрибутов согласно параметрам стабильности. |
Information Liquidity Model (ILM) является графическим инструментом моделирования движения данных, которое позволяет построить модели
Оператор SELECT AVG(Col1) AS "?????" FROM Table WHERE ID BETWEEN MAX(ID) / 2 AND (MAX(ID) / 2) + SIGN(MAX{(ID) +1 % 2)
вычисляет …
Укажите правильное соответствие между предикатами сравнения периодов времени и их определениями. Пусть Р1 есть временной интервал (P1Start, Р1End), а P2 - временной интервал (P2Start, Р2End).
Темпоральный предикат | Определения | ||
---|---|---|---|
1. | "Меньше чем" | A | (P1End = P2Start – 1) OR (P2End = P1Start – 1) |
2. | "Предшествует" | B | (P1Start <= P2Start) OR (P1End <= P2End) |
3. | "Встречаются" | C | (P1Start <= P2End) OR (P2Start <=P1End) |
4. | "Перекрывает" | D | P1Start < P2Start |
5. | "Содержится" | E | P1End < P2Start |
Дано отношение ОТГРУЗКА (корабль, дата отправления, грузополучатель, 1 партия грузов, 2 партия грузов, 3 партия грузов, объявленная стоимость, застрахованная стоимость). Использование этого отношения в реляционной базе данных может породить следующие проблемы:
FASMI означает быстрый анализ разделяемой многомерной информации, включающий следующие требования к приложениям для многомерного анализа …
Оцените в терминах операций ввода вывода следующий запрос, который делает выборку данных из таблиц PRODUCT (50 строк) и VENDOR (1000): SELECT VENDOR_CODE, PRODUCT_CODE, PRODUCT_DESCFROM VENDOR, PRODUCTWHERE VENDOR.VENDOR_CODE = PRODUCT.VENDOR_CODE AND VENDOR.VENDOR_CODE = "100";
По следующему пути доступа: Ограничение по условию поиска в второй таблице (VENDOR_CODE = "100"). Выполнение соединения полученной на 1 шаге результирующей таблицы с таблицей VENDOR.
если 20 строк удовлетворяют условиям поиска
При приятии решении о денормализации определите, что является наиболее важным для приложения базы данных?
Запрос к схеме "звезда": "Пусть руководству компании требуется отчет о прибыли по всем регионам по всем отделам продаж за 2007-08 гг. без итоговой суммы прибыли". Укажите правильный ответ.
Какое свойство данных является общим для систем складирования данных и операционных систем обработки данных?
Среди факторов, влияющих на принятие решений о выборе способа реализации хранилища данных, укажите наиболее критические.
Укажите правильное соответствие между преимуществами, которые получает организация от внедрения хранилищ данных и их расшифровкой.
Преимущества | Расшифровка | ||
---|---|---|---|
1. | Взгляд на данные организации, как на единое целое. | A | Сроки исполнения от 6 месяцев до 2-х лет в зависимости от объема хранилища данных, при следующем распределении затрат: для небольшого подразделения $ 400000-600000, для большого подразделения - $800000-1500000, для большой корпорации - $15000000. |
2. | 400% возврат инвестиций, вложенный в создание хранилища данных. | B | Анализ такой информации имеет решающее значение в принятие решений по всем вопросам, связанным с географией бизнеса. |
3. | Возрастает надежность данных для принятия решений. | C | Это ответы на такие вопросы, как -сколько продуктов реально производится? Что влияет на изменение спроса? Какие товары или услуги приносят наибольший доход? А также особенности и пристрастия своих клиентов. |
4. | Геопространственный анализ данных. | D | Данные, загружаемые в хранилище данных, подвергаются очистке - согласуются, проверяются, уточняются. |
5. | Исследование трендов и колебаний в бизнес-данных. организации во времени. | E | Позволяет достаточно надежно прогнозировать развитие бизнес-процессов |
Укажите, какие из ниже перечисленных компонент не являются составными частями архитектуры хранилища данных?
К какому из перечисленных методологических подходов к реализации хранилища данных относится следующая характеристика?
"У него есть и недостатки - данные могут дублироваться и быть несогласованными в разных киосках данных".
Какие из ниже перечисленных операций не входят в этап проектирования логической модели хранилища данных?
Какое из ниже перечисленных действий не относится к проверке правильности логической модели хранилища данных?
Укажите правильное соответствие между этапами бизнес - модели создания хранилища данных и рисками, которые имеют место быть на каждом этапе.
Этап | Документы | ||
---|---|---|---|
1. | Формулирование требований | A | Использование одного сервера БД для моделирования различных вычислительных сред, например, вычислительной среды разработки и вычислительной среды тестирования, или, что еще хуже, для вычислительной среды разработки и вычислительной среды эксплуатации ХД, особенно, если на этом сервере работает уже существующая информационная система. |
2. | Создание вычислительной среды для хранилища данных | B | Конфликт внутрикорпоративных интересов и в необходимости наладить коммуникации для успешного выполнения и этапа и проекта в целом. |
3. | Моделирование данных | C | Недооценка временных параметров и стремление команды разработчиков сделать процесс ETL как можно более всеобъемлющим, мотивируя свои действия стремлением обеспечить качество данных |
4. | Определение процедур извлечения, преобразования и загрузки данных | D | Самоуверенность проектировщиков ХД. |
5. | Проектирование аналитических отчетов | E | Ложное представление о достаточной квалификации пользователей ХД в ИТ - технологиях. |
6. | Разработка приложений хранилища данных | F | Не уделяется достаточного внимания оптимизации времени получения отчета. |
7. | Настройка производительности | G | Это люди: их квалификация, амбиции, заинтересованность в деле, мотивы и т.д. |
8. | Проверка качества | H | Использование вычислительной среды разработки ХД, которая не масштабируется к вычислительной среде эксплуатации ХД. |
Укажите, какие из ниже перечисленных объектов относятся к результатам проектирования физической модели хранилища данных.
Укажите правильное соответствие между элементами логической модели и их определениями.
Элементы модели | Определения | ||
---|---|---|---|
1. | Отношение (связь) | A | - это характер участия сущности в связи. |
2. | Уникальный идентификатор связи | B | – это соотношение между числом сущностей, участвующих в образовании связи. |
3. | Степень (мощность) связи | C | – это сущность, которая не может присутствовать в базе данных, пока не существует связанного с ней экземпляра другой сущности. |
4. | Класс принадлежности сущности | D | – это сущность, которая порождает непересекающиеся подмножества экземпляров (категории сущности), связанных с сущностью через значения своего атрибута. |
5. | Рефлексивное отношение | E | – это категория порождающей сущности (сущности- супертипа). |
6. | Слабая сущность | F | представляет собой соединение (взаимоотношение) между двумя или более сущностями. |
7. | Супертип | G | - это супертип с порожденными им подтипами. |
8. | Подтип | H | - это атрибут для однозначной идентификации отношения. |
9. | Составная сущность | J | - это отношение, связывающее сущность саму с собой. |
Предположим, что атрибуты сущности зависят друг от друга следующим образом из X следует Y, а из Y следует A
К какой нормальной форме приведено исходное отношение?
Исходное отношение:
Курсовой_проект (Преподаватель - Предмет - Студент)
Иванов - Тема1 - Петрова
Фролов - Тема1 - Исаев
Антонов - Тема1 - Сидоров
Иванов - Тема2 - Ивлева
Фролов - Тема2 - Степанов
Фролов - Тема3 - Мусин
Антонов - Тема3 - Сац
Результирующие отношения:
Руководство (Преподаватель, Предмет)
Выполнение (Студент, Предмет)
Комментарий к ответу: На роль ключа отношения Курсовой_проект претендует набор атрибутов {Преподаватель, Предмет}. Студент выполняет только один проект, один и тот же проект может выполняться несколькими студентами у разных преподавателей. Отношение содержит следующие ФЗ: {Преподаватель, Предмет} -> Студент и Студент -> Предмет.
Отношение находится в 3НФ и не содержит частичных и транзитивных ФЗ. Однако наличие ФЗ части составного ключа от неключевого атрибута может привести к следующим аномалиям:
Устранение аномалий заключается в удалении ФЗ ключа от неключевого атрибута.
Установите соответствие между понятиями, связанными с временными метками.
Понятие | Определение | ||
---|---|---|---|
1. | Время фиксации события или факта | A | - это временная метка, связанная со временем загрузки данных в ХД. |
2. | Время операции | B | - это временная метка, представляющая время, когда данные были извлечены или собраны из источника данных. |
3. | Время сбора данных | C | - это временная метка, представляющая время, когда была выполнена операцию хозяйственной деятельности организации. |
4. | Время актуализации данных | D | - это временная метка, которая представляет время события или состояния предметной области. |
На практике проектировщики темпоральных моделей данных используют следующие классы временной зависимости атрибутов:
Установите соответствие между объектами реляционной базы данных и их определениями.
Объект | Определение | ||
---|---|---|---|
1. | Кластер | А | - это группа каталогов, к которым можно обращаться через одно соединение с сервером базы данных |
2. | Каталог | Б | - это базовая структура реляционной базы данных, которая представляет собой единицу хранения данных. |
3. | Схема | В | - это поименованная динамически поддерживаемая СУБД выборка из одной или нескольких таблиц базы данных. |
4. | Таблица | Г | - это группа схем |
5. | Представление | Д | - это контейнер для таблиц, представлений и других структурных элементов реляционной базы данных. |
6. | Пользователь | Е | - это объект, обладающий возможностью создавать или использовать другие объекты базы данных и запрашивать выполнение функций СУБД таких, как организация сеанса работы, изменение состояние базы данных и т. д. |
7. | Синоним | Ж | - это объект базы данных, создаваемый для повышения производительности выборки данных и контроля уникальности первичного ключа (если он задан для таблицы). |
8. | Индекс | З | - это альтернативное имя объекта (псевдоним) реляционной базы данных, которое позволяет иметь доступ к данному объекту |
Установите соответствие между типами данных для представления чисел и значениями, которые они определяют.
Тип данных | Значение | ||
---|---|---|---|
1. | Integer | А | Целое |
2. | Smallint | Б | Числа с заданной точностью |
3. | Number [(точность [, масштаб])] | В | Числа с заданной точностью |
4. | Decimal[(точность [, масштаб])] | Г | Маленькое целое |
5. | tinyint | Д | Числа от 0 до 255 |
6. | Float (точность) | Е | Числа с плавающей запятой одинарной точности |
7. | Real | Ж | Числа с плавающей запятой заданной точности |
Дополните состав описания преобразований данных, приведенный ниже, из указанного в ответах списка. Идентификацию полей источников данных Соответствие между атрибутами сущностей источников данных и атрибутами объектов ХД Преобразования атрибутов Физические характеристики преобразований Преобразования таблиц кодировки и ссылочных таблиц Алгоритмы трансформации данных и т. д.
Установите соответствие между процессом и его определением.
Процесс | Определение | |
---|---|---|
Извлечение данных | A | На этой стадии релевантные данные преобразуются в формат представления данных в ХД, правила преобразования сохраняются в метаданных ХД, формируются ключевые поля таблиц физической структуры ХД, выполняется очистка данных. |
Преобразование данных | B | На этой стадии данные загружаются в ХД, выполняется построение агрегатов. |
Загрузка данных | C | На этой стадии отбираются и описываются данные внешних источников (начинают формироваться метаданные ХД), которые должны быть храниться в ХД (релевантные данные). |
Установите соответствие между дигарммами ILM модели и их определением.
Процесс | Определение | |
---|---|---|
Диаграмма движения данных | A | – это диаграмма высокого уровня, которая позволяет моделировать преобразование данных посредством определения |
Диаграмма преобразования данных | B | - это диаграмма низкого уровня, которая позволяет моделировать конкретные задачи преобразования посредством определения того, как данные извлекаются из входного источника данных, как преобразуются и как загружаются в выходной источник данных. |
Диаграмма управления преобразованием | C | - это диаграмма низкого уровня модели, которая позволяет определить последовательность выполнения серии задач преобразования. |
Указать трудности применения известных методик проектирования к разработке модели ХД масштаба предприятия с точки зрения проведения нормализации:
При создании связей в структуре "Свода данных" следует соблюдать Х правил поддержки ссылочной целостности
Установите соответствие между элементом определения транзакции и его смыслом.
Элемент | Определение | ||
---|---|---|---|
1. | Имя транзакции и номер транзакции | А | уникальная идентификация каждой транзакции базы данных. |
2. | Описание транзакции | Б | онлайновая транзакция или пакетная транзакция, высокая, средняя, низкая. |
3. | Характер транзакции и ее сложность | В | перечень операций предметной области, которые выполняются транзакцией. |
4. | Объем транзакции | Г | средняя частота и пиковая частота использования. |
5. | Требования к производительности транзакции | Д | количество секунд, необходимое для завершения транзакции в режиме эксплуатации базы данных. |
6. | Относительный приоритет | Е | насколько важна настоящая транзакция для предметной области по сравнению с другими. |
7. | Время выполнения транзакции | Ж | количества секунд, требуемых для выполнения транзакции |
Для случая горизонтального разбиения таблицы в тексте лекции были разобраны примеры поддержки ссылочной целостности для новой таблицы. В качестве какой таблицы выступала таблицы, которая подвергалась разбиению?
Установите соответствие между терминами и их определениями.
Термин | Определение | ||
---|---|---|---|
1 | Локально секционированный индекс | А | имеет такой же ключ секционирования, количество табличных пространств и правила секционирования, что и отвечающая ему базовая таблица. |
2 | Глобально секционированный индекс | Б | ключ секционирования секционирование выполняется по значениям, отличным от значений колонки индексирования. |
3 | Префиксный секционированный индекс | В | означает, что индекс имеет то же число секций и те же правила секционирования, что и его базовая таблица. |
4 | Непрефиксный секционированный индекс | Г | содержит предложение PARTITION BY RANGE, в котором задаются параметры секционирования, отличные от параметров секционирования соответствующей базовой таблицы. |
5 | Локально равносекционированный секционированный индекс | Г | секционирование производится по ключу секционирования, который содержит основную часть индексного ключа. |
. Рассмотрим базу данных обработки заказов и создадим индексный кластер для хранения одной из таблиц базы данных - Customer. CREATE CLUSTER cust_c (cust_id varchar(8))INDEX;CREATE INDEX cust_c_id ON CLUSTER cust_c;CREATE TABLE cust (cust_id varchar2(8) NOT NULL REFERENCES customers,ent# number NOT NULL,date_ent date NOT NULL,comment varchar2(60) NOT NULL,…PRIMARY KEY(cust_id, ent#)) CLUSTER cust_c (cust_id);
Созданная таблица кластеризована по колонке cust_id, и все специальные записи о клиента в колонке comment будут расположены в одной странице физической базы данных, либо в смежных страницах. Их можно выбрать за одну операцию поиска по индексу: SELECT date_ent, comment FROM cust_c WHERE cust_id=:cur_cust;
Комментарий. На ограничение первичного ключа в операторе CREATE сделан, чтобы избежать создания второго индекса.
Является ли такое решение преимуществом с точки зрения утверждения: "Все записи о клиентах выбираются для ежегодного отчета".
Запрос к схеме "звезда": "Определить, сколько нереализованных подушек было в сети магазинов торговой организации в январе 2009 года.". Укажите правильный вариант ответа.
Запрос к схеме "звезда": "Пусть руководству компании требуется отчет о прибыли по всем регионам по всем отделам продаж за 2007-08 гг. без итоговой суммы прибыли". Укажите правильный ответ.
Запрос к схеме "звезда": "Пусть руководству компании требуется перекрестный отчет о прибыли по всем регионам по всем отделам продаж за 2007-08 гг.". Укажите правильный ответ.
Задан оператор SELECT Time, Region, Department, SUM(Profit) AS Profit FROM sales GROUP BY Time, ROLLUP (Region, Department);
Укажите правильное результирующее множество.
Оператор SELECT OrderID, ProductID, OrderQty ,SUM(OrderQty) OVER(PARTITION BY OrderID) AS 'Итого' ,AVG(OrderQty) OVER(PARTITION BY OrderID) AS 'Среднее'FROM OrderDetailWHERE OrderID IN(43659,43664);
вычисляет …
Задан оператор SELECT р_productkey, SUM(s_amount) as 'Суммарное количество', RANK() OVER (ORDER BY SUM(s_amount) DESC) AS 'rank_all', DENSE_RANK() OVER (ORDER BY SUM(s_amount) DESC) AS 'rank_dense'FROM salesGROUP BY р_productkey;
Укажите правильное результирующее множество.
Установите соответствие между некоторыми функциями построения линейной регрессии и их определениями.
Функция | Возвращаемое значение | |
---|---|---|
REGR_SLOPE | A | Функция вычисляет отсечение на оси Y |
REGR_INTERCEPT | B | Функция вычисляет тангенс угла наклона линии регрессии, соответствующей ненулевым парам (e1, e2). |
REGR_R2 | C | Функция возвращает количество ненулевых пар, которые участвуют в построении линии регрессии. |
REGR_COUNT | C | Функция вычисляет коэффициент детерминации для линии регрессии (после проверки пар (e1, e2) на нуль). |
Концепция независимости прикладных программ от физической структуры данных не дает следующих преимуществ:
Оцените в терминах операций ввода вывода следующий запрос, который делает выборку данных из таблиц PRODUCT (50 строк) и VENDOR (1000): SELECT VENDOR_CODE, PRODUCT_CODE, PRODUCT_DESCFROM VENDOR, PRODUCTWHERE VENDOR.VENDOR_CODE = PRODUCT.VENDOR_CODE AND VENDOR.VENDOR_CODE = "100";
По следующему пути доступа: Формируем декартово произведение таблиц PRODUCT и VENDOR. Ограничиваемся в результирующей таблице строками, которые удовлетворяют условию поиска в предложении WHERE. Выполняем проекцию результирующей таблицы на список колонок, указанный в предложении SELECT.
если 20 строк удовлетворяют условиям поиска
Какие из ниже перечисленных причин приводят к нецелесообразности к созданию индексов для каждого оператора SELECT?
FASMI означает быстрый анализ разделяемой многомерной информации, включающий следующие требования к приложениям для многомерного анализа …
Какое из перечисленных ниже вопросно-ответных отношений нельзя реализовать в информационной системе обслуживания счетов клиентов банка?
Задана команда: SELECT Time, Region, Department, SUM(Profit) AS Profit, GROUPING (Time) as T, GROUPING (Region) as R, GROUPING (Department) as D FROM SalesGROUP BY ROLLUP (Time, Region, Department);
Какое из ниже перечисленных утверждений является для нее правильным?
Разбиение сущностей корпоративной модели на транзакционные и не транзакционные позволяет определить …
Сколько этапов алгоритма преобразования корпоративной модели данных в модель хранилища данных являются обязательными (т.е. практически всегда имеют место быть)?
Укажите правильное соответствие между типовыми архитектурными элементами логической структуры CIF и их характеристиками
Элементы | Характеристики | ||
---|---|---|---|
1. | Системы, доставшиеся «по наследству» (Legacy Systems) | A | Здесь накапливается детальная информация, необходимая для выполнения анализа. Данные перегружаются в корпоративное хранилище из оперативных элементов — унаследованных систем, автоматизированных банковских систем или оперативных складов данных. Как правило обновление информации в EDW происходит с большой задержкой. Для разрешения этой проблемы используются ODS-элементы. |
2. | Приложения оперативного управления организацией (OLTP) | B | Предназначены для хранения аналитической информации уровня подразделения или направления бизнеса. |
3. | Оперативные склады данных (Operational Data Store — ODS) | C | DSS, примером функционала которых могут быть системы анализа клиентской базы банка, обеспечивают поддержку принятия решений. Разнообразный статистический анализ выполняется в DM. |
4. | Компоненты преобразования данных (ETL-tools, Staging Area, Near-line Storage) | D | Этот элемент наделяется свойствами как оперативных, так и аналитических систем. Основное его назначение — обеспечить осуществление анализа информации практически сразу после ее обновления в оперативных системах |
5. | Корпоративное хранилище данных (Enterprise Data Warehouse) | E | Служат для перегрузки данных из одних программных компонентов в другие (с промежуточной очисткой и согласованием данных, получаемых из различных источников). |
6. | Витрины данных (Data Marts) | F | Поддерживают бизнес-функции, которые были созданы в организации ранее. В таких системах обычно компоненты, обеспечивающие формирование отчетов и ввод и передачу данных, реализуются в рамках единого программного блока, что затрудняет решение задач по интеграции и преобразованию данных в соответствие с новыми требованиями бизнеса. |
7. | Приложения поддержки принятия решений (DSS) и приложения анализа данных (DM) | G | Обеспечивает публикацию данных в сети Интранет (Интернет), а также обработку результатов ввода информации пользователями. |
8. | Инфраструктура сетевых коммуникаций | H | Обеспечивают быструю обработку данных в рамках бизнес - направлений деятельности организации. Как правило, такие системы приобретаются у компании-разработчика, которая осуществляет их техническую поддержку. |
Установите соответствие между объектами реляционной базы данных, относящимися к так называемому серверному коду, и их определениями
Объект | Определение | ||
---|---|---|---|
1. | Хранимая процедура | А | - это объект базы данных, представляющий поименованный набор команд SQL и/или операторов специализированных языков программирования базы данных |
2. | Функция | Б | - это поименованный оператор SQL, который заранее откомпилирован и сохраняется в базе данных. Скорость обработки команды выше, чем у соответствующего ему оператора SQL, т.к. при этом не выполняются фазы синтаксического разбора и компиляции. |
3. | Команда | В | - это объект базы данных, представляющий поименованный набор команд SQL и/или операторов специализированных языков обработки программирования базы данных, который при выполнении возвращает значение - результат вычислений. |
4. | Триггер | Г | - это объект базы данных, который представляет собой специальную хранимую процедуру. Эта процедура запускается автоматически, когда происходит связанное с триггером событие (например, до вставки строки в таблицу). |
5. | Таймер | Д | - это объект базы данных, который состоит из поименованного, структурированного набора переменных, процедур и функций. |
6. | Пакет | Е | - это триггер, с запускающимся событием таймера. |
Какая характеристика транзакции задается ниже следующей спецификацией? "Онлайновые транзакции низкой сложности должны выполнятся не более 4 с."
Задан оператор SELECT р_productkey, SUM(s_amount) as 'Суммарное количество', RANK() OVER (ORDER BY SUM(s_amount) DESC) AS 'rank_all', DENSE_RANK() OVER (ORDER BY SUM(s_amount) DESC) AS 'rank_dense'FROM salesGROUP BY р_productkey;
Укажите правильное результирующее множество.
Установите соответствие между ограничениями и их содержанием.
Ограничение | Описание | ||
---|---|---|---|
1. | CHECK | А | Гарантирует, что колонка всегда содержит значение и оно и уникально в таблице. |
2. | DEFAULT | Б | Помещает значение по умолчанию в колонку. Гарантирует, что колонка всегда имеет значение. |
3. | FOREING KEY | В | Гарантирует, что значения существую, как значение в колонке первичного ключа другой таблицы. Обеспечивает процедуры удаления дочерних строк при удалении связанных с ней родительских. |
4. | NOT NULL | Г | Гарантирует, что значение будет уникальным в таблице |
5. | PRIMARY KEY | Д | Гарантирует, что значения находятся в границах специфицированного интервала, задаваемого предикатом. |
6. | UNIQUE | Е | Гарантирует, что колонка всегда содержит значение. |
Укажите правильное соответствие между вариантами реализации хранилища данных и их характеристиками
Варианты реализации | Характеристики | ||
---|---|---|---|
1. | Виртуальное хранилище данных | A | Архитектура представляет собой единый источник интегрированных данных организации |
2. | Глобальное хранилище данных | B | Архитектура является разновидностью глобального ХД, в которую технологически реализуются три уровня (На первом уровне располагается корпоративное ХД организации. На втором уровне поддерживаются связанные киоски данных тематической направленности на основе многомерной СУБД. На третьем уровне находятся клиентские приложения пользователей с установленными на них средствами анализа данных |
3. | Хранилища данных с многоуровневой (в основном трехзвенной) архитектурой или корпоративные ХД | C | Архитектура обеспечивает доступ к "живым" данным в режиме реального времени через программное обеспечение промежуточного слоя. В основе такого решения лежит репозитарий метаданных, который описывает источники данных, процедуры их предварительной обработки и форматы представления информации конечному пользователю. Недостаток такого решения - интенсивный сетевой трафик, снижение производительности несущей системы, угроза нарушения целостности данных в случае неудачных действий пользователей ХД |
4. | Встроенные (комбинированные) хранилища данных. | D | В этой архитектуре ХД не является единым физическим репозиторием (в отличие от CIF). Это "виртуальное" ХД, представляющее коллекцию витрин данных, каждая из которых имеет архитектуру типа "звезда". |
5. | Корпоративная информационная фабрика (Corporate Information Factory, CIF). | E | Архитектура представляет собой ХД, которые органически встраиваются в виртуальное предприятие (Enterprise Information Factory, EIF) или используются как компонент аналитической поддержки в информационной реализации бизнес-функций. |
6. | Хранилище данных с архитектурой шины данных (Data Warehouse Bus). | F | Архитектура является развитием архитектуры корпоративного ХД (enterprise data warehouse, EDW). Использование данной архитектуры предполагает скоординированное извлечение данных из источников, загрузку их в реляционную БД со структурой в третьей нормальной форме, использование построенного ХД для наполнения дополнительных репозиториев презентационных данных. |
7. | Объединенное (федеративное) ХД. | G | Архитектура представляет собой облегченный вариант ХД тематической направленности. |
8. | Киоски данных. | H | В этой архитектуре ХД состоит из ряда экземпляров ХД, которые функционируют на полуавтономной основе и, как правило, организационно или географически разнесены, однако могут рассматриваться и управляться как одно большое ХД. |
К какому из перечисленных методологических подходов к реализации хранилища данных относится следующая характеристика?
"Достоинством такого подхода является получение более согласованных определений данных и бизнес-правил организации в самом начале работы над созданием ХД. Стоимость начального планирования и проектирования может оказаться достаточно высокой. Для этого подхода характерны большие затраты времени, что откладывает начало реализации и задерживает возврат инвестиций. Этот подход хорошо работает в организациях с хорошо организованной информационно-вычислительной структурой, когда программно-аппаратная платформа определена, существуют слаженно работающие источники данных".
Укажите правильное соответствие между этапами проектирования хранилища данных и их кратким содержанием.
Этап | Содержание | ||
---|---|---|---|
1. | На этапе планирования | A | Решаются задачи: определение требований владельца ХД; определение требований конечных пользователей; определение технологических требований; определение архитектурных требований |
2. | На этапе разработки требований | B | Решаются задачи: выбор стратегии реализации и методологии разработки, анализ задач, для решения которых создается ХД, анализ ресурсов разработки с технологической точки зрения и с точки зрения задач бизнеса, выбор архитектуры ХД, определяется бюджет проекта, разрабатываются возможные сценарии использования ХД, начинается сбор метаданных для ХД |
3. | На этапе анализа | C | Решаются задачи разработки физической модели ХД, проектирования процедур поступления данных в него и проектирования архитектуры приложений |
4. | На этапе проектирования | D | Решаются задачи построения согласованной по источникам логической модели и определения набора инструментальных средств для работы с ХД. |
5. | На этапе внедрения | E | Решаются задачи поддержки работоспособности и масштабируемости программно-аппаратного обеспечения ХД; сбора, очистки, преобразования, загрузки и актуализации данных в соответствии с установленными бизнес - процедурами. |
6. | На этапе поддержки | F | Решаются задачи начальной инсталляции, включающей начальную загрузку хранилища из источников данных, и тестирования процедур обновления и синхронизации данных. |
Установите соответствие между понятиями, связанными с предметной областью, и их определениями.
Понятие | Определение | ||
---|---|---|---|
1. | Ядро предметной области | A | в каждый конкретный момент времени представляет собой выделенную совокупность определенных объектов и ситуаций. |
2. | Объект | B | взаимосвязи, выражающие взаимоотношения между объектами. |
3. | Класс ситуаций | C | является результатом абстрагирования реального объекта путем выделения и фиксации набора его свойств. |
4. | Состояние предметной области (снимок) | D | совокупность объектов (реалий внешнего мира), о которых можно задавать вопросы. |
Рассмотрим схему отношения ПРЕПОДАВАТЕЛЬ_ПРЕДМЕТ (Личный номер, Предмет, Фамилия, Должность, Оклад, Часы). Ключами отношения являются:
Укажите правильное соответствие между таблицами фактов и их определениями.
Элементы модели | Определения | ||
---|---|---|---|
1. | Транзакционная таблица фактов | A | В такой таблице собирают факты, фиксирующие текущее состояние определенного направления бизнеса. |
2. | Таблица фактов куммулятивных моментальных снимков | B | В такой таблице фактов сохраняют факты, которые фиксируют определенные события бизнеса. |
3. | Таблица фактов периодических моментальных снимков | C | В такой таблице собирают факты, фиксирующие некоторое итоговое состояние определенного направления бизнеса на текущий момент времени. |
Укажите правильное соответствие между этапами алгоритма преобразования корпоративной модели данных в модель хранилища данных и их целями.
Элементы модели | Определения | ||
---|---|---|---|
1. | I. | A | Определить грануллированость данных для представления фактов модели ХД. |
2. | II. | B | Преобразовать взаимосвязи между данными для представления их в модели ХД. |
3. | III. | C | Перенести атрибуты из таблиц корпоративной модели данных в таблицы ХД. |
4. | IV. | D | Определить массивы данных модели ХД. |
5. | V. | E | Сгруппировать данные по частоте их использования. |
6. | VI. | F | Получить список сущностей и их атрибутов для представления в модели ХД. |
7. | VII. | G | Выполнить секционирование таблиц ХД. |
8. | VIII. | H | Добавить в модель или определить временные метки для представления истории объектов ХД. |
Установите соответствие между типами денормализации и их определениями.
Тип денормализации | Определение | ||
---|---|---|---|
1. | нисходящая денормализация | А | - это процесс введения избыточных колонок в одной таблице с целью увеличения производительности запроса строки по производному значению. |
2. | восходящая денормализация | Б | – это процесс введения избыточных колонок в родительских таблицах с целью устранения операций соединения с операциями агрегирования. |
3. | Внутритабличная денормализация | В | – это процесс введения избыточных колонок в подчиненных таблицах с целью устранения операций соединения. |
4. | Денормализация методом разделяй и властвуй | Г | – это процесс объединения одной или более нормализованных таблиц с целью устранения операций соединений или уменьшения в некоторых случаях числа операций вставки. |
5. | Денормализация методом слияния таблиц | Д | – это процесс разбиения нормализованной таблицы на две и более таблиц и создание между ними отношения "один к одному" с целью устранения дополнительных операций ввода-вывода или по техническим причинам. |
В контексте физического проектирования реляционных баз данных горизонтальное разбиение таблицы – это …
Установите соответствие между терминами и их определениями.
Термин | Определение | ||
---|---|---|---|
1 | Кластер | А | - это значение колонок, общих для кластеризуемых таблиц. |
2 | Индексный кластер | Б | -это кластер, для физической организации которого используется индекс со структурой B-Tree |
3 | Хеш-кластер | В | - это кластер, для физической организации которого использует структура на основе преобразования ключа. |
4 | Кластерный ключ | Г | - это группа таблиц, которая разделяет общие физические страницы данных при совместном использовании в запросах общих колонок этих таблиц. |
Рассмотрим фрагмент определения преставления SELECT * FROM east_sales@icp.ac.ru WHERE LOC = 'EAST'UNION ALLSELECT * FROM west_sales@ioc.ac.ru WHERE LOC = 'WEST';
Если заменить предложение WHERE на ограничение CHECK, то в таком случае …
Рассмотрим базу данных обработки заказов и создадим индексный кластер для хранения одной из таблиц базы данных - Customer. CREATE CLUSTER cust_c (cust_id varchar(8))INDEX;CREATE INDEX cust_c_id ON CLUSTER cust_c;CREATE TABLE cust (cust_id varchar2(8) NOT NULL REFERENCES customers,ent# number NOT NULL,date_ent date NOT NULL,comment varchar2(60) NOT NULL,…PRIMARY KEY(cust_id, ent#)) CLUSTER cust_c (cust_id);
Созданная таблица кластеризована по колонке cust_id, и все специальные записи о клиента в колонке comment будут расположены в одной странице физической базы данных, либо в смежных страницах. Их можно выбрать за одну операцию поиска по индексу: SELECT date_ent, comment FROM cust_c WHERE cust_id=:cur_cust;
Комментарий. На ограничение первичного ключа в операторе CREATE сделан индекс первичного ключа, чтобы избежать создания второго индекса.
Является ли такое решение преимуществом с точки зрения утверждения: "Строки, имеющие специальные записи о клиенте, имеют более одной записи о клиенте".
Задан оператор SELECT Time, Region, Department, SUM(Profit) AS Profit FROM sales GROUP BY CUBE(Time, Region, Department);
Укажите правильное результирующее множество.
Оператор SELECT Region. MIN(Population) AS Minimum, MAX(Populations)AS Maximum, AVG(Population) AS Average. VAR(Population) AS VarianceFROM Region GROUP BY Region ORDER BY Maximum DESC;
вычисляет …
Оцените в терминах операций ввода вывода следующий запрос, который делает выборку данных из таблиц PRODUCT (50 строк) и VENDOR (1000): SELECT VENDOR_CODE, PRODUCT_CODE, PRODUCT_DESCFROM VENDOR, PRODUCTWHERE VENDOR.VENDOR_CODE = PRODUCT.VENDOR_CODE AND VENDOR.VENDOR_CODE = "100";
По следующему пути доступа: Формируем декартово произведение таблиц PRODUCT и VENDOR. Выполняем проекцию результирующей таблицы на список колонок, указанный в предложении SELECT. Ограничиваемся в результирующей таблице строками, которые удовлетворяют условию поиска в предложении WHERE.
если 20 строк удовлетворяют условиям поиска
Какие из ниже перечисленных причин приводят к нецелесообразности к созданию индексов для каждого оператора SELECT?
Установите соответствие между типами приложений и их определениями.
Тип приложения | Определение | ||
---|---|---|---|
1. | OLTP-система | А | - это такое приложение обработки данных, для которого база данных растет или сжимается в размерах периодически в зависимости от характера обработки данных. |
2. | DSS-система | Б | – это приложение, которое обеспечивает аналитическую обработку данных, включающую математический, статистический или иной анализ данных. |
3. | BATCH-системы | В | – это такое приложение, которое работает с базой данных в не интерактивном режиме. |
4. | OLAP-система | Г | – это такое приложение, которое работает с очень большой базой данных в режиме только чтение. |
5. | VCDB-система | Д | – это такое приложение, которое содержит в основном транзакции вставки, обновления и удаления, с высокой частотой преимущественно транзакций обновления. |
К основным технологическим средствам реализации функциональности систем–бизнес – аналитики не относят …
Установите соответствие между статистическими функциями и их определениями.
Функция | Возвращаемое значение | |
---|---|---|
STDEV | A | Возвращает статистическое среднеквадратичное отклонение совокупности всех значений в указанном выражении. |
STDEVP | B | Возвращает статистическую дисперсию для заполнения всех значений в указанном выражении. |
VAR | C | Возвращает статистическую дисперсию всех значений в указанном выражении. |
VARP | C | Возвращает статистическое стандартное отклонение всех значений в указанном выражении. |
К какой нормальной форме приведено исходное отношение?
Исходное отношение:
Преподаватель (Фамилия, Группа, Предмет )
Результирующие отношения:
Преподаватель_группа (Фамилия, Группа )
Преподаватель_предмет (Фамилия, Предмет )
Комментарий к ответу: Отношение Преподаватель содержит две многозначные ФЗ: Фамилия ->-> Группа и Фамилия ->-> Предмет. Это приводит к аномалии включения: если у преподавателя появляется новая группа, в отношение приходится добавлять несколько кортежей (по числу читаемых им предметов). Устранение аномалии заключается в выделении МФЗ в отдельное отношение.
Установите соответствие между агрегатной функцией и ее определением.
Функция | Определение | ||
---|---|---|---|
1 | AVG(X) | А | Вычисляет среднее значение аргумента, который может быть выражением любого типа. |
2 | COUNT(X) | Б | Вычисляет число итемов. |
3 | MAX(X) | В | Вычисляет максимальное значение аргумента, который может быть выражением любого типа. |
4 | MIN(X) | Г | Вычисляет минимальное значение аргумента, который может быть выражением любого типа. |
5 | SUM(X) | Д | Вычисляет сумму значений аргумента, который может быть выражением любого типа. |
6 | STDEV(Х) | Е | Вычисляет стандартное отклонение на множестве значений аргумента, который может быть выражением любого типа. |
7 | VAR(X) | Ж | Вычисляет квадрат дисперсии. |
Рассмотрим схему отношения ПРОДУКТ (Номер_модели, Производитель, Тип_модели, Цена). Ключами отношения являются:
Будет ли ниже приведенный запрос при выборке данных обращаться к таблице данных? Колонка Ename проиндексирована. SELECT COUNT(*) FROM EMPLOYEE WHERE Ename LIKE 'C%';
Укажите правильное соответствие между элементами логической модели и их определениями.
Элементы модели | Определения | ||
---|---|---|---|
1. | Сущность предметной области | A | - это атрибут сущности, позволяющий отличать одну сущность от другой. |
2. | Атрибут сущности | B | - это атрибут конкретного экземпляра сущности, у которого может быть только одно значение. |
3. | Экземпляры сущности | C | - это атрибут конкретного экземпляра сущности, у которого может быть несколько значений. |
4. | Уникальный идентификатор сущности | D | - это класс объектов или явлений предметной области базы данных. |
5. | Однозначный атрибут | E | - это выражение, определяющее значения, разрешенные для данного атрибута; область значений атрибута. |
6. | Многозначный атрибут | F | - это реализации сущности, отличающиеся друг от друга и допускающие однозначную идентификацию. |
7. | Домен атрибута | G | - это свойство или характеристика сущности. |
Установите правильное соответствие между нормальными формами и некоторыми аспектами их определения.
Нормальная форма | Определение | ||
---|---|---|---|
1. | Первая нормальная форма (1НФ) | A | отношение должно удовлетворять зависимости по соединению относительно своих проекций. |
2. | Вторая нормальная форма (2НФ) | B | все неключевые атрибуты отношения функционально полно зависят от составного ключа отношения; отношение не должно содержать частичных ФЗ. |
3. | Третья нормальная форма (3НФ) | C | неключевые атрибуты отношения не зависят от ключей; отношение допускает наличия только таких нетривиальных ФЗ, в которых ключ определяет один или более других атрибутов: из Х следует А, где А не входит в Х, Х включает некоторый ключ. |
4. | Нормальная форма Бойса-Кодда (НФБК) | D | все неключевые атрибуты отношения зависят только от первичного ключа; отношение не должно содержать транзитивных ФЗ неключевых атрибутов от ключа. |
5. | Четвертая нормальная форма (4НФ) | E | отношение не должно содержать независимых многозначных ФЗ. |
6. | Пятая нормальная форма (5НФ) | F | все атрибуты отношения являются простыми, т.е. не имеют компонентов. |
К какой нормальной форме приведено исходное отношение?
Исходное отношение:
Преподаватель_предмет (Личный_#, Предмет, Часы, Фамилия, Должность, Оклад, Кафедра, Телефон )
Результирующие отношения:
Преподаватель (Личный_#, Фамилия, Должность, Оклад, Кафедра, Телефон )
Предмет(Личный_#, Предмет, Часы )
Комментарий к ответу: Отношение Преподаватель_Предмет содержит частичные ФЗ: пять последних неключевых атрибутов зависят от части ключа Личный_#. Это может привести к следующим аномалиям:
Устранение аномалий заключается в выполнении двух проекций отношения.
Укажите правильное соответствие между подходами к построению логической темпоральной модели данных и их определениями.
Подход | Определение | ||
---|---|---|---|
1. | Подход, основанный на накоплении моментальных снимков | A | состоит в добавлении временной метки фиксации события (факта) как атрибута экземпляра сущности предметной области и отражении момента времени в таблице БД как истории жизни данных предметной области |
2. | Подход, основанный на фиксации событий предметной области | B | состоит в добавлении временных меток для фиксации начала и завершения определенного состояния как атрибутов экземпляра сущности предметной области экземпляров сущности, и отражении моментов времени начала и завершения определенного состояния сущности в таблице БД как истории жизни данных предметной области |
3. | Подход, основанный на фиксации состояний предметной области | C | состоит в сборе снимков фрагмента предметной области и накоплении таких снимков в различных фрагментах БД или другой БД как истории жизни данных предметной области |
Установите соответствие между процессом и его определением.
Процесс | Определение | |
---|---|---|
Планирование ETL процесса | A | включает разработку и верификацию процесса заполнения статических таблиц измерений, разработку и верификацию механизмов изменения для каждой таблицы измерений. |
Конструирование процесса заполнения таблиц измерений | B | включает в себя разработку диаграммы потоков данных от систем источников, определение преобразований, метода генерации ключей и последовательности операций для каждой таблицы назначения. |
Конструирование процесса заполнения таблиц фактов | C | включает разработку и верификацию процесса первоначального заполнения таблиц фактов, разработку и верификацию процесса периодического дополнения таблиц фактов, построение агрегатов и разработку процедур автоматизации процесса ETL. |
Пусть, для таблицы базы данных EMPLOYEE
1. | Номер личной карточки | EMPNO (PK) |
2. | Фамилия | ENAME |
3. | Имя | LNAME |
4. | Страховка | SSECNO |
5. | Номер подразделения | DEPNO (FK) |
6. | Должность | JOB |
7. | Возраст | AGE |
8. | Стаж | HIREDATE |
9. | Доплаты | COMM |
10 | Зарплата | SAL |
11 | Штрафы | FINE |
12 | Автобиография | Biog |
13 | Фотография | Foto |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | |
1 | + | + | + | + | + | + | + | + | + | + | + | + | + |
2 | + | + | + | + | + | + | + | + | + | + | + | + | + |
3 | + | + | + | + | + | + | + | + | + | + | + | + | + |
4 | + | + | + | + | + | + | + | + | + | + | + | + | + |
5 | + | + | + | - | - | + | - | - | + | + | + | - | - |
6 | + | + | + | - | - | + | - | - | - | - | + | - | - |
7 | + | + | + | - | - | + | - | - | - | + | - | - | - |
8 | + | + | + | - | - | + | - | - | + | - | - | - | - |
9 | + | + | + | - | + | - | - | - | - | - | - | - | - |
10 | + | + | + | - | + | - | - | - | - | - | - | - | - |
Запрос к схеме "звезда": "Пусть требуется просмотреть данные о продажах товара с идентификационным номером 33 за месяцы с мая по август текущего года по региону "Москва" с идентификационным номером 81". Укажите правильный вариант ответа.
Запрос к схеме "звезда": "Пусть руководству компании требуется отчет о прибыли по всем регионам по всем отделам продаж за 2007-08 гг". Укажите правильный ответ.
Задан оператор SELECT Time, Region, Department, SUM(Profit) AS Profit FROM sales GROUP BY ROLLUP(Time, Region, Department);
Укажите правильное результирующее множество.
Задан оператор SELECT r_regionkey, p_productkey, s_amount, s_profit, RANK() OVER (ORDER BY s_amount DESC, s_profit DESC) AS 'Ранг по востоку'FROM region, product, salesWHERE region.r_regionkey = sales.s_regionkey AND product.p_productkey = sales.s_productkey AND r_regionkey = 'Восток';
Укажите правильное результирующее множество.
Какие из ниже перечисленных причин приводят к нецелесообразности к созданию индексов для каждого оператора SELECT?
Укажите правильное соответствие между этапами бизнес - модели создания хранилища данных и документами, которые создаются на каждом этапе.
Этап | Документы | ||
---|---|---|---|
1. | Формулирование требований | A | Спецификации на программно-аппаратное обеспечение, а также скрипты и установки для программного обеспечения |
2. | Создание вычислительной среды для хранилища данных | B | Перечень источников данных и их описание, а также логическая и физическая модели данных. |
3. | Моделирование данных | C | Каталог требований, утвержденный заказчиком и уточненный план проекта, который точно определяет используемые ресурсы и даты контрольных точек ходы выполнения проекта |
4. | Определение процедур извлечения, преобразования и загрузки данных | D | Документация, описывающая механизм доставки пользователям отчетов и спецификации экранных форм. |
5. | Проектирование аналитических отчетов | E | Схема соответствия данных подающих систем и ХД, программы или ETL - инструменты. |
6. | Разработка приложений хранилища данных | F | Спецификация кубов данных (измерения и метрики) и разработанные отчеты. |
7. | Настройка производительности | G | План тестирования ХД и заключение о готовности ХД к эксплуатации. |
8. | Проверка качества | H | Перечень рекомендаций по настойке производительности. |
Рассмотрим базу данных обработки заказов и создадим индексный кластер для хранения одной из таблиц базы данных - Customer. CREATE CLUSTER cust_c (cust_id varchar(8))INDEX;CREATE INDEX cust_c_id ON CLUSTER cust_c;CREATE TABLE cust (cust_id varchar2(8) NOT NULL REFERENCES customers,ent# number NOT NULL,date_ent date NOT NULL,comment varchar2(60) NOT NULL,…PRIMARY KEY(cust_id, ent#)) CLUSTER cust_c (cust_id);
Созданная таблица кластеризована по колонке cust_id, и все специальные записи о клиента в колонке comment будут расположены в одной странице физической базы данных, либо в смежных страницах. Их можно выбрать за одну операцию поиска по индексу: SELECT date_ent, comment FROM cust_c WHERE cust_id=:cur_cust;
Комментарий. На ограничение первичного ключа в операторе CREATE сделан индекс первичного ключа, чтобы избежать создания второго индекса.
Является ли такое решение преимуществом с точки зрения утверждения: "При выборке специальных записей о клиенте для клиента выбираются все такие записи".
Установите соответствие между понятиями, связанными с многомерным моделированием, и их определениями.
Понятие | Определение | ||
---|---|---|---|
1. | Факт | A | - это числовая характеристика факта, который определяет эффективность деятельности или бизнес - действия организации с точки зрения измерения. |
2. | Измерение | B | - это интерпретация факта с некоторой точки зрения в реальном мире. |
3. | Атрибут | C | – это описание характеристики реального объекта предметной области. |
4. | Параметр | D | - это набор связанных элементов данных, содержащих метрики и описательные данные. |
5. | Иерархия | E | – это уровень детализации данных, сохраняемых в ХД. |
6. | Гранулированность | F | - это отношение часть-целое или родитель - потомок |
Запрос к схеме "звезда": "Пусть руководству компании требуется перекрестный отчет о прибыли по всем регионам по всем отделам продаж за 2007-08 гг без вывода частичных сумм". Укажите правильный ответ.
К какому из перечисленных методологических подходов к реализации хранилища данных относится следующая характеристика?
"Этот подход требует детального планирования и проектирования ХД в рамках ИТ – проекта до начала выполнения проекта".
Укажите правильное соответствие между этапами бизнес - модели создания хранилища данных и временными затратами, которые имеют место быть на каждом этапе.
Этапы | Временные затраты | ||
---|---|---|---|
1. | Формулирование требований | A | - от двух недель до полутора месяцев. |
2. | Создание вычислительной среды для хранилища данных | B | - от двух недель до двух месяцев. |
3. | Моделирование данных | C | - от одной недели до полутора месяцев. |
4. | Определение процедур извлечения, преобразования и загрузки данных | D | - от двух недель до двух месяцев. |
5. | Проектирование аналитических отчетов | E | - от одной недели до месяца. |
6. | Разработка приложений хранилища данных | F | зависит от числа разрабатываемых отчетов. |
7. | Настройка производительности | G | - от одной до четырех недель. |
8. | Проверка качества | H | не должно превышать одну-две недели. |
Установите уровень иерархии объектов реляционной базы данных, согласно стандарту SQL-92.
Уровень иерархии | Объект | ||
---|---|---|---|
1. | I | А | Кластеры |
2. | II | Б | Представления |
3. | III | В | Столбцы |
4. | IY | Г | Таблицы |
5. | IY | Д | Каталоги |
6. | V | Е | Строки |
7. | V | Ж | Схемы |
Для каких из перечисленных ниже объектов реляционной базы данных не используются квалифицируемые имена?
Установите соответствие между терминами и их определениями.
Термин | Определение | ||
---|---|---|---|
1 | Ключ секционирования | А | колонка таблицы, относительно значений которых СУБД будет делать физическое разнесение таблицы по различным табличным пространствам на жестких дисках. |
2 | Секционирование по диапазону | Б | означает распределение строк таблицы на различные предопределенные табличные пространства в зависимости от значения ключа секционирования. |
3 | Хеш-секционирование | В | означает, что таблица сначала распределяется среди табличных пространств на основе диапазона значений ключа секционирования, далее каждая из полученных секций диапазонов делится на подчиненные секции или подсекции, и затем строки равномерно распределяются среди подчиненных секций по значению хеш-ключа. |
4 | Составное секционирование | Г | означает равномерное распределение строк таблицы по назначенным табличным пространствам в зависимости от значения ключа секционирования, который в данном случае хешируется. |
Нужно ли в СУБД Oracle при определении кластерного ключа индексного кластера на первичном ключе одной из таблиц оставлять ограничение первичного ключа в определении колонки этого ключа?
FASMI означает быстрый анализ разделяемой многомерной информации, включающий следующие требования к приложениям для многомерного анализа …:
При конструировании процесса заполнения таблиц фактов проектировщик решает следующие основные задачи:
Установите соответствие между фазами обработки команды SQL и действиями СУБД.
Тип данных | Значение | ||
---|---|---|---|
1 | фаза синтаксического разбора | А | включает проверку синтаксиса команды, проверку имен таблиц и колонок в базе данных, а также подготовку исходных данных для оптимизатора. |
2 | фаза оптимизации | Б | включает подстановку действительных имен таблиц и колонок базы данных в представление, идентификацию возможных вариантов выполнения команды, определения стоимости выполнения каждого варианта, выбор наилучшего варианта на основе внутренней статистики. |
3 | фаза генерации исполняемого кода | В | включает выполнение кода команды. |
4 | фаза выполнения команды | Г | включает построение выполняемого кода команды. |
Какое из ниже перечисленных ограничений не относится к ограничениям целостности данных?
(data integrity constraints) относятся к значениям данных в некоторых колонках и определяются в спецификации колонки с помощью элементов SQL
Установите соответствие между терминами и их определениями.
Термин | Определение | ||
---|---|---|---|
1 | Индекс | А | - это физический объект реляционной базы данных, организованный по принципу сбалансированной иерархической структуры. |
2 | Ключевые поля или ключи | Б | - это колонки, входящие в индекс. |
3 | Индекс B-Tree | В | - это объект в реляционной базе данных, который предназначен для организации быстрого доступа к строкам таблицы по значениям одной или более колонок этих строк. |
4 | Составной индекс | Г | - это индекс типа B-Tree базы данных, который одновременно выполняет роль таблицы. |
5 | Исключительно индексная таблица | Д | - это индекс, построенный для нескольких колонок таблицы. |
6 | Кардинальность колонки | Е | - это число дискретных различных значений колонки, которые встречаются в строках таблицы. |
В контексте физического проектирования реляционных баз данных вертикальное разбиение таблицы – это …
Укажите правильное соответствие между типами архитектур хранилищ данных и их определениями.
Архитектура | Определение | ||
---|---|---|---|
1. | Глобальное хранилище данных (Global data warehouse) или хранилище данных масштаба организации | A | управляются рабочими группами, отделами или направлениями бизнеса, и разрабатываются исключительно для реализации аналитических потребностей последних |
2. | Независимые киоски данных (Stand-alone Data Marts) | B | управляются рабочими группами, отделами или направлениями бизнеса, но разрабатываются в рамках единой для организации схемы удовлетворения информационных и аналитических потребностей |
3. | Связанные киоски данных | C | это такое ХД, в котором будут поддерживаться все, или большая часть, данных организации |
К основным технологическим средствам реализации функциональности систем–бизнес – аналитики относят …
Рассмотрим базу данных обработки заказов и создадим индексный кластер для хранения одной из таблиц базы данных - Customer. CREATE CLUSTER cust_c (cust_id varchar(8))INDEX;CREATE INDEX cust_c_id ON CLUSTER cust_c;CREATE TABLE cust (cust_id varchar2(8) NOT NULL REFERENCES customers,ent# number NOT NULL,date_ent date NOT NULL,comment varchar2(60) NOT NULL,…PRIMARY KEY(cust_id, ent#)) CLUSTER cust_c (cust_id);
Созданная таблица кластеризована по колонке cust_id, и все специальные записи о клиента в колонке comment будут расположены в одной странице физической базы данных, либо в смежных страницах. Их можно выбрать за одну операцию поиска по индексу: SELECT date_ent, comment FROM cust_c WHERE cust_id=:cur_cust;
Комментарий. На ограничение первичного ключа в операторе CREATE сделан, чтобы избежать создания второго индекса.
Является ли такое решение преимуществом с точки зрения утверждения: "Очень немного строк о клиентах имеют специальные записи о клиенте".
Какие из ниже перечисленных объектов относятся к результатам проектирования логической модели хранилища данных?
Установите соответствие между ранжируюoими функциями и их определениями.
Функция | Возвращаемое значение | |
---|---|---|
RANK | A | Возвращает ранг строк в секции результирующего набора без промежутков в ранжировании. Ранг строки равен количеству различных значений рангов, предшествующих строке, увеличенному на единицу. Возвращаемый тип данных bigint. |
DENSE_RANK | B | Распределяет строки упорядоченной секции в заданное количество групп. Группы нумеруются, начиная с единицы. Для каждой строки функция возвращает номер группы, которой принадлежит строка. |
NTILE | C | Возвращает последовательный номер строки в секции результирующего набора, 1 соответствует первой строке в каждой из секций. Возвращаемый тип данных bigint. |
ROW_NUMBER | D | Возвращает ранг каждой строки в секции результирующего набора. Ранг строки вычисляется как единица плюс количество рангов, находящихся до этой строки. Возвращаемый тип данных bigint. |