Главная /
Проектирование хранилищ данных для приложений систем деловой осведомленности (Business Intelligence Systems)
Проектирование хранилищ данных для приложений систем деловой осведомленности (Business Intelligence Systems) - ответы на тесты Интуит
Курс содержит курс лекций по проектированию хранилищ данных для систем бизнес-аналитики на технологической платформе MS SQL Server 2008 с использованием современных CASE-средств. В курсе изучается весь комплекс вопросов проектирования хранилищ данных. Материал изложен с единых методологических позиций и содержит описание методологии в объеме, необходимом для практической работы, а также набор учебных примеров для СУБД MS SQL Server 2008 и CASE инструмента PowerDesigner.
Список вопросов:
- # Многомерное моделирование является …
- # На основе каких понятий выполняется многомерное моделирование?
- # Установите соответствие между понятиями, связанными с многомерным моделированием, и их определениями. ПонятиеОпределение1.ФактA- это числовая характеристика факта, который определяет эффективность деятельности или бизнес - действия организации с точки зрения измерения.2.ИзмерениеB- это интерпретация факта с некоторой точки зрения в реальном мире.3.АтрибутC– это описание характеристики реального объекта предметной области.4.ПараметрD- это набор связанных элементов данных, содержащих метрики и описательные данные.5.ИерархияE– это уровень детализации данных, сохраняемых в ХД.6.ГранулированностьF- это отношение часть-целое или родитель - потомок
- # Аддитивный факт - это
- # Полуаддитвный факт – это
- # Неаддитивный факт – это
- # Числовая мера интенсивности – это
- # Укажите правильное соответствие между таблицами фактов и их определениями. Элементы моделиОпределения1.Транзакционная таблица фактовAВ такой таблице собирают факты, фиксирующие текущее состояние определенного направления бизнеса.2.Таблица фактов куммулятивных моментальных снимковBВ такой таблице фактов сохраняют факты, которые фиксируют определенные события бизнеса.3.Таблица фактов периодических моментальных снимковCВ такой таблице собирают факты, фиксирующие некоторое итоговое состояние определенного направления бизнеса на текущий момент времени.
- # Основными характеристиками таблицы фактов являются следующие
- # Основными характеристиками таблицы измерений являются следующие:
- # Схема "звезда" имеет …
- # Схема "снежинка" имеет …
- # Агрегатами являются …
- # Таблицей агрегатов фактов называется …
- # Медленно меняющимся измерениями называются …
- # Вырожденным измерением называется …
- # Сбалансированная иерархия – это иерархия, …
- # Таблицей – мостом называется …
- # Установите уровень иерархии объектов реляционной базы данных, согласно стандарту SQL-92. Уровень иерархииОбъект1.IАКластеры2.IIБПредставления3.IIIВСтолбцы4.IYГТаблицы5.IYДКаталоги6.VЕСтроки7.VЖСхемы
- # Установите соответствие между объектами реляционной базы данных и их определениями. ОбъектОпределение1.Кластер А- это группа каталогов, к которым можно обращаться через одно соединение с сервером базы данных2.Каталог Б- это базовая структура реляционной базы данных, которая представляет собой единицу хранения данных.3.Схема В- это поименованная динамически поддерживаемая СУБД выборка из одной или нескольких таблиц базы данных.4.Таблица Г- это группа схем5.Представление Д- это контейнер для таблиц, представлений и других структурных элементов реляционной базы данных.6.Пользователь Е- это объект, обладающий возможностью создавать или использовать другие объекты базы данных и запрашивать выполнение функций СУБД таких, как организация сеанса работы, изменение состояние базы данных и т. д.7.Синоним Ж- это объект базы данных, создаваемый для повышения производительности выборки данных и контроля уникальности первичного ключа (если он задан для таблицы).8.Индекс З- это альтернативное имя объекта (псевдоним) реляционной базы данных, которое позволяет иметь доступ к данному объекту
- # Установите соответствие между объектами реляционной базы данных, относящимися к так называемому серверному коду, и их определениями ОбъектОпределение1.Хранимая процедураА- это объект базы данных, представляющий поименованный набор команд SQL и/или операторов специализированных языков программирования базы данных2.ФункцияБ- это поименованный оператор SQL, который заранее откомпилирован и сохраняется в базе данных. Скорость обработки команды выше, чем у соответствующего ему оператора SQL, т.к. при этом не выполняются фазы синтаксического разбора и компиляции.3.Команда В- это объект базы данных, представляющий поименованный набор команд SQL и/или операторов специализированных языков обработки программирования базы данных, который при выполнении возвращает значение - результат вычислений.4.Триггер Г- это объект базы данных, который представляет собой специальную хранимую процедуру. Эта процедура запускается автоматически, когда происходит связанное с триггером событие (например, до вставки строки в таблицу).5.ТаймерД- это объект базы данных, который состоит из поименованного, структурированного набора переменных, процедур и функций.6.ПакетЕ- это триггер, с запускающимся событием таймера.
- # Какой из ниже перечисленных категорий таблиц нет в стандарте SQL-92?
- # Какой из перечисленных ниже объектов является обязательным элементам стандарта SQL-92?
- # Для каких из перечисленных ниже объектов реляционной базы данных не используются квалифицируемые имена?
- # Физическая модель реляционной базы данных есть
- # В контексте проектирования физической модели реляционной базы данных ограничение – это …
- # Какой вид ограничений не рассматривается в рамках физической модели базы данных?
- # Установите соответствие между ограничениями и их содержанием. ОграничениеОписание1.CHECKАГарантирует, что колонка всегда содержит значение и оно и уникально в таблице.2.DEFAULTБПомещает значение по умолчанию в колонку. Гарантирует, что колонка всегда имеет значение.3.FOREING KEYВГарантирует, что значения существую, как значение в колонке первичного ключа другой таблицы. Обеспечивает процедуры удаления дочерних строк при удалении связанных с ней родительских.4.NOT NULLГГарантирует, что значение будет уникальным в таблице5.PRIMARY KEYДГарантирует, что значения находятся в границах специфицированного интервала, задаваемого предикатом.6.UNIQUEЕГарантирует, что колонка всегда содержит значение.
- # Какое из ниже перечисленных ограничений не относится к ограничениям целостности данных? (data integrity constraints) относятся к значениям данных в некоторых колонках и определяются в спецификации колонки с помощью элементов SQL
- # Какое из перечисленных ниже бизнес-правил не относится к правилам ссылочной целостности?
- # В контексте проектирования физической модели реляционной базы данных имя – это …
- # Квалифицируемые имена - это
- # В контексте проектирования физической модели реляционной базы данных домен – это …
- # Установите соответствие между типами данных для представления чисел и значениями, которые они определяют. Тип данныхЗначение1.IntegerАЦелое2.Smallint БЧисла с заданной точностью3.Number [(точность [, масштаб])]ВЧисла с заданной точностью 4.Decimal[(точность [, масштаб])]ГМаленькое целое5.tinyintДЧисла от 0 до 2556.Float (точность)ЕЧисла с плавающей запятой одинарной точности7.RealЖЧисла с плавающей запятой заданной точности
- # В значения какого типа данных не могут быть преобразованы данные строкового типа?
- # В реляционной базе данных синоним - это …?
- # Метаданные хранилища данных определяются как …
- # Метаданные хранилища данных отвечают на вопросы …
- # При проектировании метаданных хранилища данных не выполняется следующее действие …
- # Какие из перечисленных ниже функций относятся к основным функциям метаданных в ХД?
- # Какие из перечисленных ниже функций относятся к основным функциям метаданных в ХД?
- # Какие из перечисленных ниже функций относятся к основным функциям метаданных в ХД?
- # Какие из перечисленных ниже элементов не являются элементами метаданных ХД?
- # Какие из перечисленных ниже элементов не являются элементами метаданных ХД?
- # Дополните состав описания преобразований данных, приведенный ниже, из указанного в ответах списка. Идентификацию полей источников данныхСоответствие между атрибутами сущностей источников данных и атрибутами объектов ХДПреобразования атрибутовФизические характеристики преобразованийПреобразования таблиц кодировки и ссылочных таблицАлгоритмы трансформации данных и т. д.
- # Логическая структура метаданных фактов, как правило, не включает в себя …
- # Логическая структура метаданных измерений, как правило, не включает в себя …
- # Логическая структура метаданных метрик, как правило, не включает в себя …
- # Классификации метаданных по их функциональному назначению не включает следующий класс …
- # Классификации метаданных по их функциональному назначению не включает следующий класс …
- # Классификации метаданных по их функциональному назначению не включает следующий класс …
- # Под аббревиатурой ETL — …
- # Установите соответствие между процессом и его определением. ПроцессОпределениеИзвлечение данныхAНа этой стадии релевантные данные преобразуются в формат представления данных в ХД, правила преобразования сохраняются в метаданных ХД, формируются ключевые поля таблиц физической структуры ХД, выполняется очистка данных.Преобразование данныхBНа этой стадии данные загружаются в ХД, выполняется построение агрегатов.Загрузка данныхCНа этой стадии отбираются и описываются данные внешних источников (начинают формироваться метаданные ХД), которые должны быть храниться в ХД (релевантные данные).
- # Установите соответствие между процессом и его определением. ПроцессОпределениеПланирование ETL процесса Aвключает разработку и верификацию процесса заполнения статических таблиц измерений, разработку и верификацию механизмов изменения для каждой таблицы измерений.Конструирование процесса заполнения таблиц измеренийBвключает в себя разработку диаграммы потоков данных от систем источников, определение преобразований, метода генерации ключей и последовательности операций для каждой таблицы назначения.Конструирование процесса заполнения таблиц фактов Cвключает разработку и верификацию процесса первоначального заполнения таблиц фактов, разработку и верификацию процесса периодического дополнения таблиц фактов, построение агрегатов и разработку процедур автоматизации процесса ETL.
- # При конструировании процесса заполнения таблиц фактов проектировщик решает следующие основные задачи:
- # Не корпоративные источники данных: …
- # Корпоративные источники данных …
- # Очистку данных можно разделить на следующие типы:
- # Модель движения данных или ILM модель содержит следующие элементы:
- # Установите соответствие между дигарммами ILM модели и их определением. ПроцессОпределениеДиаграмма движения данныхA– это диаграмма высокого уровня, которая позволяет моделировать преобразование данных посредством определенияДиаграмма преобразования данныхB- это диаграмма низкого уровня, которая позволяет моделировать конкретные задачи преобразования посредством определения того, как данные извлекаются из входного источника данных, как преобразуются и как загружаются в выходной источник данных.Диаграмма управления преобразованиемC- это диаграмма низкого уровня модели, которая позволяет определить последовательность выполнения серии задач преобразования.
- # Information Liquidity Model (ILM) является графическим инструментом моделирования движения данных, которое позволяет построить модели
- # При проектировании процессов преобразования данных проектировщик ХД должен решить следующие задачи:
- # Разработка ETL процесса включает в себя следующие основные стадии:
- # Под корпоративной моделью данных понимают
- # В корпоративную модель данных, как правило, включается …
- # Корпоративная модель данных, как правило, имеет … уровней представления.
- # Корпоративная модель данных создается …
- # При проектировании корпоративной модели данных, обычно, предпринимается попытка создать на основе …
- # С точки зрения проектирования хранилищ данных корпоративная модель данных содержит в себе …
- # Сколько этапов алгоритма преобразования корпоративной модели данных в модель хранилища данных являются обязательными (т.е. практически всегда имеют место быть)?
- # Укажите правильное соответствие между этапами алгоритма преобразования корпоративной модели в модель хранилища данных и их названиями. ЭтапыНаименования этапов 1.I.AПреобразовать взаимосвязи между данными.2.II.BОпределить уровень структуризации (гранулированности) данных в ХД.3.III.CОбъединить данные из таблиц корпоративной модели данных в таблицах выбранной схемы ХД.4.IV.DВыбрать данные данных корпоративной модели, которые следует хранить в ХД.5.V.EНахождение периодических групп данных или массивов данных и представление их в модели ХД.6.VI.FДобавить в модель производные элементы данных.7.VII.GИсследовать временные зависимости данных и, если необходимо, добавить элемента времени в ключи сущностей ХД.8.VIII.HРазделение атрибутов согласно параметрам стабильности.
- # Укажите правильное соответствие между этапами алгоритма преобразования корпоративной модели данных в модель хранилища данных и их целями. Элементы моделиОпределения1.I.AОпределить грануллированость данных для представления фактов модели ХД.2.II.BПреобразовать взаимосвязи между данными для представления их в модели ХД.3.III.CПеренести атрибуты из таблиц корпоративной модели данных в таблицы ХД.4.IV.DОпределить массивы данных модели ХД.5.V.EСгруппировать данные по частоте их использования.6.VI.FПолучить список сущностей и их атрибутов для представления в модели ХД.7.VII.GВыполнить секционирование таблиц ХД.8.VIII.HДобавить в модель или определить временные метки для представления истории объектов ХД.
- # Идентификация бизнес- процессов предметной области позволяет определить ….
- # Разбиение сущностей корпоративной модели на транзакционные и не транзакционные позволяет определить …
- # Выявление отношений "многие ко многим" в корпоративной модели данных позволяют определить …
- # Метод моделирования "Свод данных" - это…
- # Указать трудности применения известных методик проектирования к разработке модели ХД масштаба предприятия с точки зрения проведения нормализации:
- # Модель проектирования "Свод данных" имеет новые структурные элементы:
- # Сущности-концентраторы или просто хабы (hubs), являются…
- # Сущности-связи являются …
- # Сущности-сателлиты содержат...
- # Дополнительными элементами модели "Свод данных" являются …
- # Сущности должны создаваться в следующем порядке:
- # При создании связей в структуре "Свода данных" следует соблюдать Х правил поддержки ссылочной целостности
- # "Свод данных" - есть …
- # Процесс преобразования нормализованной модели в модель "Свод данных" включает следующие этапы:
- # Изменения в данных в "Своде данных" собираются …
- # Относятся ли следующие правила поддержки ссылочной целостности:
- # Относятся ли следующие правила поддержки ссылочной целостности:
- # Относятся ли следующие правила поддержки ссылочной целостности:
- # Относятся ли следующие правила поддержки ссылочной целостности:
- # Относятся ли следующие правила поддержки ссылочной целостности:
- # Данные в информационных системах выступают как …
- # Данные в операционных системах обработки данных выступают как …
- # Данные в системах складирования данных выступают как …
- # Основной целью создания систем складирования данных является …
- # Основной целью создания операционных систем обработки данных является …
- # Основной целью создания информационных систем является …
- # Какое свойство данных не характерно для систем складирования данных?
- # Какое свойство данных не характерно для операционных систем обработки данных?
- # Какое свойство данных является общим для систем складирования данных и операционных систем обработки данных?
- # Какое свойство не входит в классическое определение хранилища данных?
- # Какое свойство не входит в классическое определение хранилища данных?
- # Какое свойство не входит в классическое определение хранилища данных?
- # Операционные системы обработки данных создаются с учетом следующих значений параметров:
- # Операционные системы обработки данных создаются с учетом следующих значений параметров:
- # Операционные системы обработки данных создаются с учетом следующих значений параметров:
- # Системы складирования данных создаются с учетом следующих значений параметров:
- # Системы складирования данных создаются с учетом следующих значений параметров:
- # Одной из главных целей разработки ХД является
- # Под архитектурой ХД понимают …
- # Среди факторов, влияющих на принятие решений о выборе способа реализации хранилища данных, укажите наиболее критические.
- # Аналитические CRM системы собирают информацию
- # Аналитические SRM системы предназначены для …
- # Аналитические SCM системы – это …
- # Укажите правильное соответствие между типами архитектур хранилищ данных и их определениями. АрхитектураОпределение1.Глобальное хранилище данных (Global data warehouse) или хранилище данных масштаба организацииAуправляются рабочими группами, отделами или направлениями бизнеса, и разрабатываются исключительно для реализации аналитических потребностей последних2.Независимые киоски данных (Stand-alone Data Marts)Bуправляются рабочими группами, отделами или направлениями бизнеса, но разрабатываются в рамках единой для организации схемы удовлетворения информационных и аналитических потребностей3.Связанные киоски данныхCэто такое ХД, в котором будут поддерживаться все, или большая часть, данных организации
- # Укажите правильное соответствие между вариантами реализации хранилища данных и их характеристиками Варианты реализацииХарактеристики1.Виртуальное хранилище данныхAАрхитектура представляет собой единый источник интегрированных данных организации2.Глобальное хранилище данныхBАрхитектура является разновидностью глобального ХД, в которую технологически реализуются три уровня (На первом уровне располагается корпоративное ХД организации. На втором уровне поддерживаются связанные киоски данных тематической направленности на основе многомерной СУБД. На третьем уровне находятся клиентские приложения пользователей с установленными на них средствами анализа данных3.Хранилища данных с многоуровневой (в основном трехзвенной) архитектурой или корпоративные ХДCАрхитектура обеспечивает доступ к "живым" данным в режиме реального времени через программное обеспечение промежуточного слоя. В основе такого решения лежит репозитарий метаданных, который описывает источники данных, процедуры их предварительной обработки и форматы представления информации конечному пользователю. Недостаток такого решения - интенсивный сетевой трафик, снижение производительности несущей системы, угроза нарушения целостности данных в случае неудачных действий пользователей ХД4.Встроенные (комбинированные) хранилища данных. DВ этой архитектуре ХД не является единым физическим репозиторием (в отличие от CIF). Это "виртуальное" ХД, представляющее коллекцию витрин данных, каждая из которых имеет архитектуру типа "звезда".5.Корпоративная информационная фабрика (Corporate Information Factory, CIF). EАрхитектура представляет собой ХД, которые органически встраиваются в виртуальное предприятие (Enterprise Information Factory, EIF) или используются как компонент аналитической поддержки в информационной реализации бизнес-функций.6.Хранилище данных с архитектурой шины данных (Data Warehouse Bus).FАрхитектура является развитием архитектуры корпоративного ХД (enterprise data warehouse, EDW). Использование данной архитектуры предполагает скоординированное извлечение данных из источников, загрузку их в реляционную БД со структурой в третьей нормальной форме, использование построенного ХД для наполнения дополнительных репозиториев презентационных данных.7.Объединенное (федеративное) ХД. GАрхитектура представляет собой облегченный вариант ХД тематической направленности. 8.Киоски данных.HВ этой архитектуре ХД состоит из ряда экземпляров ХД, которые функционируют на полуавтономной основе и, как правило, организационно или географически разнесены, однако могут рассматриваться и управляться как одно большое ХД.
- # Укажите правильное соответствие между преимуществами, которые получает организация от внедрения хранилищ данных и их расшифровкой. ПреимуществаРасшифровка1.Взгляд на данные организации, как на единое целое. AСроки исполнения от 6 месяцев до 2-х лет в зависимости от объема хранилища данных, при следующем распределении затрат: для небольшого подразделения $ 400000-600000, для большого подразделения - $800000-1500000, для большой корпорации - $15000000.2.400% возврат инвестиций, вложенный в создание хранилища данных.BАнализ такой информации имеет решающее значение в принятие решений по всем вопросам, связанным с географией бизнеса.3.Возрастает надежность данных для принятия решений. CЭто ответы на такие вопросы, как -сколько продуктов реально производится? Что влияет на изменение спроса? Какие товары или услуги приносят наибольший доход? А также особенности и пристрастия своих клиентов.4.Геопространственный анализ данных. DДанные, загружаемые в хранилище данных, подвергаются очистке - согласуются, проверяются, уточняются.5.Исследование трендов и колебаний в бизнес-данных. организации во времени.EПозволяет достаточно надежно прогнозировать развитие бизнес-процессов
- # Укажите, какие из ниже перечисленных компонент не являются составными частями архитектуры хранилища данных?
- # Укажите ответы на какой вопрос не относится к решению задач управления хранилищем данных?
- # Укажите правильное соответствие между типовыми архитектурными элементами логической структуры CIF и их характеристиками ЭлементыХарактеристики1.Системы, доставшиеся «по наследству» (Legacy Systems)AЗдесь накапливается детальная информация, необходимая для выполнения анализа. Данные перегружаются в корпоративное хранилище из оперативных элементов — унаследованных систем, автоматизированных банковских систем или оперативных складов данных. Как правило обновление информации в EDW происходит с большой задержкой. Для разрешения этой проблемы используются ODS-элементы.2.Приложения оперативного управления организацией (OLTP)BПредназначены для хранения аналитической информации уровня подразделения или направления бизнеса.3.Оперативные склады данных (Operational Data Store — ODS)CDSS, примером функционала которых могут быть системы анализа клиентской базы банка, обеспечивают поддержку принятия решений. Разнообразный статистический анализ выполняется в DM.4.Компоненты преобразования данных (ETL-tools, Staging Area, Near-line Storage)DЭтот элемент наделяется свойствами как оперативных, так и аналитических систем. Основное его назначение — обеспечить осуществление анализа информации практически сразу после ее обновления в оперативных системах5.Корпоративное хранилище данных (Enterprise Data Warehouse)EСлужат для перегрузки данных из одних программных компонентов в другие (с промежуточной очисткой и согласованием данных, получаемых из различных источников).6.Витрины данных (Data Marts)FПоддерживают бизнес-функции, которые были созданы в организации ранее. В таких системах обычно компоненты, обеспечивающие формирование отчетов и ввод и передачу данных, реализуются в рамках единого программного блока, что затрудняет решение задач по интеграции и преобразованию данных в соответствие с новыми требованиями бизнеса.7.Приложения поддержки принятия решений (DSS) и приложения анализа данных (DM)GОбеспечивает публикацию данных в сети Интранет (Интернет), а также обработку результатов ввода информации пользователями.8.Инфраструктура сетевых коммуникацийHОбеспечивают быструю обработку данных в рамках бизнес - направлений деятельности организации. Как правило, такие системы приобретаются у компании-разработчика, которая осуществляет их техническую поддержку.
- # К какому из перечисленных методологических подходов к реализации хранилища данных относится следующая характеристика? "Достоинством такого подхода является получение более согласованных определений данных и бизнес-правил организации в самом начале работы над созданием ХД. Стоимость начального планирования и проектирования может оказаться достаточно высокой. Для этого подхода характерны большие затраты времени, что откладывает начало реализации и задерживает возврат инвестиций. Этот подход хорошо работает в организациях с хорошо организованной информационно-вычислительной структурой, когда программно-аппаратная платформа определена, существуют слаженно работающие источники данных".
- # К какому из перечисленных методологических подходов к реализации хранилища данных относится следующая характеристика? "У него есть и недостатки - данные могут дублироваться и быть несогласованными в разных киосках данных".
- # К какому из перечисленных методологических подходов к реализации хранилища данных относится следующая характеристика? "Этот подход требует детального планирования и проектирования ХД в рамках ИТ – проекта до начала выполнения проекта".
- # Какое из ниже приведенных определений не связано с термином транзакция? Транзакция – это …
- # Какая из ниже перечисленных команд SQL относится к термину запрос?
- # Какая характеристика транзакции задается ниже следующей спецификацией? "Онлайновые транзакции низкой сложности должны выполнятся не более 4 с."
- # Установите соответствие между типами приложений и их определениями. Тип приложенияОпределение1.OLTP-система А- это такое приложение обработки данных, для которого база данных растет или сжимается в размерах периодически в зависимости от характера обработки данных.2.DSS-система Б– это приложение, которое обеспечивает аналитическую обработку данных, включающую математический, статистический или иной анализ данных.3.BATCH-системы В– это такое приложение, которое работает с базой данных в не интерактивном режиме.4.OLAP-система Г– это такое приложение, которое работает с очень большой базой данных в режиме только чтение.5.VCDB-система Д– это такое приложение, которое содержит в основном транзакции вставки, обновления и удаления, с высокой частотой преимущественно транзакций обновления.
- # Установите соответствие между элементом определения транзакции и его смыслом. ЭлементОпределение1.Имя транзакции и номер транзакцииАуникальная идентификация каждой транзакции базы данных.2.Описание транзакцииБонлайновая транзакция или пакетная транзакция, высокая, средняя, низкая.3.Характер транзакции и ее сложностьВперечень операций предметной области, которые выполняются транзакцией.4.Объем транзакцииГсредняя частота и пиковая частота использования.5.Требования к производительности транзакцииДколичество секунд, необходимое для завершения транзакции в режиме эксплуатации базы данных.6.Относительный приоритетЕнасколько важна настоящая транзакция для предметной области по сравнению с другими.7.Время выполнения транзакцииЖколичества секунд, требуемых для выполнения транзакции
- # Установите соответствие между типами денормализации и их определениями. Тип денормализацииОпределение1.нисходящая денормализация А- это процесс введения избыточных колонок в одной таблице с целью увеличения производительности запроса строки по производному значению.2.восходящая денормализация Б– это процесс введения избыточных колонок в родительских таблицах с целью устранения операций соединения с операциями агрегирования.3.Внутритабличная денормализация В– это процесс введения избыточных колонок в подчиненных таблицах с целью устранения операций соединения.4.Денормализация методом разделяй и властвуй Г– это процесс объединения одной или более нормализованных таблиц с целью устранения операций соединений или уменьшения в некоторых случаях числа операций вставки.5.Денормализация методом слияния таблиц Д– это процесс разбиения нормализованной таблицы на две и более таблиц и создание между ними отношения "один к одному" с целью устранения дополнительных операций ввода-вывода или по техническим причинам.
- # В контексте физического проектирования реляционных баз данных денормализация – это …
- # В контексте физического проектирования реляционных баз данных вертикальное разбиение таблицы – это …
- # В контексте физического проектирования реляционных баз данных горизонтальное разбиение таблицы – это …
- # Какой из перечисленных ниже факторов не пытаются устранить в процессе денормализации?
- # При приятии решении о денормализации определите, что является наиболее важным для приложения базы данных?
- # В чем состоит эмпирическое правило Д. Энсора?
- # Пусть, для таблицы базы данных EMPLOYEE 1.Номер личной карточкиEMPNO (PK)2.ФамилияENAME3.ИмяLNAME4.СтраховкаSSECNO5.Номер подразделенияDEPNO (FK)6.ДолжностьJOB7.ВозрастAGE 8.СтажHIREDATE9.ДоплатыCOMM10ЗарплатаSAL11ШтрафыFINE12АвтобиографияBiog13ФотографияFoto задана следующая матрица распределения (использования) колонок таблицы (пронумерованы) по 10 транзакциям. 123456789101112131+++++++++++++2+++++++++++++3+++++++++++++4+++++++++++++5+++--+--+++--6+++--+----+--7+++--+---+---8+++--+--+----9+++-+--------10+++-+-------- Как следует изменить предложенное в примере лекции вертикальное разбиение данной таблицы?
- # Какое из перечисленных ниже словосочетаний не является синонимом?
- # Для случая горизонтального разбиения таблицы в тексте лекции были разобраны примеры поддержки ссылочной целостности для новой таблицы. В качестве какой таблицы выступала таблицы, которая подвергалась разбиению?
- # В контексте проектирования физической модели данных ХД индексирование – это …
- # В контексте проектирования физической модели данных ХД секционирование – это …
- # В контексте проектирования физической модели данных ХД кластеризация – это …
- # Установите соответствие между терминами и их определениями. ТерминОпределение1ИндексА- это физический объект реляционной базы данных, организованный по принципу сбалансированной иерархической структуры.2Ключевые поля или ключиБ- это колонки, входящие в индекс.3Индекс B-Tree В- это объект в реляционной базе данных, который предназначен для организации быстрого доступа к строкам таблицы по значениям одной или более колонок этих строк.4Составной индексГ- это индекс типа B-Tree базы данных, который одновременно выполняет роль таблицы.5Исключительно индексная таблица Д- это индекс, построенный для нескольких колонок таблицы.6Кардинальность колонки Е- это число дискретных различных значений колонки, которые встречаются в строках таблицы.
- # Установите соответствие между терминами и их определениями. ТерминОпределение1Ключ секционированияАколонка таблицы, относительно значений которых СУБД будет делать физическое разнесение таблицы по различным табличным пространствам на жестких дисках.2Секционирование по диапазону Бозначает распределение строк таблицы на различные предопределенные табличные пространства в зависимости от значения ключа секционирования.3Хеш-секционирование Возначает, что таблица сначала распределяется среди табличных пространств на основе диапазона значений ключа секционирования, далее каждая из полученных секций диапазонов делится на подчиненные секции или подсекции, и затем строки равномерно распределяются среди подчиненных секций по значению хеш-ключа.4Составное секционирование Гозначает равномерное распределение строк таблицы по назначенным табличным пространствам в зависимости от значения ключа секционирования, который в данном случае хешируется.
- # Установите соответствие между терминами и их определениями. ТерминОпределение1Локально секционированный индекс Аимеет такой же ключ секционирования, количество табличных пространств и правила секционирования, что и отвечающая ему базовая таблица.2Глобально секционированный индексБключ секционирования секционирование выполняется по значениям, отличным от значений колонки индексирования.3Префиксный секционированный индекс Возначает, что индекс имеет то же число секций и те же правила секционирования, что и его базовая таблица.4Непрефиксный секционированный индексГсодержит предложение PARTITION BY RANGE, в котором задаются параметры секционирования, отличные от параметров секционирования соответствующей базовой таблицы.5Локально равносекционированный секционированный индекс Гсекционирование производится по ключу секционирования, который содержит основную часть индексного ключа.
- # Установите соответствие между терминами и их определениями. ТерминОпределение1Кластер А- это значение колонок, общих для кластеризуемых таблиц.2Индексный кластерБ-это кластер, для физической организации которого используется индекс со структурой B-Tree3Хеш-кластерВ - это кластер, для физической организации которого использует структура на основе преобразования ключа.4Кластерный ключ Г- это группа таблиц, которая разделяет общие физические страницы данных при совместном использовании в запросах общих колонок этих таблиц.
- # Какой из перечисленных ниже типов колонок является плохим кандидатом для построения индекса?
- # Будет ли ниже приведенный запрос при выборке данных обращаться к таблице данных? Колонка Ename проиндексирована. SELECT COUNT(*) FROM EMPLOYEE WHERE Ename LIKE 'C%';
- # Нужно ли в СУБД Oracle при определении кластерного ключа индексного кластера на первичном ключе одной из таблиц оставлять ограничение первичного ключа в определении колонки этого ключа?
- # Укажите свойство, которое не является свойством индекса со структурой B-Tree?
- # Укажите, какая модификация индекса со структурой B-Tree не поддерживается в СУБД Oracle?
- # Укажите, какое из ниже перечисленных утверждений не относится к недостаткам кластеризации?
- # Укажите недостаток секционирование представлений с помощью ограничения CHECK.
- # Укажите преимущество секционирование представлений с помощью предложения WHERE?
- # Рассмотрим фрагмент определения преставления SELECT * FROM east_sales@icp.ac.ru WHERE LOC = 'EAST' UNION ALL SELECT * FROM west_sales@ioc.ac.ru WHERE LOC = 'WEST'; Если заменить предложение WHERE на ограничение CHECK, то в таком случае …
- # . Рассмотрим базу данных обработки заказов и создадим индексный кластер для хранения одной из таблиц базы данных - Customer. CREATE CLUSTER cust_c (cust_id varchar(8)) INDEX; CREATE INDEX cust_c_id ON CLUSTER cust_c; CREATE TABLE cust ( cust_id varchar2(8) NOT NULL REFERENCES customers, ent# number NOT NULL, date_ent date NOT NULL, comment varchar2(60) NOT NULL, … PRIMARY KEY(cust_id, ent#) ) CLUSTER cust_c (cust_id); Созданная таблица кластеризована по колонке cust_id, и все специальные записи о клиента в колонке comment будут расположены в одной странице физической базы данных, либо в смежных страницах. Их можно выбрать за одну операцию поиска по индексу: SELECT date_ent, comment FROM cust_c WHERE cust_id=:cur_cust; Комментарий. На ограничение первичного ключа в операторе CREATE сделан, чтобы избежать создания второго индекса. Является ли такое решение преимуществом с точки зрения утверждения: "Все записи о клиентах выбираются для ежегодного отчета".
- # Рассмотрим базу данных обработки заказов и создадим индексный кластер для хранения одной из таблиц базы данных - Customer. CREATE CLUSTER cust_c (cust_id varchar(8)) INDEX; CREATE INDEX cust_c_id ON CLUSTER cust_c; CREATE TABLE cust ( cust_id varchar2(8) NOT NULL REFERENCES customers, ent# number NOT NULL, date_ent date NOT NULL, comment varchar2(60) NOT NULL, … PRIMARY KEY(cust_id, ent#) ) CLUSTER cust_c (cust_id); Созданная таблица кластеризована по колонке cust_id, и все специальные записи о клиента в колонке comment будут расположены в одной странице физической базы данных, либо в смежных страницах. Их можно выбрать за одну операцию поиска по индексу: SELECT date_ent, comment FROM cust_c WHERE cust_id=:cur_cust; Комментарий. На ограничение первичного ключа в операторе CREATE сделан, чтобы избежать создания второго индекса. Является ли такое решение преимуществом с точки зрения утверждения: "Очень немного строк о клиентах имеют специальные записи о клиенте".
- # Рассмотрим базу данных обработки заказов и создадим индексный кластер для хранения одной из таблиц базы данных - Customer. CREATE CLUSTER cust_c (cust_id varchar(8)) INDEX; CREATE INDEX cust_c_id ON CLUSTER cust_c; CREATE TABLE cust ( cust_id varchar2(8) NOT NULL REFERENCES customers, ent# number NOT NULL, date_ent date NOT NULL, comment varchar2(60) NOT NULL, … PRIMARY KEY(cust_id, ent#) ) CLUSTER cust_c (cust_id); Созданная таблица кластеризована по колонке cust_id, и все специальные записи о клиента в колонке comment будут расположены в одной странице физической базы данных, либо в смежных страницах. Их можно выбрать за одну операцию поиска по индексу: SELECT date_ent, comment FROM cust_c WHERE cust_id=:cur_cust; Комментарий. На ограничение первичного ключа в операторе CREATE сделан индекс первичного ключа, чтобы избежать создания второго индекса. Является ли такое решение преимуществом с точки зрения утверждения: "Строки, имеющие специальные записи о клиенте, имеют более одной записи о клиенте".
- # Рассмотрим базу данных обработки заказов и создадим индексный кластер для хранения одной из таблиц базы данных - Customer. CREATE CLUSTER cust_c (cust_id varchar(8)) INDEX; CREATE INDEX cust_c_id ON CLUSTER cust_c; CREATE TABLE cust ( cust_id varchar2(8) NOT NULL REFERENCES customers, ent# number NOT NULL, date_ent date NOT NULL, comment varchar2(60) NOT NULL, … PRIMARY KEY(cust_id, ent#) ) CLUSTER cust_c (cust_id); Созданная таблица кластеризована по колонке cust_id, и все специальные записи о клиента в колонке comment будут расположены в одной странице физической базы данных, либо в смежных страницах. Их можно выбрать за одну операцию поиска по индексу: SELECT date_ent, comment FROM cust_c WHERE cust_id=:cur_cust; Комментарий. На ограничение первичного ключа в операторе CREATE сделан индекс первичного ключа, чтобы избежать создания второго индекса. Является ли такое решение преимуществом с точки зрения утверждения: "При выборке специальных записей о клиенте для клиента выбираются все такие записи".
- # Результат выполнения оператора SELECT называется …
- # Установите соответствие между фазами обработки команды SQL и действиями СУБД. Тип данныхЗначение1фаза синтаксического разбораАвключает проверку синтаксиса команды, проверку имен таблиц и колонок в базе данных, а также подготовку исходных данных для оптимизатора.2фаза оптимизацииБвключает подстановку действительных имен таблиц и колонок базы данных в представление, идентификацию возможных вариантов выполнения команды, определения стоимости выполнения каждого варианта, выбор наилучшего варианта на основе внутренней статистики.3фаза генерации исполняемого кодаВвключает выполнение кода команды.4фаза выполнения командыГвключает построение выполняемого кода команды.
- # Какая из ниже перечисленных команд SQL не относится к командам манипулирования данными?
- # Запрос к схеме "звезда": "Пусть требуется просмотреть данные о продажах товара с идентификационным номером 33 за месяцы с мая по август текущего года по региону "Москва" с идентификационным номером 81". Укажите правильный вариант ответа.
- # Запрос к схеме "звезда": "Определить, сколько нереализованных подушек было в сети магазинов торговой организации в январе 2009 года.". Укажите правильный вариант ответа.
- # Установите соответствие между агрегатной функцией и ее определением. ФункцияОпределение1AVG(X)АВычисляет среднее значение аргумента, который может быть выражением любого типа. 2COUNT(X)БВычисляет число итемов. 3MAX(X)ВВычисляет максимальное значение аргумента, который может быть выражением любого типа.4MIN(X)ГВычисляет минимальное значение аргумента, который может быть выражением любого типа. 5SUM(X)ДВычисляет сумму значений аргумента, который может быть выражением любого типа. 6STDEV(Х)ЕВычисляет стандартное отклонение на множестве значений аргумента, который может быть выражением любого типа. 7VAR(X)ЖВычисляет квадрат дисперсии.
- # Запрос к схеме "звезда": "Пусть руководству компании требуется отчет о прибыли по всем регионам по всем отделам продаж за 2007-08 гг". Укажите правильный ответ.
- # Запрос к схеме "звезда": "Пусть руководству компании требуется отчет о прибыли по всем регионам по всем отделам продаж за 2007-08 гг. без итоговой суммы прибыли". Укажите правильный ответ.
- # Запрос к схеме "звезда": "Пусть руководству компании требуется отчет о прибыли по всем регионам по всем отделам продаж за 2007-08 гг. без итоговой суммы прибыли". Укажите правильный ответ.
- # Запрос к схеме "звезда": "Пусть руководству компании требуется перекрестный отчет о прибыли по всем регионам по всем отделам продаж за 2007-08 гг.". Укажите правильный ответ.
- # Запрос к схеме "звезда": "Пусть руководству компании требуется перекрестный отчет о прибыли по всем регионам по всем отделам продаж за 2007-08 гг без вывода частичных сумм". Укажите правильный ответ.
- # Задана команда: SELECT Time, Region, Department, SUM(Profit) AS Profit, GROUPING (Time) as T, GROUPING (Region) as R, GROUPING (Department) as D FROM Sales GROUP BY ROLLUP (Time, Region, Department); Какое из ниже перечисленных утверждений является для нее правильным?
- # Задан оператор SELECT Time, Region, Department, SUM(Profit) AS Profit FROM sales GROUP BY ROLLUP(Time, Region, Department); Укажите правильное результирующее множество.
- # Задан оператор SELECT Time, Region, Department, SUM(Profit) AS Profit FROM sales GROUP BY Time, ROLLUP (Region, Department); Укажите правильное результирующее множество.
- # Задан оператор SELECT Time, Region, Department, SUM(Profit) AS Profit FROM sales GROUP BY CUBE(Time, Region, Department); Укажите правильное результирующее множество.
- # К аналитическим функциям в SQL относят …
- # Секционирование результирующего множества – это …
- # Окно определяет …
- # Статистические функции …
- # Оконные функции …
- # Функции ранжирования …
- # Оператор SELECT Region. MIN(Population) AS Minimum, MAX(Populations)AS Maximum, AVG(Population) AS Average. VAR(Population) AS Variance FROM Region GROUP BY Region ORDER BY Maximum DESC; вычисляет …
- # Оператор SELECT AVG(Col1) AS "?????" FROM Table WHERE ID BETWEEN MAX(ID) / 2 AND (MAX(ID) / 2) + SIGN(MAX{(ID) +1 % 2) вычисляет …
- # Оператор SELECT OrderID, ProductID, OrderQty ,SUM(OrderQty) OVER(PARTITION BY OrderID) AS 'Итого' ,AVG(OrderQty) OVER(PARTITION BY OrderID) AS 'Среднее' FROM OrderDetail WHERE OrderID IN(43659,43664); вычисляет …
- # Задан оператор SELECT r_regionkey, p_productkey, s_amount, s_profit, RANK() OVER (ORDER BY s_amount DESC, s_profit DESC) AS 'Ранг по востоку' FROM region, product, sales WHERE region.r_regionkey = sales.s_regionkey AND product.p_productkey = sales.s_productkey AND r_regionkey = 'Восток'; Укажите правильное результирующее множество.
- # Задан оператор SELECT р_productkey, SUM(s_amount) as 'Суммарное количество', RANK() OVER (ORDER BY SUM(s_amount) DESC) AS 'rank_all', DENSE_RANK() OVER (ORDER BY SUM(s_amount) DESC) AS 'rank_dense' FROM sales GROUP BY р_productkey; Укажите правильное результирующее множество.
- # Задан оператор SELECT р_productkey, SUM(s_amount) as 'Суммарное количество', RANK() OVER (ORDER BY SUM(s_amount) DESC) AS 'rank_all', DENSE_RANK() OVER (ORDER BY SUM(s_amount) DESC) AS 'rank_dense' FROM sales GROUP BY р_productkey; Укажите правильное результирующее множество.
- # Установите соответствие между ранжируюoими функциями и их определениями. ФункцияВозвращаемое значениеRANKAВозвращает ранг строк в секции результирующего набора без промежутков в ранжировании. Ранг строки равен количеству различных значений рангов, предшествующих строке, увеличенному на единицу. Возвращаемый тип данных bigint.DENSE_RANKBРаспределяет строки упорядоченной секции в заданное количество групп. Группы нумеруются, начиная с единицы. Для каждой строки функция возвращает номер группы, которой принадлежит строка.NTILECВозвращает последовательный номер строки в секции результирующего набора, 1 соответствует первой строке в каждой из секций. Возвращаемый тип данных bigint.ROW_NUMBERDВозвращает ранг каждой строки в секции результирующего набора. Ранг строки вычисляется как единица плюс количество рангов, находящихся до этой строки. Возвращаемый тип данных bigint.
- # Установите соответствие между статистическими функциями и их определениями. ФункцияВозвращаемое значениеSTDEVAВозвращает статистическое среднеквадратичное отклонение совокупности всех значений в указанном выражении.STDEVPBВозвращает статистическую дисперсию для заполнения всех значений в указанном выражении.VARCВозвращает статистическую дисперсию всех значений в указанном выражении.VARPCВозвращает статистическое стандартное отклонение всех значений в указанном выражении.
- # Установите соответствие между некоторыми функциями построения линейной регрессии и их определениями. ФункцияВозвращаемое значениеREGR_SLOPEAФункция вычисляет отсечение на оси YREGR_INTERCEPTBФункция вычисляет тангенс угла наклона линии регрессии, соответствующей ненулевым парам (e1, e2).REGR_R2CФункция возвращает количество ненулевых пар, которые участвуют в построении линии регрессии.REGR_COUNTCФункция вычисляет коэффициент детерминации для линии регрессии (после проверки пар (e1, e2) на нуль).
- # К основным типам языков манипулирования данными в базах данных относят …
- # Процедурные языки обработки данных требуют …
- # Концепция независимости прикладных программ от физической структуры данных не дает следующих преимуществ:
- # Оптимизатором запросов называется …
- # Оптимизация запросов может быть определена как …
- # Путь доступа - это …
- # Оцените в терминах операций ввода вывода следующий запрос, который делает выборку данных из таблиц PRODUCT (50 строк) и VENDOR (1000): SELECT VENDOR_CODE, PRODUCT_CODE, PRODUCT_DESC FROM VENDOR, PRODUCT WHERE VENDOR.VENDOR_CODE = PRODUCT.VENDOR_CODE AND VENDOR.VENDOR_CODE = "100"; По следующему пути доступа: Формируем декартово произведение таблиц PRODUCT и VENDOR.Ограничиваемся в результирующей таблице строками, которые удовлетворяют условию поиска в предложении WHERE.Выполняем проекцию результирующей таблицы на список колонок, указанный в предложении SELECT. если 20 строк удовлетворяют условиям поиска
- # Оцените в терминах операций ввода вывода следующий запрос, который делает выборку данных из таблиц PRODUCT (50 строк) и VENDOR (1000): SELECT VENDOR_CODE, PRODUCT_CODE, PRODUCT_DESC FROM VENDOR, PRODUCT WHERE VENDOR.VENDOR_CODE = PRODUCT.VENDOR_CODE AND VENDOR.VENDOR_CODE = "100"; По следующему пути доступа: Ограничение по условию поиска в второй таблице (VENDOR_CODE = "100").Выполнение соединения полученной на 1 шаге результирующей таблицы с таблицей VENDOR. если 20 строк удовлетворяют условиям поиска
- # Оцените в терминах операций ввода вывода следующий запрос, который делает выборку данных из таблиц PRODUCT (50 строк) и VENDOR (1000): SELECT VENDOR_CODE, PRODUCT_CODE, PRODUCT_DESC FROM VENDOR, PRODUCT WHERE VENDOR.VENDOR_CODE = PRODUCT.VENDOR_CODE AND VENDOR.VENDOR_CODE = "100"; По следующему пути доступа: Формируем декартово произведение таблиц PRODUCT и VENDOR.Выполняем проекцию результирующей таблицы на список колонок, указанный в предложении SELECT.Ограничиваемся в результирующей таблице строками, которые удовлетворяют условию поиска в предложении WHERE. если 20 строк удовлетворяют условиям поиска
- # При оптимизации запросов, основанных на правилах, …
- # При оптимизации запросов, основанных на вычислении стоимости, …
- # При оптимизации запросов, основанных на вычислении стоимости, отличается от оптимизации, основанной на правилах, в том, что …
- # Какие из ниже перечисленных причин приводят к нецелесообразности к созданию индексов для каждого оператора SELECT?
- # Какие из ниже перечисленных причин приводят к нецелесообразности к созданию индексов для каждого оператора SELECT?
- # Какие из ниже перечисленных причин приводят к нецелесообразности к созданию индексов для каждого оператора SELECT?
- # OLAP можно определить, как.…
- # Клиентские OLAP-средства представляют собой…
- # Серверные OLAP-средства представляют собой …
- # MOLAP как способ хранения данных …
- # ROLAP как способ хранения данных …
- # HOLAP как способ хранения данных …
- # FASMI означает быстрый анализ разделяемой многомерной информации, включающий следующие требования к приложениям для многомерного анализа …
- # FASMI означает быстрый анализ разделяемой многомерной информации, включающий следующие требования к приложениям для многомерного анализа …:
- # FASMI означает быстрый анализ разделяемой многомерной информации, включающий следующие требования к приложениям для многомерного анализа …
- # Многомерная диаграмма (multidimensional diagram) представляет собой …
- # OLAP хранилища данных заполняются данными из…
- # Куб данных является …
- # Элементами многомерной диаграммы являются …
- # Элементами многомерной диаграммы являются …
- # Элементами многомерной диаграммы являются …
- # Элементами многомерной диаграммы являются …
- # Укажите, какие объекты не являются результатами логического проектирования хранилища данных.
- # Какие из ниже перечисленных операций не входят в этап проектирования логической модели хранилища данных?
- # Укажите, какой вид работы не входит в этап проектирования физической модели хранилища данных
- # Укажите, какие объекты не являются входными данными для проектирования хранилища данных.
- # Какие из ниже перечисленных объектов относятся к результатам проектирования логической модели хранилища данных?
- # Какое из ниже перечисленных действий не относится к проверке правильности логической модели хранилища данных?
- # Укажите правильное соответствие между этапами проектирования хранилища данных и их кратким содержанием. ЭтапСодержание1.На этапе планирования AРешаются задачи: определение требований владельца ХД; определение требований конечных пользователей; определение технологических требований; определение архитектурных требований2.На этапе разработки требованийBРешаются задачи: выбор стратегии реализации и методологии разработки, анализ задач, для решения которых создается ХД, анализ ресурсов разработки с технологической точки зрения и с точки зрения задач бизнеса, выбор архитектуры ХД, определяется бюджет проекта, разрабатываются возможные сценарии использования ХД, начинается сбор метаданных для ХД3.На этапе анализаCРешаются задачи разработки физической модели ХД, проектирования процедур поступления данных в него и проектирования архитектуры приложений4.На этапе проектированияDРешаются задачи построения согласованной по источникам логической модели и определения набора инструментальных средств для работы с ХД.5.На этапе внедренияEРешаются задачи поддержки работоспособности и масштабируемости программно-аппаратного обеспечения ХД; сбора, очистки, преобразования, загрузки и актуализации данных в соответствии с установленными бизнес - процедурами.6.На этапе поддержкиFРешаются задачи начальной инсталляции, включающей начальную загрузку хранилища из источников данных, и тестирования процедур обновления и синхронизации данных.
- # Укажите правильное соответствие между этапами бизнес - модели создания хранилища данных и документами, которые создаются на каждом этапе. ЭтапДокументы1.Формулирование требованийAСпецификации на программно-аппаратное обеспечение, а также скрипты и установки для программного обеспечения2.Создание вычислительной среды для хранилища данныхBПеречень источников данных и их описание, а также логическая и физическая модели данных.3.Моделирование данныхCКаталог требований, утвержденный заказчиком и уточненный план проекта, который точно определяет используемые ресурсы и даты контрольных точек ходы выполнения проекта4.Определение процедур извлечения, преобразования и загрузки данных DДокументация, описывающая механизм доставки пользователям отчетов и спецификации экранных форм.5.Проектирование аналитических отчетов EСхема соответствия данных подающих систем и ХД, программы или ETL - инструменты.6.Разработка приложений хранилища данныхFСпецификация кубов данных (измерения и метрики) и разработанные отчеты.7.Настройка производительностиGПлан тестирования ХД и заключение о готовности ХД к эксплуатации.8.Проверка качестваHПеречень рекомендаций по настойке производительности.
- # Укажите правильное соответствие между этапами бизнес - модели создания хранилища данных и рисками, которые имеют место быть на каждом этапе. ЭтапДокументы1.Формулирование требованийAИспользование одного сервера БД для моделирования различных вычислительных сред, например, вычислительной среды разработки и вычислительной среды тестирования, или, что еще хуже, для вычислительной среды разработки и вычислительной среды эксплуатации ХД, особенно, если на этом сервере работает уже существующая информационная система.2.Создание вычислительной среды для хранилища данныхBКонфликт внутрикорпоративных интересов и в необходимости наладить коммуникации для успешного выполнения и этапа и проекта в целом.3.Моделирование данныхCНедооценка временных параметров и стремление команды разработчиков сделать процесс ETL как можно более всеобъемлющим, мотивируя свои действия стремлением обеспечить качество данных4.Определение процедур извлечения, преобразования и загрузки данных DСамоуверенность проектировщиков ХД.5.Проектирование аналитических отчетов EЛожное представление о достаточной квалификации пользователей ХД в ИТ - технологиях.6.Разработка приложений хранилища данныхFНе уделяется достаточного внимания оптимизации времени получения отчета.7.Настройка производительностиGЭто люди: их квалификация, амбиции, заинтересованность в деле, мотивы и т.д.8.Проверка качестваHИспользование вычислительной среды разработки ХД, которая не масштабируется к вычислительной среде эксплуатации ХД.
- # Укажите, какие из ниже перечисленных объектов относятся к результатам проектирования физической модели хранилища данных.
- # Укажите правильное соответствие между этапами бизнес - модели создания хранилища данных и временными затратами, которые имеют место быть на каждом этапе. ЭтапыВременные затраты1.Формулирование требованийA- от двух недель до полутора месяцев.2.Создание вычислительной среды для хранилища данныхB- от двух недель до двух месяцев.3.Моделирование данныхC- от одной недели до полутора месяцев.4.Определение процедур извлечения, преобразования и загрузки данных D- от двух недель до двух месяцев.5.Проектирование аналитических отчетов E- от одной недели до месяца.6.Разработка приложений хранилища данныхFзависит от числа разрабатываемых отчетов.7.Настройка производительностиG- от одной до четырех недель.8.Проверка качестваHне должно превышать одну-две недели.
- # Укажите правильное соответствие между этапами бизнес - модели создания хранилища данных и главными задачами каждого этапа. ЭтапыЗадача этапа1.Формулирование требованийAпроектирование и разработка аналитических отчетов на спроектированной структуре данных.2.Создание вычислительной среды для хранилища данныхBформирование программной среды, в которой пользователи будут извлекать данные из ХД и просматривать предопределенные отчеты.3.Моделирование данныхCдобиться оптимальной производительности ETL-процессов, производства отчетов и их доставки конечному пользователю.4.Определение процедур извлечения, преобразования и загрузки данных Dразработка логической и физической моделей данных для ХД.5.Проектирование аналитических отчетов Eидентификация и определение процедур извлечения, очистки (фильтрации), преобразования и загрузки данных.6.Разработка приложений хранилища данныхFидентификация требований заказчика ХД и оформление их в виде документа "Каталог требований".7.Настройка производительностиGубедиться, что ХД готово к эксплуатации. Как правило, проверка качества выполняется отдельной группой специалистов, не входящих в состав команды разработчиков8.Проверка качестваHсоздание информационно-вычислительной среды, в которой будет разрабатываться ХД.
- # Под жизненным циклом продукта понимается …
- # Что не включает типовая модель бизнес-процессов разработки ХД?
- # На этапе формулирования требований к хранилищу данных определяются …
- # Термин "Business Intelligence" означает …
- # Основной целью систем бизнес – аналитики является …
- # Обычно информационная пирамида имеет следующие уровни:
- # Система деловой осведомленности или бизнес – аналитики (BI System) - …
- # Какая из ниже перечисленных функций является функцией системы бизнес - аналитики?
- # Какая из ниже перечисленных функций не является функцией системы бизнес - аналитики?
- # Система бизнес-аналитики является …
- # К основным технологическим средствам реализации функциональности систем–бизнес – аналитики относят …
- # К основным технологическим средствам реализации функциональности систем–бизнес – аналитики не относят …
- # Многомерные "информационные кубы" …
- # Система бизнес–аналитики должна предоставлять…
- # Системы бизнес-аналитики позволяют …
- # При рассмотрении задач безопасности данных следует задаться следующими вопросами:
- # При рассмотрении топологии данных с точки зрения безопасности необходимо изучить следующие вопросы:
- # Данные, подвергающиеся как процессу сбора, так и преобразования, также образуют "точки риска":
- # Какое из приведенных ниже определений является определением предметной области?
- # Установите соответствие между понятиями, связанными с предметной областью, и их определениями. ПонятиеОпределение1.Ядро предметной областиAв каждый конкретный момент времени представляет собой выделенную совокупность определенных объектов и ситуаций.2.ОбъектBвзаимосвязи, выражающие взаимоотношения между объектами.3.Класс ситуацийCявляется результатом абстрагирования реального объекта путем выделения и фиксации набора его свойств.4.Состояние предметной области (снимок)Dсовокупность объектов (реалий внешнего мира), о которых можно задавать вопросы.
- # На основе каких понятий аналитик выделяет предметную область базы данных?
- # Какой из ниже перечисленных объектов может быть материальной сущностью?
- # Какую из перечисленных ситуаций следует отнести к динамической ситуации?
- # Какое из перечисленных ниже вопросно-ответных отношений нельзя реализовать в информационной системе обслуживания счетов клиентов банка?
- # Сколько основных конструкций используется в логической модели предметной области?
- # Укажите правильное соответствие между элементами логической модели и их определениями. Элементы моделиОпределения1.Сущность предметной областиA- это атрибут сущности, позволяющий отличать одну сущность от другой.2.Атрибут сущностиB- это атрибут конкретного экземпляра сущности, у которого может быть только одно значение.3.Экземпляры сущностиC- это атрибут конкретного экземпляра сущности, у которого может быть несколько значений.4.Уникальный идентификатор сущностиD- это класс объектов или явлений предметной области базы данных.5.Однозначный атрибутE- это выражение, определяющее значения, разрешенные для данного атрибута; область значений атрибута.6.Многозначный атрибутF- это реализации сущности, отличающиеся друг от друга и допускающие однозначную идентификацию.7.Домен атрибутаG- это свойство или характеристика сущности.
- # Укажите правильное соответствие между элементами логической модели и их определениями. Элементы моделиОпределения1.Отношение (связь)A- это характер участия сущности в связи.2.Уникальный идентификатор связиB– это соотношение между числом сущностей, участвующих в образовании связи.3.Степень (мощность) связиC– это сущность, которая не может присутствовать в базе данных, пока не существует связанного с ней экземпляра другой сущности.4.Класс принадлежности сущностиD– это сущность, которая порождает непересекающиеся подмножества экземпляров (категории сущности), связанных с сущностью через значения своего атрибута. 5.Рефлексивное отношениеE– это категория порождающей сущности (сущности- супертипа).6.Слабая сущностьFпредставляет собой соединение (взаимоотношение) между двумя или более сущностями.7.СупертипG- это супертип с порожденными им подтипами.8.ПодтипH- это атрибут для однозначной идентификации отношения.9.Составная сущностьJ- это отношение, связывающее сущность саму с собой.
- # Нормализация отношений информационной модели предметной области является
- # Для достижения 3НФ необходимо, чтобы:
- # При каких условиях нормализация не нужна?
- # Установите правильное соответствие между нормальными формами и некоторыми аспектами их определения. Нормальная формаОпределение1.Первая нормальная форма (1НФ) Aотношение должно удовлетворять зависимости по соединению относительно своих проекций.2.Вторая нормальная форма (2НФ)Bвсе неключевые атрибуты отношения функционально полно зависят от составного ключа отношения; отношение не должно содержать частичных ФЗ.3.Третья нормальная форма (3НФ)Cнеключевые атрибуты отношения не зависят от ключей; отношение допускает наличия только таких нетривиальных ФЗ, в которых ключ определяет один или более других атрибутов: из Х следует А, где А не входит в Х, Х включает некоторый ключ. 4.Нормальная форма Бойса-Кодда (НФБК) Dвсе неключевые атрибуты отношения зависят только от первичного ключа; отношение не должно содержать транзитивных ФЗ неключевых атрибутов от ключа.5.Четвертая нормальная форма (4НФ)Eотношение не должно содержать независимых многозначных ФЗ.6.Пятая нормальная форма (5НФ) Fвсе атрибуты отношения являются простыми, т.е. не имеют компонентов.
- # Дано отношение ОТГРУЗКА (корабль, дата отправления, грузополучатель, 1 партия грузов, 2 партия грузов, 3 партия грузов, объявленная стоимость, застрахованная стоимость). Использование этого отношения в реляционной базе данных может породить следующие проблемы:
- # Предположим, что атрибуты сущности зависят друг от друга следующим образом из X следует Y, а из Y следует A
- # К какой нормальной форме приведено исходное отношение? Исходное отношение: Преподаватель (Личный_#, Фамилия, Должность, Оклад, Кафедра, Телефон ) Результирующие отношения:/ Преподаватель(Личный_#, Фамилия, Должность, Кафедра) Должность (Должность, Оклад) Кафедра (Кафедра, Телефон) Комментарий к ответу: Отношение Преподаватель содержит транзитивные зависимости: Личный_#→Кафедра→Телефон и Личный_#→Должность→Оклад. Это может привести к следующим аномалиям: дублирование данных о Телефоне для каждой Кафедрыпроблема контроля избыточности данных: обновление Телефонапроблема нуль-значений: данные о новой Кафедре не могут быть включены до появления первого преподавателя Устранение аномалий заключается в выполнении трех проекций отношения.
- # К какой нормальной форме приведено исходное отношение? Исходное отношение: Преподаватель_предмет (Личный_#, Предмет, Часы, Фамилия, Должность, Оклад, Кафедра, Телефон ) Результирующие отношения: Преподаватель (Личный_#, Фамилия, Должность, Оклад, Кафедра, Телефон ) Предмет(Личный_#, Предмет, Часы ) Комментарий к ответу: Отношение Преподаватель_Предмет содержит частичные ФЗ: пять последних неключевых атрибутов зависят от части ключа Личный_#. Это может привести к следующим аномалиям: дублирование данных о преподавателе в случае, если он читает несколько предметовпроблема контроля избыточности данных: обновление значения "Оклад"проблема нуль-значений: данные о преподавателе не могут быть включены, если они в настоящий момент не ведут обучения Устранение аномалий заключается в выполнении двух проекций отношения.
- # К какой нормальной форме приведено исходное отношение? Исходное отношение: Курсовой_проект (Преподаватель - Предмет - Студент) Иванов - Тема1 - Петрова Фролов - Тема1 - Исаев Антонов - Тема1 - Сидоров Иванов - Тема2 - Ивлева Фролов - Тема2 - Степанов Фролов - Тема3 - Мусин Антонов - Тема3 - Сац Результирующие отношения: Руководство (Преподаватель, Предмет) Выполнение (Студент, Предмет) Комментарий к ответу: На роль ключа отношения Курсовой_проект претендует набор атрибутов {Преподаватель, Предмет}. Студент выполняет только один проект, один и тот же проект может выполняться несколькими студентами у разных преподавателей. Отношение содержит следующие ФЗ: {Преподаватель, Предмет} -> Студент и Студент -> Предмет. Отношение находится в 3НФ и не содержит частичных и транзитивных ФЗ. Однако наличие ФЗ части составного ключа от неключевого атрибута может привести к следующим аномалиям: проблема контроля избыточности данных: замена студента требует просмотра всего отношения, чтобы изменить данные о преподавателе для негопроблема нуль-значений: данные о проекте студента не могут быть внесены, пока не назначен преподаватель Устранение аномалий заключается в удалении ФЗ ключа от неключевого атрибута.
- # К какой нормальной форме приведено исходное отношение? Исходное отношение: Преподаватель (Фамилия, Группа, Предмет ) Результирующие отношения: Преподаватель_группа (Фамилия, Группа ) Преподаватель_предмет (Фамилия, Предмет ) Комментарий к ответу: Отношение Преподаватель содержит две многозначные ФЗ: Фамилия ->-> Группа и Фамилия ->-> Предмет. Это приводит к аномалии включения: если у преподавателя появляется новая группа, в отношение приходится добавлять несколько кортежей (по числу читаемых им предметов). Устранение аномалии заключается в выделении МФЗ в отдельное отношение.
- # Рассмотрим схему отношения R(город, адрес, почтовый_индекс). Ключами отношения являются:
- # Рассмотрим схему отношения ПРЕПОДАВАТЕЛЬ_ПРЕДМЕТ (Личный номер, Предмет, Фамилия, Должность, Оклад, Часы). Ключами отношения являются:
- # Рассмотрим схему отношения ПРОДУКТ (Номер_модели, Производитель, Тип_модели, Цена). Ключами отношения являются:
- # Архитектура данных -
- # Уровень структуризации данных -
- # Отметьте характерные основные виды данных для хранилищ данных:
- # Темпоральные данные -
- # Гранулярность времени показывает ...
- # Темпоральные базы данных …
- # Временные метки -
- # Установите соответствие между понятиями, связанными с временными метками. ПонятиеОпределение1.Время фиксации события или фактаA- это временная метка, связанная со временем загрузки данных в ХД.2.Время операцииB- это временная метка, представляющая время, когда данные были извлечены или собраны из источника данных.3.Время сбора данныхC- это временная метка, представляющая время, когда была выполнена операцию хозяйственной деятельности организации.4.Время актуализации данныхD- это временная метка, которая представляет время события или состояния предметной области.
- # Интервальнаяе временная метка отличается от моментной временной метки тем, что …
- # Упорядоченным темпоральным запросом называется …
- # Укажите правильное соответствие между подходами к построению логической темпоральной модели данных и их определениями. ПодходОпределение1.Подход, основанный на накоплении моментальных снимковAсостоит в добавлении временной метки фиксации события (факта) как атрибута экземпляра сущности предметной области и отражении момента времени в таблице БД как истории жизни данных предметной области2.Подход, основанный на фиксации событий предметной областиBсостоит в добавлении временных меток для фиксации начала и завершения определенного состояния как атрибутов экземпляра сущности предметной области экземпляров сущности, и отражении моментов времени начала и завершения определенного состояния сущности в таблице БД как истории жизни данных предметной области3.Подход, основанный на фиксации состояний предметной областиCсостоит в сборе снимков фрагмента предметной области и накоплении таких снимков в различных фрагментах БД или другой БД как истории жизни данных предметной области
- # Укажите правильное соответствие между предикатами сравнения периодов времени и их определениями. Пусть Р1 есть временной интервал (P1Start, Р1End), а P2 - временной интервал (P2Start, Р2End). Темпоральный предикатОпределения1."Меньше чем"A(P1End = P2Start – 1) OR (P2End = P1Start – 1)2."Предшествует"B(P1Start <= P2Start) OR (P1End <= P2End)3."Встречаются"C(P1Start <= P2End) OR (P2Start <=P1End)4."Перекрывает"DP1Start < P2Start5."Содержится"EP1End < P2Start
- # Временной зависимостью будем называть …
- # Классом временной зависимости называется
- # На практике проектировщики темпоральных моделей данных используют следующие классы временной зависимости атрибутов:
- # Учет временных зависимостей проектировщик ХД выполняет посредством
- # Выделение классов зависимых от времени атрибутов используется проектировщиков ХД для …
- # Для группировки классов атрибутов зависимых от времени проектировщиками ХД используется