Главная /
Интеллектуальный анализ данных средствами MS SQL Server 2008
Интеллектуальный анализ данных средствами MS SQL Server 2008 - ответы на тесты Интуит
Курс посвящен использованию технологии интеллектуального анализа данных (Data Mining) и ее реализации в Microsoft SQL Server 2008 и связанных программных продуктах.
Список вопросов:
- # Выберите корректное утверждение относительно упрощенного алгоритма Байеса:
- # Выберите наиболее корректное продолжение фразы: "При использовании алгоритма Microsoft Naive Bayes числовые входные параметры…"
- # Среди представленных в списке алгоритмов интеллектуального анализа выберите наиболее быстрый (требующий наименьшего количества вычислений):
- # Выходной числовой параметр алгоритма Microsoft Decision Trees, может быть …:
- # Деревья решений позволяют решать задачи (отметьте все подходящие варианты):
- # Явление, заключающееся в том, что модель отлично классифицирует данные из обучающего набора, но имеет невысокую точность прогнозирования для новых данных, принято называть:
- # Выберите наиболее точное утверждение относительно алгоритма Microsoft Linear Regression в SQL Server 2008 (2008 R2):
- # В алгоритмах регрессии "регрессором" называется:
- # При анализе временных рядов, как правило, предполагается, что предсказываемый атрибут:
- # В приведенном списке отметьте два основных формата представления временных рядов, применяемых в ходе интеллектуального анализа данных:
- # Выберите наиболее корректное продолжение фразы "Реализация алгоритма ARIMA добавлена в алгоритм Microsoft Time Series, чтобы улучшить…":
- # В Microsoft SQL Server 2008 учет перекрестного влияния временных рядов производится алгоритмом Microsoft Time Series в случае использования (отметьте все подходящие варианты):
- # В SQL Server 2008 алгоритм Microsoft Clustering содержит реализацию двух алгоритмов кластеризации:
- # Алгоритм "к-средних" (c-means) относится к алгоритмам …
- # По умолчанию алгоритм Microsoft Clustering использует:
- # Термин "жесткая кластеризация" означает что:
- # При использовании масштабируемого алгоритма максимизации ожидания на больших объемах данных, в SQL Server 2008 по умолчанию сначала анализируется:
- # В алгоритме Apriori и основанном на нем алгоритме Microsoft Association Rules для измерения популярности набора элементов используется показатель поддержка (англ support) Поддержка набора элементов {A,B} это:
- # В алгоритме Apriori и основанном на нем алгоритме Microsoft Association Rules, чтобы оценить взаимную зависимость двух элементов используется показатель importance (важность) Importance({A,B})=1 означает что (выберите наиболее точный ответ):
- # Корректно завершите утверждение: "Microsoft Sequence Clustering является гибридным алгоритмом, сочетающим методы кластеризации с…":
- # Корректно завершите утверждение относительно алгоритмов, входящих в стандартную поставку SQL Server 2008: "Алгоритм логистической регрессии, по сути, является …":
- # Нейронная сеть, формируемая алгоритмом Microsoft Neural Network, может включать:
- # В качестве функции активации в алгоритме Microsoft Neural Network скрытые нейроны используют:
- # В качестве функции активации в алгоритме Microsoft Neural Network выходные нейроны используют:
- # В приведенном списке отметьте все типы данных, поддерживаемых языком DMX
- # В приведенном списке отметьте типы содержимого (Внимание! Не перепутайте с типами данных!), поддерживаемые языком DMX:
- # Выберите корректное продолжение фразы "Значения в ключе вложенной таблицы должны быть …"
- # Тип содержимого key sequence может применяться только:
- # Тип содержимого key time может применяться только:
- # Выберите корректное продолжение фразы: "В SQL Server 2008 (2008 R2) типы содержимого Time и Sequence поддерживаются …"
- # Для создания временной структуры интеллектуального анализа данных в операторе CREATE MINING STRUCTURE надо использовать ключевое слово:
- # Указать, что в структуре интеллектуального анализа необходимо резервировать данные для проверочного набора, можно с помощью ключевых слов:
- # Если надо гарантировать возможность повторного создания такого же разбиения исходных данных на обучающий и проверочный набор (при условии, что исходные данные остались прежними), при создании структуры…
- # Флаг моделирования REGRESSOR указывается:
- # Создать новую модель интеллектуального анализа данных в существующей структуре можно с помощью оператора:
- # Оператор CREATE MINING MODEL позволяет:
- # В языке DMX указывать используемый алгоритм интеллектуального анализа надо (выберите наиболее точный ответ):
- # Если при создании модели интеллектуального анализа для столбца установлен флаг PREDICT, это означает:
- # Ключевые слова WITH DRILLTHROUGH указанные при создании модели означают, что:
- # Если столбец исходных данных, помещаемых в модель или структуру оператором INSERT INTO, не должен использоваться для заполнения структуры или модели (те пропускается), это указывается с помощью:
- # Пусть необходимо с помощью оператора INSERT INTO обработать структуру, включающую вложенные таблицы В приведенном списке выберите инструкцию, которую нужно использовать для формирования набора данных, помещаемого в структуру:
- # Если необходимо удалить модель или структуру из базы данных аналитических служб, надо использовать оператор языка DMX:
- # В результате выполнения оператора DELETE FROM MINING STRUCTURE <имя структуры>CASES
- # Сохранить модель или структуру интеллектуального анализа в файл резервной копии служб Analysis Services можно с помощью инструкции:
- # В языке DMX, если необходимо преобразовать возвращаемый запросом результат в "плоский" набор строк (к табличному виду), оператор SELECT дополняют инструкцией:
- # Чтобы оператор DMX SELECT вернул не весь набор записей, а только первые 5, надо использовать формат:
- # Функция DMX, возвращающая истину, если вариант принадлежит обучающему набору данных, это:
- # Пусть мы хотим, чтобы при прогнозирующем соединении автоматически сопоставлялись имена столбцов "исходного" запроса (исходных данных) с совпадающими по именам столбцами модели (те предложение ON можно было бы опустить) Для этого надо использовать инструкцию DMX (выберите наиболее точный вариант):
- # В приведенном списке отметьте все характерные особенности алгоритма Microsoft Naive Bayes:
- # Чтобы на SQL Server 2008 (2008 R2) создать модель интеллектуального анализа, использующую стандартную реализацию упрощенного алгоритма Байеса, в коде на DMX в качестве названия алгоритма надо указать:
- # Выберите наиболее точное утверждение относительно алгоритма Microsoft Naive Bayes:
- # Параметр MAXIMUM_STATES указывает максимальное количество состояний атрибута, поддерживаемое алгоритмом Если количество состояний больше, то алгоритм использует наиболее частые состояния атрибутов и считает остальные состояния отсутствующими Значение по умолчанию для этого параметра алгоритма Microsoft Naive Bayes:
- # Выберите правильное продолжение утверждения относительно алгоритма Microsoft Decision Trees: "Если прогнозируемый атрибут дискретен, а входные данные непрерывны, вход непрерывных столбцов автоматически …":
- # Выберите правильное продолжение утверждения: "Параметр FORCE_REGRESSOR, требующий от алгоритма обязательно использовать указанные столбцы в качестве регрессоров …"
- # Укажите параметр алгоритма Microsoft Decision Trees, который определяет метод, используемый для разбиения узлов (использовать бинарное разбиение или полное):
- # В приведенном списке отметьте характерные особенности алгоритма Microsoft Linear Regression:
- # Для алгоритма Microsoft Time Series параметром MISSING_VALUE_SUBSTITUTION определяется:
- # Параметр PERIODICITY_HINT алгоритма Microsoft Time Series позволяет:
- # Для алгоритма Microsoft Time Series значением по умолчанию параметра FORECAST_METHOD является:
- # Для алгоритма Microsoft Time Series параметр PREDICTION_SMOOTHING указывает:
- # В приведенном списке отметьте характерные особенности алгоритма Microsoft Clustering:
- # У алгоритма Microsoft Clustering есть параметр MINIMUM_SUPPORT Он указывает:
- # У алгоритма Microsoft Clustering есть параметр, содержащий признак завершения построения модели - оценку максимального числа вариантов, которые могут изменить свое членство в кластерах Этот параметр называется:
- # У многих встроенных в SQL Server 2008 алгоритмов интеллектуального анализа есть параметр MAXIMUM_INPUT_ATTRIBUTES (максимальное количество входных атрибутов, которые алгоритм может обработать перед вызовом процедуры выбора характеристик) со значением по умолчанию:
- # Выберите правильное утверждение относительно алгоритма Microsoft Association Rules:
- # В алгоритме Microsoft Association Rules минимальное количество элементов, допустимых в наборе, можно указать, используя параметр:
- # В запросах к модели, основанной на алгоритме Microsoft Sequence Clustering, в которых требуется получить наиболее вероятное продолжение последовательности, надо использовать функцию:
- # У алгоритма Microsoft Sequence Clustering есть параметр CLUSTER_COUNT, указывающий примерное количество кластеров, создаваемых алгоритмом Его значение по умолчанию:
- # Выберите корректное продолжение утверждения: "Модель, использующая алгоритм Microsoft Neural Network, должна содержать, по крайней мере, …"
- # В модели, использующей алгоритм Microsoft Neural Network, вложенная таблица…
- # В алгоритме Microsoft Neural Network соотношение числа скрытых, входных и выходных нейронов указывается с помощью параметра:
- # Для алгоритма Microsoft Logistic Regression параметр HIDDEN_NODE_RATIO
- # Определение методами интеллектуального анализа значения непрерывного числового параметра на основании значений независимых переменных производится при решении задачи:
- # В приведенном списке отметьте задачи интеллектуального анализа данных, относящиеся к классу "обучение с учителем":
- # В приведенном списке отметьте задачи интеллектуального анализа данных, относящиеся к классу "обучение без учителя":
- # В приведенном списке отметьте службы Microsoft SQL Server 2008 (2008 R2), которые содержат реализацию встроенных алгоритмов Data Mining (выберите один вариант):
- # Внешние приложения могут взаимодействовать со службами Analysis Services, используя протокол:
- # Используемый SQL Server 2008 (2008 R2) язык запросов интеллектуального анализа данных называется:
- # Создаваемый при проведении интеллектуального анализа средствами Microsoft SQL Server объект, представляющий собой сочетание данных, алгоритма интеллектуального анализа, набора параметров и фильтров, называется:
- # В приведенном списке выберите корректное утверждение относительно структур и моделей интеллектуального анализа
- # Выберите корректное продолжение фразы: "В структуре интеллектуального анализа данных можно …"
- # В приведенном ниже списке отметьте алгоритмы интеллектуального анализа данных, включаемые в поставку Microsoft SQL Server 2008 (2008 R2):
- # Укажите число стандартных алгоритмов интеллектуального анализа данных, включаемых в поставку SQL Server 2008 (2008 R2):
- # В приведенном ниже списке выберите алгоритм интеллектуального анализа данных, результаты работы которого при одинаковых настройках и исходных данных могут отличаться в зависимости от используемой редакции SQL Server
- # Среди перечисленных алгоритмов, поддерживаемых Microsoft SQL Server 2008, отметьте те, с помощью которых можно решить задачу нахождения групп общих элементов в транзакциях (например, товаров, часто встречающихся в "одном чеке" в магазине):
- # Среди перечисленных алгоритмов, поддерживаемых Microsoft SQL Server 2008, отметьте те, с помощью которых можно решить задачу классификации (прогнозирования дискретного атрибута):
- # Задача нахождения групп схожих элементов может быть решена с помощью алгоритма:
- # Отметьте версии Microsoft SQL Server 2008 (2008 R2), в которых поддерживается проведение перекрестной проверки:
- # Отметьте версии Microsoft SQL Server 2008 (2008 R2), в поставку которых включены стандартные алгоритмы интеллектуального анализа данных:
- # В приведенном списке инструментальных средств, входящих в поставку SQL Server 2008 (2008 R2), выберите основное средство разработки решений в области интеллектуального анализа данных:
- # Процедуру "очистки" исходных данных рекомендуется производить:
- # Ниже перечислены рекомендуемые этапы проведения интеллектуального анализа данных Расставьте их в правильной последовательности. Ответ укажите в виде последовательности чисел, например 654321 изучение данныхподготовка данныхпостановка задачиразвертывание и обновление моделейпостроение моделейисследование и проверка моделей
- # Выберите наиболее корректное продолжение фразы "При проведении интеллектуального анализа данных на этапе изучения данных …"
- # Выберите наиболее точное продолжение фразы: "Перекрёстная проверка может использоваться для оценки точности модели …"
- # Среди перечисленных средств оценки точности, выберите те, что плохо применимы в случае решения описательных задач интеллектуального анализа:
- # Автоматизировать обновление развернутых в производственной среде моделей интеллектуального анализа данных можно, используя службы: