Главная /
Data Mining
Data Mining - ответы на тесты Интуит
Курс знакомит слушателей с технологией Data Mining, подробно рассматриваются методы, инструментальные средства и применение Data Mining. Описание каждого метода сопровождается конкретным примером его использования.
Список вопросов:
- # Data Mining — это процесс обнаружения в сырых данных
- # Какая из перечисленных дисциплин более сосредоточена на теории проверки гипотез?
- # Подготовка данных в процессе Data Mining является:
- # Data Mining — это процесс обнаружения в сырых данных знаний, необходимых для:
- # В процессе работы Data Mining программы пользователь может получить такие результаты:
- # Назовите факторы, обусловившие возникновение и развитие Data Mining:
- # Если сравнивать Data Mining, машинное обучение и статистику, какая из дисциплин сконцентрирована на едином процессе анализа данных, включает очистку данных, обучение, интеграцию и визуализацию результатов:
- # Инструменты Data Mining:
- # Закономерности, найденные в процессе использования технологии Data Mining должны обладать такими свойствами:
- # В результате использования инструментов Data Mining пользователь может …
- # Оцените правильность утверждения:"Data Mining может заменить аналитика"
- # Какая из перечисленных ниже групп методов достаточно часто использует для выявления взаимосвязей в данных концепцию усреднения по выборке?
- # Выберите характеристику, наиболее подходящую для Data Mining
- # Оцените правильность утверждения: "Извлечение полезных сведений невозможно без хорошего понимания сути данных"
- # В методе опорных векторов для классификации используется …
- # Решаются ли задачи классификации и регрессии при помощи метода "ближайшего соседа"?
- # Все переменные являются одинаково важными и статистически независимыми, т.е. значение одной переменной ничего не говорит о значении другой. Это свойства:
- # Классификация методом опорных векторов считается хорошей, если область между границами …
- # Метод "ближайшего соседа":
- # На результат классификации в наивно-байесовском подходе влияют:
- # Если область между границами пуста, классификация ...
- # С помощью метода "ближайшего соседа" возможно решение задач:
- # Использование байесовских сетей имеет следующие преимущества:
- # Назовите метод, недостаток которого приведен ниже: "Существует сложность выбора меры "близости", от этой меры главным образом зависит объем множества записей, которые нужно хранить в памяти для достижения удовлетворительной классификации или прогноза"
- # Назовите свойства наивной байесовской классификации:
- # В основе метода опорных векторов лежит …
- # Метод, который делает заключения относительно данной ситуации по результатам поиска аналогий, хранящихся в базе прецедентов относится к категории …
- # Назовите метод, недостаток которого приведен ниже: "Перемножать условные вероятности корректно только тогда, когда все входные переменные действительно статистически независимы"
- # Группа синапсов нейрона – это …
- # В синхронных нейронных сетях в каждый момент времени свое состояние меняет...
- # Явление переобучения характеризуется …
- # Нейрон имеет аксон, который представляет собой …
- # В асинхронных сетях в каждый момент времени свое состояние меняет …
- # Многослойный персептрон – это сеть …
- # Слой нейронной сети – это …
- # Синхронные и асинхронные сети отличаются:
- # В многослойном персептроне …
- # Главная функция искусственного нейрона - ...
- # Заполните пропуски в формулировке: "… - выходная связь нейрона, с которой сигнал (возбуждения или торможения) поступает на… следующих нейронов"
- # Ошибкой обучения нейронной сети называется …
- # Заполните пропуски в формулировке: "В самой распространенной конфигурации входные сигналы обрабатываются …, затем выходной сигнал сумматора поступает в … , где преобразуется функцией активации, и результат подается на …"
- # Однонаправленные входные связи, соединенные с выходами других нейронов – это …
- # Целевая функция, требующая минимизации в процессе управляемого обучения нейронной сети – это …
- # Сети без обратных связей - это …
- # Сеть Кохонена представляет собой …
- # Правило формирования окрестности (несколько нейронов, которые окружают нейрон-победитель):
- # Сети с обратными связями – это…
- # Наиболее распространенное применение сетей Кохонена:
- # Самоорганизующиеся сети в процессе обучения подстраиваются …
- # Сети Кохонена относятся к классу:
- # Уникальность метода самоорганизующихся карт состоит в …
- # Обучение самоорганизующихся сетей заключается …
- # Наличие блоков динамической задержки и обратных связей - характерная особенность …
- # При … для каждого обучающего входного примера требуется знание правильного ответа или функции оценки качества ответа
- # Какое количество слоев имеет сеть Кохонена?
- # Закончите фразу: "В процессе обучения сетей Кохонена на входы подаются данные, сеть при этом подстраивается…"
- # Сети Кохонена относятся к классам:
- # При… раскрывается внутренняя структура данных или корреляции между образцами в наборе данных
- # Традиционно темно-синие участки на карте Кохонена соответствуют ...
- # Обучение сетей Кохонена заключается ….
- # Спорный объект кластеризации — это объект, который по мере сходства …
- # Работа кластерного анализа опирается на предположения:
- # Процедура, которая приводит значения всех преобразованных переменных к единому диапазону значений путем выражения через отношение этих значений к некой величине, отражающей определенные свойства, это – …
- # Работа кластерного анализа опирается на следующие предположения (выберите неверный ответ):
- # Иерархические агломеративные методы характеризуются …
- # Объект относится к кластеру, если …
- # Работа кластерного анализа опирается на предположения:
- # Иерархические дивизимные методы характеризуются …
- # Назовите характеристики кластерного анализа:
- # При применении кластерного анализа переменные …
- # Характеристикой каких групп методов являются последовательное объединение исходных элементов и соответствующее уменьшение числа кластеров?
- # Назовите характеристики кластерного анализа:
- # Кластерный анализ …
- # Деление одного кластера на меньшие кластеры, в результате чего образуется последовательность расщепляющих групп. Характеристика каких групп методов описана выше?
- # При использовании какого метода необходимо задавать количество кластеров?
- # К какой группе методов относится метод ближнего соседа?
- # Процесс последовательного укрупнения кластеров лежит в основе работы...
- # Основные меры расстояния между объектами при использовании иерархического метода КА:
- # Какой метод требует априорной информации о количестве кластеров?
- # К какой группе методов относится метод k-средних?
- # Пересчет кластерных центров и перераспределение объектов между кластерными центрами – это шаги...
- # Перед началом кластеризации все объекты считаются отдельными кластерами, которые в ходе алгоритма объединяются. Это характеристика...
- # Какой метод рекомендуется использовать при небольших объемах выборки?
- # К какой группе методов относится алгоритм PAM (partitioning around Medoids)?
- # Чувствительность к выбросам – это недостаток...
- # Дендрограмма – результат работы …
- # Назовите достоинства алгоритма кластеризации k-средних
- # Какие методы выявляют более высокую устойчивость по отношению к шумам и выбросам, некорректному выбору метрики, включению незначимых переменных в набор, участвующий в кластеризации?
- # Какие методы отказываются от определения числа кластеров, а строят полное дерево вложенных кластеров?
- # Назовите недостатки алгоритма быстрой кластеризации
- # Назовите сложности иерархических методов кластеризации:
- # Преимуществом какой группы методов кластеризации является их наглядность и возможность получить детальное представление о структуре данных
- # Набор называют часто встречающимся (frequent), если:
- # С помощью алгоритма Apriori определите часто встречающиеся наборы в базе данных D, состоящие из трех товаров с минимальной поддержкой, равной 2 База данных DTIDItems10a,c,d20b,c,e30a,b,c,e40b,e
- # Выберите задачу, которая не решается при помощи поиска ассоциативных правил:
- # Транзакция – это множество событий, которые произошли …
- # С помощью алгоритма Apriori определите часто встречающиеся наборы в базе данных D, состоящие из трех товаров с минимальной поддержкой, равной 2 База данных DTIDItems10l,m,p20a,d,l30a,d,l,m40a,d
- # Достоверность ассоциативного правила определяет…
- # Поддержка ассоциативного правила определяет…
- # С помощью алгоритма Apriori определите часто встречающиеся наборы в базе данных D, состоящие из трех товаров с минимальной поддержкой, равной 2 База данных DTIDItems10k,l,m20l,n,o30k,l,n,o40n,o
- # Выберите правильное утверждение:
- # Набор ассоциативных правил представляет интерес, если его поддержка …
- # Вероятность того, что из события A следует событие B. Это - …
- # Назовите алгоритмы, при помощи которых осуществляется поиск ассоциативных правил:
- # Каждый этап работы алгоритма Apriori состоит из таких шагов:
- # Количество транзакций, содержащих определенный набор данных. Это - …
- # Назовите алгоритм, который не осуществляет поиск ассоциативных правил:
- # Традиционные методы визуализации могут находить следующее применение:
- # Способы визуального представления могут …
- # Основные тенденции в области визуализации:
- # Традиционные методы визуализации могут находить следующее применение:
- # Способы визуального представления могут …
- # Основные тенденции в области визуализации:
- # Традиционные методы визуализации могут находить следующее применение:
- # Основные тенденции в области визуализации:
- # Нахождение шумов и выбросов в данных …
- # Визуализация в виде параллельных координат является представлением информации в …
- # Основными тенденциями в области визуализации являются:
- # Какие из перечисленных средств визуализации помогают интерпретировать полученный результат?
- # Компактное описание закономерностей, присущих исходному набору данных …
- # Визуализация в виде "лиц Чернова" является представлением информации в …
- # Назовите характеристики одной из основных тенденций в области визуализации:
- # Какие из перечисленных средств визуализации служат средством оценки качества построенной модели?
- # Существенными концепциями системы поддержки принятия решений являются:
- # Исходные данные при использовании MOLAP архитектуры хранятся:
- # Предметная ориентация хранилища данных означает, что …
- # Охарактеризуйте неструктурированные задачи
- # Исходные данные при использовании ROLAP архитектуры хранятся...
- # Интегрированность хранилища данных означает, что …
- # Охарактеризуйте слабоструктурированные задачи
- # Исходные данные при использовании HOLAP архитектуры хранятся:
- # Привязка ко времени хранилища данных означает, что …
- # СППР — система, предназначенная для поддержки принятия решений в … проблемах различных видов человеческой деятельности, существенная концепцией которой …
- # EIS (Execution Information System) или информационные системы руководства в большинстве ориентированы на …, основаны на …
- # MOLAP является:
- # Назовите основные концепции хранилища данных:
- # Назовите существенные характеристики СППР:
- # DSS (Desicion Support System) ориентированы на …, основаны на …
- # ROLAP является:
- # Как называется характеристика хранилища данных описанная ниже: "Данные объединены в категории и сохраняются соответственно областям, которые они описывают, а не применениям, их использующим"
- # Для какого вида набора данных важно определение наличия сезонной компоненты:
- # Выберите неверную формулировку
- # Наличие дубликатов в наборе данных может быть:
- # Если набор данных упорядочен и в нем присутствует сезонная или цикличная компонента, то каково минимальное количество данных, которое необходимо иметь для возможности анализа?
- # Выберите верную(-ые) формулировку(-и).
- # При наличии дубликатов в наборе данных следует использовать такой вариант их обработки:
- # Если набор данных не упорядочен, то количество данных, которое необходимо иметь для возможности анализа данных:
- # Все типы грязных данных в базе данных могут быть автоматически обнаружены и очищены
- # Ваши действия при обнаружении выбросов в наборе данных:
- # Какой из перечисленных этапов является первым в процессе Data Mining?
- # Если данные являются неупорядоченными, это означает …
- # Качество данных – это критерий, определяющий такие качества данных как:
- # Постановка задачи …
- # Репрезентативность выборки означает, что …
- # Существуют такие типы грязных данных:
- # Ошибки, которые возникают в процессе использования инструментов очистки (являющиеся двумя крайностями очистки данных) — это:
- # Качественная программа очистки данных должна:
- # Специальные средства очистки служат:
- # Ошибка Типа 1 возникает в случае, когда …
- # Качественная программа очистки данных должна:
- # Инструменты ETL предназначены:
- # Ошибка Типа 2 возникает в случае, когда …
- # Качественная программа очистки данных должна иметь такие характеристики:
- # Когда речь идет о создании банков данных всего предприятия и, соответственно, о сплошной очистке данных, имеет смысл пользоваться следующими средствами очистки данных:
- # Оцените правильность формулировки: "Инструменты Data Mining служат средством очистки данных"
- # Инструменты очистки данных обычно выполняют такие функции:
- # Автоматизированный процесс очистки данных … к ошибкам в данных, которых раннее в них не было
- # Согласно классификации средств очистки данных инструменты Data Mining относятся к классу …
- # Согласно классификации ошибок в данных, которые возникают в результате использования средств очистки, выделяют такие их классы:
- # Данные представляют собой:
- # Объектом не является:
- # Номинальная шкала – это шкала,
- # Данные могут быть получены в результате:
- # Порядковая шкала – это шкала, содержащая
- # Данные — это …
- # Строка таблицы также известна как:
- # Интервальная шкала – это шкала,
- # Объект описывается как …
- # Такие данные как температура воздуха относятся к …
- # Для какой шкалы применимы только такие операции как равно и не равно?
- # Атрибут – это:
- # К какой категории данных относится вес измеряемых объектов:
- # Для какой шкалы применимы только такие операции как равно, не равно, больше, меньше?
- # Построение моделей Data Mining осуществляется с целью:
- # Простота модели в сравнении с исследуемым объектом является …
- # Прогнозирующие модели Data Mining …
- # Характеристиками модели являются …
- # Преимуществом модели является возможность выделить в объекте …
- # Классификационные модели Data Mining …
- # Использование моделей Data Mining позволяет:
- # Модель обладает свойством неполноты.
- # Дескриптивные модели …
- # Создание каких моделей Data Mining означает поиск правил, которые объясняют зависимость выходных параметров от входных?
- # Экзогенные переменные — это переменные, которые …
- # Назовите причины, из-за которых следует переобучать или обучать модель заново:
- # Какие модели используются для классификации объектов, при условии, что набор целевых классов неизвестен?
- # Эндогенные переменные — это переменные, которые …
- # Если модель с успехом используется определенное время, это означает, что …
- # Data Mining это … , который должен быть интегрирован в бизнес.
- # На каком этапе пересекается работа специалиста предметной области и специалиста по добыче данных?
- # Специалист по анализу данных, который имеет, как минимум, основы статистических знаний и способен применять технологии Data Mining, а также интерпретировать полученные результаты - это...
- # Data Mining по стандарту CRISP-DM включает следующие фазы:
- # Data Mining — это не только инструмент, но также процесс, который...
- # На каком(-их) этапе(-ах) пересекается работа администратора баз данных и специалиста по добыче данных
- # Специалист, имеющий знания о окружении бизнеса, процессах, заказчиках, клиентах, потребителях, а также конкурентах - это...
- # Стандарт PMML относится к группе:
- # Data Mining — это не только инструмент, но также …
- # На каком этапе пересекается работа специалиста предметной области и администратора баз данных?
- # Специалист, имеющий знания о том, где и каким образом хранятся данные, как получить к ним доступ, и как связать между собой эти данные - это...
- # Стандарт CWM (Common Warehouse Metamodel) относится к группе:
- # Анализ предметной области и интерпретация результатов, полученных в результате Data Mining - это точки соприкосновения таких специалистов как:
- # Шаги какой из методологий Data Mining здесь описаны: осмысление бизнеса; осмысление данных; подготовка данных; моделирование; оценка результатов; внедрение?
- # Какой стандарт обеспечивает возможности обмена моделями данных между программным обеспечением разных разработчиков?
- # Анализ требований к данным и сбор данных- это точки соприкосновения таких специалистов как:
- # Шаги какой из методологий Data Mining здесь описаны: отбор данных, исследование отношений в данных, модификация данных, моделирование взаимозависимостей, оценка полученных моделей и результатов?
- # Какой стандарт обеспечивает поддержку наиболее распространенных прогнозных моделей, созданных при помощи алгоритмов и методов анализа данных?
- # Существуют следующие варианты решений по внедрению инструментов Data Mining:
- # На рынке инструментов Data Mining в последние годы наблюдается:
- # Цены на инструменты Data Mining уровня предприятия находятся в диапазоне:
- # Существуют следующие варианты решений по внедрению инструментов Data Mining:
- # На рынке инструментов Business Intelligence в последние годы наблюдается:
- # Цены на инструменты Data Mining уровня отдела находятся в диапазоне:
- # Существуют следующие варианты решений по внедрению инструментов Data Mining:
- # На рынке инструментов Business Intelligence в последние годы наблюдается:
- # Могут ли отличаться цены на инструменты Data Mining для различных категорий пользователей?
- # Для использования технологии Data Mining …
- # Инструмент SPSS относится к категории:
- # Рынок Business Intelligence, в том числе рынок инструментов Data Mining, ...
- # Инструменты Data Mining могут решать …
- # Инструмент Weka относится к категории:
- # Охарактеризуйте рынок программного обеспечения Data Mining:
- # Пакет SAS Enterprise Miner особенно удобен для осуществления анализа данных в …
- # Позволяет ли пакет Enterprise Miner производить последовательное сравнение моделей?
- # Итогом работ по интеллектуальному анализу данных в SAS Enterprise Miner является …
- # Разработка проектов Data Mining в SAS Enterprise Miner может выполняться:
- # Пакет SAS Enterprise Miner обеспечивает сравнение результатов различных методов моделирования:
- # Скоринг в SAS – это …
- # Процессы в Enterprise Miner могут работать …
- # Репозитарий моделей в SAS Enterprise Miner представляет собой …
- # Выбор лучшей модели в пакете SAS Enterprise Miner:
- # SAS Enterprise Miner относится к категории:
- # Пакет SAS Enterprise Miner …
- # Подход SAS к созданию информационно-аналитических систем предусматривает:
- # Программный продукт SAS Enterprise Miner создан специально для выявления закономерностей в …
- # Назовите характеристики, присущие SAS Enterprise Miner:
- # Подход SAS к созданию информационно-аналитических систем предусматривает:
- # Архитектура системы PolyAnalyst …
- # Алгоритмы анализа системы PolyAnalyst данных можно объединить в такие группы по их функциональному назначению:
- # Выберите характеристики математических модулей версии PolyAnalyst 4.6
- # Единицей Data Mining исследования в PolyAnalyst является…
- # Алгоритмы анализа системы PolyAnalyst данных можно объединить в такие группы по их функциональному назначению:
- # Выберите характеристики математических модулей версии PolyAnalyst 4.6:
- # Проект в PolyAnalyst объединяет в себе:
- # Алгоритмы анализа системы PolyAnalyst данных можно объединить в следующие группы по их функциональному назначению:
- # Выберите характеристики математических модулей версии PolyAnalyst 4.6:
- # Решение каких задач предусматривают алгоритмы анализа данных в PolyAnalyst?
- # Какие из перечисленных модулей PolyAnalyst предназначены для построения числовых моделей и прогноза числовых переменных?
- # Возможно ли решение задач поиска ассоциативных правил в PolyAnalyst?
- # Какие из перечисленных характеристик имеет пользовательский интерфейс PolyAnalyst?
- # Какие из перечисленных алгоритмов PolyAnalyst предназначены для решения задач классификации?
- # Опишите возможности текстового анализа в PolyAnalyst
- # В основу программного продукта Cognos 4Thought положена технология …
- # Инструмент фирмы Cognos, используемый для построения запросов любой сложности и отчетов произвольного формата пользователями, от которых не требуется навыков программирования:
- # МАР-сплайны в системе STATISTICA – это …
- # Cognos 4Thought предназначен для …
- # Интеллектуальное инструментальное средство поиска (разведки) данных (Data Mining), которое позволяет руководителям выявлять скрытые тенденции и модели бизнеса и "извлекать на поверхность" его ранее неизвестные закономерности и корреляционные связи:
- # Рабочее пространство STATISTICA Data Miner не включает такого элемента:
- # Системы Impromptu, PowerPlay, Scenario и 4Thought являются…
- # Инструментальное средство для оперативного анализа данных и формирования отчетов по OLAP-технологии:
- # Охарактеризуйте систему STATISTICA:
- # Назовите характеристики программного продукта Cognos 4Thought:
- # Система Cognos PowerPlay – это инструментальное средство, предназначенное для:
- # На каких этапах 4Thought поддерживает анализ данных?
- # Охарактеризуйте систему Cognos Scenario:
- # Oracle Data Mining является …
- # Deductor Studio …
- # Основные группы алгоритмов пакета Deductor:
- # Модуль Oracle Data Mining доступен из таких редакций:
- # Архитектура хранилища типа "звезда" в Deductor называется …
- # Основные группы алгоритмов пакета Deductor:
- # Oracle Data Mining поставляется как …
- # Последовательность действий, которые необходимо провести для анализа данных, называется в Deductor…
- # Основные группы алгоритмов пакета Deductor:
- # Охарактеризуйте особенности работы алгоритмов, реализованных в Oracle Data Mining:
- # Какие компоненты входят в состав Deductor?
- # Опишите возможности пакета Deductor по заполнениию пропусков
- # Oracle Data Mining является ... - куда входят ...
- # При анализе данных в Deductor Studio возможны такие действия:
- # Какие из представленных алгоритмов реализованы в пакете Deductor?
- # Постановка задачи, построение оптимальной модели, понимание модели, применение результатов. Перечисленные выше этапы являются этапами:
- # Подготовка данных в KXEN включает следующие этапы :
- # Какой компонент KXEN используется в случаях, когда "сырые" данные содержат одновременно статическую информацию (например, возраст, пол или профессия индивида) и динамические переменные (например, шаблоны покупок или транзакции по кредитной карте)?
- # Укажите, какие из перечисленных этапов являются этапами подхода KXEN к анализу данных:
- # Существует ли необходимость временного или постоянного копирования данных для анализа в системе KXEN?
- # Какой компонент позволяет автоматически подготовить данные и трансформировать их в формат, подходящий для использования аналитическими приложениями KXEN?
- # Выберите пропущенный этап аналитического процесса KXEN: Постановка задачи…Понимание моделиПрименение результатов
- # Реинжиниринг аналитического процесса KXEN …
- # Какой компонент KXEN позволяет выявить естественные группы (кластеры) в наборе данных?
- # Какие задачи позволяет решать инструмент KXEN?
- # В чем заключается основная особенность инструмента KXEN?
- # Охарактеризуйте квалификацию, которой требуется обладать пользователю для работы с KXEN
- # На решение каких трудностей направлен усовершенствованный аналитический процесс KXEN?
- # Построение модели в KXEN можно охарактеризовать как …
- # Что требуется от пользователя при работе с KXEN?
- # Data Mining-услуги могут предоставляться …
- # Преимуществами использования готового программного обеспечения являются:
- # Постановка бизнес-задачи – это этап, который …
- # Data Mining консультирование может включать следующие услуги:
- # Слабыми сторонами использования готового программного обеспечения могут быть:
- # На этапе первичного исследования данных …
- # Data Mining консультирование может включать следующие услуги:
- # Преимущества использования адаптированного программного обеспечения Data Mining по сравнению с готовыми программными продуктами и их самостоятельным использованием является:
- # На этапе подготовки данных…
- # Вариант использования адаптированного программного обеспечения Data Mining …
- # Какое решение в большей мере требует наличия высококвалифицированных специалистов при внедрении и использования инструмента Data Mining?
- # Гибкость инструмента Data Mining означает …
- # Готовые алгоритмы, полная конфиденциальность информации, техническая поддержка производителя, общение с другими пользователями пакета - это преимущества использования …
- # Достаточно высокая стоимость, невозможность добавлять свои функции, сложность подготовки данных, практическое отсутствие в интерфейсе терминов предметной области – это слабые стороны …
- # Какую часть мирового рынка Data Mining занимают услуги или консультации по эффективному внедрению этой технологии для решения актуальных бизнес-задач?
- # Какие из перечисленных ниже пунктов являются названиями стадий Data Mining?
- # Стадия свободного поиска представлена действиями:
- # На какие две группы подразделяются методы Data Mining по принципу работы с исходными обучающими данными?
- # Какой из перечисленных ниже пунктов не является названием стадии Data Mining?
- # Прогностическое моделирование включает такие действия:
- # Нейронные сети относятся к группам ...
- # На стадии свободного поиска осуществляется ...
- # Частью какой из перечисленных стадий является валидация закономерностей?
- # Деревья решений относятся к группе (-ам) …
- # Большинство аналитических методов, используемые в технологии Data mining – это …
- # Какая из перечисленных ниже стадий может считаться дополнительной или частью одной из основных стадий Data mining:
- # Регрессионный и дискриминантный анализ …
- # Большинство методов Data mining были разработаны в рамках …
- # Какая из перечисленных ниже стадий может считаться дополнительной или частью одной из основных стадий Data mining:
- # Нечеткая логика и деревья решений …
- # В ходе решения какой из перечисленных задач устанавливаются закономерности между связанными событиями в наборе данных?
- # К классу описательных задач Data Mining относятся такие задачи:
- # Любые, неизвестные ранее сведения о каком-либо событии, сущности, процессе и т.п., являющиеся объектом некоторых операций, для которых существует содержательная интерпретация, являются...
- # В ходе решения каких из перечисленных задач устанавливаются закономерности между событиями, связанными во времени?
- # К классу прогнозирующих задач Data Mining относятся такие задачи:
- # Формирование какой из перечисленных категорий происходит в процессе сбора и передачи данных, т.е. их обработки?
- # Правильна ли такая формулировка: "Ассоциация является частным случаем последовательности с временным лагом, равным нулю"?
- # Продолжите фразу: "Кластеризация и классификация относятся к...
- # Совокупность фактов, закономерностей и эвристических правил, с помощью которых решается поставленная задача, – это ...
- # Согласно классификации по стратегиям, задачи Data Mining подразделяются на:
- # Заполните пропуск в формулировке: "Формирование … происходит в процессе сбора и передачи, т.е. обработки данных"
- # У основания так называемой информационной пирамиды находится категория …
- # Задачи Data Mining, в зависимости от используемых моделей подразделяются на:
- # В результате использования одних и тех же данных и различных методов…
- # Информация, данные и знания являются:
- # Классификация — это ...
- # Задачу классификации нельзя решить с помощью...
- # Множество примеров, используемое для конструирования модели, называется...
- # Задачей классификации можно назвать предсказание...
- # Задачи классификации решаются следующими алгоритмами:
- # Процесс классификации состоит из следующих этапов:
- # Основная характеристика задачи бинарной классификации:
- # Задачи классификации решаются следующими алгоритмами:
- # Множество примеров, используемое для проверки работы сконструированной модели, называется...
- # Заполните пропуск в формулировке: "Для проведения ... должны присутствовать признаки, характеризующие группу, к которой принадлежит то или иное событие или объект"
- # Классификация относится к стратегии:
- # Кластер можно охарактеризовать как …
- # Метод деревьев решений применяется для решения задач …
- # Задачей классификации часто является предсказание …
- # Классификация относится к:
- # Изначальная предопределенность классов является характеристикой задачи …
- # Иерархические алгоритмы применяются для решения задач …
- # Какой из параметров является основной единицей времени, на которую делается прогноз?
- # В чем сходство задач классификации и прогнозирования?
- # Возможности визуализации включают:
- # Какой из параметров является числом периодов в будущем, которые покрывает прогноз?
- # Продолжите фразу: "Прогнозирование будет иметь смысл, если горизонт прогнозирования …
- # Продолжите фразу:"Визуализация …
- # Какой из параметров является частотой, с которой делается новый прогноз?
- # Решение задачи прогнозирования ...
- # Преимуществом визуализации является:
- # В чем состоит основное сходство задач прогнозирования и классификации?
- # Временной ряд — последовательность наблюдаемых значений какого-либо признака,…
- # Параметрами прогнозирования являются:
- # Характеристики визуализации:
- # В чем состоит основное отличие задач прогнозирования и классификации?
- # Отличием анализа временных рядов от анализа случайных выборок является:
- # Период прогнозирования – это …
- # Оцените правильность утверждения: "Визуализация направлена исключительно на совершенствование техники анализа"
- # Выделите два основных направления Web Mining:
- # При использовании какого из перечисленных ниже направлений выделяют подход, основанный на агентах, и подход, основанных на базах данных:
- # Какие задачи возникают перед разработчиками при построении системы Web Mining:
- # Какое из перечисленных ниже направлений подразумевает автоматический поиск и извлечение качественной информации разнообразных источников Интернета, перегруженных "информационным шумом":
- # Какие из перечисленных ниже систем используются в подходе, основанном на агентах:
- # Выделите категории задач Web Mining:
- # Какое из перечисленных ниже направлений подразумевает обнаружение закономерностей в действиях пользователя web-узла или их группы?
- # Какие из перечисленных ниже систем используются в подходе, основанном на базах данных:
- # Какая из технологий анализирует массивы неструктурированной информации и одним из ее методов является поиск подстроки в строке?
- # Область использования Data Mining …
- # Технология Web mining применяет технологию Data Mining для анализа:
- # Web content mining подразумевает …
- # Выделяют такие основные сферы применения технологии Data Mining:
- # Согласно таксономии Web Mining выделяют основные направления:
- # Web Usage Mining подразумевает …
- # Характеристики измерения центральной тенденции:
- # Медианой для выборки 1,2,3,7,10,__,16 является:
- # Выберите соответствующую характеристику данному варианту связи: большие значения из одного набора данных связаны с большими значениями другого набора (положительная корреляция), и это…
- # Характеристики вариации данных:
- # Медианой для выборки 1,__,3,7,10,15,16,18 является:
- # Выберите соответствующую характеристику данному варианту связи: малые значения одного набора связаны с большими значениями другого (отрицательная корреляция), и это…
- # Какая из перечисленных характеристик не является числом, описывающим определенным способом все значения признака набора данных?
- # Медианой для выборки 1,2,3,__,__,15,16,18 является:
- # Выберите соответствующую характеристику данному варианту связи: данные двух диапазонов никак не связаны (нулевая корреляция), и это…
- # Размах и дисперсия являются:
- # Заполните пропуск в формулировке: "Корреляционный анализ применяется для … оценки взаимосвязи двух наборов данных, представленных в безразмерном виде"
- # Основные особенности регрессионного анализа заключаются в том, что при его помощи можно получить конкретные сведения о том:
- # Среднее и медиана являются:
- # Заполните пропуск в формулировке: "Коэффициент корреляции Пирсона, который является безразмерным индексом в интервале … включительно, отражает степень … зависимости между двумя множествами данных"
- # Основные задачи регрессионного анализа включают:
- # Если зависимая переменная принимает дискретные значения, при помощи метода дерева решений решается задача:
- # Внутренний узел дерева решений называют также …
- # Алгоритм конструирования дерева решений …
- # Если зависимая переменная принимает непрерывные значения, то дерево решений решает задачу:
- # Конечный узел дерева решений называют также ...
- # Алгоритмы конструирования деревьев решений ...
- # При помощи метода деревьев решений могут решаться задачи:
- # Лист дерева решений является …
- # Какие модели строят деревья решений?
- # При помощи метода деревьев решений решаются задачи …
- # Заполните пропуски в формулировке: "Каждая ветвь дерева, идущая от внутреннего узла, отмечена … , который может относиться лишь к одному … данного узла"
- # Процесс создания дерева …
- # Заполните пропуски в формулировке: "Если зависимая переменная принимает … значения, при помощи метода дерева решений … "
- # Внутренние узлы дерева решений называют …
- # Процесс отсечения ветвей или замена некоторых ветвей поддеревом …