Главная /
Введение в аналитику больших массивов данных
Введение в аналитику больших массивов данных - ответы на тесты Интуит
Курс представляет возможность познакомиться с основными понятиями в области аналитической обработки больших данных. В нем изложены основы машинного обучения, визуализации и хранения больших данных. По результатам изучения курса читатель сможет переводить проблемы предметной области на язык технологий обработки больших данных.
Список вопросов:
- # На основе какого языка был создан R?
- # Какие из перечисленных языков оказали влияние на R?
- # R является:
- # Присваивание в языке R можно осуществить с помощью оператора:
- # Присваивание в R нельзя осуществить с помощью оператора:
- # Какие из вариантов присвоения не вызовут ошибки:
- # Как сделать вектор из трех чисел?
- # Чему равняется length(c(7,7,7))
- # В каких из следующих случаях исполнение выдаст ошибку?
- # Для каких аргументов функция is.finite вернет true?
- # Для каких аргументов функция is.finite вернет false?
- # Какой результат будет у функции is.finite(Inf-Inf)?
- # Что вернет следующее выражение sum(1:3>2)?
- # Каким образом можно сформировать вектор (FALSE, FALSE, TRUE)?
- # Что вернет следующее выражение sum(1:3>1)?
- # p.x=1.y=2 Что выведет print(p)?
- # Как правильно присвоить p значение типа данных, имеющих две координаты x=1 и y=2?
- # Является ли ошибкой использование такой записи: x.x=1?
- # Какая типизация в языке R?
- # Выберите неверные утверждения:
- # Какая типизация в языке R?
- # Операция с диапазонами x=1:3 y=4:6 Чему будет равно x+y?
- # Операция с диапазонами x=1:3 y=4:6 Чему будет равно x+y? (Введите цифры через пробел)
- # Каким образом можно описать вектор (1,2,3,4,5,6)?
- # Есть таблица со столбцами x, id, y, price. Какая формула описывает зависимость price от x,y?
- # Есть таблица со столбцами x, id, y, price. Что означает запись ?
- # Есть таблица со столбцами x, id, y, price. Выразите зависимость price от x,y?
- # Приведите округленный результат прогнозирования пустого значения в таблице с помощью функции ТЕНДЕНЦИЯ: Год1234Тыс. руб67120160
- # Каким будет округленный результат прогнозирования пустого значения в таблице с помощью функции ТЕНДЕНЦИЯ: Год1234Тыс. руб67120160
- # Приведите округленный результат прогнозирования пустого значения в таблице с помощью функции РОСТ: Год1234Тыс. руб67120160
- # Какое значение запишет функция Flash (Мгновенное заполнение) Excel в пропущенной ячейке: 1234233212134534134
- # Какое значение запишет функция Flash (Мгновенное заполнение) Excel в пропущенной ячейке: [Большая Картинка]
- # Какое значение запишет функция Flash (Мгновенное заполнение) Excel в пропущенной ячейке [Большая Картинка]
- # Существуют ли встроенные ограничения в Excel 2013 на количество элементов данных в одном ряду данных для плоских диаграмм?
- # Каково ограничение в Excel 2013 на количество строк при загрузке csv-файла? (Если считаете, что размер ограничен только объемом доступной оперативной памяти напишите 0).
- # Каково ограничение в Excel 2013 на количество строк при загрузке csv-файла?
- # Отметьте верное представление типа данных "очень плохо"-"плохо"-"средне"-"хорошо-"очень хорошо" в файле типа ARFF:
- # Какие из перечисленных признаков таблицы могут быть классификационными без предварительной обработки? [Большая Картинка]
- # Какие из перечисленных признаков таблицы представлены в абсолютной шкале? [Большая Картинка]
- # Основной целью процесса на приведенной диаграмме является [Большая Картинка]
- # Можно ли с помощью приведённой схемы произвести оценку качества работы алгоритма J48 на загруженных данных? [Большая Картинка]
- # Что выведет в приведённой схеме TextViewer? [Большая Картинка]
- # Продукты аналогичные Knime, RapidMiner хорошо подойдут для
- # В каком случае применение Tableau наиболее оправдано
- # Какой из языков наиболее богат библиотеками/фреймворками для интерактивной визуализации данных
- # Какая из приведённых функций реализует алгоритм классификации
- # Какая из функций реализует алгоритм кластеризации
- # Алгоритм какого типа реализует функция randomForest()?
- # Основное преимущество Python перед R – это
- # Назовите преимущества R, как инструмента data mining, перед другими языками
- # базовая библиотека для data science на Python
- # Имеет ли Python аналог Data Frame из R
- # Есть список на Python s = [1, 2, 3, 4, 6], что вернет выражение s[2:-2]
- # Есть список на Python s = [1, 2, 3, 4, 6], что вернет выражение s[2:-2]
- # Что будет присвоено переменной res (Python) в следующем выражении res = [x for x in xrange(1,5, 2)]
- # Необходимо провести предварительный анализ данных для их лучшего понимания, выберите наиболее подходящие инструменты
- # Необходимо реализовать решение по анализу данных и передать его стороннему заказчику в эксплуатацию, выберите наиболее подходящие инструменты
- # Необходимо реализовать интерактивную визуализацию данных, которая будет доступна широкому кругу людей, выберите наиболее подходящие инструменты
- # Какая из следующих СУБД подходит для организации высоко-доступного и консистентного хранилища?
- # Какие характеристики объединяют следующие СУБД: Greenplum и BigTable?
- # Какие типы СУБД поддерживают одновременно высокую-доступность, консистентность и распределённость?
- # Какая из следующих СУБД подходит для организации высоко-доступного и распределённого хранилища?
- # Какие характеристики объединяют следующие СУБД: Cassandra и CouchDB?
- # Какое максимальное количество свойств БД допускает CAP-теорема?
- # Какая из NoSQL СУБД подходит для организации консистентного и распределённого хранилища?
- # Почему Hbase не подходит для большинства веб-приложений с высокой посещаемостью?
- # Какие характеристики объединяют СУБД Hbase и BigTable
- # Какая из следующих СУБД обладает свойством расширяемости записей?
- # В чём состоит свойство расширяемости записей СУБД?
- # В каких из перечисленных случаях требуется СУБД со свойством расширяемости записей?
- # Какой тип NoSQL решения наиболее эффективен для потоковой обработки логов кластера серверов и быстрого сохранения без требования оперативной аналитики?
- # В каких из приведённых примеров наиболее эффективны NoSQL решения типа ключ-значение?
- # Какая из следующих СУБД не относится к типу документо-ориентированных?
- # Отметьте СУБД, обладающие встроенной поддержкой MapReduce
- # Отметьте СУБД, не обладающие встроенной поддержкой MapReduce
- # Отметьте ту характеристику, которая объединяют СУБД Redis и CouchDB
- # Чего не могут стандартные реляционные базы (MySQL, Oracle, MS SQL)?
- # Назовите отличия RDBMS от NoSQL:
- # Отметьте причины создания NoSQL баз данных:
- # Какие задачи решают графовые БД?
- # В социальной сети пользователи пишут друг другу сообщения, какие данные логично хранить в графовой СУБД?
- # Перечислите основные свойства графовых БД
- # большинство данных в мире в 2011 году содержалось:
- # В каком веке произошёл перевес объёмов накопленных человечеством данных в сторону цифровых?
- # Объём накопленных человечеством цифровых данных на 2012 год измеряется:
- # Сколько Петабайт в Зеттабайте? Укажите число.
- # укажите фактор, способствовавший появлению тренда больших данных
- # Какие вероятные разочарования тренда больших данных?
- # Отметьте значимые события, повлиявшие на формирование тренда больших данных:
- # Выберите верный ответ
- # Выберите неверный ответ:
- # Отметьте те из вариантов, в которых данные структурированы:
- # Перечислите четыре основных характеристики Big Data:
- # Выберите неверное высказывание:
- # Отметьте неверное понимание Variety в контексте характеристик Big Data:
- # Принцип MapReduce состоит в том, чтобы
- # Выберите одно неверное высказывание про MapReduce:
- # Во сколько раз теоретически вырастет производительность при подсчёте числа слов в тексте при работе MapReduce при переходе от одного узла к двум? (Введите число.)
- # Какие из следующих технологий СУБД не используют принцип MapReduce
- # Какие СУБД полностью полагаются на оперативную память при хранении информации:
- # В чём преимущество колоночно-ориентированных СУБД?
- # Для чего аналитику необходима "песочница"?
- # Какие из следующих средств разумно использовать для анализа данных, представленных единственным csv-файлом размера более 100Гб:
- # Выберите верное утверждение:
- # Ниже приведена последовательность этапов проекта аналитики в соответствии с CRISP-DM, укажите первый этап.
- # На каком из этапов процесса CRISP-DM происходит проверка гипотез?
- # Вы являетесь владельцем и аналитиком в компании из 10 человек, в которой требуется проанализировать продажи за 1 год (1 млн. продаж). Какие из этапов CRISP-DM можно опустить:
- # Пример благоразумного использования Hadoop
- # Начиная с каких размеров данных обоснованно применение кластера Hadoop для хранения данных?
- # Hadoop – это:
- # Клиент покупает билет на самолет через интернет. В момент покупки, он хочет знать насколько может упасть стоимость этого билета в ближайшем будущем и когда. К какому типу относится эта задача анализа данных?
- # Клиент покупает билет на самолет через интернет. Как бы в данном случае формулировалась задача прогнозирования?
- # Клиент покупает билет на самолет через интернет. В момент покупки стоит задача определить вероятность дополнительных покупок (отель, страховка, туристический тур) и предложить наиболее вероятные пользователю. К какому типу относиятся эта задача анализа данных?
- # Инвестиционный фонд интересуется тем, почему часть финансируемых им проектов успешно переходят на второй год, а часть - нет. К какому типу относится эта задача анализа данных?
- # Инвестиционный фонд имеет ряд проектов, который успешно переходят на второй год финансирования и тех, кто не переходит. Как бы в данном случае формулировалась задача поиска информативных признаков?
- # Инвестиционный фонд имеет ряд проектов, который успешно переходят на второй год финансирования и тех, кто не переходит. Фонд поставил задачу определить критерий успешности проекта. К какому типу задач анализа данных наиболее близка эта задача?
- # Коммерческая клиника желает установить структуру своих клиентов с точки зрения вклада в доход клиники. К какому типу относится эта задача анализа данных?
- # Коммерческая клиника обладает некоторыми данными о клиентах и о доходах от них. Как бы в данном случае формулировалась задача кластеризации?
- # Коммерческая клиника обладает некоторыми данными о клиентах и о доходах от них. Руководителем поставлена задача определить, к какой группе "инноватор"-"последователь"-"консерватор" относится данный клиент. К каким из типов задач анализа данных близка эта задача?
- # Компания, проводящая социологические опросы, испытывает сложности с верификацией данных, поступающих от волонтеров непосредственно опрашивающих респондентов: многие анкеты заполнены не полностью; волонтеры фальсифицируют результаты опроса, самостоятельно заполняя часть анкет. К какому типу наиболее близка эта задача анализа данных?
- # Компания, проводящая социологические опросы получает анкеты от волонтеров, непосредственно опрашивающих респондентов. При каких условиях разумна постановка задачи цензурирования?
- # Компания, проводящая социологические опросы, испытывает сложности с верификацией данных, поступающих от волонтеров непосредственно опрашивающих респондентов: многие анкеты заполнены не полностью; волонтеры фальсифицируют результаты опроса, самостоятельно заполняя часть анкет. К какому типу задач анализа данных здесь прибегать не придётся?
- # С некоторой периодичностью персонал предприятия списывает группы расходных материалов на различных участках учета. Для выявления ошибок, акты списания выборочно проверяются аудитором. Руководство компании заинтересовано в сокращении количества проверок, при сохранении точности выявления ошибочного списания на уровне 97%. Требуется выявлять сомнительные акты списания, подлежащие обязательной проверке аудитором. К какому типу относится эта задача анализа данных?
- # С некоторой периодичностью персонал предприятия списывает группы расходных материалов на различных участках учета. Для выявления ошибок, акты списания выборочно проверяются аудитором. Как бы в данном случае формулировалась задача классификации?
- # С некоторой периодичностью персонал предприятия списывает группы расходных материалов на различных участках учета. Для выявления ошибок, акты списания выборочно проверяются аудитором. Определены три категории: "ошибочные", "под сомнением", "безошибочные". К какому типу задач анализа данных относится задача о построении правила автоматического отнесения списаний к этим категориям.
- # Кардиологический центр исследовал возможность прогнозирования возникновения осложнений во время операционного вмешательства по до-операционным данным о пациенте: результатам физиологического и диагностического обследований. К какому типу задача анализа данных относится задача прогнозирования операционных осложнений?
- # В кардиологическом центре проводятся операции. До и во время операционного вмешательства с пациента снимаются определённые показания. Известны случаи осложнений во время проведения операций, эти случаи описаны тем же набором данных. Как бы в данном случае формулировалась задача классификации?
- # В кардиологическом центре проводятся операции. До и во время операционного вмешательства с пациента снимаются определённые показания. Известны случаи осложнений во время проведения операций, эти случаи описаны тем же набором данных. Ранее были определены три группы риска среди пациентов. Все предыдущие случаи осложнений отнесены к определённым группам риска. Стоит задача определить группу риска для нового пациента, прошедшего дооперационные обследования. К какому типу относится эта задача анализа данных?
- # К какому типу шкал относится шкала "очень плохо"-"плохо"-"средне"-"хорошо-"очень хорошо"?
- # Какие из следующих шкал в точности являются порядковыми?