Главная /
Алгоритмы интеллектуальной обработки больших объемов данных /
В документе d слово "кластер" встречается с частотой TF("кластер",d)=0,0125. Мы имеем возможность программным образом изучить миллион документов, и выяснить, что указанное слово встречается только в 100 из них. Вычислите TF-IDF слова "кластер" в документе
В документе d слово "кластер" встречается с частотой TF("кластер",d)=0,0125. Мы имеем возможность программным образом изучить миллион документов, и выяснить, что указанное слово встречается только в 100 из них. Вычислите TF-IDF слова "кластер" в документе d с точностью до двух знаков после запятой:
вопросПравильный ответ:
0,05
Сложность вопроса
69
Сложность курса: Алгоритмы интеллектуальной обработки больших объемов данных
67
Оценить вопрос
Комментарии:
Аноним
Экзамен прошёл и ладушки. Спасибо vtone
09 авг 2018
Аноним
Спасибо за сайт
31 дек 2016
Другие ответы на вопросы из темы алгоритмы и дискретные структуры интуит.
- # Для преобразования многомерного пространства в пространство низшей размерности и формирования малого количества признаков из большого количества признаков следует использовать следующий алгоритм:
- # Дан единичный квадрат с координатами вершин (0;0), (0;1), (1;1), (1;0). При этом первая и третья вершины относятся к классу "-1", а вторая и четвертая – "1". Требуется построить классификатор, получающий на входе координату вершины, а на выходе дающий метку класса (задача XOR). Применим алгоритм градиентного бустинга (gradient boosting) с функцией потерь L(y,h)=(1/2)*(y-h)^2. Очевидно, h0(x)=const=0. Далее, выбираем в качестве a1 функцию, равную -1 левее разделяющей границы, проходящей через точки (1/2;0) и (0;1/2), и 1 в противном случае. Найдите b1 – вес функции a1 с точностью до одного знака после запятой.
- # Выберите верное утверждение
- # На картине ниже представлена схема: [Большая Картинка]
- # Укажите верное утверждение