Главная /
Алгоритмы интеллектуальной обработки больших объемов данных /
При обработке текстов, укажите подходы для приведения токенов к единому виду, чтобы избавиться от поверхностной разницы в написании ?
При обработке текстов, укажите подходы для приведения токенов к единому виду, чтобы избавиться от поверхностной разницы в написании ?
вопросПравильный ответ:
сформулировать набор правил, по которым преобразуется токен
явно хранить связи между токенами
хранить связи меду токеном и образованным от него различные части речи
всегда преобразовывать токен к существительному
Сложность вопроса
81
Сложность курса: Алгоритмы интеллектуальной обработки больших объемов данных
67
Оценить вопрос
Комментарии:
Аноним
Экзамен сдан на пять. спс
08 ноя 2020
Аноним
Если бы не опубликованные подсказки - я бы не решил c этими тестами интуит.
13 фев 2019
Аноним
Я завалил сессию, какого чёрта я не углядел данный сайт с ответами интуит в начале сессии
16 ноя 2017
Другие ответы на вопросы из темы алгоритмы и дискретные структуры интуит.
- # Для чего используется логарифм правдоподобия Бернулли?
- # Укажите основные плюсы использования Naive Bayes
- # Даны четыре примера (наблюдения) в трехмерном пространстве признаков: A(1;4;10), B(2;5;6), C(1;3;8) и D(2;4;8). В результате применения метода главных компонент исходное пространство признаков свели к двумерному пространству признаков на плоскости. Найдите евклидово расстояние между примерами C и D в редуцированном пространстве с точностью до одного знака после запятой:
- # Если в сети автоэнкодера находится всего один скрытый слой, то чему будет эквивалентен результат?
- # Даны четыре примера (наблюдения) в трехмерном пространстве признаков: A(1;4;10), B(2;5;6), C(1;3;8) и D(2;4;8), при этом известно, что первый и третий примеры относятся к классу "1", а второй и четвертый – к классу "0". Для обучения на данных примерах применяется алгоритм случайный лес (random forest). Случайным образом были выбраны 5 наборов примеров и признаков: (1) пример 1 (признаки 1,2) + пример 2 (признаки 1,3); (2) пример 3 (признаки 2,3) + пример 4 (признак 1); (3) пример 2 (признаки 1,2,3) + пример 3 (признак 1); (4) пример 1 (признаки 1,3) + пример 2 (признак 1) + пример 3 (признак 3); (5) пример 1 (признаки 2,3) + пример 4 (признаки 2,3). Для этих пяти наборов были построены соответственно пять деревьев по алгоритму CART, нечистота (impurity) вычислялась по Джини. Принадлежность к классу определяется голосованием – числом деревьев, которые отнесли тот или иной пример к определенному классу. Сколько деревьев отнесут тестовый пример F(2;3;6) к классу "0"? (Напишите ответ в виде целого числа.)