Публикации по теме 'nlp'
Стоит ли смотреть этот фильм?
Эта статья представляет собой практическое введение в основы классификации текста с использованием линейных классификаторов и созданных вручную функций.
Это модели, которые мы будем запускать
Модель мешка слов TF-IDF N-граммы
Обработка текста
Проблема с моделированием текста состоит в том, что он беспорядочный, а алгоритмы машинного обучения предпочитают четко определенные входные и выходные данные фиксированной длины. Алгоритмы машинного обучения не могут работать напрямую с..
Использование преобразования Фурье векторных представлений, полученных из вложений BERT, для семантического…
Использование преобразования Фурье векторных представлений, полученных из вложений BERT, для оценки семантической близости
Изучение взаимного влияния слов в предложении путем оценки различных представлений вложений BERT.
Встраивание BERT — это то, что дает большие возможности, когда речь идет о программных способах извлечения смысла из текста. Кажется, все, что нам (а также машинам) нужно для понимания текста, скрыто в этих числах. Это просто вопрос правильного манипулирования этими..
Наивный байесовский
Текстовый классификатор
Что это ?
Наивный байесовский классификатор просто подсчитывает, сколько раз слово встречается в каждом классе.
Это самый простой алгоритм, который вы можете применить к своим данным. Как следует из названия, этот алгоритм делает предположение, что каждая функция независима (не коррелирована друг с другом) от других, чтобы предсказать класс данной выборки.
Почему мы это используем ?
Потому что доказано, что это не только просто, но и очень быстро, точно,..
Суммирование текста с помощью сетей генераторов указателей
В этом посте я хочу объяснить детали из «Перейти к сути: обобщение с помощью сетей генераторов указателей ». Это старая статья 2017 года, но в ней есть несколько очень интересных идей, которые привлекли мое внимание, и я хочу воспользоваться возможностью, чтобы объяснить их здесь.
Я предполагаю базовые знания простых нейронных сетей и концепций машинного обучения, но объясню всю необходимую информацию, необходимую для понимания этой конкретной статьи. Статья будет основываться на..
Обработка естественного языка (NLP) упрощена
Что такое НЛП?
Обработка естественного языка (NLP) — это область изучения искусственного интеллекта (ИИ) и информатики, которая направлена на то, чтобы позволить компьютерам понимать, интерпретировать и генерировать человеческий язык. НЛП использует комбинацию алгоритмов машинного обучения и лингвистических правил для анализа и обработки данных естественного языка. Целью НЛП является создание компьютерных систем, способных понимать человеческий язык в том виде, в каком он..
SpaCy supremaCy здесь, и вот почему вы не должны спать на нем.
Авторы: Аника Тахсин Сьеда , Бхавна Арья , Мохамед Анан Анаикар , Неха Борулкар
Этот блог создается и поддерживается студентами программы магистра наук в области профессиональных компьютерных наук в Университете Саймона Фрейзера в рамках их курса обучения. Чтобы узнать больше об этой уникальной программе, посетите { sfu.ca/computing/mpcs }.
Получение информации из текста имеет решающее значение в современном мире, управляемом данными. Поиск правильных инструментов для..
Освоение центральной предельной теоремы: полное руководство для специалистов по данным
Как специалисту по данным важно иметь четкое представление о статистических концепциях и принципах. Одной из таких концепций является Центральная предельная теорема, которая играет решающую роль в проверке гипотез, оценке параметров и многом другом.
Но для многих центральная предельная теорема может показаться запутанной и сложной темой. В этой статье мы углубимся в детали центральной предельной теоремы, объясним ее значение и приведем примеры, которые помогут вам лучше понять эту..