Инструменты обработки естественного языка в Python
Изучите более 15+ инструментов, включая TextBlob, NLTK, Spacy, Flair, для выполнения проектов NLP
Автор: Джесси Э. Фармерс
Субтитры: Русский, Английский [Авто]
Язык: Английский
Чему вы научитесь
- Понять концепции обработки естественного языка и их реализацию в коде
- Изучите инструменты для извлечения данных из текстовых файлов, PDF, API и т. Д.
- Очистка и предварительная обработка текста для проектов НЛП
- Стилометрия в Python
- Анализ настроений с помощью TextBlob, Vader, Flair, машинного обучения и др.
- Извлечение ключевых слов с помощью Yake, Rake, Textrank и Spacy
- Создавайте приложения NLP, например редактирование документов, классификацию текста, анализ тональности, стилометрию, указание автора и т. Д.
- Изучите различные инструменты, используемые в сквозном проекте НЛП
- NLP с Spacy, Flair, TextBlob, NLTK и т. Д.
Вы знаете, что в мире существует более 7000 человеческих языков? Возможно ли вообще дать машинам и компьютерам возможность понимать и обрабатывать эти человеческие языки? В этом курсе мы будем изучать концепцию и инструменты для обработки человеческого (естественного) языка в Python.
Следовательно, если вас интересуют проекты обработки естественного языка и вам интересно, как работает анализ тональности, классификация текста, резюмирование и несколько задач НЛП? Тогда этот курс для вас.
Обработка естественного языка - захватывающая область науки о данных, но есть много вещей, которым нужно научиться, чтобы не отставать. Новые концепции и инструменты появляются каждый день. Так как же ты успеваешь?
В этом курсе « Потрясающие инструменты обработки естественного языка в Python» мы познакомим вас с более чем 15+ инструментами, которые вам необходимо знать при выполнении проекта НЛП в формате рабочего процесса.
Инструменты и технологии постоянно меняются, но рабочие процессы и системы остаются на долгое время, поэтому мы сосредоточимся на рабочем процессе и инструментах, необходимых для каждого из них. Курс подходит к обработке естественного языка с точки зрения использования рабочего процесса или простого жизненного цикла проекта НЛП.
По окончании этого увлекательного курса вы сможете:
- Получение текстовых данных из большинства документов (docx, txt, pdf, csv), веб-сайтов и т. Д.
- Очистите и предварительно обработайте неструктурированные текстовые данные с помощью нескольких инструментов, таких как NeatText, Ftfy, Regex и т. Д.
- Понять, как работает токенизация и почему токенизация важна в NLP
- Выполните стилометрию в Python для идентификации и проверки авторов
- НЛП с помощью Spacy, TextBlob, Flair и NLTK
- Узнайте, как выполнять классификацию текста с помощью машинного обучения, трансформаторов, TextBlob, Flair и т. Д.
- Создайте отличные приложения для НЛП с помощью Streamlit
- Выполните анализ настроений с нуля и с помощью нескольких пакетов НЛП
- Создание функций из текстовых данных - Word2Vec, FastText, Tfidf
- И многое другое
Советы по прохождению курса
- Пожалуйста, пишите или кодируйте вместе с нами, не просто смотрите, это улучшит ваше понимание.
- Вы можете регулировать скорость и звук видео по своему усмотрению, предпочтительно на -0,75x, если скорость для вас слишком высока.
- Предлагаемые предварительные условия - понимание Python.
- Этот курс НЕ является « Теоретическим введением в НЛП» или «Продвинутыми концепциями в НЛП», хотя мы изо всех сил стараемся охватить некоторые концепции для новичков и профессионалов. Скорее, речь идет об инструментах, используемых для рабочего процесса проекта НЛП.
Материалы курса
• Общая продолжительность 23 ч 36 мин
- Предпросмотр05:26
- Что такое обработка естественного языка (NLP)
04:10 - Предпросмотр03:18
- Самые популярные библиотеки и пакеты НЛП
01:59 - Предпросмотр02:52
- Проблемы обработки естественного языка
03:33 - Двусмысленность текста и языка
03:38 - Анатомия текста
03:26 - Ремесленные инструменты, монтажные и учебные материалы
06:13
- Получение текстовых данных - Введение
00:35
- Предпросмотр13:34
- Получение текстовых данных - использование запросов и Beautiful Soup для веб-сканирования
22:17
- Получение текстовых данных - поиск статей в Интернете с помощью NewsPaper3k
13:27
- Получение текстовых данных - Работа с Википедией
13:27
- Получение текстовых данных - Получение нескольких статей
07:06
- Получение текстовых данных - чтение текста из PDF
03:37
- Получение текстовых данных - чтение текста из PDF - с использованием pyPDF2
05:07
- Получение текстовых данных - чтение текста из PDF - использование PDFplumber
03:44
- Получение текстовых данных - чтение текста из текстового файла
01:55
- Получение текстовых данных - Введение
- Предпросмотр03:00
- Очистка текста с помощью NeatText - ускоренный курс
43:00 - Очистка текста с помощью чистого Python с использованием строк
27:41 - Очистка текста и предварительная обработка строк - задача
06:42 - Очистка текста и предварительная обработка с Texthero
31:52 - Токенизация - что такое токенизация
04:59 - Токенизация - почему токенизация важна в НЛП?
04:51 - Токенизация - как осуществляется токенизация и типы токенизации
02:07 - Токенизация - Использование чистого Python и NLTK
21:24 - Токенизация - Использование Spacy против NLTK
10:11 - Токенизация - токенизация твитов с помощью случайного токенизатора
06:28 - Токенизация - Токенизация предложения
07:47 - Токенизация в Tensorflow
23:34 - Стебли - возникновение с нуля
10:09 - Стемминг - Использование специальной логики
04:55 - Стемминг - Использование NLTK
06:14
- Предпросмотр04:46
- Анализ текста - подготовка данных (проект атрибуции автора)
14:50
- Анализ текста - подготовка данных (данные небиблейских авторов)
07:04
- Анализ текста - количество слов и частота слов
13:46
- Анализ текста - график частоты встречаемости слов
06:28
- Анализ текста - график частоты встречаемости слов - часть 2
02:28
- Анализ текста - лексическая сложность текста
01:51
- Анализ текста - лексическая насыщенность и удобочитаемость
18:29
- Стилометры в Python - Введение
00:51
- Стилометрия - распределение длины слов и кривая Мендал-Холла
15:40
- Стилометрия - подзаголовок для сравнения двух авторов (идентификация автора)
09:07
- Стилометрия в Python - проверка автора
03:25
- Построение элементов из текста - Введение
04:15 - Как слова представлены в НЛП
02:16 - Построение элементов из текста - мешок слов
08:01 - Создание функций из текста - одна горячая кодировка
15:42 - Построение функций из текста - Word Count / CountVectorizer
12:27 - Создание элементов из текста - ускоренный курс "Инструменты для проектирования элементов"
01:23:26 - Вложения слов - Gensim Word2Vec (Skipgram / CBOW) и FastText,
40:54
- НЛП с TextBlob - Введение и обзор API
01:50
- НЛП с TextBlob - Токенизация Word
07:37
- НЛП с TextBlob - пользовательский токенизатор
02:00
- НЛП с TextBlob - Части речевых тегов
06:37
- НЛП с TextBlob - анализ настроений и чистый Python для анализа настроений
22:55
- НЛП с TextBlob - Введение и обзор API
- Предпросмотр04:09
- НЛП с чутьем - введение и токенизация с помощью чутья
16:45 - НЛП с чутьем - маркировка последовательностей, текстовая аннотация
12:08 - НЛП с чутьем - часть речевых тегов
09:50 - НЛП с чутьем - признание именованных сущностей
09:18 - НЛП с чутьем - Использование нескольких тегеров
03:54 - НЛП с чутьем - обнаружение семантических кадров для устранения смысловой неоднозначности
06:36 - НЛП с чутьем - анализ настроений с чутьем
06:59 - НЛП с чутьем - классификация текстов с чутьем
42:11
- Что такое тематическое моделирование?
04:42
- Тематическое моделирование в НЛП - Обзор Gensim
02:12
- Тематическое моделирование в НЛП - рабочий процесс и основные термины
03:21
- Тематическое моделирование в НЛП - Введение и токенизация с помощью Gensim
09:12
- Тематическое моделирование в НЛП - Gensim: создание словаря
10:34
- Тематическое моделирование в НЛП - Gensim: создание пакета слов
16:18
- Тематическое моделирование в НЛП - Gensim: использование модели TFIDF
08:36
- Тематическое моделирование в НЛП - Gensim: использование модели LDA для определения тем
09:38
- Что такое тематическое моделирование?
- Что такое суммирование текста?
03:55 - Оценка качества текстового резюме
04:42 - Библиотеки для обобщения текста
02:25 - Предпросмотр13:27
- Обобщение текста - абстрактное обобщение с помощью преобразователей
13:49 - Оценка абстрактного и экстрактивного обобщения текста с помощью Rouge
28:23
- Визуализация текста - 5+ методов визуализации текста
01:23:27
- Визуализация текста - 5+ методов визуализации текста
- Введение в классификацию текста
04:19 - Классификация текста с машинным обучением с использованием Scikit-Learn
01:20:14 - Классификация текста с несколькими метками и несколькими классами
06:20 - Классификация текста с несколькими метками с использованием Scikit-Multi-Learn
38:25 - Классификация текста с помощью простых преобразователей - Подготовка данных
20:30 - Классификация текста с помощью простых преобразователей
21:13 - Классификация текста с помощью TextBlob
16:18
- Проект 01 - Анализ настроений
50:24
- Проект 02 - приложение NLP для извлечения ключевых слов - демонстрация
05:07
- Проект 02 - Приложение NLP для извлечения ключевых слов
01:18:50
- Проект 03 - Приложение Text Visualizer NLP - Демо
04:38
- Проект 03 - приложение NLP для визуализации текста с Streamlit - построение структуры
28:19
- Проект 03 - Приложение Text Visualizer NLP с Streamlit - Добавление функций
39:16
- Предпросмотр01:37
- Проект 04 - Приложение НЛП для анализа текста с Streamlit
53:42
- Проект 01 - Анализ настроений
Для кого этот курс:
- Начинающие разработчики Python, интересующиеся обработкой естественного языка
- Специалист по данным и разработчики
- Судебная лингвистика
- Всем, кто интересуется НЛП и анализом текста
https://www.udemy.com/course/awesome-natural-language-processing-tools-in-python/