Новая специализация по обработке естественного языка на Coursera


Первые два курса из четырех курсов специализации по обработке естественного языка от deeplearning.ai готовы и ждут на платформе Coursera. Это возможность поучиться у экспертов в этой востребованной области искусственного интеллекта.

Раскрытие информации: когда вы совершаете покупку, перейдя по ссылке на Coursera из этой статьи, мы можем получать партнерскую комиссию.

Обработка естественного языка (NLP) использует алгоритмы для понимания человеческого языка и управления им и является одной из наиболее широко применяемых областей машинного обучения. По мере того, как ИИ продолжает расширяться, будет расти спрос на профессионалов, умеющих создавать модели, которые анализируют речь и язык, выявляют контекстные закономерности и производят идеи на основе текста и звука.

Специализация по обработке естественного языка находится на среднем уровне и должна занять около 3 месяцев по 5 часов в неделю. Это очень практично, и, выполнив его, вы будете разрабатывать приложения НЛП, которые выполняют вопросы и ответы на вопросы, а также анализ настроений, создавать инструменты для перевода языков и обобщения текста и даже создавать чат-бота!

Он исходит от стартапа deeplearning.ai, основанного Эндрю Нг, соучредителем Coursera, который:

с миссией сделать образование мирового уровня доступным для людей по всему миру, чтобы все мы могли извлечь выгоду из будущего, основанного на искусственном интеллекте.

Это вторая специализация от deeplearning.ai. Первый посвящен глубокому обучению и состоит из пяти курсов, которые ведет Эндрю Нг, и мы сообщили об этом здесь. Это рекомендуемый путь для тех, кому необходимо освежить свои практические знания в области машинного обучения, прежде чем приступить к специализации НЛП.

Четыре курса, составляющие специализацию по обработке естественного языка:

Курсы были разработаны и преподаются двумя экспертами в области НЛП, машинного обучения и глубокого обучения. Юнес Бенсуда Мурри — инструктор искусственного интеллекта в Стэнфордском университете, который также помог создать специализацию по глубокому обучению, и Лукаш Кайзер, который до того, как присоединиться к deeplearning.ai, был штатным научным сотрудником в Google Brain и соавтором Tensorflow и Tensor2Tensor и Библиотеки Trax, которые также помогли создать специализацию по глубокому обучению, и Лукаш Кайзер, который, как научный сотрудник Google Brain, является соавтором Tensorflow и библиотек Tensor2Tensor и Trax.

На первом курсе «Обработка естественного языка с классификацией и векторными пространствами», который, по оценкам, потребует около 24 часов усилий, студенты будут:

Анализ настроений твитов с помощью логистической регрессии, а затем наивного Байеса

Используйте модели векторного пространства для обнаружения взаимосвязей между словами и используйте PCA для уменьшения размерности векторного пространства и визуализации этих взаимосвязей.

Напишите простой алгоритм перевода с английского на французский, используя предварительно вычисленные вложения слов и хеширование с учетом местоположения, чтобы связать слова с помощью приблизительного поиска k-ближайшего соседа

Затем на втором курсе, посвященном вероятностным моделям, также требующим около 24 часов усилий, они будут решать больше задач:

Создайте простой алгоритм автокоррекции, используя минимальное расстояние редактирования и динамическое программирование.

Применение алгоритма Витерби для тегирования части речи (POS), что важно для компьютерной лингвистики,

Напишите лучший алгоритм автозаполнения с использованием языковой модели N-грамм

Напишите свою собственную модель Word2Vec, которая использует нейронную сеть для вычисления вложений слов с использованием непрерывной модели набора слов.

Оставшиеся два курса, охватывающие модели последовательности и модели внимания в НЛП, будут продолжать формировать портфолио студентов.

По окончании данной проектной специализации студенты смогут:

Используйте логистическую регрессию, наивный байесовский метод и векторы слов для анализа настроений, полных аналогий и перевода слов

Использование динамического программирования, скрытых марковских моделей и встраивания слов для реализации автозамены, автозаполнения и определения тегов части речи для слов

Используйте повторяющиеся нейронные сети, LSTM, GRU и сиамскую сеть в TensorFlow и Trax для анализа настроений, генерации текста и распознавания именованных сущностей.

Используйте кодировщик-декодер, причинно-следственные связи и самовнимание для машинного перевода полных предложений, обобщения текста, создания чат-ботов и ответов на вопросы.

Coursera предлагает 7-дневную бесплатную пробную версию, после чего подписка стоит 49 долларов в месяц. Хотя вы можете проверять отдельные курсы бесплатно, это означает, что вы не можете получить доступ к оцененным упражнениям, которые являются такой большой и центральной его частью.


Добавить комментарий