Вы не можете не заметить всплеск интереса ко всему, что связано с машинным обучением. Теперь Google выпустил серию видеороликов, в которых представлены рецепты машинного обучения. И это добавляет к существующей куче ресурсов.
Историческая победа AlphaGo над чемпионом Кореи по го Ли Седолом имела последствия. Во-первых, во всем мире не хватает досок для игры в го из-за всплеска интереса к игре, которая признана самой сложной для игры. Во-вторых, мы все хотим заниматься машинным обучением, усиливая тенденцию, которая уже очевидна в течение нескольких лет.
Последний способ получить представление о том, что делает машинное обучение и как его можно использовать, принадлежит Джошу Гордону, который представляет серию коротких (7 минут) видеороликов, которые помогут вам начать работу с машинным обучением с использованием двух библиотек с открытым исходным кодом, scikit -learn и TensorFlow, исходный код которых Google открыл самостоятельно.
Пока доступны только две серии сериала. В первом Джош кратко описывает, что такое машинное обучение и почему оно важно. Описывая это как подраздел искусственного интеллекта, он заявляет:
«Это изучение алгоритмов, которые учатся на примерах и опыте, вместо того, чтобы полагаться на жестко запрограммированные правила».
В качестве простого примера, чтобы начать работу, он продолжает обсуждать проблему написания программы, которая могла бы различать яблоки и апельсины, а затем представляет рецепт контролируемого обучения с использованием дерева решений для создания классификатора из примеров, который кодируется просто шесть строк Python с помощью scikit-learn.
Scikit снова используется во второй лекции, где он проведет вас через построение и визуализацию дерева решений с использованием реального набора данных — классических данных Ириса Фишера:
Эти видео, большая часть которых будет размещена на YouTube, не предназначены для обучения алгоритмам машинного обучения — они о применении их по его рецептам. Однако в Интернете есть еще много других, если вы хотите узнать больше.
На платформе Udacity вы найдете еще одно предложение Google — бесплатный курс из 4 уроков, посвященный TensorFlow для глубокого обучения, от Винсента Ванхаука, главного научного сотрудника Google и технического руководителя группы Google Brain. Рекомендуется, чтобы вы уже имели некоторое представление о машинном обучении, прежде чем приступить к этому курсу, и для этого есть еще один бесплатный курс по Udacity — Введение в машинное обучение, предварительным условием для которого является немного Python и довольно много математики. В этом курсе, как и в видеороликах Google выше, используется scikit-learn.
Оба этих курса являются частью программы Udacity’s Machine Learning Engineer Nanodegree, о которой мы сообщали, когда о ней впервые было объявлено.
Nanodegrees от Udacity предназначены для достижения готовности к работе, что означает упор на понимание и использование необходимых инструментов. Этот момент отражен в обзоре 4/5 звезд Intro to Machine Learning, представленном на Course Talk его наиболее полезным рецензентом Грегом Хамелем — студентом, который отправил 114 отзывов о курсах, завершив 105 курсов, большинство из которых посвящены компьютерным наукам и смежным темам. . Он говорит:
Введение в машинное обучение — это доступный первый курс по машинному обучению, в котором приоритет отдается широте, высокоуровневому пониманию и практическим инструментам, а не глубине и теории. К тому времени, когда вы закончите, вы не станете экспертом ни в одной из тем, затронутых в этом курсе, но у вас будет хорошая основа, на которую можно опираться. Если вам интересно пройти аналогичный курс со многими интересными мини-проектами, использующими язык программирования R, попробуйте MIT Analytics Edge на edX. Машинное обучение Coursera с Эндрю Нг — это следующий логический шаг для более глубокого изучения разработки и реализации алгоритмов машинного обучения, а курс Caltech Learning from Data on edX — отличный курс, если вы интересуетесь теорией машинного обучения.
В своем обзоре Deep Learning он присуждает только 2 звезды, объясняя:
Глубокое обучение — это поверхностный курс, который сродни чтению CliffsNotes вместо учебника: вы выучите некоторую терминологию и познакомитесь с некоторыми интересными концепциями, но его сокращенное описание может запутать студентов, которые плохо знакомы с нейронными сетями, и оставить более опытных студентов. неудовлетворенный. Этот курс кажется поспешной попыткой извлечь выгоду из самого модного слова в самой популярной технологической индустрии, что является позором, потому что это мог бы быть хороший курс, если бы потребовалось время, чтобы охватить темы достаточно подробно. Я дал Deep Learning 2 звезды из 5: разочарование. * Если вы заинтересованы в более глубоком изучении тем этого курса, ознакомьтесь с видеолекциями и материалами курса CS231n, курса глубокого обучения, ориентированного на распознавание изображений, предлагаемого Стэнфордским университетом.
Стэнфордский курс, на который он ссылается, мы рассмотрели дважды — Dive Into A Convolutional Neural Network Class для его первой презентации в 2015 году и снова в январе для повторного запуска. Видео по-прежнему доступны на его странице расписания и учебной программы, и мы надеемся, что в следующем году он будет снова показан.
Последний обзор Грега Хаммела посвящен машинному обучению: регрессия, второму курсу специализации Coursera по машинному обучению. Присвоение ему полных 5 звезд из 5: Отлично, он заключает:
отличное введение в регрессию, которое охватывает несколько ключевых алгоритмов машинного обучения и помогает понять фундаментальные концепции машинного обучения, выходящие за рамки регрессии. Если у вас есть интерес к регрессии и у вас есть среда, в которой можно запускать GraphLab, пройдите этот курс.
Он почти так же положительно относится к начальному курсу специализации Coursera, о чем говорит:
предоставляет широкий обзор ключевых областей машинного обучения, включая регрессию, классификацию, кластеризацию, рекомендательные системы и глубокое обучение, используя короткие тематические исследования программирования в качестве примеров. Курс предполагает базовые навыки программирования на Python и использует программный пакет GraphLab, для которого требуется 64-разрядная операционная система с Python 2.7.
Необходимость запуска GraphLab, который не является открытым исходным кодом, вызвала некоторую критику со стороны студентов, но Грег считает, что
полезно знакомиться с новыми инструментами, и GraphLab кажется чище, чем популярный пакет Python scikit-learn.
Его вывод:
Недостаток лоска профессорам они восполняют с энтузиазмом. Для некоторых проблемы с совместимостью и настройкой будут препятствием, но их преодоление того стоит. Я даю «Основы машинного обучения: практический подход» 4,5 из 5 звезд: отлично.
Общий рейтинг студентов машинного обучения Эндрю Нг, который снова начался на этой неделе, составляет 4,9 из 5 на основе 15761 оценки. В настоящее время он занимает второе место в списке 50 самых популярных МООК всех времен, набрав 1122031 участников.
После перезапуска 18 апреля он теперь находится на новой, более интерактивной платформе Coursera, которая в будущем будет выдавать сертификаты не для отдельных курсов, а только для специализаций с несколькими курсами. Уведомление на странице машинного обучения гласит:
31 мая — последний день покупки сертификата, после которого курс будет предлагаться без сертификата. Если вы приобретете сертификат до 31 мая, вы можете закончить курс в любое время и получить сертификат.
Это классический MOOC, и наличие сертификата на него вполне может быть тем, что вы не захотите упустить. Члены команды I Programmer, которые прошли курс и получили сертификаты, когда были еще свободны, могут порекомендовать содержание курса как весьма удовлетворительное и отличный способ получить представление о практическом машинном обучении.