Скрытые преимущества машинного обучения в Интернете


Трое недавних победителей конкурсов Kaggle прошли курс Coursera по машинному обучению, и это кажется более чем совпадением.

Соучредитель Coursera Эндрю Нг, который ведет этот курс, который он основал в Стэнфордском университете, так не считает. Он сказал Деррику Харрису из GigaOm:

«Машинное обучение выросло до такой степени, что если вы пройдете один курс, вы действительно сможете довольно хорошо его применить».

и учитывая, что машинное обучение стало столь востребованным навыком, этот курс может значительно повысить чью-то зарплату и перспективы трудоустройства в компаниях, где таких знаний все еще не хватает, добавив:

«Бьюсь об заклад, многие студенты добиваются великих успехов из-за этих курсов».

По словам Нг, единственной реальной предпосылкой для прохождения его курса является базовое понимание программирования, хотя знакомство с алгеброй и вероятностью «полезно». Мои собственные беседы со студентами по поводу текущей презентации курса показывают, что вам нужен прочный фундамент как математики, в частности, матричной алгебры и исчисления, так и программирования.

Среда программирования, используемая классом, — Octave, интерпретируемый язык с открытым исходным кодом, который скорее прагматичен, чем теоретически чист. Он поддерживает матричные операции, имеет хорошие средства построения графиков для визуализации данных и множество встроенных математических функций. С другой стороны, у него неуклюжий интерфейс командной строки. Однако, если вы сможете разобраться с Octave, у вас будет реальное преимущество для многих типов задач, требующих прогнозного анализа, с которыми вы столкнетесь в соревнованиях Kaggle.

В своем 10-недельном курсе Нг применяет инженерный подход к машинному обучению, который концентрируется на статистических моделях. Если вы ищете альтернативу, на Coursera также есть нейронные сети для машинного обучения, класс, который ведет профессор Университета Торонто Джеффри Хинтон, который является ведущим сторонником в этой области с точки зрения когнитивной науки. Его восьминедельный курс направлен на обучение студентов искусственным нейронным сетям и тому, как они используются для машинного обучения, применительно к распознаванию речи и объектов, сегментации изображений, языку моделирования и движению человека. Предпосылками для этого являются знание программирования на Matlab, Octave или Python, а также знание математического анализа, линейной алгебры и теории вероятностей.

В каталог Coursera добавлен третий курс машинного обучения, 10-недельный курс от Педро Домингоса из Университета Вашингтона. В этом случае акцент делается на контролируемом обучении и будет охватывать деревья решений, правила, экземпляры, байесовские методы, нейронные сети, ансамбли моделей и вспомогательные векторные машины. Он имеет аналогичные предпосылки — базовые знания программирования с некоторым предыдущим знакомством с вероятностью, статистикой, линейной алгеброй, исчислением и / или логикой полезны, но не важны.

Часто задаваемые вопросы по этому курсу предполагают, что «Машинное обучение — это научный метод на стероидах». и это, вероятно, хорошее описание. Он также обладает всеми преимуществами относительно молодой дисциплины, которая получила свое признание только тогда, когда компьютеры стали достаточно мощными, чтобы избавить от рутинной работы по обработке огромных объемов данных. Если вы пропустили эту тему до сих пор, у вас еще есть время, чтобы наверстать упущенное.


Добавить комментарий