Курс вводного уровня по контролируемому обучению от двух профессоров статистики вот-вот начнет свою третью итерацию на платформе Stanford Online.
Как объясняют в этом видео Тревор Хасти и Роб Тибширани, основное внимание в курсе уделяется методам регрессии и классификации.
Курс рассчитан на девять недель с ориентировочной нагрузкой 5 часов в неделю и основан на книге, в которой они написаны в соавторстве, которая доступна в виде бесплатной копии в формате PDF для студентов.
Программа начинается с классических методов, таких как линейная и полиномиальная регрессия, логистическая регрессия и линейный дискриминантный анализ, а затем переходит к перекрестной проверке и методам бутстрапа, выбора модели и регуляризации (гребень и лассо).
Затем исследуются нелинейные модели, сплайны и обобщенные аддитивные модели; древовидные методы, случайные леса и бустинг; поддержка-вектор машины. Обсуждаются некоторые методы обучения без учителя, включая основные компоненты и кластеризацию (k-среднее и иерархическое).
Как и в книге, курс основан на использовании R, и существуют дополнительные ресурсы для освещения необходимого программирования на R, начиная с руководств по его введению и заканчивая более подробными сеансами, реализующими методы, описанные в каждой главе.
Курс был впервые представлен в январе 2014 года и был повторен в прошлом году, поэтому на Class Central доступны обзоры, которые представляют собой смешанный пакет с оценками от 1 до 5 звезд, где 4 являются средним значением. Критика сосредоточена на неадекватности вопросов с несколькими вариантами ответов и, в некоторых случаях, на пешеходном характере видеолекций. С другой стороны, книга, на которой основан курс, в целом признана очень хорошей.
Эта цитата взята из 4-звездочного обзора и суммирует большинство неоднократно высказанных замечаний:
онлайн-упражнения этого курса чрезвычайно малы, поэтому ваш балл в этом классе не является необходимым или достаточным для усвоения материала. Помогает, если вы думаете об этом курсе как о дополнительном материале к книге («Введение в статистическое обучение» Джеймса, Виттена, Хасти, Тибширани). В этом свете курс становится исключительной жемчужиной, потому что книга действительно невероятно хороша. Я рекомендую найти время, чтобы прочитать книгу от корки до корки, попробовав в ней многие из отличных упражнений. Затем, в качестве резюме или напоминания, пройдите этот онлайн-курс. Лекции выделяют наиболее важные части каждой главы, они красиво составлены и представлены. Вы обнаружите, что они являются прекрасным дополнением к книге, и многие концепции станут более ясными и конкретными в вашем уме. Однако, если вы попытаетесь пройти этот отдельный курс, вы будете разочарованы и, скорее всего, не многому научитесь и не запомните.
Поскольку это бесплатный MOOC, он дает вам бесплатный доступ к отличной книге, в которую, кажется, стоит погрузиться, если вас интересуют статистические методы и R.