Представляем Kaggle Learn


Kaggle уже хорошо известен своими соревнованиями по науке о данных, а теперь он добавил на свой сайт учебные ресурсы с вводным машинным обучением, программированием на R, визуализацией данных и глубоким обучением в качестве первых четырех треков.

С момента своего создания в 2010 году в качестве платформы для соревнований по прогнозному моделированию и аналитике, Kaggle собрал активное сообщество зарегистрированных пользователей, включая членов команды Google DeepMind и тех, кто работает над IBM Watson.

Как мы сообщали в то время, Kaggle присоединился к Google Cloud в 2017 году, что повысило его популярность. В июне 2017 года Kaggle объявила, что число членов увеличилось до 1 миллиона, и в настоящее время его Совет по вакансиям, который работает с 2012 года, утверждает, что компании, создающие списки вакансий, получат доступ к почти 1,5 миллионам специалистов по данным.

Kaggle Learn, платформа для практического обучения науке о данных, является последним шагом в ее развитии, и, анонсируя ее, Энтони Голдблум, основатель и генеральный директор Kaggle, объяснил:

Многие пользователи приходят в Kaggle, чтобы начать свою карьеру в области Data Science и улучшить свое обучение. Чтобы лучше поддерживать этот сегмент нашего сообщества, мы запустили платформу практических курсов машинного обучения по адресу https://www.kaggle.com/learn. Мы надеемся, что это будет самый быстрый путь для пользователей, чтобы начать создавать высокоточные модели машинного обучения и получить навыки, необходимые для получения своей первой работы в области науки о данных.

В настоящее время платформа имеет четыре направления: машинное обучение, R, визуализация данных и глубокое обучение.

Учебники бесплатные и подчеркивают практические навыки работы с данными, а не абстрактную теорию. Учащиеся работают в среде «записной книжки» Kaggle. Помимо курса R, это основы Python, и вы должны быть знакомы с основами Python — переменными, списками, словарями, функциями и циклами — прежде чем начать.

В ответах на часто задаваемые вопросы объясняется выбор Python и R для этих руководств:

Python — самый популярный язык для науки о данных, а R — второй по популярности язык. Поэтому мы рекомендуем их, в первую очередь предпочитая Python.

Курс «Машинное обучение», цель которого — быстро научить учащихся изучать «самую актуальную область науки о данных», был разработан специалистом по данным Kaggle Дэном Бекером. Он имеет два уровня с 8 шагами на первом, который завершается отправкой созданной вами модели на конкурс Kaggle, и еще 7 шагов на следующем уровне 2. —

Курс R — альтернативная отправная точка для машинного обучения. Он исходит от Рэйчел Татман, аналитика по подготовке данных в Kaggle, и содержит 6 шагов, которые вы выполняете с помощью R Notebook,

Алексей Билогур, также аналитик по подготовке данных в Kaggle, создал учебное пособие по визуализации данных, которое начинается с того, что учащиеся знакомятся с пандами, прежде чем приступить к созданию эффективных визуализаций данных на Python.

Трек Deep Learning, состоящий из шести шагов, представляет собой введение в использование сверточных сетей для компьютерного зрения и использует высокоуровневый API Keras и бэкэнд Tensorflow. Автором его является Дэн Бекер, и в этом видео он объясняет, как его подход ставит практический опыт выше деталей и теории.

Этот подход на основе записной книжки Python кажется привлекательным способом овладеть навыками, необходимыми для науки о данных.


Добавить комментарий