Машинное обучение как услуга не новость, но когда Microsoft предлагает ее как часть Azure, вы должны принять это во внимание.
В настоящее время Azure ML — это только предварительная версия для партнеров Microsoft, но в июле будет запущена общедоступная бета-версия, и вы можете зарегистрироваться сейчас, чтобы получить к ней доступ.
Также стоит отметить, что у Microsoft уже есть облачный сервис для больших данных на основе Hadoop — Azure HDInsight. Azure ML, похоже, ориентирован на пользователей, которые не хотят или не могут изучать технические аспекты реализации решения Hadoop.
На данный момент неясно, какие методы будут включены. Вы, вероятно, можете составить список очевидных кандидатов от регрессии к деревьям решений Байеса и глубоким нейронным сетям, но следующая цитата из блога Microsoft делает его немного более интересным:
«Машинное обучение Azure, предварительная версия которого выйдет в следующем месяце, объединит возможности новых аналитических инструментов, мощные алгоритмы, разработанные для продуктов Microsoft, таких как Xbox и Bing, и многолетний опыт машинного обучения в одной простой и удобной облачной службе».
Какие новые инструменты и алгоритмы аналитики могут иметь в виду?
Интерфейс выглядит простым в использовании и, как и следовало ожидать, называется ML Studio. Кажется, у него есть графический дизайнер, и он называет каждый анализ «экспериментом».
Вы можете увидеть, что Microsoft имеет в виду, из следующего очень преувеличенного промо-видео:
Первое, что вы замечаете, — это то, что упор делается на «прогнозную аналитику», которую мы привыкли называть «статистикой», но я думаю, это звучит очень скучно. По мнению Microsoft, возможности прогнозной аналитики не менее чем чудотворны и позволяют вовремя управлять железными дорогами или, по крайней мере, современным эквивалентом самолета, и обнаруживать мошенничество до того, как оно произойдет. Похоже, что партнеры Microsoft использовали Azure ML для некоторых из этих задач.
«Сегодня партнеры используют раннюю предварительную версию Azure ML для создания решений машинного обучения для наших клиентов. Например, MAX451 помогает крупному розничному покупателю определить, какие продукты он, скорее всего, купит в следующий раз, на основе данных электронной торговли, а также данные о физических магазинах. OSISoft работает с Университетом Карнеги-Меллона над обнаружением неисправностей в реальном времени и диагностикой изменений выходной мощности в зданиях кампуса. Машинное обучение помогает смягчать проблемы в режиме реального времени и прогнозно оптимизировать энергопотребление и затраты ».
Все это звучит слишком хорошо, чтобы быть правдой, и, вероятно, так оно и есть. Интересно, сколько невиновных собираются попытаться извлечь информацию из своих данных только для того, чтобы сделать неправильные выводы из-за неадекватного понимания базовой статистики? ML подходит для многих вещей, но он не заменяет базовую статистику.