Машинное обучение добавлено в Azure HDInsight


Корпорация Майкрософт объявила об общедоступности служб машинного обучения (ML) 9.3 в Azure HDInsight. В новом выпуске добавлена поддержка Python, поэтому название изменилось с R Server на ML Services.

Службы машинного обучения в HDInsight можно использовать с аналитикой на основе Python или R для наборов данных, загруженных в хранилище BLOB-объектов Azure или Data Lake. Поскольку кластер ML Services построен на R с открытым исходным кодом, его можно использовать с тысячами пакетов R с открытым исходным кодом, а также с подпрограммами из ScaleR, пакета Microsoft для анализа больших данных. Microsoft говорит, что:

«Любой пакет машинного обучения с открытым исходным кодом на R или Python может работать бок о бок с любыми проприетарными инновациями от Microsoft».

Службы машинного обучения в HDInsight включают хорошо масштабируемый распределенный набор алгоритмов, таких как RevoscaleR, revoscalepy и microsoftML, которые могут работать с данными, размер которых превышает размер физической памяти.

ML Services поставляется с набором предварительно обученных моделей для визуального анализа и анализа тональности текста, готовых для оценки предоставленных вами данных. После создания модели машинного обучения ее можно превратить в API веб-сервисов, который размещается в сетке сервера в облаке и может быть интегрирован с локальными приложениями.

Обновленная версия ML Services была анонсирована вместе с обновлениями Apache Hadoop, Apache Spark 2.3, Apache Kafka 1.0 и другими исправлениями ошибок в более чем двадцати фреймворках с открытым исходным кодом, которые являются частью HDInsight. HDInsight предоставляет предварительно настроенные кластеры, которые включают необходимые продукты из экосистемы Hadoop. Объявление также включало 50-процентное снижение цен на HDInsight, предварительную версию HDInsight с Azure Data Lake Storage 2-го поколения и улучшения пакета Enterprise Security Package. Azure Data Lake Storage 2-го поколения — это глобально доступная файловая система HDFS для хранения и анализа файлов петабайтного размера, содержащих триллионы объектов.


Добавить комментарий