Apache PredictionIO достигает статуса верхнего уровня


PredictionIO — это платформа машинного обучения с открытым исходным кодом, которая в основном поддерживается Salesforce. Пожертвованный Apache прошлым летом, он вышел из инкубатора Apache и стал проектом верхнего уровня, что сделало его более общедоступным.

PredictionIO основан на стеке машинного обучения с открытым исходным кодом, который можно использовать для создания, оценки и развертывания движков с алгоритмами машинного обучения. Он также имеет сервер событий, который обрабатывает события с нескольких платформ, и галерею шаблонов с шаблонами движка для различных типов приложений машинного обучения. К ним относятся рекомендации, классификация, регрессия и обработка естественного языка. Разработчики говорят, что использование шаблонов сокращает время на создание механизма рекомендаций до пары недель с одним или двумя инженерами.

Код движков состоит из компонентов DASE:

[D] Источник данных и средство подготовки данных Источник данных считывает данные из источника ввода и преобразует их в желаемый формат. Средство подготовки данных предварительно обрабатывает данные и направляет их в алгоритм для обучения модели.

[A] Алгоритм Компонент «Алгоритм» включает алгоритм машинного обучения, и настройки его параметров определяют способ построения прогнозной модели.

[S] Обслуживание: Компонент обслуживания принимает запросы на прогнозирование и возвращает результаты прогнозирования. Если в движке несколько алгоритмов, этот элемент объединит результаты в один. Кроме того, в раздел «Обслуживание» можно добавить бизнес-логику для дальнейшей настройки конечных возвращаемых результатов.

[E] Метрики оценки Метрика оценки количественно определяет точность прогнозов с помощью числовых баллов. Его можно использовать для сравнения алгоритмов или настроек параметров алгоритмов.

Все элементы могут быть адаптированы под ваши нужды.

Сервер событий используется для сбора данных из вашего приложения во время его работы. Затем механизм PredictionIO строит прогнозные модели на основе одного или нескольких алгоритмов с использованием данных. После того, как вы развернули его как веб-службу, он прослушивает запросы от вашего приложения и отвечает прогнозируемыми результатами в режиме реального времени.

Для движка существует ряд SDK, в настоящее время для Java, PHP, Python и Ruby. Это также может быть полный стек машинного обучения в комплекте с Apache Spark, MLlib, HBase, Spray и Elasticsearch.


Добавить комментарий