Periscope Data анонсировала новый продукт машинного обучения, использующий Amazon SageMaker. В настоящее время система находится в стадии бета-тестирования.
Periscope Data наиболее известен своим продуктом Periscope Pro, который можно использовать для анализа данных в SQL, Python или R в одной среде разработки. Затем программное обеспечение можно использовать для визуализации данных, совместной работы и обмена с другими. Программное обеспечение включает в себя прогнозную аналитику, машинное обучение, обработку естественного языка и очистку данных.
Amazon SageMaker — это полностью управляемая платформа, которую можно использовать для создания, обучения и развертывания моделей машинного обучения в любом масштабе. Он включает размещенные записные книжки Jupyter для изучения и визуализации данных обучения, хранящихся в Amazon S3. Вы можете напрямую подключаться к данным в S3 или использовать AWS Glue для переноса данных из Amazon RDS, Amazon DynamoDB и Amazon Redshift в S3 для анализа в записной книжке.
Система Periscope Data ML призвана объединить все этапы создания рабочей модели, от подготовки данных до обучения модели и создания отчетов. Разработчики говорят, что это решит проблемы фрагментированности рабочих процессов при построении моделей машинного обучения, включающих ручные шаги и разрозненные инструменты. По их опыту, подготовка данных и разработка функций особенно сложны из-за итеративного экспериментирования, связанного с процессом машинного обучения.
Новая система начинается с использования данных Periscope, чтобы максимально упростить подготовку данных за счет выявления распределения и описательной статистики, а также помощи пользователям в определении того, где требуется дополнительная очистка или нормализация данных. Команды, работающие с данными, также могут использовать SQL в представлениях для создания наборов данных и для определения релевантных функций данных.
После создания наборы данных напрямую экспортируются в Amazon SageMaker для создания, обучения и развертывания моделей машинного обучения. Затем результаты модели записываются обратно в хранилище данных, что позволяет пользователям использовать обученные модели для прогнозных и предписывающих отчетов в Periscope Data.
Интеграция Periscope Data с Amazon SageMaker станет общедоступной в ближайшие месяцы, или вы можете подать заявку на участие в бета-программе.