Запущена платформа анализа данных на GPU RAPIDS

NVidia выпустила коллекцию программных библиотек для машинного обучения и анализа данных. Система на базе графического процессора, RAPIDS, состоит из набора программных библиотек с открытым исходным кодом для конвейеров обработки данных и аналитики на графическом процессоре.

Read more «Запущена платформа анализа данных на GPU RAPIDS»

В Apache Kylin 2.5 добавлен механизм кубирования All-in-Spark

Вышел новый выпуск Apache Kylin с улучшениями, включая механизм кубирования «все в Spark» и поддержку использования MySQL для хранилища метаданных Kylin.

Read more «В Apache Kylin 2.5 добавлен механизм кубирования All-in-Spark»

Couchbase запускает JSON Analytics

Существует новая аналитическая служба для Couchbase, которая поставляется с SQL ++, фреймворком языка запросов, который можно использовать для написания запросов к документно-ориентированным данным и формату данных JSON.

Read more «Couchbase запускает JSON Analytics»

Hortonworks планирует использовать Hadoop Cloud Native

Hortonworks вместе с IBM и Red Hat объявила об инициативе, направленной на то, чтобы сделать Hadoop родным для облака и способным хорошо работать в гибридных средах.

Read more «Hortonworks планирует использовать Hadoop Cloud Native»

Google упрощает обнаружение наборов данных

Google запустил настраиваемый поиск, нацеленный на «ученых, журналистов данных и компьютерных фанатов», которым необходимо находить наборы данных независимо от того, где они размещены.

Read more «Google упрощает обнаружение наборов данных»

Apache HAWQ выходит на высший уровень

Apache HAWQ стал проектом верхнего уровня. HAWQ описывается как продвинутая корпоративная система запросов SQL-on-Hadoop и аналитическая база данных, которая сочетает в себе ключевые технологические преимущества базы данных MPP с масштабируемостью и удобством Apache Hadoop.

Read more «Apache HAWQ выходит на высший уровень»

В Kafka 2 добавлена поддержка ACL

Вышла новая версия Apache Kafka с новыми функциями для улучшения аутентификации, безопасности и репликации. Apache Kafka — это распределенная потоковая платформа, которую можно использовать для создания конвейеров потоковой передачи данных в реальном времени между системами или приложениями.

Read more «В Kafka 2 добавлена поддержка ACL»

Kafka Graphs Framework расширяет потоки Kafka

Новая структура обработки графов для Apache Kafka расширяет потоки Kafka, чтобы предоставлять аналитику распределенных графов, основанную только на том, что уже предоставляется слоями Kafka. Kafka Graphs — это клиентский уровень для распределенной обработки графиков.

Read more «Kafka Graphs Framework расширяет потоки Kafka»