Вышел новый выпуск базы данных MapR, MapR-DB. Версия 6 добавляет собственные вторичные индексы и улучшенные API-интерфейсы OJAI.
MapR наиболее известен своей платформой данных, которая обеспечивает доступ к различным источникам больших данных, включая Apache Hadoop и Apache Spark. MapR-DB — это встроенная база данных, предназначенная для работы с приложениями, интенсивно использующими данные, которые распространяются по локальным сетям, периферии и облаку.
В новом выпуске добавлен ряд дополнительных функций, а также улучшена производительность. Первое улучшение — это поддержка собственных вторичных индексов. До сих пор MapR-DB использовала только индексы rowkey для оптимизации доступа. Новые встроенные вторичные индексы можно использовать для запроса любых столбцов в таблицах БД. Вы можете настроить собственные вторичные индексы для таблиц JSON MapR-DB и использовать автоматическое распространение, автоматическое масштабирование и автоматическое управление индексами. Вы также можете создавать составные индексы для нескольких столбцов, использовать все типы данных и настраивать хешированные индексы. Запросы могут использовать как первичные, так и вторичные индексные таблицы.
Следующее улучшение — улучшенная поддержка API-интерфейсов MapR-DB OJAI 2.0. OJAI (Открытый интерфейс приложения JSON) был улучшен, чтобы добавить лучшую поддержку грамматики JSCON и новый интерфейс запросов OJAI. Теперь вы можете использовать условную фильтрацию и сортировку, а также то, что разработчики описывают как:
«интеллектуальное выполнение запросов для поддержки операционных и операционных аналитических приложений в любом масштабе данных и любой сложности запросов»
Еще одно полезное улучшение — лучшая поддержка Apache Drill. Это обеспечивает аналитику SQL для данных в таблицах JSON MapR-DB. Drill — это распределенный механизм запросов SQL, который служит единым интерактивным уровнем доступа для платформы MapR, объединяя данные из MapR-FS и MapR-DB. Усовершенствования означают, что специальные SQL-запросы в MapR-DB выполняются быстрее, поскольку запросы Drill SQL могут использовать новые вторичные индексы MapR-DB, включая возможность использования операторов фильтрации, сортировки, смещения и ограничения.
Таблицы MapR-DB JSON также более тесно интегрированы с Apache Spark, и это можно использовать для создания и обслуживания моделей машинного обучения непосредственно на таблицах MapR-DB. Интеграция в этой версии добавила встроенную возможность подключения к Spark с поддержкой всех ключевых конструкций Spark — RDD, Dataframes / Datasets.
Поддержка Apache Hive также была улучшена за счет нового обработчика хранилища Hive для таблиц JSON MapR-DB.