MapR добавила в свою новую версию многоуровневое хранение данных, а также доступ через S3 API и возможность запускать приложения на основе Kubernetes без изменения образов контейнеров.
MapR наиболее известен своей платформой данных, которая обеспечивает доступ к различным источникам больших данных, включая Apache Hadoop и Apache Spark. MapR-DB — это встроенная база данных, предназначенная для работы с приложениями, интенсивно использующими данные, которые распространяются в локальных сетях, на периферии и в облаке.
Изменения в выпуске 6.1 начинаются с добавления поддержки NFSv4 и возможности доступа к данным через S3 API. Это добавляет к поддержке POSIX, NFSv3 и HDFS.
Второе улучшение — это возможность использовать многоуровневое хранилище без необходимости изменять приложения. Холодные данные могут быть перемещены из кластера в объектную систему хранения, где производительность ниже, но и затраты ниже. Если осуществляется доступ к перемещенным данным, они возвращаются в режим высокопроизводительного доступа. Файлы, таблицы и потоки могут быть даже многоуровневыми, полностью или частично, и они полностью доступны для чтения и записи даже после многоуровневого.
Шифрование в состоянии покоя — еще одно улучшение как для данных, хранящихся в MapR, так и для данных, находящихся в многоуровневом хранилище. Теперь вы также можете прозрачно запускать существующие приложения на основе Kubernetes на MapR, не изменяя образы контейнеров, из которых состоят приложения.
Последняя область улучшения — это набор изменений, призванных упростить разработку и развертывание приложений AI и Analytic. Это начинается с возможности запускать MapR и Spark 2.3 в одном кластере с доступом к одним и тем же данным. В наборе инструментов аналитики для Hive 2.3 было разрешено большое количество JIRA, а также расширена поддержка SQL для Apache Drill. Также была добавлена поддержка KSQL для создания приложений потоковой аналитики для Kafka. Добавлены привязки на собственном языке для Python и Node.JS, и вы можете запускать запросы непосредственно к типам данных JSON без ETL.