Couchbase запускает JSON Analytics


Существует новая аналитическая служба для Couchbase, которая поставляется с SQL ++, фреймворком языка запросов, который можно использовать для написания запросов к документно-ориентированным данным и формату данных JSON.

Новая служба аналитики поддерживает JSON и предназначена для исключения необходимости преобразования ETL при переносе данных в хранилище NoSQL.

CouchDB был первоначально разработан Дэмиеном Кацем, а затем был принят как успешный проект Apache. Затем разработчики перешли к созданию преемника CouchDB, Couchbase Server. Это гибридная база данных, объединяющая элементы как документной базы данных, так и базы данных «ключ-значение». Элемент «ключ-значение» поступает из протокола, совместимого с memcached, в то время как документы обрабатываются путем хранения данных в формате JSON с поддержкой вторичных индексов.

По словам разработчиков, собственный механизм аналитики JSON позволит пользователям выполнять параллельную специальную аналитику данных, как только они будут загружены в хранилище NoSQL. По сути, новая служба аналитики использует функции Apache AsterixDB, а также академические исследования SQL ++. Извлечение, преобразование и загрузка (ETL) могут быть важной операцией при попытке сделать данные доступными для использования, а перенос сложных, но слабо структурированных данных из документов JSON в более жесткие требования традиционных служб анализа может привести к потере большого количества информации. .

Подход Couchbase к сохранению структуры данных JSON основан на исследовании AsterixDB, проведенном Калифорнийским университетом, а также на модифицированном подходе к гибридной транзакционной аналитической обработке (HTAP), методике, предложенной Gartner для анализа данных, выполняемого в производственных системах, а не чем более обычный переход в отдельную систему для анализа.

Новая служба Couchbase предназначена для того, чтобы бизнес-пользователи могли выполнять специальные аналитические запросы с использованием архитектуры с массовым параллелизмом (MPP), чтобы избежать неприемлемого воздействия на производительность основной базы данных. Он поддерживает специальные запросы данных, и разработчики говорят, что данные доступны для аналитической обработки за миллисекунды. Язык запросов, который компания называет N1QL for Analytics, представляет собой реализацию языка SQL ++ для запросов к полуструктурированным данным JSON без схемы. Разработка инфраструктуры SQL ++ основана на финансируемом NSF проекте FORWARD Калифорнийского университета в Сан-Диего с последующим вкладом и финансированием со стороны Couchbase и Informatica. Разработчики говорят, что, поскольку язык является производным от SQL ++, N1QL for Analytics легко изучить разработчикам, знакомым с синтаксисом SQL.


Добавить комментарий