Первая гибридная СУБД с открытым исходным кодом на базе Hadoop и Spark


Splice Machine — это новая попытка объединить лучшие части традиционных систем управления реляционными базами данных и их аналогов NoSQL с распределенными вычислениями и вычислениями в памяти на основе Hadoop и Spark.

Традиционные СУБД сталкиваются с трудностями при работе с огромными объемами данных, которые они обычно обрабатывают путем масштабирования, хотя и дорого. Еще один побочный эффект огромного объема данных, накапливаемых из социальных сетей и мобильных устройств, заключается в том, что запросы OLTP и OLAP несут высокопроизводительные результаты, которые впоследствии пагубно сказываются на анализе в реальном времени и мгновенном принятии решений.

Системы NoSQL могут дать ответ на дешевую и эффективную обработку таких объемов за счет горизонтального масштабирования, а не увеличения на обычном оборудовании. Но по сравнению с традиционным решением СУБД NoSQL не предлагает поддержки ANSI SQL и обработки транзакций.

Затем базы данных в памяти, несмотря на то, что они предлагают лучшее соотношение цены и качества, также терпят неудачу, когда память заполняется под нагрузкой террабайтами данных, и в этот момент они обычно отбрасывают запросы, которые не могут обработать, не обеспечивая ни отказоустойчивости. ни последовательности.

Ответ на эти проблемы заключается в интеграции ряда современных технологий в единый пакет с использованием «гипер» -гибридного подхода.

Эта попытка представляет собой сварочную машину и включает в себя:

HBase и Hadoop

Они решают проблему масштабирования работы под петабайтной нагрузкой, в то же время обеспечивая гарантии переключения при отказе. Apache Spark — аналитический движок в памяти, который, в отличие от остальных, использует технологию передачи данных на диск, которая, как только память заполняется, выгружает лишние запросы на диск, чтобы они не завершались ошибкой.

Apache DerbyIt предоставляет компонент РСУБД, облегченный и ANSI SQL, совместимый с подобными соединениями, ограничениями, индексами, подзапросами, хранимыми процедурами и т. Д.

Их взаимодействие, основанное на сложных процедурах, позволяет создать настоящую РСУБД с MVCC и ACID на Hadoop, способную выполнять анализ на лету в реальном времени и обновлять массивные и распределенные объемы данных, создавая новое поколение технологий баз данных.

Не забывайте о преимуществах открытого исходного кода. Совсем недавно Splice Machine вышла с открытым исходным кодом, следуя тенденции, уже установленной другими СУБД, такими как Ingres от Actian, в попытке расширить ее принятие и клиентскую базу, сформировать вокруг нее сообщество и значительно упростить процесс получения и тестирования. .

Splice Machine доступна как в редакции Community, так и в версии Enterprise, причем версия Community является бесплатной и с неограниченным SQL, а версия Enterprise включает функции DevOps, такие как резервное копирование, шифрование и безопасность, а также будущие функции, такие как Oracle PL / SQL wire- совместимость (осень 2016 г.) и активная-активная репликация (в 2017 г.). Официальная поддержка предоставляется только в версии Enterprise.

Разработчики смогут протестировать и развернуть Community Edition в любом масштабе благодаря облачной песочнице Amazon Web Services, запущенной ранее на этой неделе. Это дает возможность протестировать новую версию 2.0 Community Edition с открытым исходным кодом в различных масштабах от малых до корпоративных, инициируя кластеры за считанные минуты.

Если этого уже недостаточно, чтобы убедить вас попробовать Splice Machine, то это могут дать следующие преимущества по сравнению с традиционными СУБД, такими как Oracle, IBM DB2 или MySQL:

• В 10-20 раз быстрее — использует HBase, распределенную базу данных NoSQL, а также кластерные вычисления в памяти от Spark

• Четверть стоимости — масштабирование на обычном оборудовании с помощью Hadoop

• ANSI SQL — использует существующие аналитики, отчеты и приложения на основе SQL без перезаписи

• Распределенные транзакции — обеспечивает надежное обновление нескольких строк и таблиц на основе передовых исследований Google.

• Гибкость — обеспечивает отличную производительность для одновременных рабочих нагрузок OLTP и OLAP.

• Эластичный — увеличивает или уменьшает масштаб всего за несколько минут.


Добавить комментарий