Песочница IBM Big SQL


IBM выпустила версию Big SQL в песочнице для настольных компьютеров. Sandbox представляет собой образ докера с одним узлом и предназначен для того, чтобы вы могли начать работу с Big SQL и платформой Hortonworks Data.

Песочница IBM Big SQL

Каждая загрузка Sandbox предварительно настроена с образцами данных, учебным пособием и упражнением, которые вы должны выполнить, и IBM заявляет, что вы будете готовы к работе через 30 минут.

IBM Big SQL — это механизм SQL от IBM для Hadoop. IBM работала с Hortonworks над интеграцией HDP (Hortonworks Data Platform) с IBM Big SQL, а Big SQL 5 расширяет возможности Hive и использует HBase и Spark для предоставления возможности интегрированной аналитики.

Big SQL использует IBM Fluid Query для виртуализации данных из множества различных хранилищ данных, таких как Hive, HBase, Spark, DB2, Oracle, SQL Server, Netezza, Informix, Teradata, WebHDFS и хранилища объектов.

IBM Fluid Query был представлен в 2015 году. Он основан на технологии Netezza и может использоваться для создания объединенных запросов, в которых данные извлекаются из различных источников, без необходимости того, чтобы пользователи данных занимались управлением несколькими хранилищами данных или запросами. системы. Fluid Query также можно использовать для выполнения и управления массовым перемещением данных между репозиториями данных. Netezza создала первое устройство хранилища данных, а также как независимая компания разработала передовые аналитические приложения. Он был куплен IBM в 2010 году.

Big SQL предлагает двунаправленную интеграцию со Spark и поддерживает синтез между исполнителями Spark и рабочими узлами Big SQL. Наряду с поддержкой больших данных, он также поддерживает диалекты SQL из других предложений, таких как базы данных IBM DB2 и устройства хранилища данных IBM Netezza и базы данных Oracle, включая встроенную поддержку диалектов Oracle SQL и PL/SQL. IBM надеется, что приложения, написанные для Oracle, будут переведены на Big SQL, поскольку их можно будет перемещать с минимальными изменениями.

Big SQL также предлагает интеграцию YARN через Slider. YARN (Another Resource Negotiator) — это технология управления кластером Apache, а Slider расширяет Hadoop и YARN, позволяя другим базам данных работать в YARN без изменений. Очевидно, полагая, что они не включили достаточное количество имен и технологий для больших данных, IBM добавила в Big SQL новую технологию под названием «Elastic Boost». IBM заявляет, что это может повысить производительность Big SQL до 50% за счет выделения нескольких рабочих процессов на узел для более эффективного использования ЦП и памяти.

Big SQL также поставляется с ANSI-совместимым анализатором SQL, который может выполнять все 99 запросов TPC-DS без необходимости модификации запросов и структурированной потоковой передачи с новыми API.


Добавить комментарий