Apache HAWQ стал проектом верхнего уровня. HAWQ описывается как продвинутая корпоративная система запросов SQL-on-Hadoop и аналитическая база данных, которая сочетает в себе ключевые технологические преимущества базы данных MPP с масштабируемостью и удобством Apache Hadoop.
HAWQ считывает и записывает данные в HDFS изначально, является быстрым и масштабируемым, а также предоставляет пользователям полный, совместимый со стандартами интерфейс SQL. HAWQ изначально работает в Apache Hadoop.
Разработчики говорят, что параллельная обработка HAWQ означает, что он сочетает в себе высокую производительность и низкую задержку (потенциально почти в реальном времени) ответов на запросы, которые можно масштабировать до наборов данных размером в петабайт. Разработчики использовали опыт в области массово-параллельной обработки (MPP), полученный в результате создания корпоративной базы данных Pivotal Greenplum и PostgreSQL с открытым исходным кодом.
HAWQ начал свою жизнь как Pivotal HAWQ, прежде чем был переведен в проект Apache. Pivotal Сама компания HAWQ многим обязана технологии, которую Pivotal приобрела, когда купила Greenplum и ее продукт хранилища данных MPP Shared-Nothing. Pivotal разработала HAWQ как базу данных SQL-запросов, которая объединила достоинства Pivotal Greenplum с распределенным хранилищем Hadoop. Pivotal представила ядро Pivotal HAWQ для Apache в сентябре 2015 года. Первоначальная команда разработчиков продолжила работу над продуктом Apache HAWQ, чтобы улучшить его работу в общедоступном облаке, частном облаке или общих физических кластерных средах.
Поддержка SQL означает, что HAWQ работает с приложениями на основе SQL и инструментами бизнес-аналитики / визуализации данных. Вы можете использовать его для выполнения сложных запросов и объединений, включая сводные и вложенные запросы. HAWQ теперь работает с остальными продуктами экосистемы Apache Hadoop, поэтому вы можете интегрировать и управлять с помощью Apache YARN. обеспечение с Apache Ambari. и интерфейс с Apache HCatalog. Он также поддерживает Apache Parquet, Apache HBase и работает с библиотеками машинного обучения Apache MADlib для аналитики на основе ИИ.