HBase 1.4 с новым затененным клиентом


Apache выпустил обновленную версию HBase с новым закрашенным клиентом, предназначенным для улучшения совместимости, наряду с улучшениями клиента REST, расширенными возможностями автоматического перезапуска и улучшениями показателей RegionServer.

Apache HBase — это распределенная нереляционная база данных с открытым исходным кодом Hadoop, созданная по образцу Google BigTable, которая предлагает произвольный доступ для чтения / записи в реальном времени к большим данным. Цель Apache в этом проекте — разместить очень большие таблицы — миллиарды строк X миллионы столбцов — на верхних кластерах стандартного оборудования.

Это первый выпуск в новой линейке HBase 1.4, продолжающий тему предыдущих выпусков 1.x по обеспечению стабильной и надежной базы данных в экосистеме больших данных Apache.

Новый затененный клиент больше не содержит ряд не перемещенных сторонних классов зависимостей, которые были включены по ошибке. Хотя это делает клиент более совместимым, это означает, что, если приложение полагается на присутствующие классы, iy необходимо будет добавить зависимость времени выполнения к соответствующему стороннему артефакту.

Ранее закрашенный клиент упаковал несколько сторонних библиотек, не перемещая их. В некоторых случаях эти библиотеки были перемещены; в некоторых случаях они вообще не включаются.

В список вошли:

* jaxb

* пристань

* трикотаж

* показатели codahale (только HBase 1.4+)

* commons-crypto

* jets3t

* юнит

* куратор (HBase 1.4+)

* netty 3 (HBase 1.1)

* mokito-junit4 (HBase 1.1)

Практика затенения зависимостей включает в себя включение и переименование зависимостей для создания частной копии, которая связана с основным пакетом, в данном случае HBase.

Клиент REST также был улучшен, чтобы добавить поддержку двоичных ключей строк. RemoteHTable теперь поддерживает двоичные ключи строк с любым символом или байтом путем правильного кодирования URL-адресов запросов. Разработчики говорят, что это одновременно изменение поведения по сравнению с более ранними версиями и важное исправление для корректности протокола.

Показатели региона были улучшены двумя способами. Во-первых, есть гораздо более быстрая функция стоимости местоположения и генератор кандидатов, использующий кэширование и инкрементные вычисления. Это позволяет стохастическому балансировщику нагрузки учитывать примерно в двадцать раз больше конфигураций кластера для больших кластеров, чтобы определить наиболее рентабельные. Второе улучшение — это новая метрика RegionServer, которая подсчитывает все действия со строками и дает значение, равное сумме количества запросов чтения и количества запросов записи. Счетчики также были улучшены, чтобы не переоценивать несколько запросов. Это приводит к более точному мониторингу нагрузки на сервер.


Добавить комментарий