Apache Avro добавляет поддержку ZStandard


Доступен Apache Avro 1.9 с обновленным средством чтения JSON, меньшим размером и поддержкой сжатия ZStandard.

Avro — это платформа сериализации данных для систем обработки данных большого объема, высокой производительности и высокой пропускной способности. Он использует JSON для определения типов данных и протоколов и сериализует данные в компактном двоичном формате. Avro был разработан той же командой, что и Hadoop, и используется системами обработки данных, включая Hadoop, Spark и Kafka.

Avro можно использовать в качестве инструментария через удаленные вызовы процедур (RPC). Эталонная реализация Avro разработана и выпущена как библиотека Java. Avro поддерживает привязку к языку для C, C ++, C #, Go, Haskell, Java, Perl, PHP, Python, Ruby, Scala и TypeScript. Он использует быстрый и компактный формат двоичных данных, имеет независимый от языка формат определения схемы. и использует файл-контейнер для хранения и сохранения данных.

Улучшения в новой версии призваны сделать ее более компактной и быстрой. Изменения начинаются с того, что новая версия по умолчанию построена на Java 8. Это означает, что библиотека времени Joda больше не нужна для обработки логических значений даты и времени, поскольку Java 8 изначально обрабатывает дату и время.

Следующее улучшение меняет способ чтения JSON. В предыдущих версиях это выполнялось с использованием библиотеки Джексона Java. В этом выпуске старый Codehaus Jackson был заменен на FasterXML Jackson 2.9. Это не только быстрее, но и улучшения безопасности. Разработчики также удалили классы Джексона из общедоступного API.

Также была добавлена поддержка сжатия Facebook ZStandard. ZStandard — это алгоритм сжатия в реальном времени, обеспечивающий высокую степень сжатия.

В другом месте, в стремлении сделать Acro более компактным, было удалено несколько зависимостей, включая guava, paranamer, commons-codec и commons-logging. Apache Avro скомпилирован и протестирован с Java 11.


Добавить комментарий