Apache Arrow был обновлен с добавлением механизма запросов DataFusion Rust-Native для столбчатого формата Arrow.
Read more «Apache Arrow добавляет движок DataFusion Rust-Native Engine»
Apache Arrow был обновлен с добавлением механизма запросов DataFusion Rust-Native для столбчатого формата Arrow.
Read more «Apache Arrow добавляет движок DataFusion Rust-Native Engine»
Вышел новый выпуск Apache Kudu, в котором добавлена информация о местоположении и поддержка скриптов Docker. Kudu — это механизм хранения по столбцам, который заполняет пробел между распределенной файловой системой Hadoop (HDFS) и базой данных HBase NoSQL. Kudu предоставляет клиентские API C ++, Java и Python.
Read more «Apache Kudu 1.9 добавляет информацию о местоположении»
Фонд GraphQL объявил о сотрудничестве с Фондом совместного развития, и к нему присоединились новые члены, включая Neo4j.
Новый экспериментальный инструмент, предназначенный для помощи ученым в подготовке интерактивных документов с использованием веб-технологий, выпущен в альфа-версии. Iodide разработан для поощрения «коммуникативных рабочих процессов» путем включения инструмента редактирования как части документа.
Read more «Йодид — новый инструмент для научного общения и исследований»
Apache Daffodil. Реализация языка описания формата данных с открытым исходным кодом для преобразования между данными фиксированного формата и XML / JSON была обновлена для улучшения совместимости с DFDL.
Есть обновленная версия Databricks Delta, которая увеличивает скорость импорта данных Parquet и имеет более сильные функции слияния. Механизм аналитики также стал доступен пользователям Amazon AWS и Azure для Databricks.
Read more «Databricks Delta добавляет более быстрый импорт паркета»
Ручной ввод данных в электронную таблицу — это, вернее, рутинная работа. Теперь это даже в большей степени то, что принадлежит прошлому. Microsoft представила в Excel еще одну функцию на базе искусственного интеллекта — функцию вставки данных путем фотографирования таблицы с помощью телефона Android.
Read more «Завершить ручной ввод данных в Excel — Спасибо, AI!»
После успеха в предсказании лучшей картины прошлого года на 90-й церемонии вручения премии «Оскар«, центр Data Science Thinkful повторил упражнение для «Оскара» этого года и предсказал, что победит «Рома». UPDATE: И победителем стала не «Рома». Вместо этого победа досталась фильму «Зеленая книга«, занявшему второе место. Что пошло не так с наукой о данных?
Read more «Прогнозирование обладателя «Оскара» с помощью Data Science»Инструмент, который предупреждает вас, если пользователи запускают дорогостоящие запросы в механизме запросов Amazon Athena, был открыт разработчиками.
Команда Data Studio добавила ряд новых функций, которые позволяют быстрее получать аналитические данные и создавать более подробные отчеты. Улучшения включают интерактивные диаграммы, фильтры поиска и возможность встраивать внешние данные.