Apache Kudu 1.9 добавляет информацию о местоположении

Вышел новый выпуск Apache Kudu, в котором добавлена информация о местоположении и поддержка скриптов Docker. Kudu — это механизм хранения по столбцам, который заполняет пробел между распределенной файловой системой Hadoop (HDFS) и базой данных HBase NoSQL. Kudu предоставляет клиентские API C ++, Java и Python.

Read more «Apache Kudu 1.9 добавляет информацию о местоположении»

Йодид — новый инструмент для научного общения и исследований

Новый экспериментальный инструмент, предназначенный для помощи ученым в подготовке интерактивных документов с использованием веб-технологий, выпущен в альфа-версии. Iodide разработан для поощрения «коммуникативных рабочих процессов» путем включения инструмента редактирования как части документа.

Read more «Йодид — новый инструмент для научного общения и исследований»

Apache Daffodil улучшает совместимость с DFDL

Apache Daffodil. Реализация языка описания формата данных с открытым исходным кодом для преобразования между данными фиксированного формата и XML / JSON была обновлена для улучшения совместимости с DFDL.

Read more «Apache Daffodil улучшает совместимость с DFDL»

Databricks Delta добавляет более быстрый импорт паркета

Есть обновленная версия Databricks Delta, которая увеличивает скорость импорта данных Parquet и имеет более сильные функции слияния. Механизм аналитики также стал доступен пользователям Amazon AWS и Azure для Databricks.

Read more «Databricks Delta добавляет более быстрый импорт паркета»

Завершить ручной ввод данных в Excel — Спасибо, AI!

Ручной ввод данных в электронную таблицу — это, вернее, рутинная работа. Теперь это даже в большей степени то, что принадлежит прошлому. Microsoft представила в Excel еще одну функцию на базе искусственного интеллекта — функцию вставки данных путем фотографирования таблицы с помощью телефона Android.

Read more «Завершить ручной ввод данных в Excel — Спасибо, AI!»

Прогнозирование обладателя «Оскара» с помощью Data Science

После успеха в предсказании лучшей картины прошлого года на 90-й церемонии вручения премии «Оскар«, центр Data Science Thinkful повторил упражнение для «Оскара» этого года и предсказал, что победит «Рома». UPDATE: И победителем стала не «Рома». Вместо этого победа досталась фильму «Зеленая книга«, занявшему второе место. Что пошло не так с наукой о данных?

Read more «Прогнозирование обладателя «Оскара» с помощью Data Science»

Студия данных добавляет интерактивные диаграммы

Команда Data Studio добавила ряд новых функций, которые позволяют быстрее получать аналитические данные и создавать более подробные отчеты. Улучшения включают интерактивные диаграммы, фильтры поиска и возможность встраивать внешние данные.

Read more «Студия данных добавляет интерактивные диаграммы»