Есть новая техника для добавления детальной безопасности при использовании Apache Hive и Spark для работы с большими наборами данных.
Рубрика: Большие данные
\\ Без комментариев — Влияние Pokémon Go на физическую активность и статистическую механику изменения веса человека
• Влияние Pokémon Go на физическую активность
// No Comment — Цезий для временных рядов, данных о погоде Google и кухонь поцелуев
• цезий: платформа с открытым исходным кодом для вывода временных рядов
Read more «// No Comment — Цезий для временных рядов, данных о погоде Google и кухонь поцелуев»
Columbia создает очиститель наборов данных
Инструмент, который очищает большие наборы данных от грязных данных, был разработан в Колумбийском университете и Калифорнийском университете в Беркли.
Выпущен Apache Spark 2.0
Был выпущен Apache Spark 2.0 с обновленной поддержкой SQL, структурированной потоковой передачей и улучшенной производительностью.
Техническая предварительная версия Apache Spark 2.0
Новая версия Apache Spark теперь доступна в технической предварительной версии.
Read more «Техническая предварительная версия Apache Spark 2.0»
Google Data Studio 360
Бесплатная версия инструмента отчетности и визуализации данных Google Data Studio выпущена в виде бета-версии.
Read more «Google Data Studio 360»Виртуальная машина для обработки и анализа данных Linux
Microsoft выпустила образ виртуальной машины с инструментами для анализа данных.
Read more «Виртуальная машина для обработки и анализа данных Linux»
Шторм достигает 1.0
Новая версия Apache Storm имеет улучшенную производительность, новые API и управление состоянием среди длинного списка других новых функций и улучшений.
SandDance добавлен в PowerBI
Microsoft Research представила новый инструмент визуализации данных. SandDance — это проект Microsoft Garage, который выпускается в двух версиях; автономный веб-инструмент и настраиваемый визуальный элемент Power BI.