Веб-приложение для визуализации и анализа данных было выпущено JetBrains на этапе проверки концепции.
Рубрика: Большие данные
Apache выпускает Spark 1.6
Выпущена новая более быстрая версия механизма обработки данных Apache Spark с открытым исходным кодом с новым API набора данных и улучшенными функциями обработки данных.
GCHQ Gaffer с открытыми исходными кодами
База данных графов, разработанная коммуникационным агентством Великобритании и оптимизированная для получения данных об интересующих узлах, стала доступной на Github.
Flink получает потоковую передачу во время событий
Был выпущен Apache Flink 0.10.0 с улучшениями для обработки потока данных, поддержкой потоковой передачи во время события и однократной обработки.
Read more «Flink получает потоковую передачу во время событий»
Институт Алана Тьюринга начинает работу
Новый национальный институт науки о данных Великобритании назначил Эндрю Блейка, главу Microsoft Research UK, первым директором Института Алана Тьюринга. Институт также объявил о партнерстве с GCHQ для работы над идеями и методами нового поколения для использования больших данных.
Выпущена Spark 1.4
Spark 1.4 был выпущен с R API, ориентированным на специалистов по данным.
Бета-версия Google Cloud Bigtable
Google анонсировала облачную службу баз данных NoSQL, способную обрабатывать большие объемы данных. Cloud Bigtable — это бета-версия, но в ней используются технологии, уже используемые в Google.
Объявления о больших данных Azure
На Build 2015 разработчики узнали о новых возможностях больших данных: сервис хранилища данных; способ запуска эластичных баз данных; и озеро данных, где клиенты могут хранить большие объемы данных.
Алгоритм, который знает, когда вы что-то включаете
Умные счетчики просто регистрируют общее количество потребляемой вами электроэнергии, но при правильной обработке данных вы можете определить, что и когда включается.
Read more «Алгоритм, который знает, когда вы что-то включаете»
Обнаружение аномалий в Twitter с открытым исходным кодом
Пакет, который сейчас находится на GitHub, написан на R и автоматически обнаруживает аномалии, такие как всплески данных, которые случаются в Twitter, когда выходит основная новость или происходит крупное спортивное событие.
Read more «Обнаружение аномалий в Twitter с открытым исходным кодом»