Исследователи показали, что Twitter может служить индикатором психологического благополучия сообщества и прогнозировать частоту сердечных заболеваний.
Рубрика: Большие данные
Flink достигает статуса верхнего уровня
Язык обработки данных, разрабатываемый Apache Software Foundation, получил статус верхнего уровня. Flink имеет открытый исходный код, имеет API-интерфейсы для Java и Scala, а со специализированными API-интерфейсами для обработки графов предлагается в качестве альтернативы MapReduce.
Twitter индексирует каждый твит
Twitter создает индекс каждого публичного твита, когда-либо сделанного, чтобы сделать возможным поиск без ограничений по возрасту твита. Это достигается с помощью Apache Mesos, диспетчера кластеров с открытым исходным кодом, который обеспечивает эффективную изоляцию и совместное использование ресурсов в распределенных приложениях или фреймворках.
Read more «Twitter индексирует каждый твит»Apache Drill достигает 0,6
Разработчики Apache Drill, программного обеспечения с открытым исходным кодом, которое вы можете использовать для написания SQL-запросов к данным, хранящимся в Hadoop, выпустили версию 0.6.
Google Flu Trends принимает новую модель
Google Flu Trends запускает новую модель в США на предстоящий сезон гриппа 2014/2015 гг. Важное отличие состоит в том, что он будет включать данные CDC о гриппе, что, скорее, разрушает его первоначальную идею.
SalesForce Wave
Анонсированный в этом году на Dreamforce, Wave является первым пакетом бизнес-аналитики и анализа данных Salesforce.
SQL в масштабе Hadoop
Hortonworks анонсировала улучшения в движке Hive. Stinger.next предназначен для доставки корпоративного SQL с временем ответа на запрос менее секунды и для масштабирования от гигабайт до петабайт.
Ruby и R для Enigma
Для доступа к Enigma API были написаны две клиентские библиотеки, которые расширяют возможности доступа к данным, метаданным и статистике по правительственным наборам данных, хранимым Enigma.
GraphLab Create
GraphLab анонсировала программное обеспечение, позволяющее командам специалистов по анализу данных получать представление о больших данных в 10 000 раз быстрее, чем продукты конкурентов, и его можно загрузить бесплатно.
Read more «GraphLab Create»Климатические данные из облака
FetchClimate, новая служба Azure, разработанная Microsoft Research, делает поиск отображаемых данных из тысяч доступных наборов данных таким же простым, как поиск отеля или объекта, привлекающего посетителей.