На Build 2015 разработчики узнали о новых возможностях больших данных: сервис хранилища данных; способ запуска эластичных баз данных; и озеро данных, где клиенты могут хранить большие объемы данных.
Все объявления, призванные упростить работу с данными, независимо от их размера или сложности, были сделаны в его программном выступлении Скоттом Гатри.
Azure Data Lake — это гипермасштабируемое хранилище данных для рабочих нагрузок аналитики больших данных. Согласно сообщению в блоге SQL Server Т.К. Ранга Ренгараджан, корпоративный вице-президент по платформе данных Microsoft, это:
единое место для хранения всех типов данных в собственном формате без фиксированных ограничений на размер учетной записи или файла, высокая пропускная способность для повышения аналитической производительности и встроенная интеграция с экосистемой Hadoop.
Озеро данных совместимо с HDFS (распределенная файловая система Hadoop), которая интегрирована с Azure HDInsight, и будет интегрирована с предложениями Microsoft, такими как Revolution-R Enterprise, и отраслевыми стандартными дистрибутивами, такими как Hortonworks и Cloudera.