В журнале Significance, выпускаемом Королевским статистическим обществом, есть специальный выпуск о больших данных и несколько действительно интересных статей, в том числе о Питере Норвиге о том, почему язык является статистическим по своей природе.
Единственным недостатком является то, что вы не можете читать какие-либо статьи без подписки или доступа к академической библиотеке.
Если вас интересуют большие данные, то интересными статьями являются:
Большие данные и жизнь в городах — что они могут для нас сделать? Большие данные меняют наши города. Салли Энн Келлер, Стивен Э. Кунин и Стефани Шипп рассматривают преимущества, которые большие данные могут принести обществу, а также некоторые проблемы.
Сколько информации содержится в «информационном обществе»? Мы знаем, что наш дивный новый мир трансформируется с помощью данных. Но насколько его там больше, чем раньше? Мартин Гильберт обнаруживает огромные неиспользованные возможности для обработки информации.
Статистическое путешествие к центру Земли Что лежит у нас под ногами? Огромное количество данных и сложный анализ выявили, что Земля вращается в своем ядре, — говорит Пинг Ма.
Хаос внутри: изучение шума в клеточной биологии Взрыв данных трансформирует все области науки, включая биологию. Это также трансформирует наше понимание самой жизни и заставляет нас осознать случайный характер жизненных процессов, — объясняет Иэн Джонстон.
Большие данные в астрономии Астрономия была одной из первых областей науки, которая приняла и извлекла уроки из больших данных. Эрик Д. Фейгельсон и Дж. Йогеш Бабу рассказывают об усилиях, проблемах и некоторых способах преобразования наших знаний о космосе.
Прогноз настроения нации Обширные потоки данных из социальных сетей, таких как Twitter и Facebook, содержат мнения, страхи и мечты людей. Томас Лэнсдалл-Велфар, Василиос Лампос и Нелло Кристианини используют совершенно новый инструмент для социологов.
Бесцветные зеленые идеи яростно учатся: Хомский и две культуры статистического обучения Программы распознавания языков используют огромные базы данных слов и статистические корреляции между этими словами для перевода или распознавания речи. Но корреляция — это не причинная связь. Дают ли эти углубленные статистические данные какое-либо представление о том, как работает язык? Или это просто уловка с большими числами, полезная, но ничего не дающая пониманию? Второй точки зрения придерживается теоретик языка Ноам Хомский. Питер Норвиг не согласен.
Если у вас есть время, чтобы прочитать только одну из них, заставьте ее яростно усвоить «Бесцветные зеленые идеи» Питера Норвига: Хомский и две культуры статистического обучения. Если вы не можете получить доступ к опубликованной статье, более длинную, но менее доработанную версию можно найти по адресу http://norvig.com/chomsky.html.