Хотя кажется, что большие данные могут решить более или менее любую проблему, есть вещи, до которых они просто не справляются. Использование данных социальных сетей для оценки общественного мнения и, в частности, для прогнозирования результатов выборов кажется надежным приложением для сбора данных, но так ли это?
Данные Twitter так часто использовались для прогнозирования результатов выборов, что мы склонны думать, что мнения, выраженные в твите, являются ключом к предсказанию будущего. Были опубликованы различные статьи, в которых содержатся предсказания всех видов будущих результатов, включая фондовый рынок и возникновение пандемий. Но оправданы ли эти утверждения? Есть ли в массовом твите прогнозные знания?
В статье с оригинальным названием «Я хотел предсказать выборы с помощью Twitter, и все, что я получил, это паршивая бумага», исследователь Даниэль Гайо-Авелло из Университета Овьедо утверждает, что предсказательная сила Twitter далека от доказательства. Он даже заходит так далеко, что говорит:
«Нет, вы не можете предсказать выборы с помощью Twitter»
Затем он указывает на недостатки в попытке использовать Twitter таким образом. Пожалуй, наиболее впечатляющим является наблюдение:
«Это вовсе не предсказание! Я не нашел ни одной статьи, предсказывающей будущий результат. Все они утверждают, что предсказание могло быть сделано; то есть они являются апостериорным анализом, и, разумеется, отрицательные результаты встречаются редко. . »
Постфактум-прогноз всегда несет в себе возможность предвзятости. Он также отмечает, что было бы несправедливо сравнивать прогноз с равновероятным исходом — в конце концов, не часто есть априори равные шансы на победу всех сторон. Далее он перечисляет восемь пунктов, в которых предыдущий анализ ошибочен, и дает рекомендации для будущей работы, которая может доказать, что Twitter может предсказывать выборы. Как вы можете догадаться, для исследователей важнее всего делать прогнозы и утверждать, какой результат будет хорошим. Он также предоставляет аннотированную библиографию с довольно суровым вердиктом, что ни в одном случае не было фактически сделано предсказаний о выборах.
Обратите внимание, что Гайо-Авелло не доказал, что вы не можете предсказать результаты выборов или что-либо еще, используя данные Twitter — просто никто другой убедительно не доказал, что это возможно.
Конечно, это имеет коммерческий аспект. Если компании готовы тратить большие деньги, чтобы заполучить большие данные, которые предлагает Twitter, им необходимо убедиться, что они обладают прогностической силой. Если данные Twitter не могут предсказать выборы, могут ли они предсказать рыночные тенденции и общественные настроения?
Это вопрос, который требует прояснения.