Что общего у «Богемской рапсодии», «Макбета» и списка друзей на Facebook?


Для английского ученого или заядлого читателя Шекспировский канон представляет собой одни из величайших литературных произведений английского языка. Для сетевого исследователя 37 пьес Шекспира и 884 421 слово, которое они содержат, также представляют собой чрезвычайно сложную коммуникационную сеть. Сетевым ученым, которые используют математику, физику и информатику для изучения обширных и взаимосвязанных систем, ставят задачу использовать статистически строгие подходы, чтобы понять, как сложные сети, подобные всем Шекспировским, передают информацию человеческому мозгу.

В новом исследовании, опубликованном в Nature Physics , используются инструменты сетевой науки, чтобы объяснить, как сложные коммуникационные сети могут эффективно передавать большие объемы информации в человеческий мозг. Исследование, проведенное постдоком Кристофером Линном, аспирантами Ари Каном и Лией Пападопулос и профессором Даниэль С. Бассетт, показало, что различные типы сетей, в том числе те, которые встречаются в литературных произведениях, музыкальных произведениях и социальных связях, имеют схожую базовую структуру. что позволяет им быстро и эффективно обмениваться информацией.

С технической точки зрения сеть — это просто статистическое и графическое представление соединений, известных как ребра, между различными конечными точками, называемыми узлами. В литературе, например, узел может быть словом, а ребро может соединять слова, когда они появляются рядом друг с другом («мой» — «королевство» — «вместо» — «а» — » лошадь ») или когда они передают похожие идеи или концепции (« желтый »-« оранжевый »-« красный »).

По словам Линн, преимущество использования сетевой науки для изучения таких вещей, как языки, заключается в том, что, как только отношения определены в небольшом масштабе, исследователи могут использовать эти связи, чтобы делать выводы о структуре сети в гораздо большем масштабе. «Как только вы определите узлы и края, вы можете уменьшить масштаб и начать спрашивать, как выглядит структура всего этого объекта и почему он имеет такую конкретную структуру», — говорит Линн.

Основываясь на недавнем исследовании группы, в котором моделируется, как мозг обрабатывает сложную информацию, исследователи разработали новую аналитическую основу для определения объема информации, передаваемой сетью, и ее эффективности. «Чтобы рассчитать эффективность коммуникации, вам нужна модель того, как люди получают информацию», — говорит он.

С помощью этой аналитической основы исследователи оценили 40 реальных коммуникационных сетей, чтобы определить, какие функции имеют решающее значение для передачи информации. Они просмотрели произведения английской литературы, в том числе канон Шекспира и «Гордость и предубеждение» Джейн Остин, а также музыкальные произведения, такие как Соната № 11 Моцарта и «Богемская рапсодия» королевы. Они также изучали сети социальных отношений, в том числе сети соавторства в науке и связи с друзьями в Facebook.

Изучив эту разнообразную группу сетей, исследователи обнаружили, что крупномасштабная структура сети имеет важное значение для способности этой сети передавать информацию. Что было удивительно, так это то, насколько похожа эта структура в разных сетях, независимо от того, представляла ли сеть переходы существительных в литературном произведении или мелодические прогрессии в музыкальном произведении.

Что делает эти сети одновременно насыщенными информацией и эффективными, так это баланс между двумя ключевыми характеристиками сети, известными как структура «сообщества» и «неоднородная» структура. Структура сообщества возникает, когда узлы собираются вместе и образуют кластеры, которые вызывают связанные концепции. Произнося слово «собака», можно вспомнить, например, «мяч», «фрисби» или «кость». Такая структура сообщества помогает сделать сети более эффективными, потому что человек может предвидеть, какое слово или идея может появиться дальше.

Но если человек может предвидеть, что будет дальше, он не получит много информации, потому что информация напрямую связана с удивлением. Для предоставления информации сети должны иметь «неоднородную» смесь как хорошо связанных, так и редко связанных узлов. Возьмем, к примеру, произведения Шекспира. Хотя «the» и «and» используются 28 944 и 27 317 раз соответственно, есть также 12 493 словоформы, которые встречаются только один раз. «В таком хабе, как« the », вы не можете предвидеть, куда собираетесь отправиться, — говорит Линн. «Оказывается, эти узлы-концентраторы действительно важны для генерации неожиданностей или, что то же самое, информации».

Линн увлекает то, что баланс между разнородной структурой и структурой сообщества является ключевым для создания сетей, богатых информацией, но также легко интерпретируемых. «Люди изучали эти две структуры в течение долгого времени; они являются двумя основополагающими концепциями сетевой науки», — говорит он. «Это исследование объясняет, почему некоторые из этих сетей так структурированы: потому что они пытаются эффективно передавать информацию. Это то, что я думаю, самая крутая часть», — говорит он.

Исследователи продолжат эту работу, расширяя типы сетей связи, которые они оценивают, с целью выявления тенденций во времени, а также различий и сходств между произведениями других языков и культур. «Мы также особенно заинтересованы в том, чтобы определить, насколько эффективная коммуникация связана с исправлением ошибок», — говорит Бассетт. «Наши предварительные результаты показывают, что сети реального мира помогают людям автоматически исправлять собственные ошибки».

Это исследование в первую очередь поддерживалось Исследовательским офисом армии США через DCIST-W911NF-17-2-0181 и Национальным научным фондом через грант CAREER, PHY-1554488.


Добавить комментарий