Ученый-семантик Института Аллена


Был запущен новый инструмент, который применяет возможности ИИ для поиска в научных статьях.

Проблема, которую Semantic Scholar намеревается решить, заключается в том, что существует обширный пул исследовательских работ в общественном достоянии, которые остаются в тени, их невозможно найти, невозможно прочитать.
Излишне говорить, что существует большой неиспользованный потенциал, который, если его использовать, подтолкнет развитие коллективных исследований, идей, чертежей и других сфер деятельности.
Главный человек, стоящий за проектом, — Орен Эциони, ветеран в области искусственного интеллекта поисковых систем, который сейчас участвует в разработке Scholar Институтом искусственного интеллекта Аллена (AI2).

Итак, как ИИ участвует в этом процессе?
На ИИ возложена задача выявления связей между документами, даже внутри отсканированных документов, а также изображений и диаграмм на основе фраз, ключей, авторов, тем, других данных и цитат.
Другими словами, задача состоит в том, чтобы сканировать, связывать и классифицировать, и такая классификация без использования чистой вычислительной мощности и интеллектуального программного обеспечения была бы невозможна.
Чтобы убедиться в этом на собственном опыте, мы проверили его, выполнив поиск по нескольким простым терминам. Затем мы сравнили результаты с результатами Google Scholar.
При поиске по запросу «C # Traits» из 10 результатов, представленных на первой и наиболее важной странице, мы получили 6 релевантных результатов, тогда как тот же запрос в Google Scholar дал 8 релевантных результатов.

Но при простом поиске «C #» мы получили ноль (!) Релевантных результатов, поскольку поисковая система по умолчанию ищет имя автора. Таким образом, в этом запросе были обнаружены не связанные между собой статьи, такие как «Адаптивные субградиентные методы для онлайн-обучения» Алана С. Бовикла и «Стохастическая оптимизация и оценка качества изображения» Джона К. Дучи, поскольку в их именах была найдена буква «С»; вряд ли полезно. При просмотре последующих страниц результатов ничего не изменилось.
Тот же запрос в Google Scholar дал ошеломляющие 10 из 10. Из них 8 относились к книгам, которыми Google может позволить себе роскошь. Несправедливое преимущество?
Похоже, что поисковой системой нужно управлять, давая оптимизатору подсказку, чтобы помочь ему выполнять лучший поиск, например, вводить несколько терминов. Также вероятно, что по мере развития инструмента будут вноситься уточнения для улучшения результатов.
Фильтрация данных может выполняться по автору, дате публикации, используемому набору данных, ключевой фразе и обзору после завершения поиска, поскольку необработанные данные уже собраны.
Так следует ли Google Scholar остерегаться?
Я пока не думаю, поскольку Semantic Scholar публикует статьи по CS только с перспективой расширения в другие области науки в ближайшее время. Не смотря на то, что Google Scholar не пытается превзойти Google Scholar, он определенно стремится стать постмодернистским, более совершенным высокотехнологичным инструментом, чем остальные.
После многообещающего старта еще предстоит показать, соответствует ли он великим амбициям, поставленным в качестве цели. Нам просто нужно подождать и посмотреть.


Добавить комментарий