Google финансирует проект искусственного интеллекта, который внедрит в программы техническую концепцию сожаления, но между сожалением и сожалением есть большая разница.
Вероятно, это не та новость, которую вы могли ожидать. Это история недопонимания и СМИ.
Если бы я дал вам пресс-релиз, в котором говорилось, что Google финансирует исследовательскую группу при университете, чтобы запрограммировать сожаление в компьютеры, вы могли бы начать думать о психологии машины и, возможно, даже о научно-фантастических проблемах, таких как Sky Net или HAL или аналогичная машина, которая тоже показывала много искусственного интеллекта с чувством. Конечно, средства массовой информации писали множество историй в том же духе, хотя некоторые старались воспроизвести эту линию.
«Конечно, компьютеры не могут« чувствовать сожаление … »
но затем проигнорировал это и стал спекулировать на компьютерах, которые действительно испытывают сожаление. Заявление об отказе от ответственности не остановило заголовков вроде «Google хочет, чтобы компьютеры чувствовали сожаление», «Google стремится запрограммировать сожаление и ретроспективу в компьютеры», «Google хочет научить компьютеры сожалеть» и так далее.
Google финансирует проект Школы компьютерных наук им. Блаватника при Тель-Авивском университете, возглавляемый профессором Ишаем Мансуром. Проект представляет собой применение принципов обучения с подкреплением (RL). В RL обучающийся агент не обязательно знает, как улучшить свою производительность, но он получает вознаграждение, которое зависит от того, насколько хорошо он это делает. Вознаграждение может быть положительным или отрицательным, и идея состоит в том, что положительное вознаграждение усиливает недавнее поведение, поэтому вероятность его повторения выше. RL — это форма обучения без учителя, в которой в качестве обратной связи используется только производительность агента — нет учителя, который подталкивал бы агента в правильном направлении.
У RL есть свой жаргон, как и в любой другой области исследований, и разница между максимальной наградой и фактической полученной наградой называется «сожалением». Другими словами, агент RL либо пытается максимизировать среднее долгосрочное вознаграждение, либо минимизировать среднее долгосрочное сожаление.
А теперь снова подумайте о проекте, спонсируемом Google. На этот раз помня, что сожаление — это просто числовая мера разницы между тем, что агент мог получить, и тем, что он получил на самом деле. Теперь заголовок должен гласить: «Google финансирует проект по внедрению алгоритма оптимизации». Исследование, вероятно, столь же потенциально полезно, но вряд ли это сенсационная история, которая сейчас ходит кругами.
Из этой ситуации можно извлечь два урока. Во-первых, то, что некоторая числовая мера называется «сожалением», не означает, что она имеет какое-либо отношение к обычному использованию этого термина. Во-вторых, если вы собираетесь изобрести технику искусственного интеллекта, подбор эмоциональных слов для вашего жаргона — хороший способ обеспечить публичность.