Возможно, даже исследования Google нашли способ не дать вам выглядеть глупо на групповых фотографиях. Мы все знаем, что сделать групповое фото очень сложно. Просто постарайтесь привлечь всеобщее внимание, пока вы составляете кадр! И вы можете быть уверены, что на любой групповой фотографии по крайней мере один человек закрывает глаза в тот момент, когда вы нажимаете кнопку.
Решением этой проблемы является вычислительная фотография. Сделайте несколько групповых снимков и используйте набор для создания одной хорошей фотографии. Звучит просто, но для того, чтобы сделать это правильно, нужно много внимания к деталям. Именно над этим работали Раджви Шах и Вивек Кватра из Google Research.
Учитывая набор групповых фотографий, первая задача состоит в том, чтобы оценить каждую из них, применив распознавание лиц, а затем определить оценку, основанную на том, сколько лиц правильно ориентированы, улыбаются и имеют открытые глаза. Используя это, изображения можно ранжировать и выбрать лучшее, но, возможно, все еще ошибочное групповое изображение.
Следующий этап возвращается к набору отклоненных фотографий и пытается найти любые лица с высокими баллами, которые можно было бы использовать для замены лиц с низкими баллами на лучшей фотографии.
Реальные трудности здесь заключаются в выборе лиц, которые на самом деле лучше оригинала, и в критерии отбора было вложено много работы. Алгоритмы обучения использовались для определения разницы между улыбающимися и неулыбающимися лицами, а также открытыми и закрытыми глазами.
Что можно сказать о результатах?
Как говорят авторы статьи:
Мы продемонстрировали эффективность нашего подхода на множестве примеров, которые вызывают улыбку на лицах людей.
Когда вы смотрите на фотографии » до » и «после», вы немного пугаетесь, представляя себе мир, в котором все постоянно улыбаются, и, возможно, потеря забавной и запоминающейся групповой фотографии может быть чем-то, о чем стоит оплакивать, но… вы хотите быть тем, кто с закрытыми глазами или выглядит как мокрый уик-энд?
Заключительный комментарий дает вам представление о том, куда все может пойти:
В будущем мы хотели бы оптимизировать нашу реализацию для обеспечения производительности в реальном времени, сделав ее привлекательной утилитой для вычислительных камер. Мы также хотели бы изучить и включить более тонкие черты лица для оценки доброты.