Замедленные Видео С Интернет-Фотографий


Вычислительная фотография приближается к статусу магии. Представьте, что вы собираете фотографии со всего мира, сделанные разными людьми в разное время, и собираете их вместе, чтобы сделать замедленное видео популярных мест. Вам не нужно воображать, потому что Google вместе с Вашингтонским университетом сделали это. 

Традиционно замедленные видео получаются путем фиксации камеры на месте и съемки одной фотографии каждые несколько часов или даже дней. Если вы хотите, чтобы промежуток времени длился несколько лет, вам нужно либо набраться терпения, либо подумать об этом давным-давно. Тем не менее, люди все время бродят и фотографируют популярные достопримечательности. Часто рассматривая их с одной и той же точки зрения. Это обеспечивает огромный каталог потенциальных кадров для замедленного видео, что означает, что вы можете увидеть, как что-то изменилось с течением времени.

Проблема, конечно, заключается в том, что эти потенциальные кадры не снимаются камерой с фиксированного положения, и просто сложение их вместе в порядке временных меток привело бы к созданию видео, которое невозможно было бы смотреть.

Исследователи из Вашингтонского университета и Google применили ряд вычислительных фотографических методов для эффективной стабилизации изображений в видео. Они называют общую технику «замедленным майнингом». 

Сначала они начали с ошеломляющих 86 миллионов фотографий с отметками времени и геотегами со всего мира. Их система автоматически определяет, в каких местах достаточно изображений, и создает для них замедленное видео. 

Вы можете представить себе, какие шаги необходимы при обработке изображений для создания временного промежутка, но учтите внимание к деталям, которое необходимо для создания высококачественного результата. Учитывая набор фотографий, сделанных в данном месте, первая задача состоит в том, чтобы использовать функции SIFT для группировки фотографий с аналогичным контентом. Например, вы могли находиться на месте известного памятника, но вы могли фотографировать людей, с которыми вы были, или толпу. Затем набор сокращается до простого включения фотографий, сделанных с той же точки зрения. 

Следующим шагом является вычисление карты глубины с точки зрения эталонного изображения. Эта карта глубины используется для преобразования всех других изображений в одну и ту же систему отсчета. Затем каждое изображение нормализуется для учета различий в экспозиции и освещении. Наконец, для заполнения недостающих пикселей был использован алгоритм рисования. 

Это много вычислений, но, похоже, это работает: 

В общей сложности система создала 10 728 замедленных видеороликов. Цитата из статьи (будет представлена на SIGGRAPH в этом году):

«Масштаб и повсеместность наших заминированных временных промежутков создает новую парадигму для визуализации глобальных изменений. По мере того, как все больше фотографий будет доступно в Интернете, временные промежутки будут визуализировать еще более длительные периоды времени, показывая более радикальные изменения.»

Похоже, что интернет действительно собирает данные о состоянии всей планеты. Зачем останавливаться на неподвижных изображениях? Существуют миллионы камер наблюдения, которые могли бы обеспечить полные видеопоследовательности. Возможно, скоро удастся доказать, что вы делали и где были в прошлом.

Визуализация данных помогает нам увидеть, что там есть, но это не приближает нас к практическому использованию данных. 


Добавить комментарий