Выпущен OpenCV 3.0 — компьютерное зрение для всех нас


Открытое резюме стало рабочей лошадкой повседневного компьютерного зрения. Да, дело дошло до того, что компьютерное зрение может стать очень обычной задачей для программистов, не являющихся экспертами в области ИИ. Поэтому выпуск Open CV 3.0 является важным событием.

Если вы хотите включить в свое приложение алгоритм компьютерного зрения, обнаружение краев, обнаружение лиц, отслеживание объектов и т. Д., Вы можете начать с нуля, прочитать все книги и статьи по этой теме и реализовать свою собственную версию «стандартных» алгоритмов. . Или вы можете просто загрузить Open CV CV с открытым исходным кодом. Когда-то он имел репутацию сложного в использовании и недостаточно документированного, но в последнее время он стал намного лучше, и версия 3.0, о которой только что было объявлено, стала еще более функциональной.
В нем более 2500 алгоритмов, которые вы можете использовать в своих проектах. Его можно использовать из C ++, C, Java, Python и нового в этой версии Matlab. Он работает под Windows, Android и Mac OS. Он автоматически использует преимущества векторизованных аппаратных операций с использованием MMX и SSE, если они доступны. Также была улучшена аппаратная поддержка ARM:

Существует также новый уровень OpenCV HAL, который упростит создание кода, оптимизированного для NEON, и который должен сформировать основу для открытых и проприетарных ускорителей OpenCV.

Графические процессоры также могут ускорить процесс с помощью CUDA и OpenCL, но эти интерфейсы все еще находятся в стадии разработки. Однако существует ряд автоматических ускорений, которые работают при наличии графического процессора:

Введен T-API (transparent API), это прозрачный слой ускорения графического процессора с использованием OpenCL. Он не добавляет никакой зависимости OpenCL во время компиляции или выполнения. Когда OpenCL доступен, он обнаруживается и используется, но его можно отключить во время компиляции или во время выполнения. Он охватывает ~ 100 функций OpenCV. Эта работа была выполнена по контракту и при щедрой поддержке компаний AMD и Intel.

Кажется, что мы многим обязаны этой новой функциональностью не только AMD и Intel, но и Google через Summer of Code — так что теперь вы знаете, чем занимались все эти стажеры:

обнаружение текста
множество алгоритмов вычислительной фотографии (HDR, рисование, фильтры с распознаванием границ, суперпиксели и т. д.)
алгоритмы отслеживания и оптического потока
новые функции, включая дескрипторы строк, KAZE / AKAZE
оптимизация общего использования (восхождение на гору, линейное программирование)
значительно улучшена поддержка Python, включая поддержку Python 3.0, множество новых руководств и примеров использования OpenCV с Python.
Модуль согласования двухмерной формы и модуль согласования трехмерной поверхности
Модуль RGB-D
Модуль 3D визуализации на базе ВТК

От общего сообщества разработчиков ПО с открытым исходным кодом у нас также есть:

биологически вдохновленный модуль зрения
Функции DAISY, дескриптор LATCH, улучшенный КРАТКИЙ ОБЗОР
модуль регистрации изображений

Также есть много улучшений и чисток во многих функциях и API. Было реализовано множество новых тестов, что сделало новую библиотеку более надежной и более подходящей для перехода к версии 4.0.
Проект Open CV действительно является примером продвижения вперед в сложной предметной области с открытым исходным кодом. Без него нам пришлось бы использовать библиотеки с близким исходным кодом с явно проприетарными алгоритмами, которые мало что давали бы понять, как они работают. Open CV отвечает за большой прогресс в робототехнике, вычислительной фотографии, обработке медицинских изображений и многом другом — вы даже можете использовать его с проектами Raspberry Pi.


Добавить комментарий