Открытое резюме стало рабочей лошадкой повседневного компьютерного зрения. Да, дело дошло до того, что компьютерное зрение может стать очень обычной задачей для программистов, не являющихся экспертами в области ИИ. Поэтому выпуск Open CV 3.0 является важным событием.
Если вы хотите включить в свое приложение алгоритм компьютерного зрения, обнаружение краев, обнаружение лиц, отслеживание объектов и т. Д., Вы можете начать с нуля, прочитать все книги и статьи по этой теме и реализовать свою собственную версию «стандартных» алгоритмов. . Или вы можете просто загрузить Open CV CV с открытым исходным кодом. Когда-то он имел репутацию сложного в использовании и недостаточно документированного, но в последнее время он стал намного лучше, и версия 3.0, о которой только что было объявлено, стала еще более функциональной.
В нем более 2500 алгоритмов, которые вы можете использовать в своих проектах. Его можно использовать из C ++, C, Java, Python и нового в этой версии Matlab. Он работает под Windows, Android и Mac OS. Он автоматически использует преимущества векторизованных аппаратных операций с использованием MMX и SSE, если они доступны. Также была улучшена аппаратная поддержка ARM:
Существует также новый уровень OpenCV HAL, который упростит создание кода, оптимизированного для NEON, и который должен сформировать основу для открытых и проприетарных ускорителей OpenCV.
Графические процессоры также могут ускорить процесс с помощью CUDA и OpenCL, но эти интерфейсы все еще находятся в стадии разработки. Однако существует ряд автоматических ускорений, которые работают при наличии графического процессора:
Введен T-API (transparent API), это прозрачный слой ускорения графического процессора с использованием OpenCL. Он не добавляет никакой зависимости OpenCL во время компиляции или выполнения. Когда OpenCL доступен, он обнаруживается и используется, но его можно отключить во время компиляции или во время выполнения. Он охватывает ~ 100 функций OpenCV. Эта работа была выполнена по контракту и при щедрой поддержке компаний AMD и Intel.
Кажется, что мы многим обязаны этой новой функциональностью не только AMD и Intel, но и Google через Summer of Code — так что теперь вы знаете, чем занимались все эти стажеры:
обнаружение текста
множество алгоритмов вычислительной фотографии (HDR, рисование, фильтры с распознаванием границ, суперпиксели и т. д.)
алгоритмы отслеживания и оптического потока
новые функции, включая дескрипторы строк, KAZE / AKAZE
оптимизация общего использования (восхождение на гору, линейное программирование)
значительно улучшена поддержка Python, включая поддержку Python 3.0, множество новых руководств и примеров использования OpenCV с Python.
Модуль согласования двухмерной формы и модуль согласования трехмерной поверхности
Модуль RGB-D
Модуль 3D визуализации на базе ВТК
От общего сообщества разработчиков ПО с открытым исходным кодом у нас также есть:
биологически вдохновленный модуль зрения
Функции DAISY, дескриптор LATCH, улучшенный КРАТКИЙ ОБЗОР
модуль регистрации изображений
Также есть много улучшений и чисток во многих функциях и API. Было реализовано множество новых тестов, что сделало новую библиотеку более надежной и более подходящей для перехода к версии 4.0.
Проект Open CV действительно является примером продвижения вперед в сложной предметной области с открытым исходным кодом. Без него нам пришлось бы использовать библиотеки с близким исходным кодом с явно проприетарными алгоритмами, которые мало что давали бы понять, как они работают. Open CV отвечает за большой прогресс в робототехнике, вычислительной фотографии, обработке медицинских изображений и многом другом — вы даже можете использовать его с проектами Raspberry Pi.