Facebook AI Research выпустила новую версию своего программного обеспечения Detectron, в котором реализованы алгоритмы обнаружения объектов. Новая версия основана на платформе глубокого обучения PyTorch и имеет новые функции, включая паноптическую сегментацию, плотное размещение, Cascade R-CNN и вращающиеся ограничивающие рамки.
Facebook AI Research использует Detectron2 для разработки и обучения моделей определения позы нового поколения, которые используются в Smart Camera, системе камер искусственного интеллекта в устройствах видеозвонков Portal Facebook.
Разработчики заявляют, что новый релиз переписан с нуля. Это происходит из maskrcnn-benchmark, сверточной нейронной сети, которая помещает маску вокруг объектов, распознаваемых на изображении. Detectron основан на нескольких типах нейронных сетей, написан на Python и использует библиотеку глубокого обучения Caffe2. Новая версия обеспечивает быстрое обучение на одном или нескольких серверах GPU.
Новая версия имеет более модульную конструкцию и расширяема. Новый дизайн означает, что пользователи могут подключать реализации пользовательских модулей практически к любой части системы обнаружения объектов. Разработчики говорят, что это означает, что новые исследовательские проекты могут быть написаны сотнями строк кода с четким разделением между основной библиотекой Detectron2 и новой исследовательской реализацией.
Алгоритмы обнаружения объектов, поддерживаемые новой версией, включают DensePose и сети пирамид паноптических функций. Оценка DensePose (плотная поза человека) направлена на отображение всех человеческих пикселей изображения RGB на трехмерной поверхности человеческого тела. Паноптическая сегментация сочетает в себе сегментацию экземпляров, которая используется для распознавания отдельных объектов переднего плана, таких как животные или люди, с семантической сегментацией, при которой пиксели на фоне изображения маркируются классами, такими как дорога, небо или трава.