В недалеком будущем роботов могут отправлять в качестве средств доставки последней мили, чтобы доставить ваш заказ на вынос, посылку или подписку на набор еды прямо у вашего порога — если они смогут найти дверь.
Стандартные подходы к роботизированной навигации включают заблаговременное картирование области, а затем использование алгоритмов для направления робота к определенной цели или GPS-координате на карте. Хотя этот подход может иметь смысл для изучения конкретных условий, таких как планировка конкретного здания или запланированная полоса препятствий, он может стать громоздким в контексте доставки «последней мили».
Представьте, например, что вам нужно заранее нанести на карту каждый отдельный район в зоне доставки робота, включая конфигурацию каждого дома в этом районе, а также конкретные координаты входной двери каждого дома. Эту задачу может быть трудно масштабировать для всего города, особенно потому, что внешний вид домов часто меняется в зависимости от времени года. Нанесение на карту каждого дома также может столкнуться с проблемами безопасности и конфиденциальности.
Теперь инженеры Массачусетского технологического института разработали метод навигации, который не требует предварительного картографирования местности. Вместо этого их подход позволяет роботу использовать подсказки в своей среде для планирования маршрута к месту назначения, которое можно описать в общих семантических терминах, таких как «входная дверь» или «гараж», а не как координаты на карте. Например, если роботу поручено доставить посылку к чьей-то входной двери, он может начать движение и увидеть подъездную дорожку, которую он был обучен распознавать как ведущую к тротуару, который, в свою очередь, может вести к тротуару. к входной двери.
Новый метод может значительно сократить время, которое робот тратит на изучение объекта перед определением цели, и он не полагается на карты конкретных домов.
«Мы бы не хотели делать карту каждого здания, которое нам нужно посетить», — говорит Майкл Эверетт, аспирант факультета машиностроения Массачусетского технологического института. «С помощью этой техники мы надеемся бросить робота в конце любой подъездной дорожки и заставить его найти дверь».
Эверетт представит результаты группы на этой неделе на Международной конференции по интеллектуальным роботам и системам. Статья, соавторами которой являются Джонатан Хау, профессор аэронавтики и космонавтики Массачусетского технологического института, и Джастин Миллер из Ford Motor Company, признана финалистом конкурса «Лучшая статья для когнитивных роботов».
«Чувство того, что есть»
В последние годы исследователи работали над внедрением естественного семантического языка в роботизированные системы, обучая роботов распознавать объекты по их семантическим меткам, чтобы они могли визуально обрабатывать дверь, например, как дверь, а не просто как твердое тело. , прямоугольное препятствие.
«Теперь у нас есть возможность дать роботам представление о том, что такое вещи, в режиме реального времени», — говорит Эверетт.
Эверетт, Хау и Миллер используют аналогичные семантические методы в качестве трамплина для своего нового подхода к навигации, который использует уже существующие алгоритмы, извлекающие элементы из визуальных данных, для создания новой карты той же сцены, представленной в виде семантических ключей. или контекст.
В своем случае исследователи использовали алгоритм для построения карты окружающей среды при перемещении робота, используя семантические метки каждого объекта и изображение глубины. Этот алгоритм называется семантическим SLAM (одновременная локализация и отображение).
Хотя другие семантические алгоритмы позволяют роботам распознавать и отображать объекты в своей среде, они не позволяют роботу принимать решения в данный момент при навигации в новой среде, выбирая наиболее эффективный путь к семантическое назначение, такое как «входная дверь».
«Раньше для исследования было достаточно просто шлепнуть робота и сказать« иди », и он будет двигаться и, в конце концов, доберется туда, но это будет медленно», — говорит Хау.
Стоимость
Исследователи стремились ускорить планирование пути робота в семантическом, контекстно-окрашенном мире. Они разработали новую «оценку затрат», алгоритм, который преобразует семантическую карту, созданную ранее существовавшими алгоритмами SLAM, во вторую карту, представляющую вероятность того, что любое заданное местоположение будет близко к цели.
«На это вдохновило преобразование изображения в изображение, когда вы делаете снимок кошки и делаете ее похожей на собаку», — говорит Эверетт. «Тот же тип идеи возникает здесь, когда вы берете одно изображение, которое выглядит как карта мира, и превращаете его в другое изображение, которое выглядит как карта мира, но теперь окрашивается в зависимости от того, насколько близко разные точки карты к конечной цели. «
На этой карте с текущими расходами окрашены в оттенки серого, чтобы представить более темные области как местоположения, далекие от цели, а более светлые — как области, близкие к цели. Например, тротуар, закодированный желтым на семантической карте, может быть переведен алгоритмом затрат на дорогу как более темная область на новой карте по сравнению с подъездной дорогой, которая постепенно становится светлее по мере приближения к входной двери — — самый светлый регион на новой карте.
Исследователи обучили этот новый алгоритм на спутниковых снимках из Bing Maps, содержащих 77 домов из одного городского и трех пригородных районов. Система преобразовала семантическую карту в карту затрат и наметила наиболее эффективный путь, следуя более светлым областям карты, к конечной цели. Для каждого спутникового изображения Эверетт назначил семантические метки и цвета контекстным элементам типичного переднего двора, например серый для входной двери, синий для проезжей части и зеленый для живой изгороди.
В процессе обучения команда также применяла маски к каждому изображению, чтобы имитировать частичный вид, который, вероятно, будет иметь камера робота, когда он пересекает ярд.
«Частью хитрости нашего подхода было [предоставление системе] большого количества частичных изображений», — объясняет Хау. «Поэтому ему действительно нужно было выяснить, как все это взаимосвязано. Это часть того, что делает эту работу надежной».
Затем исследователи протестировали свой подход на моделировании изображения совершенно нового дома за пределами обучающего набора данных, сначала используя уже существующий алгоритм SLAM для создания семантической карты, а затем применив свою новую оценку затрат к выпуску для создать вторую карту и путь к цели, в данном случае входной двери.
Новый метод рентабельности обнаружил, что входная дверь на 189 процентов быстрее, чем классические алгоритмы навигации, которые не принимают во внимание контекст или семантику, а вместо этого тратят чрезмерное количество шагов на изучение областей, которые вряд ли будут рядом с их целью.
Эверетт говорит, что результаты демонстрируют, как роботы могут использовать контекст для эффективного определения местоположения цели даже в незнакомой, не нанесенной на карту среде.
«Даже если робот доставляет пакет в среду, в которой он никогда не был, могут быть подсказки, которые будут такими же, как и в других местах, где его видели», — говорит Эверетт. «Так что мир может быть устроен немного иначе, но, вероятно, есть кое-что общее».
Это исследование частично поддерживается Ford Motor Company.
Ссылки по теме