Хотя мы хорошо прошли «пик беспилотный», насколько новости идет, есть еще случайные новые разработки, которые могут сделать вас сидеть и обратите внимание. Дроны, которые делают акробатику — ничего нового, — но беспилотные летательные аппараты, которые учатся делать акробатику это другое дело.
Это исследование интересно на ряде уровней. Во-первых, это просто весело и волнение в просмотре беспилотных летательных аппаратов делать акробатику — кто знал, что это было даже можно сделать петлю? На другом уровне также важен способ, с помощью которого беспилотники научились этому навыку.
Контроллер имел вход с камеры и акселерометра и обучался, будучи показанными демонстрациями, предоставленными экспертом. Эксперт имел доступ к большему объему данных, чем система, которая проходит подготовку, включая полное состояние беспилотника. Это сделало возможным для эксперта быть оптимальным контроллером. Однако система не получила доступа к этой привилегированной информации и должна была научиться достигать тех же результатов только на основе сенсорных данных. Нейронная сеть пыталась свести к минимуму разницу между полетом эксперта и его собственным.
Был разработан набор физически осуществимых идеальных траекторий полета, и эксперт попытался пролететь по ним как можно точнее. Затем система попыталась извлечь уроки из симуляции у эксперта.
Справочные траектории для акробатических маневровТоп ряд: Power Loop, Баррель Roll, и Мэтти FlipBottom строки: Combo
Выученная политика, соединяющая входные данные и выходы, была затем перенесена в реальную модель, и результаты можно увидеть на видео:
Вывод:
«Наша методология имеет несколько благоприятных свойств: она не требует от человека-эксперта демонстрации, она не может навредить физической системе во время тренировок, и может быть использована для обучения маневрам, которые являются сложными даже для лучших пилотов-людей. Наш подход позволяет физическому квадротору летать маневры, такие как Power Loop, Баррель Roll, и Мэтти Flip, в ходе которого он несет ускорения до 3g «.
и
«Мы показали, что разработка соответствующих абстракций ввода облегчает прямую передачу политики от моделирования к физической реальности. Представленная методология не ограничивается автономным полетом и может обеспечить прогресс в других областях робототехники».
Это выглядит как более быстрый и простой способ обучения любой робот системы делать то, что вы хотите.