Использование обучения с подкреплением, чтобы нарисовать компьютерную раскраску, как восточный художник суми-э, — это не просто крик «хорошо сделано» — и все же, когда вы смотрите на результаты, вы хотите сделать это …
Восточная техника рисования тушью, называемая Суми-э, мгновенно узнаваема, независимо от того, в какой части мира вы живете. Разница в том, что в отличие от западной живописи, основанной на мазках, которая использует слои мазков для создания изображения, Суми-э ограничивает количество штрихов — это минималистский подход к рисованию на основе мазков. Это делает очень важным максимально использовать каждый штрих, чтобы передать то, что вы видите. Таким образом, штрихи суми-э различаются по толщине и стилю вдоль штриха. Внешний вид мазка определяется формой окрашиваемого объекта, траекторией и положением кисти, а также распределением пигментов в кисти. Как вы, наверное, догадались, нужно время, чтобы научиться использовать кисть для создания определенных типов мазков.
Вы можете попытаться изобрести фильтры и основанные на физике подходы для воспроизведения навыка, но три исследователя из Токийского технологического института попытались научить компьютер, как это сделать, используя стандартное обучение с подкреплением.
Обучение с подкреплением основано на процедуре предоставления вознаграждения, когда агент приближается к правильному выполнению задачи. Программа моделирует агент мягкой кисти, который последовательно принимает решение о том, в каком направлении двигаться, и вознаграждается в соответствии с изящностью мазков, которые он использовал при рисовании произвольных форм. После того, как агент научится рисовать изящную форму, он может свободно работать с определенными фигурами.
Технические детали: пространство состояний моделируется Марковским процессом принятия решений (MDP), а метод градиента политики используется для изучения локально оптимальной политики. По сути, то, что происходит, — это градиентный акцент, чтобы максимизировать награду.
Пространство состояний контролирует положение, ориентацию и загрузку чернил кисти. Награда зависит от плавности хода. Обучающий набор состоял из 80 оцифрованных реальных одиночных мазков кисти, обычно используемых в восточной живописи тушью. Были использованы границы каждой траектории мазка, и агент кисти должен был воспроизвести их как можно более плавно.
После того, как агент кисти был обучен, его использовали для создания рисунков тушью фотографий. Контуры кисти были созданы вручную, поэтому художественный эффект не такой автономный, как может показаться. Однако результат должен быть очень хорошим, даже если вы знаете, что такое хорошая техника суми-э.
Не могу не думать, что птица очень похожа на что-то из Angry Birds …