Машинное обучение сейчас в моде, но все еще так же сложно найти данные, необходимые для выполнения обучения. Машинное обучение на основе игр — это один из способов решения проблемы — по крайней мере, в некоторых ситуациях.
Как доказали Google с переводом и Microsoft с отслеживанием тела, заставить методы машинного обучения выполнять реальные задачи может быть вопросом наличия достаточного количества данных. По мере увеличения объема данных, доступных для обучения, реальный алгоритм машинного обучения, который вы используете, имеет меньшее значение. По сути, если задачу можно упростить для изучения, то все будет хорошо для ее изучения.
В Интернете много данных, и поэтому машинное обучение и «большие данные» имеют тенденцию расти вместе. К сожалению, большая часть доступных данных «немаркирована», и для контролируемого обучения вам нужны маркированные данные. Например, предположим, что вы хотите классифицировать музыку по разным жанрам, тогда у вас нет проблем с поиском немаркированных или плохо маркированных сэмплов. Что вам действительно нужно, так это множество музыкальных треков, которые были тщательно классифицированы, а это, как правило, дорого. В результате обучающие наборы, как правило, небольшие.
Команда инженерной школы им. Джейкобса Калифорнийского университета в Лос-Анджелесе придумала идею, которая может решить множество подобных проблем — превратить задачу маркировки в игру. Игра Herd It на Facebook использует людей, которые веселятся, чтобы маркировать музыкальные сэмплы. Конечно, пользователи не думают, что они помогают с задачей обучения ИИ; что касается их, они проверяют свои знания музыкальных мелочей. Они могут бросить вызов друзьям, и есть таблица лидеров.
Помеченные данные затем можно использовать для обучения системы машинного обучения тому, как распознавать особенности звукового спектра. Пока что все кажется не чем иным, как игрофикацией задачи маркировки, но есть хитрый поворот. Результат алгоритма машинного обучения можно использовать для модификации игры, чтобы предоставить категории, которые помогут более точно разделить музыкальную вселенную. В некотором смысле это похоже на алгоритм машинного обучения, который запрашивает дополнительные данные и создает игру, чтобы гарантировать, что она получит именно то, что нужно для лучшей работы.
Конечная цель — точно пометить новую музыку, то есть музыку, которая не входит в обучающий набор, чтобы пользователи могли выполнять поиск музыки, которая им может понравиться. Учитывая, что такой музыкальный сервис, как Pandora, уже насчитывает 900 000 песен, преимущество автоматической точной классификации очевидно. Исследователи предполагают, что однажды эту технику можно будет использовать для создания личной радиостанции, которая найдет новую музыку, которая вам с большой вероятностью понравится, и даже адаптирует то, что вы слушаете, в зависимости от времени суток и других факторов.
Хотя поисковая машина по музыке — стоящая цель, ясно, что машинное обучение на основе игр может иметь приложения и в других областях. Все, что вам нужно сделать, это решить, как геймифицировать задачу классификации, а затем найти способ повысить производительность машинного обучения, чтобы изменить игру.