// Без комментариев — стоит ли использовать TensorFlow, AI Real Estate и чтение по губам


  • Стоит ли использовать TensorFlow
  • Визуальная оценка недвижимости
  • Приговоры для чтения по губам в дикой природе
TensorFlow

Иногда новости достаточно хорошо сообщаются в других местах, и нам нечего добавить, кроме как обратить на это ваше внимание.

Без комментариев — это формат, в котором мы представляем исходную исходную информацию, слегка отредактированную, чтобы вы могли решить, хотите ли вы следить за ней.

Стоит ли использовать TensorFlow

Есть много разных способов реализовать нейронную сеть, включая написание собственного кода на выбранном вами языке. TensorFlow — привлекательное предложение, но стоит ли вам использовать инструмент, поставляемый Google, даже если он имеет открытый исходный код? В новой статье сравниваются Caffe, CNTK, Theano, Torcha и TensorFlow.

Платформа машинного обучения Google TensorFlow была открыта в ноябре 2015 года и с тех пор создала вокруг себя растущее сообщество. Предполагается, что TensorFlow будет гибким для исследовательских целей, а также позволит продуктивно развертывать свои модели. Эта работа предназначена для людей с опытом в области машинного обучения, рассматривающих, следует ли им использовать TensorFlow в своей среде. Исследуются некоторые аспекты структуры, важные для такого решения, такие как неоднородность, расширяемость и граф вычислений. Реализация линейной классификации на чистом Python сравнивается с реализацией, использующей TensorFlow. Я также сравниваю TensorFlow с другими популярными фреймворками в отношении возможностей моделирования, развертывания и производительности и даю краткое описание текущей адаптации фреймворка.

Так каков ответ? Заключение начинается с:

Так стоит ли вам использовать TensorFlow? Это зависит от обстоятельств.

и продолжает:

На TensorFlow стоит обратить внимание, если вы в настоящее время пишете свои сети на чистом Python и хотите выразить свою модель с меньшими накладными расходами. Это может быть правильным выбором, если вы не сосредотачиваетесь на передовой производительности, а скорее на простых реализациях. концепций и нужна структура, поддерживаемая сильным игроком и большим развивающимся сообществом.

Имидж-оценка недвижимости

Да, удивительно, что люди думают о нейронных сетях. В этом случае исследователи использовали рекурсивную нейронную сеть для оценки стоимости дома — таким образом, агенты по недвижимости лишились работы, по крайней мере, в том, что касается оценки цены.

«Оценка недвижимости, то есть процесс определения цены на недвижимость, имеет решающее значение как для покупателей, так и для продавцов в качестве основы для переговоров и сделок. Традиционно для оценки стоимости недвижимости широко применялась модель повторных продаж. Однако , это зависит от структуры и расчета сложного экономического индекса, который сложно оценить точно.

Сегодня брокеры по недвижимости предоставляют своим клиентам легкий доступ к подробной онлайн-информации о недвижимости. Мы заинтересованы в оценке стоимости недвижимости на основе этих больших объемов легко доступных данных. В частности, мы анализируем предсказательную силу фотографий домов в Интернете, что является одним из ключевых факторов для онлайн-пользователей при принятии решения о потенциальном посещении. Разработка надежных алгоритмов компьютерного зрения делает возможным анализ визуального контента.

В этой работе мы используем рекуррентную нейронную сеть (RNN) для прогнозирования цены на недвижимость с использованием современных визуальных функций. Экспериментальные результаты показывают, что наша модель превосходит некоторые другие современные базовые алгоритмы с точки зрения как средней абсолютной ошибки (MAE), так и средней абсолютной процентной ошибки (MAPE)».

Приговоры для чтения по губам в дикой природе

Google Deepmind и Оксфордский университет создали нейронную сеть, которая может превзойти людей при чтении по губам:

«Цель этой работы — распознавать фразы и предложения, произносимые говорящим лицом, со звуком или без него. В отличие от предыдущих работ, в которых основное внимание уделялось распознаванию ограниченного количества слов или фраз, мы рассматриваем чтение по губам как открытый мир. проблема — неограниченные предложения на естественном языке и видео в диких условиях. Наши основные достижения:

  • сеть «Смотри, слушай, посещай и произноси» (WLAS), которая учится транскрибировать видео с движениями рта персонажам
  • стратегия обучения учебной программе для ускорения обучения и уменьшения переобучения
  • набор данных «Предложения по чтению по губам» (LRS) для визуального распознавания речи, состоящий из более чем 100 000 естественных предложений с британского телевидения.

Модель WLAS, обученная на наборе данных LRS, превосходит производительность всей предыдущей работы над стандартными наборами данных тестов чтения по губам, часто со значительным отрывом. Это качество чтения по губам превосходит возможности профессионального чтения по губам на видео с телевидения BBC, и мы также демонстрируем, что визуальная информация помогает улучшить качество распознавания речи даже при наличии звука.

Ясно, что это вызывает столько вопросов и возможностей, что это явно серьезный прорыв. Как скоро мы увидим коммерческие приложения?


Добавить комментарий