Новый алгоритм Массачусетского технологического института может предсказать человеческие взаимодействия, прежде чем они становятся неловкими

$config[ads_kvadrat] not found

Мультики про машинки новые серии 2017 - Кто сильнее! Лучшие мультфильмы для детей /#мультик игра

Мультики про машинки новые серии 2017 - Кто сильнее! Лучшие мультфильмы для детей /#мультик игра
Anonim

Наша неспособность читать других людей привела к нескольким эпическим сбоям и пропущенным поцелуям. Даже после жизненного опыта человеческие взаимодействия трудно предсказать. Но исследователи из Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института считают, что они могут помочь: с новым алгоритмом глубокого обучения, который может предсказать, когда два человека будут обниматься, целоваться, пожимать друг другу руки или выпивать пять, они сделали большой шаг в будущее благословенно лишенный тех неловких моментов.

Они надеются, что их новый алгоритм - обученный на 600 часах видео YouTube и телешоу как Офис, Кусты, Теория большого взрыва, а также Отчаянные домохозяйки - может использоваться для программирования менее социально неуклюжих роботов и разработки гарнитур в стиле Google Glass, чтобы предложить нам действия, прежде чем мы даже упустим шанс. В будущем, как они себе представляют, вы никогда больше не упустите шанс показать свои пять.

Понимание того, что роботы учатся быть социальными так же, как мы, было ключом к успеху алгоритма. «Люди автоматически учатся предвидеть действия через опыт, и именно это нас заинтересовало в попытках наполнить компьютеры таким же здравым смыслом», - говорит доктор философии CSAIL. студент Карл Вондрик, первый автор соответствующего документа, представленного на этой неделе на Международной конференции по компьютерному зрению и распознаванию образов. «Мы хотели показать, что, просто просматривая большое количество видео, компьютеры могут получить достаточно знаний, чтобы последовательно делать прогнозы относительно своего окружения».

Вондрик и его команда обучили алгоритм нескольким «нейронным сетям» для анализа огромных объемов данных в этом случае, часов самой большой пятерки Джима и Пэм, а также тайных поцелуев Майка и Сьюзен. Принимая во внимание такие факторы, как вытянутые руки, поднятая рука или продолжительный взгляд, каждая из нейронных сетей догадалась, что произойдет в следующую секунду, и общий консенсус сетей был принят в качестве окончательного «прогноза» в изучение.

Алгоритм получил это правильно в течение 43 процентов времени. Хотя это может показаться недостаточно высоким, чтобы гарантировать, что наши повседневные взаимодействия будут менее странными, это значительное улучшение существующих алгоритмов, точность которых составляет всего 36 процентов.

Кроме того, люди могут предсказывать действия только в 71% случаев. Нам нужна вся помощь, которую мы можем получить.

Во второй части исследования алгоритм обучался прогнозированию того, какой объект - домашние ситкомы, такие как пульты, тарелки и мусорные баки - появится на сцене через пять секунд. Например, если дверца микроволновой печи открыта, вероятность того, что кружка появится рядом, относительно высока.

Их алгоритм пока недостаточно точен для Google Glass, но с соавтором Антонио Торралба, к.т.н. - профинансирован премией научных сотрудников факультета Google и Вондриком, работающим с доктором наук Google. стипендия - мы можем поспорить, что это там. Будущие версии алгоритма, предсказывает Вондрик, могут быть использованы для программирования роботов для взаимодействия с людьми или даже для обучения камер безопасности регистрироваться, когда человек падает или получает травму.

«Видео не похоже на книгу« Выбери свое собственное приключение », где можно увидеть все возможные пути», - говорит Вондрик. «Будущее по сути своей неоднозначно, поэтому интересно бросить вызов самим себе, чтобы разработать систему, которая использует эти представления, чтобы предвидеть все возможности».

$config[ads_kvadrat] not found