Может ли «сверхчеловеческая» нейронная сеть Google действительно определить местоположение любого изображения?

$config[ads_kvadrat] not found

РС DONI ft Ð¢Ð¸Ð¼Ð°Ñ Ð¸ Ð Ð¾Ñ Ð¾Ð´Ð° Ð Ñ ÐµÐ¼Ñ ÐµÑ Ð° клипа, 2014

РС DONI ft Ð¢Ð¸Ð¼Ð°Ñ Ð¸ Ð Ð¾Ñ Ð¾Ð´Ð° Ð Ñ ÐµÐ¼Ñ ÐµÑ Ð° клипа, 2014
Anonim

Поиск изображений стал проще, чем когда-либо. Но если вы пытаетесь найти изображение чего-то в месте, которое не совсем очевидно (например, не египетские пирамиды или гигантская скульптура большого пальца в Париже), это сложнее, чем вы думаете - даже с информацией о геолокации, основанной на том, что на изображении.

Введите Google инженер по имени Тобиас Вейанд и пара его коллег. По новой статье в журнале Arxiv (произносится как «архив»), трио построило машину глубокого обучения, способную точно определять местоположение практически любой фотографии, основываясь только на анализе ее пикселей.

Чтобы машина успешно выполняла такую ​​задачу, вы хотите дать ей возможность интуитивно понимать информацию на основе визуальных подсказок. Вы хотите, чтобы он думал, другими словами, как человек.

Вейанд приступил к разработке искусственной нейронной сети - машинной системы, предназначенной для имитации неврологических путей мозга, которые позволяют ему изучать, обрабатывать и вспоминать информацию, как мог бы человек. Эта новая система PlaNet, по-видимому, способна превзойти людей в определении местоположения изображений независимо от того, где они находятся - будь то в помещении или на улице, и демонстрирует любые уникальные или неописуемые визуальные подсказки.

Как работает PlaNet? Вейанд и его команда разделили карту мира на сетку, которая уложила более 26 000 квадратных фигур в разных регионах, в зависимости от того, сколько изображений было сделано в этих местах. Плотные места, где много снимков, помещаются на меньшем квадрате, в то время как большие, более отдаленные регионы могут разрезаться на большие квадраты.

Затем команда создала большую базу данных, уже геолокацию изображений - около 126 миллионов различных фотографий. Около 91 миллиона было использовано в качестве набора данных для обучения PlaNet, как выяснить, какое изображение можно поместить в какую сетку на карте мира.

Затем нейронной сети было поручено геолокации других 34 миллионов изображений из базы данных. Наконец, PlaNet был настроен на набор из 2,3 миллионов изображений с геотегами от Flickr.

Результаты, достижения? PlaNet может определить страну происхождения для 28,4 процента фотографий и континент для 48 процентов. Кроме того, система может точно определить местоположение на уровне улицы для 3,6 процента изображений Flickr и местоположение на уровне города для 10,1 процента.

И PlaNet лучше в этом, чем большинство людей - даже самые большие путешественники. Вейанд пригласил 10 хорошо путешествующих людей, чтобы они конкурировали с PlaNet в игре с указанием мест расположения картинок, найденных в Google Street View.

«В общей сложности PlaNet выиграла 28 из 50 раундов с медианной ошибкой локализации 1131,7 км, в то время как медианная ошибка локализации человека составила 2320,75 км», - пишут исследователи. «Этот небольшой эксперимент показывает, что PlaNet достигает сверхчеловеческой производительности в задаче геолокации сцен Street View».

Это по-настоящему? Действительно ли инженер Google разработал «сверхчеловеческий» А.И. система?

Когда дело доходит до геолокации изображений, возможно. И это не так уж и удивительно - точка зрения А.И. не для того, чтобы фундаментально подражать человеческому мозгу во всех отношениях, но чтобы преодолеть человеческие ограничения несколькими конкретными способами для решения гораздо более сложных задач. В этом смысле то, что пишут исследователи, является правдой.

Тем не менее, называть PlaNet «нейронной сетью» не так уж и сложно. Идеальная форма такого рода технологий могла бы узнать гораздо больше, чем геолокация изображений. А.И. системы способны писать сравнения и играть супер Марио, но это мелочи по сравнению с идеальной «мастерской» системой, которая может автоматически контролировать и поддерживать жизненно важные органы, управлять транспортной или энергетической инфраструктурой и многое другое.

$config[ads_kvadrat] not found