РС DONI ft Ð¢Ð¸Ð¼Ð°Ñ Ð¸ Ð Ð¾Ñ Ð¾Ð´Ð° Ð Ñ ÐµÐ¼Ñ ÐµÑ Ð° клипа, 2014
Поиск изображений стал проще, чем когда-либо. Но если вы пытаетесь найти изображение чего-то в месте, которое не совсем очевидно (например, не египетские пирамиды или гигантская скульптура большого пальца в Париже), это сложнее, чем вы думаете - даже с информацией о геолокации, основанной на том, что на изображении.
Введите Google инженер по имени Тобиас Вейанд и пара его коллег. По новой статье в журнале Arxiv (произносится как «архив»), трио построило машину глубокого обучения, способную точно определять местоположение практически любой фотографии, основываясь только на анализе ее пикселей.
Чтобы машина успешно выполняла такую задачу, вы хотите дать ей возможность интуитивно понимать информацию на основе визуальных подсказок. Вы хотите, чтобы он думал, другими словами, как человек.
Вейанд приступил к разработке искусственной нейронной сети - машинной системы, предназначенной для имитации неврологических путей мозга, которые позволяют ему изучать, обрабатывать и вспоминать информацию, как мог бы человек. Эта новая система PlaNet, по-видимому, способна превзойти людей в определении местоположения изображений независимо от того, где они находятся - будь то в помещении или на улице, и демонстрирует любые уникальные или неописуемые визуальные подсказки.
Как работает PlaNet? Вейанд и его команда разделили карту мира на сетку, которая уложила более 26 000 квадратных фигур в разных регионах, в зависимости от того, сколько изображений было сделано в этих местах. Плотные места, где много снимков, помещаются на меньшем квадрате, в то время как большие, более отдаленные регионы могут разрезаться на большие квадраты.
Затем команда создала большую базу данных, уже геолокацию изображений - около 126 миллионов различных фотографий. Около 91 миллиона было использовано в качестве набора данных для обучения PlaNet, как выяснить, какое изображение можно поместить в какую сетку на карте мира.
Затем нейронной сети было поручено геолокации других 34 миллионов изображений из базы данных. Наконец, PlaNet был настроен на набор из 2,3 миллионов изображений с геотегами от Flickr.
Результаты, достижения? PlaNet может определить страну происхождения для 28,4 процента фотографий и континент для 48 процентов. Кроме того, система может точно определить местоположение на уровне улицы для 3,6 процента изображений Flickr и местоположение на уровне города для 10,1 процента.
И PlaNet лучше в этом, чем большинство людей - даже самые большие путешественники. Вейанд пригласил 10 хорошо путешествующих людей, чтобы они конкурировали с PlaNet в игре с указанием мест расположения картинок, найденных в Google Street View.
«В общей сложности PlaNet выиграла 28 из 50 раундов с медианной ошибкой локализации 1131,7 км, в то время как медианная ошибка локализации человека составила 2320,75 км», - пишут исследователи. «Этот небольшой эксперимент показывает, что PlaNet достигает сверхчеловеческой производительности в задаче геолокации сцен Street View».
Это по-настоящему? Действительно ли инженер Google разработал «сверхчеловеческий» А.И. система?
Когда дело доходит до геолокации изображений, возможно. И это не так уж и удивительно - точка зрения А.И. не для того, чтобы фундаментально подражать человеческому мозгу во всех отношениях, но чтобы преодолеть человеческие ограничения несколькими конкретными способами для решения гораздо более сложных задач. В этом смысле то, что пишут исследователи, является правдой.
Тем не менее, называть PlaNet «нейронной сетью» не так уж и сложно. Идеальная форма такого рода технологий могла бы узнать гораздо больше, чем геолокация изображений. А.И. системы способны писать сравнения и играть супер Марио, но это мелочи по сравнению с идеальной «мастерской» системой, которая может автоматически контролировать и поддерживать жизненно важные органы, управлять транспортной или энергетической инфраструктурой и многое другое.
Эта нейронная сеть может сделать ваши размытые изображения идеальным качеством снова
Три компьютерных ученых создали нейронную сеть, которая способна восстанавливать поврежденные изображения в их полном разрешении без необходимости большого набора данных.
Этот AI нейронная сеть от Nvidia создает фотореалистичные поддельные изображения
Ученые-компьютерщики из Nvidia и Калифорнийского университета в Беркли создали нейронные сети, которые способны создавать реалистичные изображения с высоким разрешением, используя только базовую схему.
Coachella 2018: нейронная сеть создает линейку, которая звучит весело
В параллельной вселенной, где компьютеры называют популярные группы, Coachella 2018 будут озаглавлены Fanch, One of Pig и Lil Hack.