Спросите Сири: как Apple учит А.И. Название вашего любимого ресторана

$config[ads_kvadrat] not found

Настя и сборник весёлых историй

Настя и сборник весёлых историй
Anonim

Apple пытается установить барьер для языка и коммерции, который в настоящее время существует между пользователями и Siri: наличие A.I. на самом деле узнают названия местных предприятий. Свой план? Предоставляя системе доступ к информации о геолокации пользователей, чтобы она понимала рестораны, бутики и магазины бытовой техники в определенных районах.

Apple назвала эту технику «языковыми моделями на основе геолокации» или Geo-LM для краткости. А в четверг в блоге компании Machine Learning Journal команда Siri по распознаванию речи объяснила, что они будут использовать это, чтобы беспрепятственно получать информацию о вашем местном пиццерии вместо того, чтобы отвечать товарным знаком: «Извините, я не совсем поняла, «.

Siri - это система автоматического распознавания речи (ASR), которая состоит из двух блоков: акустической модели и языковой модели. Первая фиксирует слова и звуки, издаваемые, когда кто-то говорит, тогда как первая определяет, насколько вероятна определенная серия слов на языке, на котором говорят. По сути, Сири в лучшем случае делает обоснованное предположение, чтобы понять, о чем вы спрашиваете.

Apple определила два интересных недостатка. С одной стороны, определенные слова и имена, используемые для бизнеса, не используются в стандартном диалоге, поэтому они редко появляются в данных обучения системы и не могут сказать, как пользователи будут произносить эти слова или имена.

В попытке это исправить, Geo-LM предоставят Siri доступ к тому, что в блоге называется «названиями сущностей». Таким образом, голосовой помощник может лучше предсказать, когда вы говорите о ресторане, а не, скажем, о парке, который может поделитесь похожим именем.

Apple собрала свой Geo-LM, используя данные Бюро переписей США из 169 районов, что охватывает 80 процентов населения США. Они также создали глобальный Geo-LM для каждого региона, не охватываемого этими областями. Поэтому, если бы пользователь попросил Siri найти местный продуктовый магазин, который не охватывался данными переписи, он вместо этого использовал бы глобальный Geo-LM.

Хотя это может заполнить некоторые пробелы в Siri, Apple по-прежнему отстает от подобных Google, который в настоящее время обучает своего голосового помощника следующего поколения, Duplex, который способен делать телефонные звонки гиперреалистичным человеческим голосом. Хотя важно отметить, что Google также работает над улучшением способности помощника Google понимать различные акценты, диалекты и языки.

В сообщении блога не указано, когда будет выпущено это обновление. Но будем надеяться, что вы можете попросить Siri заказать пиццу Denino's Pizza, не заставив ее по ошибке позвонить вашему другу Дино.

$config[ads_kvadrat] not found