Microsoft Research изобретает технологию распознавания речи лучше, чем человек

$config[ads_kvadrat] not found

Мультики про машинки новые серии 2017 - Кто сильнее! Лучшие мультфильмы для детей /#мультик игра

Мультики про машинки новые серии 2017 - Кто сильнее! Лучшие мультфильмы для детей /#мультик игра
Anonim

Microsoft стала первой в мире компанией, которая разработала программное обеспечение для распознавания речи, более точное, чем люди. В опубликованной в понедельник статье «Достижение человеческого паритета в распознавании разговорной речи» программное обеспечение создавало записи, которые содержали на полпроцента меньше ошибок, чем человеческие усилия, что невероятно, если учесть, насколько хорошо люди понимают речь. Прорыв открывает двери для нового А.И. помощники, которые более точны, чем когда-либо прежде.

Впечатляет, как далеко продвинулись технологии за такое короткое время. Это было не так давно, что компьютерное распознавание речи было странной нишей, которая казалась безнадежно далекой. Посмотрите демонстрацию речевого программного обеспечения Windows Vista 2006 года:

Команда использовала тест Национального института стандартов и технологий (NIST) 2000, который использовался во всей отрасли для измерения надежности транскрипции речи. Разговор происходит между двумя участниками по телефону, по очереди, перед тем, как результирующий сценарий сравнивается и проверяется на предмет правописания в словаре.

В той части коммутатора, где два незнакомых человека говорят впервые, уровень человеческих ошибок составляет около 5,9 процента, в то время как в домовой части, где говорят два человека, которые знают друг друга, коэффициент ошибок составляет около 11,3 процента. Программное обеспечение Microsoft показало снижение ошибок примерно на 0,4%.

Прорыв поможет принести новые формы погружения А.И. В августе студент Джошуа Браудер снял обертку со своего чата DoNotPay, который может помочь бездомным людям получить бесплатную юридическую консультацию. В сочетании с достижениями в области распознавания легко представить себе будущее, в котором люди просят виртуального помощника помочь с жильем, регулярно общаясь со своим компьютером.

На этом этапе исследователи рассматривают, как распознавание речи с помощью A.I. может дать более разумные ответы. Sensay, детектирующий гнев А.И. из лаборатории, стоящей за Siri, использует расширенные возможности распознавания, чтобы определить, чувствует ли пользователь злость или растерянность, и изменить свои ответы в соответствии с ситуацией. Снятие барьера распознавания голоса, подверженного ошибкам, создает новые возможности для виртуальной помощи.

$config[ads_kvadrat] not found