Google hat sein Parrotron-Projekt vorgestellt, ein neuronales Netzwerk von Ende zu Ende Das transformiert atypische Sprachmuster in eine synthetische und fließende Sprache und richtet sich laut Unternehmensblog an Menschen mit Sprachbehinderungen.

Das Parrotron-Projekt konzentriert sich auf Sprache und erreicht diesen Prozess, ohne dass Text erzeugt und der Schritt der Erkennung von Sprachsignalen (wie die Bewegung der Lippen) weggelassen werden muss. Das Ziel ist, dass diese Technologie zwischen Menschen und mit automatischen Spracherkennungs-Engines (ASR) verwendet werden kann.

Dieses Tool ist Teil vonDas Euphonia-Projekt, das laut Google gezeigt hat, "dass Spracherkennungsmodelle erheblich verbessert werden können, um eine Vielzahl atypischer und disartischer Sprache besser zu transkribieren".Auch Google hat mit virtuellen Assistenten und Spracherkennungsdiensten begonnen, Tools, die diese Personen aufgrund ihrer Schwierigkeiten nicht verwenden können.

Wie Google in einer in seinem Blog über künstliche Intelligenz veröffentlichten Erklärung erklärt, wurde Parrotron in zwei Phasen unter Verwendung zweier paralleler Zusammenstellungen von Eingabe- / Ausgabestimmpaaren trainiert.

Zu diesem Zweck entwickelten die Forscher ein Modell zur Umwandlung von Sprache in Sprache für flüssige Standardsprache. Später passten sie das Modell an die atypischen Stimmmuster der Person mit Schwierigkeiten an. Sie griffen auf parallele Daten zurück, die automatisch mit einem Sprach-Text-Synthesesystem (TTS) abgeleitet wurden. Ein Text-zu-Sprache-System (TTS) wandelt normale Textsprache in Sprache um. andere Systeme erzeugen eine sprachliche symbolische Repräsentation als phonetische Transkriptionen in der Sprache. Eine der bekanntesten Personen, die diese Systeme verwendet haben, war der Wissenschaftler Stephen Hawking.

Google entwickelte mehrere Parrotron-Systemtests, darunter einen mit einem Google-Forscher und Mathematiker, Dimitri Kanevsky, russischer Herkunft und für Eltern mit normalem Hörvermögen zutiefst taub Muskeldystrophie.

Bei Dimitri wurden 15 Sprechstunden aufgezeichnet, mit denen das Basismodell an die spezifischen Nuancen seiner Rede angepasst wurde. Das Parrotron-System half ihm, sowohl von Forschern als auch vom Google ASR-System verstanden zu werden. Der Betrieb der Google ASR-Engine in der Parrotron-Ausgabe reduzierte die Wortfehlerrate signifikant von 89% auf 32%.

Aubrie steuerte 1,5 Stunden Sprachaufnahmen bei, die der Schlüssel zum Erfolg dieser Sprachtechnologie waren.

LEAVE A REPLY

Please enter your comment!
Please enter your name here

This site uses Akismet to reduce spam. Learn how your comment data is processed.