Das Wort machte Text: 24 Stunden mit dem Google Instant Transcriber | Innovation

| |

Nichts ist langweiliger, als unsere Gespräche in Texte umzuwandeln. Dies ist die Unannehmlichkeit, die die Instant Transcription-Anwendung von Google zu umgehen versucht. Obwohl seine ursprüngliche Funktion anders ist: Es ist aus der Vereinigung des Technologieriesen und der Universität von Gallaudet (Washington, USA) hervorgegangen, die sich auf die Erstellung von Lernwerkzeugen für Menschen mit Hörproblemen spezialisiert hat. Wir haben es einen ganzen Tag lang versucht.

Der Mechanismus ist sehr einfach: Sobald Sie darauf zugreifen, beginnt die Transkription. Im harten Leben des Selbständigen strahlen persönliche Gespräche durch Abwesenheit aus, daher wenden wir den Transkribenten auf das Fernsehen an. Kann jemand 24 Stunden lang sprechen? Wenn Sie ein Tertullianer sind, ja. Wir drehen die Lautstärke auf, um das blumige Verb dieser unaufhaltsamen kathodischen Titanen aufzunehmen. Das erste, was wir beobachten, ist, dass es schneller und zuverlässiger ist als der chaotische Transkriptor, den Fernsehgeräte enthalten. Außerdem, und das ist ein großer Vorteil für ihn, hat er eine ehrlich gesagt bessere Schreibweise mit Pronomenakzentuierung.

Wir gingen auf die Straße, um es zu versuchen. Hier ist eine der interessantesten Funktionen des Transkribenten: Es ist überraschend, dass er alle Arten von Geräuschen jenseits der verbalen Sprache identifizieren kann. In Google nennen sie es KlangereignisseKlangereignisse. Auf der Straße werden wir “horn”, “crowd” oder “wind” sehen, wenn, wie an dem Tag, an dem wir es versucht haben, der Hirsch aufsteigt, während wir den Kauf getätigt haben. Es erkennt auch bellende Hunde oder sich bewegende Fahrzeuge (obwohl es nicht zwischen einem Auto und einem U-Bahn-Auto unterscheidet).

Es ist für ihn schwierig, den Klang einer Bar von dem der Masse zu unterscheiden, aber es entstehen paradoxe Situationen. Ein Server, bei dem es sich um einen Manza handelt, ließ sein Handy fallen und der Transkriptor übersetzte es als “Klopfen an der Tür”. Aus eschatologischer Sicht behaupten die Entwickler, das Geräusch der Windigkeit zu erkennen. Die Anwendung hat jedoch ein Problem: Sie benötigt Wi-Fi, um ordnungsgemäß zu funktionieren. Wenn Sie also nicht das Signal an die Bar unter Ihrem Haus erhalten oder den Schlüssel für die Einrichtung haben, wird die Transkription kompliziert.

Vermutlich funktioniert die künstliche Intelligenz hinter der Anwendung am besten mit Englisch, aus syntaktischen Gründen und weil die Computerlinguistik in der angelsächsischen Welt weiter entwickelt ist. Im Spanischen zum Beispiel ist es schwierig, die Ausdrucksabsicht der Phrasen zu erkennen, besonders wenn es um Fragen geht. Die Anwendung arbeitet mit 70 Sprachen und Sie können eine primäre und eine sekundäre Sprache auswählen.

Natürlich ist es mit Spanisch optimal und grenzt je nach Sprecher an Perfektion, aber dasselbe passiert nicht mit den anderen Sprachen des Staates. Wir haben es mit Katalanisch versucht und es hat offensichtliche Probleme, insbesondere die unterschiedlichen Dialekte zu erkennen: Wir verbinden uns mit TV3 und da einer der Tertullianer von Mallorca war, war die resultierende Transkription typischer für das kaputte Telefonspiel. Es ist wahr, dass es nicht einfach war, denn es ging um die Vor- und Nachteile von Klitorissaugern. In dieser Hinsicht sollte beachtet werden, dass die Anwendung eine Funktion zum Zensieren der schlechten Wörter hat.

Im Fernsehen machen sie mit dem Rasseln der Investitur und den Nachwahlpakten weiter. Endlich eine Oase der Ruhe namens Werbung. Wieder sind wir überrascht, wie die Anwendung nonverbale Sprache interpretiert. Eine so abstrakte Werbung für eine Kolonie mit geflügelten Pferden, Baumwollwolken und Frauen und leichten Männern in der Kleidung läuft auf “klassische Musik” hinaus.

Ein Server ließ sein Handy fallen und der Transkriptor übersetzte es als “Klopfen an der Tür”

Nach stundenlangen Diskussionen versuchen wir, die weisen Worte unserer kathodischen Freunde einem Textverarbeitungsprogramm zu übermitteln, um zwischen so viel Klatsch und Tratsch Klarheit zu schaffen. Problem. Die Anwendung verhindert, dass Sie das Transkript exportieren. Wenn Sie dies möchten, müssen Sie den vollständigen Text auswählen und das klassische “Ausschneiden und Einfügen” angeben. Ein kleines aber für den Mann, ein großes Problem für den Journalisten.

Die Benutzeroberfläche ist sehr einfach und sehr übersichtlich: Sobald Sie darauf zugreifen, beginnt die Transkription. Sie können sowohl die Schriftgröße als auch den Hintergrund steuern. Standardmäßig transkribiert es in Weiß auf Schwarz, etwas müde für die Augen, wobei das Schwarz auf Weiß allen Lebens vorzuziehen ist. Ein blauer Kreis in der Ecke kennzeichnet die Stärke des Klangs, den das Mikrofon empfängt, damit Sie es näher an die Quelle bringen können. Mit einer Schaltfläche können Sie Anmerkungen hinzufügen.

Bei jeder Verwendung wird der Zeitpunkt des Transkriptionsbeginns markiert, der maximal 72 Stunden lang archiviert wird. Aus diesem Grund wird der Tag, an dem die Aufzeichnung erfolgt, nicht gemeldet. Theoretisch ist ein derart kurzer Speicherplatz darauf zurückzuführen, dass Google nachweisen möchte, dass es nicht versucht, die transkribierten Daten in seinen Algorithmen zu verwenden. Außerdem können alle Dateien bei Bedarf automatisch gelöscht werden.

Urteil

Es ist ohne Zweifel eine große Hilfe für Menschen mit Hörproblemen, die die von uns gewohnten Transkriptionisten, beispielsweise im Fernsehen, erheblich verbessert. Es ist jedoch für die Öffentlichkeit ohne Hörprobleme problematisch: Das wichtigste ist die Notwendigkeit, über WLAN zu verfügen, um ordnungsgemäß zu funktionieren. eine sekundäre – wenn auch nicht geringfügige – ist die Unfähigkeit, Transkripte direkt zu exportieren.

.

Previous

Kinderlotterie 2020: Datum, Uhrzeit und Ort der Ziehung | Nachrichten

30 verletzt, als maskierte Schläger in JNU | Indien Nachrichten

Next

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.