Das goldene Zeitalter des Diktats

KI hat die Spracherkennung drastisch verbessert. Es ist eine Technologie, mit der Forscher lange zu kämpfen haben.

Illustration von The Atlantic. Quelle: Getty.

Das ist atlantisch Intelligence, eine limitierte Serie, in der unsere Autoren Ihnen dabei helfen, sich mit künstlicher Intelligenz und einem neuen Maschinenzeitalter vertraut zu machen. Hier anmelden.

Computer kamen Ihnen vielleicht einst magisch vor, Portale zu einer unvorhersehbaren Weite des Wissens und der Unterhaltung. Dann wurden sie allgegenwärtig, vielleicht ein wenig langweilig und manchmal erschreckend. Obwohl die künstliche Intelligenz mit vielen eigenen Problemen behaftet ist, ist es ihr gelungen, einen Teil der Begeisterung wiederzubeleben, die der digitalen Technologie in den letzten Jahren gefehlt hat – und das nicht nur in ihren bekanntesten Anwendungen.

Nehmen wir zum Beispiel das Diktat. Wie meine Kollegin Caroline Mimbs Nyce kürzlich in einem Artikel schrieb, hat KI kürzlich drastische Verbesserungen bei der Spracherkennung ermöglicht und damit eine Technologie vorangetrieben, mit der Forscher in der Vergangenheit Schwierigkeiten hatten. „Lange Zeit machten wir schrittweise Fortschritte, und dann wurde es plötzlich viel schneller besser“, erzählte ihr Mark Hasegawa-Johnson, Professor für Elektro- und Computertechnik an der University of Illinois in Urbana-Champaign .

Versuchen Sie, die Diktierfunktion Ihres Telefons zu aktivieren und Ihre nächste Nachricht zu sprechen, anstatt sie einzutippen. Sie könnten sich einfach eine hilfreiche neue Angewohnheit aneignen – und Sie hätten es der KI zu verdanken.

— Damon Beres, leitender Redakteur


ein Bild eines Mundes mit Textblasen
Illustration von The Atlantic. Quelle: Getty.

Sie müssen nicht mehr tippen

Von Caroline Mimbs Nyce

Als kleines Mädchen befand ich mich oft im Keller meiner Familie und kämpfte mit einem Drachen. Ich habe nicht gespielt oder so getan, als ob: Mein Drache war eine Sprachdiktiersoftware für Unternehmen namens Dragon Naturally Speaking, die 1997 auf den Markt kam (und von meinem Vater, einem frühen Anwender, gekauft wurde).

Als Kind war ich von der Idee eines Computers fasziniert, der für einen tippen kann. Die Prämisse war einfach: Setzen Sie ein Headset auf, rufen Sie die Software auf und sprechen Sie. Ihre Worte würden ein Dokument auf dem Bildschirm füllen, ohne dass Ihre Hände die Demütigung des tatsächlichen Tippens ertragen müssten. Aber ganz gleich, wie sehr ich mich zu artikulieren versuchte, ganz gleich, wie langsam ich sprach, das Programm registrierte meine kleine, hohe Stimme einfach nicht. Die Seite blieb größtenteils leer und gelegentlich wurden die falschen Wörter transkribiert. Irgendwann war ich frustriert, gab auf und ging mit etwas anderem spielen.

In den vergangenen Jahrzehnten hat sich viel verändert. Die Spracherkennung – der Informatikbegriff für die Fähigkeit einer Maschine, das Gesagte genau zu transkribieren – verbessert sich rasant, teilweise dank der jüngsten Fortschritte in der KI. Heute bin ich ein Sprach-SMS-Experte und diktiere Freunden und Familie oft unangemessen lange Absätze auf meinem iPhone, während ich mit meinem Hund spazieren gehe oder Auto fahre. Mittlerweile spreche ich ständig in die Textbox meines Telefons, einfach weil ich Lust dazu habe. Apple hat letztes Jahr seine Diktiersoftware aktualisiert, und es ist großartig. Das gilt auch für viele andere Programme. Der Traum von der präzisen Spracherkennung, der schon lange nicht nur im Keller meiner Eltern, sondern von Menschen auf der ganzen Welt gehegt wurde, geht in Erfüllung. Der Drache wurde fast getötet.

Lesen Sie den vollständigen Artikel.


Was Sie als Nächstes lesen sollten


PS

Früher diese Woche, Der Atlantik veröffentlichte einen Artikel des Autors SI Rosenbaum über Implantate, die es dem menschlichen Gehirn ermöglichen, mit Computern zu kommunizieren. KI spielt eine wesentliche Rolle, indem sie neuronale Signale in Befehle übersetzt, die beispielsweise die Bewegung eines Mauszeigers ermöglichen. Vielleicht ein weiterer ermutigender Einsatz der Technologie – obwohl, wie Rosenbaum berichtet, noch große Herausforderungen zu bewältigen sind.

– Damon

source site

Leave a Reply