Die Transkriptionsplattform von AWS basiert jetzt auf generativer KI

AWS hat seinem Amazon Transcribe-Produkt neue Sprachen hinzugefügt und bietet generative KI-basierte Transkription für 100 Sprachen sowie eine Reihe neuer KI-Funktionen für Kunden.

Während der AWS re: Invent-Veranstaltung wurde angekündigt, dass Amazon Transcribe jetzt mehr gesprochene Sprachen erkennen und eine Anruftranskription starten kann. AWS-Kunden nutzen Transcribe, um ihren Apps in der AWS Cloud Sprach-zu-Text-Funktionen hinzuzufügen.

Das Unternehmen sagte in einem Blogbeitrag, dass Transcribe auf „Millionen Stunden unbeschrifteter Audiodaten aus über 100 Sprachen“ trainiert habe und selbstüberwachte Algorithmen verwende, um Muster menschlicher Sprache in verschiedenen Sprachen und Akzenten zu lernen. AWS stellte sicher, dass einige Sprachen in den Trainingsdaten nicht überrepräsentiert waren, um sicherzustellen, dass seltener verwendete Sprachen genauso genau sind wie häufiger gesprochene Sprachen.

Ende 2022 unterstützte Amazon Transcribe 79 Sprachen.

Laut AWS weist Amazon Transcribe in vielen Sprachen eine Genauigkeit von 20 bis 50 Prozent auf. Es bietet außerdem automatische Interpunktion, benutzerdefiniertes Vokabular, automatische Spracherkennung und benutzerdefinierte Vokabelfilter. Es kann Sprache in Audio- und Videoformaten sowie in lauten Umgebungen erkennen.

Der Rand wandte sich an AWS, um Informationen über die bisherige Genauigkeit und die für Amazon Transcribe verwendeten Basismodelle zu erhalten.

Laut AWS führen die Fortschritte bei Amazon Transcribe durch eine bessere Spracherkennung auch zu einer höheren Genauigkeit bei der Call Analytics-Plattform, die von seinen Contact-Center-Kunden häufig genutzt wird. Amazon Transcribe Call Analytics, das jetzt auch auf generativen KI-Modellen basiert, fasst Interaktionen zwischen einem Agenten und einem Kunden zusammen. AWS sagte, dass dies die Arbeit nach dem Anruf bei der Erstellung von Berichten reduziert und Manager die Informationen schnell lesen können, ohne das gesamte Protokoll durchgehen zu müssen.

Natürlich ist AWS nicht das einzige Unternehmen, das KI-gestützte Transkriptionsdienste anbietet. Otter stellt Verbrauchern und Unternehmen seit einiger Zeit KI-Transkriptionen zur Verfügung und hat im Juni ein Zusammenfassungstool veröffentlicht. Obwohl dies nicht ganz dasselbe ist, gab Meta bekannt, dass es an einem generativen KI-gestützten Übersetzungsmodell arbeitet, das fast 100 gesprochene Sprachen erkennt.

AWS kündigte außerdem zusätzliche Funktionen für sein Amazon-Personalisierungsprodukt an, die es Kunden ermöglichen, Produkte anzubieten oder ihnen Empfehlungen zu zeigen, beispielsweise wie Streaming-Dienste neue Sendungen basierend auf früheren Aktivitäten vorschlagen können. AWS hat Content Generation hinzugefügt, das Titel oder E-Mail-Betreffzeilen schreibt, um Empfehlungslisten thematisch zu verbinden.

source site

Leave a Reply