Die letzte Grenze der maschinellen Übersetzung

Als Google Translate im Jahr 2006 veröffentlicht wurde, stolperte ich als Achtklässlerin über Spanisch-Einführungen, und meine Lehrerin hatte wenig Grund, sich Sorgen zu machen, dass ihre Schüler es zum Betrügen nutzen würden. Es ist heute fast schwer, sich daran zu erinnern, aber die frühen maschinellen Übersetzungssysteme waren lächerlich schlecht. Sie könnten Ihnen die allgemeine Ausrichtung beispielsweise einer portugiesischen Website vermitteln, scheiterten jedoch häufig selbst bei grundlegenden Aufgaben. In einem Fall aus dem Jahr 2010 soll ein Angeklagter in einer von Google übersetzten Vorladung angewiesen worden sein, dem Gericht auszuweichen, statt dort zu erscheinen.

Die maschinelle Übersetzung wurde erst 2015 zu dem Moloch, den wir kennen, als Baidu sein groß angelegtes neuronales maschinelles Übersetzungssystem herausbrachte, das auf derselben Grundarchitektur basiert, die Chatbots wie ChatGPT heute verwenden. Google begann nicht lange danach, von einem statistischen Modell auf ein neuronales System umzusteigen, ebenso wie Konkurrenten wie Systran und Microsoft Translator. Es war ein großer Fortschritt: Dank der Magie von Google Translate können Touristen Kaffee bestellen und um Nippes feilschen; Ich habe in meinen eigenen veröffentlichten Übersetzungen gelegentlich Reverso Context, ein KI-Tool, verwendet. Dennoch hat sich ein Bereich der Übersetzung als bemerkenswert undurchdringlich erwiesen: die Literatur, die viele Forscher als „letzte Bastion“ der menschlichen Übersetzung bezeichnen.

Die meisten Studien kommen zu dem Ergebnis, dass neuronale maschinelle Übersetzungsmodelle laut Muttersprachlern nur etwa 30 Prozent der Romanauszüge – meist einfache Passagen – in akzeptabler Qualität übersetzen können. Sie haben Schwierigkeiten, weil die literarische Übersetzung im Grunde ein Akt der Annäherung ist. Die beste Option ist manchmal nicht die richtige, sondern die am wenigsten schlechte. Oftmals müssen Übersetzer zugunsten des größeren Wohls des Textes auf die wörtliche Bedeutung verzichten. Aber KI ist weniger geschickt darin, solche Kompromisse einzugehen und kreative Lösungen zu finden, die zwar technisch weniger korrekt sind, aber Aspekte eines Buches bewahren, die schwer zu quantifizieren sind: Stimme, Geist, Sensibilität. „Man wägt unterschiedliche Verluste und unterschiedliche Gewinne gegeneinander ab“, sagte mir Heather Cleary, eine Literaturübersetzerin aus dem Spanischen ins Englische. Eine Übersetzerin muss sich fragen: Was werde ich wirklich priorisieren?

Daniel Hahns jüngstes Buch, Catching Fire: Ein Übersetzungstagebuch, ist voller solcher Dilemmata. In dem Buch geht er durch seinen Übersetzungsprozess Jamás el Fuego Nunca, ein Roman der chilenischen Schriftstellerin Diamela Eltit. Ein Kapitel beginnt beispielsweise mit den folgenden vier Worten: „Frentista, estalinista, asesina loca.„ Konzentrieren wir uns auf Frentista als Fallstudie. Die wörtlichste Übersetzung (und die, die einige KI-Übersetzer anbieten) wäre „frontist“, was im Englischen grundsätzlich bedeutungslos ist. Hahn vermutet das Frentista soll ein Begriff für einen chilenischen Linken sein, und mit der Hilfe eines Übersetzerkollegen stellt er fest, dass es sich wahrscheinlich um einen abfälligen Begriff handelt, der sich auf eine bestimmte Anti-Pinochet-Guerillagruppe bezieht.

Catching Fire – Ein Übersetzungstagebuch

Von Daniel Hahn

Hahn muss sich fragen, was in diesem Fall wichtiger ist: Spezifität oder die Wahrung der Lesbarkeit und das Einfangen der Stimme des Autors. Er wirft ein paar Optionen durcheinander – „paramilitärisch“, „kommunistische Schläger“ – bevor er sich für „extremistisch“ entscheidet. Er stellt auch die Reihenfolge in den Vordergrund „stalinistisch“ (estalinistisch), was dem Leser ein Gefühl dafür gibt, mit welcher Art von Extremist er es zu tun hat. Dann gibt es noch das Problem, dass Spanisch eine geschlechtsspezifische Sprache ist; Im Original ist deutlich zu erkennen, dass der Sprecher eine Frau anspricht. Als Ergebnis rendert Hahn asesina loca als „verrückte Killerschlampe“. Die endgültige Fassung lautet „Stalinist. Extremist. Verrückte Killerschlampe.“ Es ist unvollkommen, aber es ist auch großartig.

Im Gegensatz dazu suggeriert Google Translate „Frontist, Stalinist, verrückter Mörder“. Der Satz ist zwar korrekt, aber ungeschickt und für nicht-chilenische Leser nahezu unverständlich. Ein spezielles Modell, wie es in den meisten Studien zur neuronalen maschinellen Übersetzung verwendet wird – vielleicht eines, das speziell auf chilenische Literatur trainiert wurde – würde sicherlich besser abschneiden. Aber es ist immer noch schwer vorstellbar, dass jemand zu etwas kommt, das Hahns Lösung nahekommt.

Wenn Sie menschliche Übersetzungen mit vergleichen bearbeitet Bei maschinellen Übersetzungen wird es jedoch plötzlich viel interessanter. Bei der Produktion kommerzieller Texte – beispielsweise einer Bedienungsanleitung für einen Drucker oder ein Küchengerät oder sogar eines Nachrichtenartikels – ist es üblich, dass Menschen eine rohe maschinelle Übersetzung bearbeiten und sie dann an die Druckmaschine senden. Dieses als Post-Editing (PE) bezeichnete Verfahren gab es schon lange bevor neuronale Netze für die Übersetzung eingesetzt wurden. Studien gehen unterschiedlich aus, aber die meisten kommen zu dem Schluss, dass es schneller und kostengünstiger ist, als von Grund auf zu übersetzen.

Seit der Veröffentlichung neuronaler Modelle, wie sie von Baidu und Google Translate verwendet werden, wird in einer Reihe von Forschungsarbeiten untersucht, ob der PE-Prozess auch auf Literatur angewendet werden kann. Wenn PE den Lesern präsentiert wird, schneidet es in einigen Studien vergleichbar ab wie vollständig menschliche Übersetzungen. (Bisher wurden in den meisten Untersuchungen europäische Sprachen verglichen, was die Schlussfolgerungen, die daraus gezogen werden können, einschränkt.)

Wie gut Sportunterricht abschneidet, wird von mehreren Faktoren beeinflusst, aber Studien zeigen, dass die Methode bei anspruchsvollen literarischen Werken tendenziell weniger gut und bei handlungsorientierten Romanen besser abschneidet. Ana Guerberof Arenas, außerordentliche Professorin für Übersetzungswissenschaft an der Universität Groningen in den Niederlanden, sagte mir, dass Maschinen eher über Werke mit mehr „Einheiten kreativen Potenzials“ stolpern – Metaphern, Bilder, Redewendungen und dergleichen. Hahns Frentista Das Dilemma ist ein Paradebeispiel: Je mehr Kreativität erforderlich ist, desto größer ist die Kluft zwischen einer menschlichen und einer maschinellen Lösung.

Natürlich kann der Posteditor eine schlechte Wiedergabe einer anspruchsvollen Passage nachbessern. Einige Studien deuten jedoch darauf hin, dass sich PE-Versionen in subtilen, lebenswichtigen Punkten von vollständig menschlichen Versionen unterscheiden. Antonio Toral, außerordentlicher Professor an der Universität Groningen, der häufig mit Guerberof Arenas zusammenarbeitet, erklärte mir ein Beispiel: „Bei der Übersetzung von Grund auf entscheidet der Übersetzer von Anfang an, wohin die Übersetzung geht. Ob ein Satz im Wesentlichen auf drei Arten übersetzt werden kann, entscheidet der Übersetzer.“ Aber bei der Nachbearbeitung „wird die Maschine diese Entscheidung treffen, und dann korrigieren Sie einfach eine der drei Entscheidungen.“ [machine-translation] System hat ausgewählt.“ Dies reduziert die Stimme des Übersetzers und könnte zu homogeneren Übersetzungen auf dem gesamten Literaturmarkt führen.

Es könnte auch zu einer inkonsistenten Stimme innerhalb einer einzelnen Übersetzung führen: Toral erzählte mir, dass Posteditoren bei Recherchen, an denen er mitgearbeitet hat, im Laufe der Arbeit immer seltener von der rohen maschinellen Übersetzung abgewichen seien. Aktuelle Untersuchungen unter der Leitung von Guerberof Arenas ergaben, dass PE-Übersetzungen im Vergleich zu rein menschlichen Übersetzungen durchweg weniger kreativ sind, was bedeutet, dass sie seltener von wörtlichen Übersetzungen abweichen und mit diesen Einheiten mit kreativem Potenzial weniger gut abschneiden. Die Unterschiede sind hier subtil, es geht eher um Zoll als um Meilen. Aber genau diese Feinheiten – Stimme, Rhythmus, Stil – können eine funktionale Übersetzung von einer großartigen unterscheiden.

Trotz dieser Nachteile veröffentlichen einige europäische Verlage aktiv PE-Titel. Nuanxed, eine Agentur, die PE-Übersetzungen für Verlage erstellt, hat seit ihrer Gründung vor zwei Jahren mehr als 250 Bücher fertiggestellt, die meisten davon kommerzielle Belletristik. Als ich im Oktober mit Robert Casten Carlberg, dem CEO von Nuanxed und einem seiner Mitbegründer, sprach, hörte es sich an, als ob es Nuanxed gut ginge. „Die Verlage, mit denen wir zusammenarbeiten, kommen zurück und wollen mehr tun, wenn sie einmal mit uns zusammengearbeitet haben“, sagte er mir. Vielleicht liegt das daran, dass Nuanxed die Mensch-Maschine-Übersetzung wirklich auf den Punkt gebracht hat; Carlberg beschrieb die Version seines Unternehmens als „breiter“ und „ganzheitlicher“ als die PE-Norm, wollte jedoch keine Einzelheiten besprechen. Ich halte es jedoch für wahrscheinlicher, dass der Qualitätsunterschied zwischen Sportunterricht und menschlicher Übersetzung den durchschnittlichen Leser handlungsorientierter kommerzieller Belletristik nicht stört. Wenn die Kunden zufrieden sind, ist es leicht zu verstehen, warum Nuanxed möglicherweise nicht so besorgt über die jüngsten wissenschaftlichen Untersuchungen ist, die darauf hinweisen, dass PE nicht optimal ist.

Die Veränderungen in der Branche bleiben nicht unbemerkt. „Kollegen werden zunehmend Post-Editing-Jobs von den Verlagen angeboten, die ihnen normalerweise Übersetzungsjobs anbieten würden“, erzählte mir Morten Visby, ein dänischer Literaturübersetzer und ehemaliger Präsident des European Council of Literary Translators’ Associations. In den Vereinigten Staaten hat die Authors Guild kürzlich eine Musterklausel für Buchverträge veröffentlicht, die es Verlagen verbieten würde, das Buch eines Autors maschinell zu übersetzen, es sei denn, der Autor stimmt zu. Aber solange die Übersetzung „im Wesentlichen menschliche Schöpfung umfasst“ und ein Übersetzer „die Kontrolle über jedes Wort in der Übersetzung hat, es überprüft und genehmigt“, müsste der Verlag keine Zustimmung zur Verwendung von KI „als Werkzeug“ einholen. Ich habe mehrere der Experten, mit denen ich gesprochen habe, gefragt, ob PE ihrer Meinung nach dieser Definition entspricht, und es war nicht überraschend, dass es keinen Konsens gab. (Mary Rasenberger, die Geschäftsführerin der Authors Guild, sagte mir, dass nach ihrem Verständnis ein Verlag für die PE-Übersetzung die Zustimmung des Autors einholen müsse.)

Obwohl einige europäische Verlage befürchten, dass die Veröffentlichung von PE-Titeln ihrer Marke schaden würde, glauben die meisten Experten, mit denen ich gesprochen habe, dass sich die Branche weiterhin in diese Richtung bewegen wird, sagte Visby. Auch wenn Nuanxed derzeit keine weiteren literarischen Arbeiten verfolgt, sagte Carlberg, dass sie dies tun würden, wenn sie eine Anfrage von einem Verlag erhalten würden und glauben, dass sie der Aufgabe gewachsen sind.

Der Zeitpunkt all dessen ist etwas ironisch. In den englischsprachigen Märkten gab es in den letzten Jahren einen echten Vorstoß, die Namen von Übersetzern auf Titelseiten anzubringen und allgemein für eine bessere Sichtbarkeit der Übersetzer zu sorgen. Wenn die Zahl der Berufstätigen in der Berufsausbildung zunimmt, wird die Rolle der Übersetzer wahrscheinlich noch unwichtiger werden. Das Übersetzen, ohnehin schon ein äußerst prekärer Beruf, könnte noch unsicherer werden: Visby sagte, dass er bei seiner Arbeit für Übersetzer festgestellt habe, dass Post-Editing-Aufträge im Gegensatz zu Übersetzungsverträgen menschlichen Übersetzern im Allgemeinen kein Urheberrecht gewähren und weniger Vorteile bieten .

Und doch teilen viele Übersetzer das Gefühl, dass all diese jüngsten Umwälzungen den Status der literarischen Übersetzung als unverzichtbare Kunst nur noch weiter gefestigt haben. KI kann vorhersagen, wie sich Proteine ​​falten. Es kann Medizinstudenten übertreffen und die Prüfung bestehen. Damit lässt sich eine plausible Version des von Johnny Cash gesungenen „Barbie Girl“ erstellen. Die Tatsache, dass die Literaturübersetzung – zumindest für sich genommen – nach wie vor völlig unzureichend ist, ist ein Beweis für die Schwierigkeit und den Wert dieses Berufs.


​Wenn Sie über einen Link auf dieser Seite ein Buch kaufen, erhalten wir eine Provision. Danke für die Unterstützung Der Atlantik.

source site

Leave a Reply