Deutsch

Post-Editing unter die Lupe genommen

Machine Translation – Teil 3

TRANSLATE
Post-Editing unter die Lupe genommen

Im ersten Teil unserer dreiteiligen Blog-Serie „Machine Translation“ sind wir auf die Vorbereitung eines maschinellen Übersetzungsprozesses sowie die Faktoren, die maschinelle Übersetzungsergebnisse beeinflussen, eingegangen. Im zweiten Teil zu "Machine Translation" stellten wir die Merkmale und Eigenschaften von generischen und trainierbaren Engines vor. In diesem letzten Beitrag erläutern wir anhand einiger Beispiele die Notwendigkeit des Post-Editings von maschineller Übersetzung und erklären dabei, welche Aspekte es zu beachten gilt.  

Irren ist maschinell

Verschiedene Faktoren, wie die Art und Qualität des Ausgangstextes, Sprachrichtungen sowie die Wahl der Engine, wirken sich unterschiedlich auf maschinelle Übersetzungsergebnisse aus. Jedoch sind diese Faktoren nicht die einzigen Gründe für fehlerhafte Übersetzungen bei Machine Translation, denn grundsätzlich fehlen der Maschine einige Fähigkeiten, die für Humanübersetzer selbstverständlich sind. So können maschinelle Übersetzungssysteme Segmente immer nur unabhängig voneinander bearbeiten und sie nicht zusammen in einen Kontext setzen. Das wird besonders dann zum Problem, wenn im Ausgangstext lexikalische oder strukturelle Mehrdeutigkeiten vorhanden sind. Im Beispielsatz „Die Türen schließen.“ kann die Maschine nicht erkennen, ob es sich um eine Handlungsanweisung im imperativischen Infinitiv oder um das Resultat einer Handlungsanweisung handelt. Es gibt daher zwei mögliche Übersetzungen ‒ z. B. im Englischen „Close the doors.“ und „The doors close.“ ‒, zwischen denen die Maschine wählen muss, ohne den Kontext zu kennen. Ein Humanübersetzer kann dagegen sofort über den Kontext des restlichen Textes darauf schließen, welche Übersetzung an dieser Stelle die richtige ist. Ein weiteres Beispiel: die Kapitelüberschrift aus einer Betriebsanleitung "Reinigen und warten". Hier kann es durchaus vorkommen, dass bei Anwendung von maschineller Übersetzung, aufgrund des fehlenden Kontextes "warten" mit "wait" anstelle von "maintenance" übersetzt wird.

Des Weiteren haben maschinelle Übersetzungssysteme Schwierigkeiten bei der Generierung von pragmatischen Übersetzungen, also Übersetzungen, die nicht wörtlich den Ausgangstext widerspiegeln. Das folgende Beispiel soll dies veranschaulichen:

Ausgangstext:                   Führen Sie die Testvorbereitung gemäß dem Leitfaden durch.
Machine Translation:       Perform the test preparation according to the guideline.
Humanübersetzer:           Prepare the test according to the guideline.

Zwar ist die maschinelle Übersetzung in diesem Beispiel per se nicht falsch, jedoch ist ein Humanübersetzer in der Lage, diesen Satz sinngemäß zu übersetzen. Da sich das Wort „prepare“ („vorbereiten“) so nicht im Ausgangstext wiederfindet, ist das maschinelle Übersetzungssystem auch nicht in der Lage, eine solche pragmatische Übersetzung zu erzeugen.

Post-Editing als Notwendigkeit bei maschinellen Übersetzungen

Mit dem Wissen, dass Machine Translation nicht unfehlbar ist, sind die maschinellen Übersetzungsergebnisse stets als Rohdaten zu verstehen, die anschließend editiert und korrigiert ‒ genauer gesagt: „posteditiert“ ‒ werden müssen. Hierbei wird zwischen zwei Arten unterschieden: „Light Post-Editing“und „Full Post-Editing“. In beiden Fällen überprüft ein qualifizierter Übersetzer das maschinelle Übersetzungsergebnis in Relation zum Ausgangstext.
Beim Light Post-Editing besteht kein Anspruch, eine Übersetzung zu erzielen, die qualitativ mit einer Humanübersetzung vergleichbar ist. Das Ergebnis sollte verständlich und korrekt sein, muss stilistisch jedoch nicht ansprechend sein. Gemäß der ISO 18587:2017 „Übersetzungsdienstleistungen ‒ Posteditieren maschinell erstellter Übersetzungen ‒ Anforderungen“ ist das Anpassen von fach- oder kundenspezifischer Terminologie nicht Gegenstand des Light Post-Editing. Diese Form des Post-Editing dient vorrangig dazu, den Inhalt eines Textes zu erfassen, und eignet sich somit eher für interne Zwecke oder kurzlebige Texte, die nicht veröffentlicht werden sollen.

Beim Full Post-Editing hingegen soll das Übersetzungsergebnis mit einer Humanübersetzung gleichkommen. Der Posteditor muss hier, den maschinell übersetzten Text, neben inhaltlichen Anpassungen und einfachen, verständlichen Formulierungen auch Grammatik und Stil, ggf. gemäß Kundenanforderungen, anpassen.

Zwar gibt es beim Post-Editing Überschneidungen zum klassischen Übersetzen und Korrekturlesen, jedoch werden zusätzliche Kompetenzen von Posteditoren gefordert. Anders als beim Übersetzen soll beim Post-Editing mittels Fehlerkorrekturen die Qualität von maschinellen Übersetzungsergebnissen verbessert werden. Das Löschen von Übersetzungsvorschlägen, um eine Neuübersetzung einzufügen, ebenso wie übermäßige Anpassungen (Over-Editing) sind hier der falsche Ansatz. Darüber hinaus sollten Posteditoren mit den linguistischen Eigenschaften von Machine Translation vertraut sein: Während Rechtschreib- und Flüchtigkeitsfehler kaum auftreten, weisen maschinelle Übersetzungen oft syntaktische Unstimmigkeiten sowie Terminologiefehler auf, die selbst dem unerfahrensten Übersetzer nicht passieren würden.

Im ersten Teil unserer Blogserie haben wir bereits erwähnt, dass der Durchsatz beim Post-Editing deutlich höher sein kann, wodurch die erwünschten Zeit- und Kostenersparnisse erzielt werden können. Die tatsächlichen Zeitersparnisse variieren in der Realität jedoch stark; laut einigen Anbietern sind die Ersparnisse bis zu 50 % höher als bei herkömmlichen Übersetzungen, während in verschiedenen Forschungsprojekten teilweise gar keine signifikanten Produktivitätssteigerungen zu verzeichnen waren. In einigen Fällen berichten Übersetzer sogar, dass ihre Produktivität gesunken ist. Die Faustregel ist hier: je höher die Qualität der maschinellen Übersetzung, desto geringer der Aufwand beim Post-Editing.

 

Sprachliche Regulierung schafft Abhilfe

Obwohl einige Fehler von maschinellen Übersetzungen den Systemen selbst zugrunde liegen, so kann doch aktiv dazu beigetragen werden, die Qualität von maschinellen Übersetzungen zu beeinflussen. Neben der Wahl der Engine spielen die Art und Qualität der Ausgangstexte eine entscheidende Rolle. Die häufigsten Fehler, dazu zählen Terminologiefehler und syntaktische Übersetzungen (Wort-für-Wort-Übersetzungen), stehen in direktem Zusammenhang mit Mehrdeutigkeiten und/oder kontextlosen Begriffen und Phrasen. Zudem lässt sich beobachten, dass maschinelle Übersetzungssysteme einfache und verständliche Sätze häufiger korrekt übersetzen als lange, verschachtelte Sätze mit unübersichtlichen Bezügen. An dieser Stelle lassen sich durch Regulierungen der Ausgangstexte, wie es beispielsweise in der Technischen Dokumentation über Redaktionsleitfäden geregelt ist, maschinelle Übersetzungsergebnisse signifikant verbessern. 

Um den Aufwand beim Post-Editing von maschinellen Übersetzungen so gering wie möglich zu halten, ist es daher ratsam, im Vorfeld die Qualität des Ausgangsmaterials ‒ dazu zählt der Ausgangstext selbst, aber auch vorhandene Translation Memories sowie Terminologielisten ‒ zu prüfen und gegebenenfalls anzupassen. Als Dienstleister für Informationsprodukte setzen wir auf eine ganzheitliche Betrachtung des Informationsprozesses, angefangen bei der redaktionellen Erstellung der Ausgangstexte bis zur Optimierung unserer Übersetzungsprozesse. Gerne prüfen wir Ihre Dokumente und beraten mit Ihnen anschließend, welche Lösung für Sie die beste ist.

Unser Fazit

Machine Translation ist mittlerweile aus der Übersetzungsbranche nicht mehr wegzudenken und zusammen mit Post-Editing bereits in bestehende Übersetzungsprozesse eingegliedert. Jedoch variieren die Erfahrungen mit dem Einsatz von Machine Translation stark, da viele Faktoren die Qualität von maschinellen Übersetzungsergebnissen bestimmen. Wir haben daher abschließend eine Checkliste der vier Faktoren erstellt, die beim Einsatz von Machine Translation berücksichtigt werden sollten.

  1. Wahl der Engine
    Generische Engines sind günstig und decken eine große Bandbreite an Fachgebieten ab, sind jedoch auch fehleranfälliger. Trainierbare Engines sind speziell auf ein Fachgebiet oder auf die Anforderungen eines Kunden trainiert. Sie können spezifische Inhalte somit verlässlicher übersetzen und durch sogenanntes Re-Training "aus Fehlern lernen". Allerdings erfordern sie daher einen höheren Aufwand in Bezug auf die Aufbereitung der Trainingsdaten sowie auf das initiale und wiederkehrende Training.
     
  2. Art des Ausgangstextes
    Texte mit wiederkehrenden Elementen sowie einfachen Satzstrukturen, wie beispielsweise Betriebsanleitungen oder Online-Hilfen, eignen sich eher als kreative oder literarische Texte.
     
  3. Qualität des Ausgangsmaterials
    Die Maschine ist nicht in der Lage, Fehler im Ausgangstext zu korrigieren. Darüber hinaus können keine Kontextbezüge hergestellt werden. Je länger und verschachtelter ein Satz ist, desto höher ist die Wahrscheinlichkeit, dass das System die Bezüge nicht mehr korrekt wiederherstellen kann. Die Einbindung von Leitfäden in den redaktionellen Prozess ermöglicht es nicht nur, konsistente und verständliche Ausgangstexte zu erzeugen, sondern begünstigt eben dadurch auch maschinelle Übersetzungen.
    Darüber hinaus sollten sowohl für das Training des maschinellen Übersetzungssystems als auch für Qualitätssicherungsmaßnahmen bereits bestehende Übersetzungsressourcen, wie das Translation Memory und Terminologiedatenbanken, gut gepflegt sein.
     
  4. Sprachpaare
    Bei Sprachen, die sich in ihrer grammatikalischen Struktur ähneln (z. B. Deutsch und Englisch), erzielen maschinelle Übersetzungssysteme in der Regel bessere Ergebnisse als bei Sprachen, die sich in ihrer Struktur stark unterscheiden (z. B. Russisch und Japanisch).

Die Vorbereitung eines maschinellen Übersetzungsprozesses scheint aufwändig. Jedoch können mit der richtigen Vorbereitung Kosten und Zeit gespart werden. Es lohnt sich daher, das Thema Machine Translation ganzheitlich zu betrachten und bereits bei der Erstellung von Ausgangstexten mit struktueller Vorarbeit gemäß Redaktionsleitfäden sowie Terminologiemanagement den Grundstein für einen erfolgreichen maschinellen Übersetzungsprozess zu legen. Darüber hinaus entwickeln sich maschinelle Übersetzungssysteme stetig weiter und bieten somit immer häufiger korrekte Übersetzungen. Auch wenn sie in naher Zukunft den Menschen nicht ersetzen werden, so können wir doch ihre Stärken effizient einsetzen.

Katrin Grzimek
Autor:
Blog post Katrin Grzimek