Technische Grundlage von translate

Die Übersetzungstechnologie, die der translate Produktreihe zugrunde liegt, basiert auf den Prinzipien der Slot-Grammar, einer ursprünglich von IBM entwickelten grammatischen Beschreibungsmethode. Die Grundidee der Slot-Grammar ist, dass jeder Satz und jedes Satzglied ein zentrales Element (den Kopf) und Modifikatoren hat. Für jeden Kopf kann bestimmt werden, welche Stellen (Slots) für Modifikatoren (Fillers) verfügbar sind. Die Slots können einerseits durch die Wortart bestimmt sein und andererseits durch das Wort selbst. So kann fast jedes Substantiv durch Adjektive modifiziert werden, aber nur bestimmte Substantive durch Ergänzungen mit der Präposition an, zum Beispiel: Nachricht an die Firma.

Die von einzelnen Wörtern abhängigen Slots müssen im Wörterbuch bei der Definition des Wortes angegeben werden, da sonst ausgangssprachliche Sätze nicht richtig analysiert und demzufolge auch nicht richtig übersetzt werden können.

Slots

Der zentrale Begriff des Slot-Grammar-Systems ist der Slot, zu deutsch freie Stelle oder Leerstelle.
Die Slot-Grammar geht davon aus, dass jedem Wort bestimmte Slots eigen sind. Dabei muss jede Bedeutung eines Wortes berücksichtigt werden. Denn beispielsweise hat das englische Wort house als Verb andere Slots als als Substantiv. Der Begriff Slot ist verwandt mit herkömmlichen Begriffen wie Ergänzung, Komplement, Objekt und Attribut.

Die Slots werden durch Satzglieder gefüllt, sog. Fillers, die einzelne Wörter oder auch ganze Sätze sein können. Zum Beispiel legt das Verb schenken fest, dass der Schenkende im Satz als Subjekt auftritt, der Beschenkte als Dativobjekt, das Verschenkte als Akkusativobjekt:

Er schenkt dem Kind ein Auto.

Slots, die zu einem bestimmten Wort gehören, werden im Wörterbuch bei eben diesem Wort vermerkt. Da ein Wort mehrere Slots haben kann, spricht man vom Slotrahmen (oder der Rektion) dieses Worts. Bei dem Verb schenken besteht der Slotrahmen aus Subjekt, Akkusativobjekt, Dativobjekt.

Slots können optional sein wie Akkusativ- und Dativobjekt bei schenken oder obligatorisch wie das Akkusativobjekt von verursachen. Optionale Slots können leer bleiben, obligatorische müssen immer gefüllt sein, damit ein vollständiger Satz entsteht.

Fillers

Slots können durch unterschiedliche Satzglieder gefüllt werden. Diese werden Fillers genannt und müssen für die jeweiligen Slots bei jedem Wort angegeben werden.

Bei einem Verb wie schenken sind Akkusativ- und Dativobjekt Nominalgruppen, also Satzglieder, deren Kopf ein Substantiv ist. Anders das Verb vergessen, dessen Akkusativobjekt-Slot außer durch Nominalgruppen auch durch Dass-Sätze und Infinitivsätze gefüllt werden kann:

Er hat das Prinzip vergessen.
Er hat vergessen, dass das Prinzip gilt.
Er hat vergessen, das Prinzip zu beachten.

Arbeitsweise von translate

translate zerlegt einen Text in einzelne Sätze (manchmal auch Bruchstücke von Sätzen), und geht dann satzweise vor. Dabei wird ein Satz zunächst in einzelne Wörter zerlegt, diese werden auf Grundformen zurückgeführt und im Wörterbuch nachgeschlagen. Den Wörtern werden ihre grammatischen Eigenschaften und die Möglichkeiten der Übersetzung zugeordnet.

Anschließend findet eine syntaktische Analyse des Satzes statt, bei der der Satz in seine einzelnen Bestandteile oder Satzglieder zerlegt wird. Die eigentliche Übersetzung findet dann in zwei Phasen statt, erst der lexikalische Transfer, der aufgrund der Übersetzungsbedingungen jedem Wort seine im Kontext gültige Übersetzung zuordnet, und dann der strukturelle Transfer, der für die korrekte Wortstellung in der Übersetzung sorgt und andere notwendige strukturelle Veränderungen vornimmt (siehe auch Zuordnung zwischen ausgangs- und zielsprachlichen Ergänzungen und Transformationen). Schließlich werden die korrekten Wortformen erzeugt, und die Übersetzung wird in ihre endgültige Form gebracht.

Zuordnung zwischen ausgangs- und zielsprachlichen Ergänzungen

Für die Übersetzung eines Satzes müssen nicht nur die Entsprechungen der Wörter in der Ausgangs- und der Zielsprache, sondern auch die jeweiligen Slotrahmen bekannt sein. Für die deutschen und englischen Slots (Ergänzungen) sind Standardentsprechungen festgelegt. So ist dem deutschen Akkusativobjekt das direct object im Englischen als Standardentsprechung zugeordnet. Zum Beispiel:

begleiten subject accusative object
accompany subject direct object

Anders als bei folgendem Beispiel:

bedürfen subject genitive object
require subject direct object

Zu Genitivobjekten gibt es keine standardmäßige Entsprechung.

Transformationen

Deutsche und englische Sätze, die Übersetzungen voneinander sind, unterscheiden sich oft in ihrer syntaktischen Struktur. Bei der Übersetzung werden deshalb in translate in solchen Fällen Transformationen angewendet, um die gewünschte strukturelle Veränderung zu bewirken.

Es gibt zwei Arten von Transformationen:

  1. Lexikalische Transformationen, die an konkrete lexikalische Einheiten gebunden sind. Die jeweiligen Transformationen sind im Wörterbuch von translate bei den betreffenden Wörtern bzw. Ausdrücken erfasst.
  2. Strukturelle Transformationen, die allgemeine strukturelle Unterschiede zwischen Deutsch und Englisch beschreiben. Sie sind Bestandteil der Transferkomponente von translate.

Strukturelle Transformationen

Verbendstellung in deutschen Nebensätzen gegenüber normaler Wortstellung im Englischen:

It is good that he has come.

Es ist gut, dass er gekommen ist.

Umschreibung mit do in englischen Fragesätzen:

Did you answer the letter?

Beantworteten Sie den Brief?

Umschreibung der Negation mit do:

I didn’t answer the letter.

Ich beantwortete den Brief nicht.

Vorangestellte Objekte im Deutschen:

Diesen Brief beantwortete ich nicht.

I didn’t answer this letter.

Konstruktionen mit Modalverben:

Er hatte das Buch nicht lesen wollen.

He hadn’t wanted to read the book.

Lexikalische Transformationen

Wörter oder Konstruktionen können nicht immer so übersetzt werden, dass sich Wortart und Slotrahmen genau entsprechen. In translate gibt es lexikalische Transformationen, mit deren Hilfe eine große Anzahl struktureller Unterschiede zwischen deutschen und englischen Konstruktionen behandelt werden können.

Manche Verben verlangen in der Ausgangssprache kein Objekt, wohl aber in der Zielsprache.

Beispiele dafür gibt es reichlich:

He golfed.

Er spielte Golf.

I bank at Barclay’s.

Ich habe ein Konto bei Barclay.

I inconvenienced him.

Ich bereitete ihm Umstände.

He hiccuped.

Er hatte den Schluckauf.

Eine englische Konstruktion mit prädikativem Adjektiv kann oft durch ein deutsches Verb wiedergegeben werden:

He is aware of the new situation.

Er weiß von der neuen Situation.

Einem englischen Subjekt kann ein deutsches Dativobjekt und dem Akkusativobjekt das Subjekt entsprechen, wobei bei like auch die Wortstellung unterschiedlich ist, bei lack nicht:

I like it that the vase is red.

Es gefällt mir, dass die Vase rot ist.

I lack money.

Mir fehlt Geld.

Bei Verben, die in transitiver Verwendung kausative Bedeutung haben, wie drop, erscheint im Deutschen lassen, wofür es im englischen Satz keine direkte Entsprechung gibt.

He dropped it.

Er ließ es fallen.

You should hear me out.

Sie sollten mich ausreden lassen.

Einige englische Konstruktionen mit Infinitiv werden im Deutschen besser durch ein Adverb wiedergegeben:

I like to read books.

Ich lese gerne Bücher.

She happened to find the book he lost last week.

Sie fand zufällig das Buch, das er letzte Woche verlor.

Einige Verben in Passivkonstruktionen werden im Deutschen im Aktiv-Reflexiv wiedergegeben.

He said that he was injured.

Er sagte, dass er sich verletzte.

Für die Wortdefinition in translate steht die häufigste lexikalische Transformation zur Verfügung, die have mit sein übersetzt.

She has walked to the house.

Sie ist zum Haus gegangen.

Literatur

Eberle, Kurt (2001)
Translation mismatches in lexically driven FUDR-based MT – Towards standardization of lexicon formalisms for MT
TALN, Tours, Juillet 2001, pp. 267- 276.

Eberle, Kurt (2001)
FUDR-based MT, head switching and the lexicon
MT Summit VIII, Santiago de Compostela, 18-22 September 2001.

Lehmann, Hubert (2002)
Integration von automatischer Übersetzung und Translation-Memorys
Präsentation
tekom-Jahrestagung, November 2002