Neue Ergebnisse von Lingenio zu hybrider Übersetzung und Textanalyse

Publikationen und Tools für akademische und industrielle Forschung und Entwicklung

Lingenio stellt als Mitherausgeber das gerade  bei Springer erschienene Buch Hybrid Approaches to Machine Translation vor das erstmals für ein breiteres Publikum Ergebnisse der aktuell stark diskutierten gleichnamigen  Forschungsrichtung  zugänglich macht. Gleichzeitig stellt Lingenio den Band zu HyTra 5, dem bisher letzten Workshop der internationalen Workshop-Reihe HyTra  vor, die Lingenio mitveranstaltet, und demonstriert wie die Forschung von den frei zugänglichen Versionen der Lingenio-Textanalyse-Tools wie dem Lemmatisierer und der Satzanalyse im standardisierten CoNLL-Format profitiert.

Die Workshop-Reihe Hybrid Approaches to Translation (HyTra), u.a. entstanden aus dem mehrjährigen EU-Forschungsprojekt HyghTra der Lingenio GmbH mit der Universität Leeds zu hybrider maschineller Übersetzung, bietet der internationalen Forschung ein Forum, um die Kombination von Verfahren aus der  statistischen und der linguistischen Übersetzung zu diskutieren und neue Ansätze vorzustellen. Der erste Workshop fand 2012 in Avignon statt, der sechste wird noch dieses Jahr im Zusammenhang mit der weltweit wichtigsten Konferenz zur Computerlinguistik, der Coling, in Osaka, Japan stattfinden.

Contributed Volume: Hybrid Approaches to Machine Translation
Contributed Volume: Hybrid Approaches to Machine Translation

Das nun vorgestellte und von Lingenio mitherausgegebene Buch Hybrid Approaches to Machine Translation  aus dem Hause Springer enthält ausgewählte Beiträge der ersten drei Workshops der HyTra-Reihe, mit Vorschlägen aus unterschiedlichem Blickwinkel von renommierten Experten, u.a. aus der Forschung von Microsoft.

Damit bietet es auch für den fortgeschrittenen Laien in dem Gebiet einen kompakten Zugang zum aktuell spannendsten Thema der Maschinellen Übersetzung auf höchstem Niveau.

Fast zeitgleich sind die Proceedings zum bisher letzten Workshop der Reihe im Juni dieses Jahres in Riga erschienen. Sie enthalten u.a. Beiträge einer spannenden Panel-Diskussion zum Fortgang der Maschinellen Übersetzung aus akademischem und industriellem Blick mit wie üblich hochrangigen Vertretern des Fachs. Details finden sich auf der Homepage von Hytra5.

Moderne Übersetzung sieht heute u.a. statistische Übersetzung auf der Ebene von abstrakten Repräsentationen der Sätze, nicht der Sätze selber vor. Wichtige Voraussetzungen sind dafür die Bereitstellung der Grundformen der Wörter und syntaktische Analysen der Sätze. Das Lingenio-Sprachportal wwwtranslate.eu stellt beides mit den Funktionen Lemmatizer und Analysis zur Verfügung.

Lemmatisierer
Lemmatisierer

Mit letzterem können auch statistische Parser trainiert werden – unter Verwendung verschiedener Analyseformate. U.a. erhältlich ist das Standard-Format CoNLL. Ein Angebot für Forschung und Entwicklung.

Analyse im CoNLL-Format
Analyse im CoNLL-Format

Auf wwwtranslate finden sich auch zahlreiche andere Lingenio-Tools wie der GlossaryMaker, der Annotator, die Lingenio-Übersetzung. Ein Angebot auch für den Privatnutzer und ein Showcase für Unternehmen und Institutionen zur Integration von Lingenio-Text-Tools ins Intranet.

Glossary Maker
Glossary Maker