Print-Logo Deutscher Zukunftspreis

Preisträger 2001

Sprachverstehende Computer

Sprachverstehende Computer als Dialog- und Übersetzungsassistenten

Prof. Dr. rer. nat. Wolfgang Wahlster
Deutsches Forschungszentrum für Künstliche Intelligenz, Saarbrücken

Prof. Dr. rer. nat. Wolfgang Wahlster

Die umständliche Bedienung per Maus, Tastatur oder berührungsempfindlichem Display hindert viele Menschen am Benutzen von Computern. Ist es möglich, mit dem Rechner stattdessen zu reden wie mit einem Menschen?

Wolfgang Wahlster und seinem Team am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) gelang mit der Entwicklung des Verbmobil-Systems für automatische Übersetzungen von gesprochenen Dialogen ein Durchbruch bei der Spracherkennung. Wolfgang Wahlster ist Wissenschaftlicher Direktor und Mitglied der Unternehmensleitung des DFKI.

Dolmetscher für die Hosentasche

Fortschritte auf dem Gebiet der Sprachtechnologie machen den Computer zum allgegenwärtigen Assistenten und Dialogpartner, der menschliche Alltagssprache versteht und selbst auch spricht. Das Verbmobil-System erkennt gesprochene Spontansprache, analysiert die Eingabe, übersetzt sie in eine Fremdsprache, erzeugt einen Satz und spricht ihn aus.

Damit kann etwa ein Mobiltelefon im Ausland zur Übersetzungshilfe werden. Dazu wird eine Dreierkonferenz zwischen zwei Menschen, die unterschiedliche Sprachen sprechen, und dem Verbmobil-System als Dolmetscherhilfe geschaltet. Das System übersetzt – fast ohne Verzögerung – wechselweise zwischen den Gesprächspartnern.

Die Technologie, die die Forscher dafür entwickelt haben, ist aufwendig und komplex. Zunächst wird das akustische Signal durch Spracherkennung symbolisch dargestellt. Verfahren der Sprachanalyse sowie des Sprachverstehens unterziehen es dann einer inhaltlichen Interpretation. Anschließend erfolgt die Erzeugung der Sprachausgabe für die Antwort des Systems.

Der Sinn muss erkannt werden

Da sich dieselben Äußerungen von Sprecher zu Sprecher, aber auch beim gleichen Sprecher in verschiedenen Situationen und Zusammenhängen, stark unterscheidet, kann ein Computer einen fließenden Dialog nicht ohne Zusatzwissen in eine eindeutige Wortfolge überführen. Die Forscher statteten das System mit dem dafür nötigen Zusatzwissen aus. Es gewährleistet auch, dass der automatische Dolmetscher den Sinn mehrdeutiger Äußerungen aus dem Gesprächskontext heraus erkennt. Der Kern der Innovation des Projektes besteht in der semantischen Integration und der zuverlässigen Auswahl der korrekten Bedeutung und Übersetzung. Dafür haben die Forscher in Verbmobil 69 Softwarebausteine zusammengeführt.

Die Ergebnisse des Forschungsprojekts haben Deutschland bei der Sprachtechnologie in eine internationale Spitzenstellung gebracht. Bis 2006 sind aus dem Projekt 42 Spin-off-Firmen hervorgegangen und über 1.200 neue Arbeitsplätze entstanden. Zusammen mit Industriepartnern konnte das DFKI mehr als 80 Patente anmelden. Inzwischen nutzen etliche Millionen Menschen täglich Sprachdialogsysteme – das Marktvolumen beträgt rund zwei Milliarden Euro.

Das Vorschlagsrecht zum Deutschen Zukunftspreis obliegt den führenden deutschen Einrichtungen aus Wissenschaft und Wirtschaft sowie Stiftungen.

Das Projekt „Sprachverstehende Computer als Dialog- und Übersetzungsassistenten“ wurde vom Bundesministerium für Bildung und Forschung und von der Karl Heinz Beckurts-Stiftung vorgeschlagen.

"Praktisch bedeutet die Realisierung von Verbmobil und seiner Derivate, dass wir die ersten Systeme geschaffen haben, die von dem sprachlichen Eingabesignal bis hin zur akustischen Sprachausgabe ein Sprachverständnis zeigen."

Prof. Dr. rer. nat. Wolfgang Wahlster

Fragen an den Nominierten

Erklären Sie uns bitte die Entwicklung des Projektes in einzelnen Schritten und stellen Sie den Bereich daraus dar, der jetzt mit der Nominierung zum Deutschen Zukunftspreis als Innovation gewürdigt worden ist.

Prof. Dr. rer. nat. Wolfgang Wahlster
Wir haben das Projekt Verbmobil 1993 nach einer intensiven Planungsphase und Genehmigung der Fördermittel durch das Bundesministerium für Bildung und Forschung offiziell gestartet. Ich hatte mich vorher schon 15 Jahre lang in der Grundlagenforschung mit der Frage beschäftigt, wie man Computern beibringen kann, die deutsche Sprache zu beherrschen. Es ist für unsere Kultur sehr wichtig, dass die Sprachtechnologie nicht nur für das Englische zur Verfügung steht, sondern dass auch unsere eigene Muttersprache in der Welt der IT-Technik weiterhin verwendet werden kann. Wenn man bedenkt, dass Deutsch in der EU zurzeit die am meisten gesprochene Sprache ist, so wird sofort das große wirtschaftliche Potenzial der maschinellen Sprachverarbeitung des Deutschen klar. Das grundlegende Ziel meiner Forschung ist, den Computer näher an den Menschen heranzubringen. Das bedeutet, dass sich der Mensch nicht länger auf künstliche Computersprachen einstellen muss, sondern die Vision ist, den Menschen in die Lage zu versetzen, sich in deutscher Alltagssprache Information aus dem Computer zu besorgen und Aufgaben an ihn zu delegieren.
Wir sind 1993 mit dem ehrgeizigen Verbmobil-Projekt ein sehr großes Forschungs- und Entwicklungsrisiko eingegangen. Die Entwicklung eines funktionsfähigen Prototyps zur Übersetzung von Telefondialogen mit über 35 Arbeitsgruppen aus der Wissenschaft und Wirtschaft hielten viele Kollegen wegen der extrem hohen Komplexität der Aufgabe für unmöglich. Wir haben sogar Unteraufträge nach Japan und den USA geben müssen, um dort Sprachdaten sammeln zu lassen. Erstmals wurde in Verbmobil in großem Maßstab versucht, Spracherkennung, Sprachverstehen und Künstliche Intelligenz in insgesamt 135 Arbeitspaketen zusammenzubringen. Heute sind in Deutschland Sprachdialogsysteme im Einsatz, die in sehr eingeschränkten Themengebieten wie der Fahrplanauskunft oder der Steuerung von nicht sicherheitskritischen Fahrzeugfunktionen nahezu perfekt arbeiten. Je mehr der Computer über das Sachgebiet und über die Themenstellung weiß, über die der Benutzer spricht, desto besser funktioniert das automatische Sprachverstehen. Wenn dagegen ein Stammtischgespräch oder das Liebesgeflüster zwischen einer Japanerin und einem Deutschen automatisch analysiert und übersetzt werden soll, so kann das bei unserem heutigen Stand der Technik keinesfalls funktionieren, weil die Thematik viel zu weit gefasst ist. Wir betrachten Sprache als kommunikatives Instrument, wobei wir dessen Verwendungszweck klar abgrenzen können: wir wollen etwa über das Verbmobil-System einen Termin ausmachen oder ein Hotel im Ausland reservieren.

Unser Projekt entwickelte sich in Phasen: Die erste von 1993 bis 1996 bestand in der Aufgabe, die verschiedenen existierenden wissenschaftlichen Ansätze zur automatischen Sprachverarbeitung zu integrieren und die verschiedenen beteiligten Wissenschaftsdiziplinen zusammenzubringen. Das Faszinierende am Thema Sprachtechnologie ist nämlich, dass es einen Brückenschlag zwischen Geistes- und Sozialwissenschaften auf der einen Seite und der Natur- und Ingenieurswissenschaften auf der anderen Seite voraussetzt. Ich habe Linguistik und Informatik studiert und mich seitdem immer in diesen beiden doch sehr unterschiedlichen wissenschaftlichen Welten bewegt.

Zunächst muss man dem Computer - vereinfacht gesagt - die Grammatik des Deutschen beibringen. Wir konnten natürlich nicht einfach den Duden digital abspeichern, sondern wir mussten das grammatische Wissen zunächst formalisieren, es auf eine mathematisch-logische Basis stellen, die ein Computerprogramm für seine Analysen nutzen kann. Ingenieure, Nachrichtentechniker und Informatiker verstehen natürlich von den komplexen Zusammenhängen und Subtilitäten der Sprache zu wenig, so dass sie unbedingt mit Sprachwissenschaftlern und Sprachpsychologen zusammenarbeiten müssen. Wir mussten gleichzeitig viele Sprachproben von vielen Sprechern in mehr als 3.000 Dialogen sammeln und für den Computer aufbereiten. Dann konnten wir die automatischen Spracherkennungsprogramme für Spontansprache maschinell trainieren. Völlig neu war dabei, dass wir uns von Beginn an mit spontan gesprochener Sprache beschäftigt haben. Der Computer sollte auch Sätze mit „Ähs“ sowie Satzabbrüchen und Versprechern bearbeiten können.

Eine grundlegende Idee in unserem Projekt war, statistischbasierte Verfahren mit regelbasierten Verfahren zur Sprachanalyse in einem System zu vereinen. Bisher waren dies zwei Schulen der Wissenschaft, die meinten, jeweils alleine das Problem der automatischen Sprachanalyse bewältigen zu können. Beide Verfahrensparadigmen haben aber spezifische Vor- und Nachteile. Wir haben eine neuartige Systemarchitektur für die Sprachverarbeitung erfunden, die mehrere Nachrichtentafeln zwischen einzelnen Prozessen verwendet und parallel mit mehreren alternativen Analysemethoden die gleiche Spracheingabe bearbeitet. Nachdem in den 90er Jahren ein Paradigmenstreit zwischen Vertretern regelbasierter und statistischer Verarbeitungsverfahren die sprachtechnologische Forschung beherrschte, wurde ein entscheidender technischer Durchbruch durch das von uns entwickelte innovative Prinzip der wechselseitigen, synergistischen Ergänzung flacher, statistisch-basierter Algorithmen und tiefer, wissensbasierter Analyseverfahren für spontane Umgangssprache in einer hybriden Multi-Blackboard-Architektur erreicht - wie das in der Fachsprache heißt. Der Kern der Innovation besteht in der semantischen Fusion über eine logische Zwischensprache und der konfidenzbasierten Selektion multipler und konkurrierender Analyse- und Übersetzungspfade, die erstmals hohe Robustheits- und Realzeitanforderungen mit variabler Verstehenstiefe und Analysekorrektheit verbindet.

Nach der erfolgreichen Abnahme des Verbmobil-Forschungsprototyps im Oktober 1996 bewilligte das Forschungsministerium die zweite Projektphase (1997 - 2000). In dieser wurde Verbmobil auf einem zentralen Sprachserver implementiert, der über ISDN-Telefone, ATM-basierte Telekooperationsdienste oder GSM-Mobilfunk in Anspruch genommen werden kann. Dieser Sprachserver identifiziert die Eingabesprache und übernimmt die Spracherkennungs-, Übersetzungs- und Sprachgenerierungsleistung. Da mehrere Nutzer die Übersetzungsdienstleistung gleichzeitig in Anspruch nehmen können, werden bei dem Sprachserverkonzept parallele Kanäle vorgesehen. Verbmobil wird dadurch auch in mehrsprachigen Telekonferenzen mit mehr als zwei Partnern eingesetzt werden können.

Praktisch bedeutet die Realisierung von Verbmobil und seiner Derivate, dass wir die ersten Systeme geschaffen haben, die von dem sprachlichen Eingabesignal bis hin zur akustischen Sprachausgabe ein Sprachverständnis zeigen. Wir sind jetzt auch in der Lage, solche Gespräche automatisch zusammenzufassen. Wenn man sich vorstellt, man führt ein Gespräch fremdsprachlich - und kann nachher dem Computer sagen, man möchte ein Gesprächsprotokoll: das eröffnet ganz neue Anwendungsperspektiven. Aber ich muss immer dazu sagen, all das funktioniert bisher nur bei vorher abgegrenzten Gesprächsthemen. Verbmobil bietet eine Assistenzfunktion in Standardsituationen an; es ist kein Ersatz für hochspezialisierte Simultandolmetscher.

Das Ganze ist ein Computerprogramm?

Prof. Dr. rer. nat. Wolfgang Wahlster
Ja, alle Sprachtechnologien basieren auf sehr umfangreichen Softwaresystemen. Das ist auch gut so, denn damit ist die Technik universell einsetzbar. Einige der Systeme laufen auch bereits auf kleinen Computern, z.B. Notebooks. Ein Telefonübersetzungssystem wie Verbmobil braucht in der vollen Ausbaustufe heute aber noch sehr viel Computerressourcen.

Nochmals zu diesem Prozess der Innovation. Gab es einen Punkt, an dem Sie sagten, so kann es funktionieren oder war es eine Kausalkette?

Prof. Dr. rer. nat. Wolfgang Wahlster
Ich meine, das war bei dem Übergang von der ersten Phase, der grundlegenden Vorlaufphase von vier Jahren, zur zweiten Projektphase. Da mussten wir uns entscheiden, welche Forschungsstränge wir weiterführen, um das Projekt erfolgreich beenden zu können. Wir erzielten Ergebnisse von ganz unterschiedlicher Qualität: Manche Verfahren analysierten genau, aber schlugen oft fehl, andere analysierten recht oberflächlich, aber funktionierten immer. Und da hatte ich die Idee, nicht so vorzugehen, dass wir eine Analysemethode ganz herausschmeißen, sondern nach Wegen der Kombination zu suchen. Ich hatte immer schon die Vorstellung, dass in der Kombination der Pfiff liegen muss. Die Mehrdeutigkeit ist ja eines der großen Probleme, die wir in der Verarbeitung natürlicher Sprache haben und um so mehr verschiedene Evidenzen ich für eine Hypothese habe, um so besser ist es, weil sie sich wechselseitig verstärken. Und dann kam mir der Gedanke, morgens unter der Dusche: Das ist die Lösung! Wir müssen die unterschiedlichen Ergebnisse mit Konfidenzen versehen und sie zu einem gemeinsamen Ergebnis über eine logische Zwischensprache in einem Hypothesengitter integrieren können. Diese Idee haben wir dann in Phase 2 des Projektes konsequent verfolgt und dabei stets darauf geachtet, gleich auch immer Spin-Off-Produkte zu erzeugen. Wir haben gesagt: Der Weg ist das Ziel und wir wollen auch zwischendurch schon eine Umsetzung in Produkte. Als das Projekt im Jahr 2000 sehr erfolgreich abgeschlossen war, konnten wir 20 kommerzielle Spin-Off-Produkte aufweisen und es sind schon acht neue Firmen aus dem Projekt entstanden.

In den Unterlagen steht nun, es war ein „geplantes Projekt“: Start 1993, Zielsetzung 2000. Das widerspricht doch der Definition der Innovation. Ihre Entwicklungen waren exakt geplant, weil Sie dafür Gelder generieren mussten?

Prof. Dr. rer. nat. Wolfgang Wahlster
Es war ein ganz großes Forschungsrisiko in diesem Projekt. Obwohl wir einen Netzplan für alle Forschungsfragen hatten, standen wir vor einem riesigem Berg ungelöster Probleme mit extremer Komplexität. Ich gestehe, ich hatte auch einige schlaflose Nächte; es war ein Riesenunterfangen und man steht bei einem solchen Projekt auch unter einem erheblichen Erfolgsdruck; insbesondere weil eine ganze Menge Geld - über 100 Millionen Mark - in unsere Arbeiten investiert wurden. Selbst Kollegen im Ausland haben gebangt, ob das gut geht. Wir hatten aber zündende Ideen zur richtigen Zeit und immer ein tolles Team, das sich auch nach kleineren Rückschlägen schnell wieder auf die ambitionierten Projektziele konzentrierte und neue Lösungen fand.
Mein erster Chef scherzte häufig: Vormittags sollte man sich die Durchbrüche überlegen und nachmittags dann Epoche machen. So ist es leider in der Praxis der Forschung überhaupt nicht. Es ist extrem viel Detailarbeit, viel Fleiß und Hartnäckigkeit erforderlich. Gerade in der Sprachtechnologie gibt es nicht einige wenige einfache Grundprinzipien, sondern es müssen viele sprachliche Wissensquellen im Detail berücksichtigt werden. Ich habe in der Forschung so manche Nacht und viele Wochenenden durchgearbeitet und trotzdem machte es immer viel Spaß. Ich beklage das große Arbeitspensum nicht, weil ich glaube, dass die wissenschaftliche Arbeit ausüben zu dürfen, ein Privileg ist. Man hat das Hobby zum Beruf gemacht und wird dafür auch noch bezahlt.

Ihr Projekt wird als „interdisziplinäre Großleistung“ bezeichnet. Wir zählen 23 Forschungsgruppen mit 100 Wissenschaftlern, vier Unternehmen, 15 Hochschulen, eine Forschungseinrichtung usw. Das ist ungewöhnlich. Können Sie noch einmal erläutern, wie das zustande kam und was der direkte Effekt daraus war?

Prof. Dr. rer. nat. Wolfgang Wahlster
Es ist aus zweierlei Hinsicht wichtig, mit den Industrielabors zusammenzuarbeiten: Einerseits kommen von dort immer wieder exzellente praktische Anregungen. Die sagen allerdings auch einmal: Das könnt ihr gleich vergessen, das kann nie ein Produkt werden. Diese Rückkopplung ist ganz wichtig. Ich habe es zum Prinzip gemacht, dass die meisten unserer Mitarbeiter nach einer gewissen Zeit an unserem Zentrum in die Industrie gehen bzw. lade ich auch immer wieder Leute aus der Industrie ein, um bei uns am DFKI mitzuarbeiten. Die werden dann von ihren Stammunternehmen zum DFKI abgestellt, sind ein paar Jahre hier, und empfinden das auch als besonderen Anreiz, weil sie wieder an die vorderste Front der aktuellen Forschung herangeführt werden. Dann gehen sie zurück und verbreiten ihr Wissen in der Firma. Ohne den Menschen läuft der Technologietransfer halt nicht.
Andererseits ist die Sprachtechnologie ein enorm personalaufwendiges Unterfangen. Wir müssen uns ja nicht nur ständig neue Algorithmen ausdenken und die Programmierarbeit leisten, sondern wir brauchen ungeheuer viel Datenmaterial und das muss von Sprachwissenschaftlern aufbereitet werden. Wir mussten von Flensburg bis Oberbayern Sprachmaterial sammeln, auch solches, das Dialektbehaftet ist, von alten Leuten, von jungen Leuten. Die TU München hat als Verbmobil-Partner über 50 CDs produziert nur mit annotierten Sprachdaten. Ohne Unterstützung aus der Industrie wäre ein solche umfangreiche Sprachdatensammlung einfach nicht realisierbar.

Wir wollen die Benutzerschnittstelle vereinfachen, denn wir wollen - als gemeinsames Ziel mit der IT-Industrie - noch mehr Menschen an den Computer heranführen. Im Moment verzeichnet man eine Stagnation des Verkaufs im PC-Bereich. Wenn man über 40% der Bevölkerung erreichen will, muss man radikal die Benutzerschnittstelle vereinfachen. Wir wollen die Computernutzung so populär machen wie den Fernseher und das kann man nur, indem man andere Lösungen als die umständliche Bedienung per Tastatur oder Maus findet. Außerdem ist es ein Menschheitstraum, mit den Dingen zu sprechen.

Wir arbeiten interdisziplinär und ich bin ein bisschen stolz darauf, dass ich auch zum Professor unserer philosophischen Fakultät ernannt wurde. Ich bin derzeit der einzige Naturwissenschaftler, der auch in der philosophischen Fakultät kooptiert wurde. Technik braucht auch ganz stark die Kognitionswissenschaften.

Und wenn Sie nach dem Effekt fragen, hat die gezielte Ausbildung vieler Sprachtechnologie-Spezialisten in unserem Projekt auch zu neuen Industrie-Ansiedlungen ausländischer Unternehmen in Deutschland geführt. Beispielsweise hat sich die Firma Sony aus Japan entschieden, in ihrem europäischen Zentrum in Stuttgart eine Abteilung für Sprachtechnologie zu eröffnen. Die führenden Wissenschaftler dort haben vorher in unserem Verbmobil-Projekt gearbeitet. Auch die Firma Ericsson aus Schweden hat sich für Erlangen entschieden als Standort für ihre gesamten weltweiten Forschungs- und Entwicklungsaktivitäten in der Sprachtechnologie. Damit wird letztlich die Wissenschaft auch zu einem wichtigen Teil der Standortpolitik. Wenn man die Wissenschaftler und Ingenieure hier hat, die international gesucht werden, siedeln sich auch neue Firmen aus dem Ausland hier an.

Ich habe mir auch einmal die Frage gestellt, wie kam ich persönlich eigentlich zu diesem Forschungsschwerpunkt? Ich war zunächst auf einem humanistischen Gymnasium, war immer recht gut in Latein und insbesondere die Grammatik hat mich sehr fasziniert. Ich habe mein erstes Geld mit Nachhilfe in Mathematik und Latein als Gymnasiast verdient. Ich hatte immer ein Faible für Mathematik, Latein und Grammatiken. Für mich war in der Schule schon klar, dass ich mathematische Linguistik studieren will. Dann war ich der erste Student in Hamburg, der die Kombination Informatik und Linguistik studierte. Ich konnte meinen eigenen Studienplan entwerfen, weil es eine neue Kombination war. Das machte sehr viel Spaß. Heute ist dies zwar auch kein Massenstudiengang, aber er ist etabliert. Wir bieten etwa hier in Saarbrücken, in Stuttgart, in Tübingen und in Hamburg gute Möglichkeiten Computerlinguistik und Informatik zu kombinieren.

Woher kam das erste Interesse? Mein Vater hat sich sehr für Sprache interessiert, war Schriftsteller und hat Lyrik veröffentlicht, er war aber auch Bankdirektor und später Wirtschaftsprüfer. Ein zweiter Auslöser war vielleicht der Dialektschock. Ich bin nämlich im Saarland aufgewachsen, wo man einen markanten Dialekt spricht, besonders in der Familie. Dann sind wir nach Norddeutschland gezogen, gerade dorthin, wo man zum Teil sogar Plattdeutsch spricht. Und das war für mich, obwohl ich einigermaßen Hochdeutsch sprechen konnte, ein Anlass, mich als Jugendlicher intensiv mit Sprachstrukturen zu beschäftigen, denn mein Saarländisch verstand niemand und ich hatte zunächst große Probleme mit vielen norddeutschen Formulierungen.

Ich hatte in meinem Beruf später das Glück, dass ich nie das Forschungsgebiet wechseln musste. Manche Kollegen fragen mich schon mal, ob mir das nicht langsam langweilig wird. Aber ich glaube nicht, dass man in der Wissenschaft viel bewirken kann, wenn man nicht seinem Spezialgebiet treu bleibt. Es gibt ja auch noch jede Menge spannende Themen und offene Probleme in meinem Forschungsgebiet.

In welchem Stadium der Entwicklung sind Sie jetzt, wie geht es weiter? Was ist für Sie der nächste Entwicklungsschritt?

Prof. Dr. rer. nat. Wolfgang Wahlster
Der nächste Schritt ist das SmartKom-Projekt, an dem wir derzeit schon arbeiten. Hier geht es um multimodale Kommunikation, also die gleichzeitige Verwendung von Sprache, Gestik und sogar Mimik zur Kommunikation zwischen Mensch und Computer. Das ist das Nachfolgeprojekt zu Verbmobil, an dem sich wieder zahlreiche Industrieunternehmen finanziell beteiligen. Wenn man die nächste Generation von Mobilfunkgeräten auf UMTS-Basis mit ihren großen Übertragungsbandbreiten als Mehrwert verkaufen will, muss man ganz neue Anwendungen und Bedienkonzepte erfinden. Die multimodale Kommunikation ist dabei eine Schlüsseltechnologie.
Ich habe schon vor 15 Jahren angefangen, Sprache und Gestik zusammenzuschalten. Das Projekt XTRA war damals noch reine Grundlagenforschung und die lief sehr holprig. Wir wollen heute multimodale Systeme entwickeln, in denen der menschliche Benutzer neben der Sprache durch Gestik und Mimik weitere Information übermittelt. Viele meinen, dass das noch schwieriger wird. Das stimmt nicht. Es kann sogar einfacher werden. Man kann leicht zeigen, dass wenn man Sprache und Gestik zusammenschaltet, sich viele Mehrdeutigkeiten auflösen. Wir wollen dahin kommen, dass wir ein tragbares Gerät haben, mit einer kleinen Digitalkamera, einem Computer, mobiler Internetanbindung und einem grafischen Bildschirm. Sie können darauf zeigen und ihre Information sprechen. Das System zeigt mir beispielsweise den Stadtplan und wo ich gerade bin. Ich sage dann „Ich möchte jetzt dort hin“, weil ich dort das Heidelberger Schloss sehe. Dann zeige ich auf die digitale Karte und brauche es nicht lange zu beschreiben. Das heißt: Sprache und Gestik beschleunigen die Kommunikation. Wenn man Spracheingabe und Gestik verbindet, kann man bis zu fünfmal schneller mit dem Computer interagieren als mit der Tastatur und Menüs am PC. Multimodal arbeitet man also schneller, aber auch intuitiver. Wir wollen auch nicht länger nur mit der Maus oder mit einem Stift zeigen, sondern wirklich natürlich nur mit Hand- und Fingerbewegungen. Die an das System angeschlossene digitale Kamera beobachtet dann die Bewegungen der Finger und unsere Gestikanalysesoftware stellt fest, was damit gemeint war.

Ihr Projekt ist ja ein Verbundprojekt zwischen Wissenschaft und Wirtschaft, um es vereinfacht zu skizzieren. Können Sie uns erklären, wie das im DFKI funktioniert? Sie haben ja hier besondere Bedingungen.

Prof. Dr. rer. nat. Wolfgang Wahlster
Das ist auch forschungspolitisch sehr interessant. Das DFKI ist eine gemeinnützige GmbH und funktioniert nach dem Prinzip der „Public Private Partnership“. Unsere Gesellschafter kommen aus dem Bereich der Wirtschaft und der Universitäten. Da durch zunehmend kürzere Innovationszyklen in der Informationstechnik Vorlaufforschung, anwendungsnahe Entwicklung und die Umsetzung in Produkte immer enger zusammenwachsen, wird in DFKI-Projekten das gesamte Spektrum von der anwendungsorientierten Grundlagenforschung bis zur markt- und kundenorientierten Entwicklung von Produktfunktionen abgedeckt. Zurzeit beschäftigt die DFKI GmbH etwa 170 Angestellte, davon 145 wissenschaftliche Mitarbeiter. Hinzukommen noch rund 140 studentische Hilfskräfte als Teilzeitkräfte. Im Jahr 2000 wurde ein Volumen von rund 30 Mio. DM im Rahmen praxisorientierter Auftragsforschung erzielt. Wir haben keine Grundfinanzierung durch den Staat, sondern basieren alleine auf Projektfinanzierung. Alle Projekte werden international begutachtet, so dass wir uns stets der Qualitäts- und Erfolgskontrolle unterziehen müssen. Das führt meiner Ansicht nach zu höherer Produktivität als ständig am Tropf der staatlichen Förderung zu hängen. Wir arbeiten auch nach dem Prinzip des Lean Management und haben viele Standard- aufgaben wie die Lohn- und Gehaltsabrechnung unserer Mitarbeiter an andere Unternehmen vergeben.
Alle Arbeiten sind in der Form zeitlich befristeter und klar fokussierter Projekte organisiert, die u. a. zu lizenzierten Lösungen, Prototypen oder Produktfunktionen führen. Es war für mich ein tolles Erlebnis, als der Staatssekretär im BMBF, Dr. Uwe Thomas, mir sagte, dass er das DFKI-Modell für zukunftsweisend halte, und dass es mehr solcher Forschungszentren geben sollte. Wir haben inzwischen 14 Fimengründungen aus dem von mir geleiteten Forschungszentrum mit mehr als 530 neuen Hightech-Arbeitsplätzen geschaffen - und dies in der strukturschwachen Region des Saarlandes und der West-Pfalz.

Das Verbmobil wird jetzt vermarktet, über ein Spin-Off und/oder mit Kooperationspartnern?

Prof. Dr. rer. nat. Wolfgang Wahlster
Aus dem Verbmobil-Projekt sind insgesamt acht Spin-Off-Firmen entstanden, und die vermarkten wichtige Komponenten des Systems. Außerdem basieren 20 kommerzielle Produkte auf den in Verbmobil entwickelten Technologien. Dazu gehören vier Sprachdialogsysteme, drei Übersetzungssysteme und drei Textklassifikationssysteme. Die beteiligten Firmen an Verbmobil sind sehr zufrieden, weil sie die entwickelten Verfahren in ihre Produkte einbauen konnten.

Sie haben ja nun einen sehr starken wirtschaftlichen Aspekt in ihrer Arbeit, haben Sie trotzdem die Möglichkeit der wissenschaftlichen Weiterentwicklung? Es gibt bei Ihnen nicht den Ausschlag in die eine oder andere Richtung?

Prof. Dr. rer. nat. Wolfgang Wahlster
Das ist an der Sprachverarbeitung das Faszinierende, dass man sowohl eine kognitionswissenschaftliche als auch eine ingenieurswissenschaftliche Zielsetzung hat. Man betreibt also erkenntnisorientierte Grundlagenforschung und wirtschaftsnahe Anwendungsforschung parallel. Wir möchten verstehen, wie der Mensch die Sprache lernt, versteht und erzeugt. Computermodelle bieten die präziseste Möglichkeit, das menschliche Sprachverstehen wissenschaftlich zu beschreiben. Die ingenieurswissenschaftliche Zielsetzung, sprachtechnologische Anwendungen zu entwickeln, bringt einerseits die notwendige Finanzierung, andererseits gibt es auch vielen Mitarbeitern den motivierenden Kick. Mir macht es ja auch viel mehr Spaß, wenn ich nicht nur sagen kann, ich habe wieder fünf Papiere veröffentlicht und zehn Vorträge gehalten, sondern die Ergebnisse werden auch praktisch angewandt und die Wirtschaft kann damit auch Geld verdienen.

Kommen wir nochmals zu dem Begriff der Innovation, der viel und abgenutzt ist. Wie definieren Sie Innovation, allgemein und in Zusammenhang mit Ihrem Projekt?

Prof. Dr. rer. nat. Wolfgang Wahlster
Innovation bedeutet für mich ein Übergang von einer Technikgeneration zu einer anderen: also wirklich ein Bruch, eine Idee, die auch praktisch umgesetzt werden kann und zu einer ganz neuen Qualität führt. Das ist in unserem Projekt gelungen, insofern als wir vorher Systeme hatten, mit denen man nur Monologe in den Computer einsprechen konnte. Jetzt haben wir den Computer als einfachen Dialogassistenten. Die Innovation besteht in dem Übergang von der reinen Spracherkennung als Umsetzung von Schallwellen in Schriftsprache - ohne Sinn und Verstand hätte ich beinahe gesagt - zu einer wirklichen inhaltlichen Kommunikation im Dialog. Das ist die entscheidende Innovation.

Eine Zielsetzung des Preises des Bundespräsidenten ist auch, der Öffentlichkeit die Leistung der Wissenschaft zu vermitteln und den Dialog herzustellen. Was tun Sie denn für diesen Dialog mit der Öffentlichkeit?

Prof. Dr. rer. nat. Wolfgang Wahlster
Wir haben sehr früh angefangen, Pressekonferenzen zu unseren Projekten zu organisieren und haben dazu nicht nur die Fachpresse eingeladen. Zusammen mit den Presseabteilungen unserer Industriepartner haben wir später eine jährliche Pressekonferenz veranstaltet, die sehr gut aufgenommen wurde. Ich meine, dass der Wissenschaftler eine Bringschuld gegenüber der Öffentlichkeit hat, und in möglichst allgemeinverständlicher Weise über seine Vorhaben und Ergebnisse unterrichten sollte. Ein Großteil unserer Forschungsgelder sind ja Steuergelder, so dass jeder Bürger einen Anspruch auf Information über die Projekte hat. Außerdem sollte man früh mit der Aufklärung über neue Technologien beginnen, um kritisches Feedback von den späteren Nutzern zu bekommen. Dann entsteht mehr Vertrauen in die neuen Technologien und das ist ganz essenziell für die spätere Akzeptanz und damit letztlich auch für den wirtschaftlichen Erfolg einer Technologie. Ich halte Öffentlichkeitsarbeit in der Wissenschaft für sehr wichtig. Ich nehme daher auch gelegentlich Vortragseinladungen von politischen Verbänden, Wirtschaftsverbänden, Firmen oder Vereinen an, um allgemeinverständlich über Künstliche Intelligenz und Sprachtechnologien sowie ihre Chancen und Risiken zu sprechen.

Sie haben schon viele Preise und Ehrungen bekommen. Wie wirken sich solche Ehrungen auf Ihre Arbeit aus? Ist das nur was Nettes, was man als „Streicheleinheit“ empfindet oder hat das einen konkreten Nutzen?

Prof. Dr. rer. nat. Wolfgang Wahlster
Doch, es hat sicherlich einen konkreten Nutzen. Hier ist auch wieder die Öffentlichkeitsarbeit wichtig: Gerade in einem Auftragsforschungsinstitut ohne staatliche Grundfinanzierung wie dem DFKI gehört ein Marketing der Kompetenzen zum Alltag. Wir haben schon viele Kontakte und Aufträge letztlich dadurch bekommen, dass wir mit einem Preis für eine wissenschaftliche Leistung ausgezeichnet worden waren. Dann gibt es Zeitungsartikel über den Preis, und daraufhin ruft ein Unternehmer an und fragt: Kann das DFKI mit dieser neuen Methode bei einem konkreten Problem in meiner Firma helfen? So kommen neue Kontakte und neue Aufträge häufig zustande. Eine gute Pressearbeit nach einem Preis ist oft viel mehr Wert für die Projektakquisition als ein Riesenstand auf der CeBIT oder Hannover Messe.
Durch das Renommee eines Preisträgers hat man auch die Möglichkeit, als Berater eingeladen zu werden, um besonders in internationalen forschungspolitischen Gremien die Forschungstrends und Fördermaßnahmen mit zu prägen. Ich bin heute nicht nur Berater für deutsche Ministerien, sondern auch für internationale Forschungsprogramme und -institute in Japan, USA, Frankreich, Niederlande und Italien. Das hätte ich ohne die Anerkennung durch die verschiedenen Preise und Auszeichnungen sicherlich nicht erreichen können.

Gibt es ein Motto, eine formulierbare Motivation für das, was Sie tun?

Prof. Dr. rer. nat. Wolfgang Wahlster
Ja, einfach gesagt ist mein Motto: Den Computer näher an den Menschen heran zu bringen und nicht umgekehrt den Menschen an den Computer anzupassen. Man sollte den Computer so intuitiv bedienen können, dass man keine Zeit damit verschwenden muss, spezielle Bedientechniken zu erlernen und umfangreiche Benutzerhandbücher zu studieren.

Zum Klima von Forschung und Innovation - wie schätzen Sie das in Deutschland ein und wie stehen wir momentan, auch bezogen auf Ihr Sachgebiet, im internationalen Vergleich da?

Prof. Dr. rer. nat. Wolfgang Wahlster
In Deutschland funktioniert das eigentlich recht gut. Es wird von einigen Kollegen oft zu viel gejammert und auf angeblich bessere Bedingungen in Japan und den USA verwiesen. Da ich oft in Japan und den USA bin - und dort sitzen die Hauptkonkurrenten auf meinem Gebiet - weiß ich, dass dort auch nur mit Wasser gekocht wird und viele Defizite zu verzeichnen sind. Die Amerikaner verstehen es zwar oft besser, ihre Forschung zu vermarkten und auch oft schneller umzusetzen. Aber was wir hier in Deutschland auf meinem Gebiet zustande bringen, diese enge Kooperation zwischen Industrie und Hochschulen in konkreten Projekten, klappt in den USA kaum. Die Amerikaner wundern sich immer, wie das bei uns funktioniert. So etwas wie unser Verbmobil-Projekt wäre derzeit in den USA nicht möglich. In Japan gibt es sehr starre Denk- und Ausbildungsstrukturen, die ein wirklich interdisziplinäres Arbeiten oft vermeidet. Das ist hier in Deutschland erheblich einfacher. Wir haben es in der Sprachtechnologie im internationalen Vergleich geschafft, dass wir nicht nur mithalten können, sondern auf diesem Gebiet spielen wir inzwischen in der ersten Liga. Noch vor zehn Jahren fuhren wir mehrfach im Jahr in die USA oder in Japan, um neueste Entwicklungen kennen zu lernen. Heute ist es oftmals umgekehrt: Japanische und amerikanische Wissenschaftler reisen auf eigene Kosten nach Saarbrücken, um sich über neueste Forschungsresultate intensiv zu informieren.
Man muss aber sagen, dass wir eine Spitzenstellung in Deutschland nur auf ganz spezifischen Gebieten erreichen können. Deshalb finde ich es in der forschungspolitischen Diskussion gut, dass wir uns profilieren wollen und nur spezielle Gebiete abdecken und nicht die ganze Breite. Es gibt einfach Gebiete, da können wir mit den Japanern und Amerikanern nicht mithalten und sollten es dann auch lassen, aber andere Dinge, da halten wir nicht nur mit, sondern spielen die erste Geige. In der Sprachtechnologie kommt noch das nationale Interesse hinzu, dass es fatal wäre, wenn man sich für die deutsche Sprache die Softwareprodukte aus Japan oder USA anliefern lassen muss. Wir Deutschen wurden ja immer belächelt mit unseren vielen langen Wörtern: der bekannten „Donaudampfschiffahrtsversicherungsgesellschaft“. Aber lange Wörter sind durch heutige Spracherkenner leichter eindeutig zu analysieren. Wir haben einen Vorteil in der Sprachtechnologie durch die Struktur unserer Sprache. Die Amerikaner müssen sich ärgern, denn sie haben in diesem Punkt durch ihre Sprache einen Nachteil. Englisch macht unserer heutigen Sprachtechnologie bei der Spracherkennung mehr Probleme als das Deutsche.

Haben Sie Wünsche und Forderungen an die Öffentlichkeit, an die Politik und die Gesellschaft, um Projekte wie Ihres durchzusetzen?

Prof. Dr. rer. nat. Wolfgang Wahlster
Mein größter Wunsch wäre, dass man innovative Strukturen wie unser Public Private Partnership im DFKI in das normale Forschungsförderungskonzept und das sogenannte Förderhandbuch des BMBF aufnimmt. Viele Politiker begrüßen zwar sehr die Organisation der Forschung in gemeinnützigen GmbHs mit einer Beteiligung der Wirtschaft und des Staates. Im verwaltungstechnischen Detail, bei Abrechnungs- und Prüfungsfragen gibt es aber leider immer noch zahlreiche Probleme mit Behörden, weil ein solches Institut nicht in die Schubladen der Großforschungseinrichtungen, der Universitäten oder der Industrielabors eingeordnet werden kann. Insbesondere die Behörden in Brüssel zur europäischen Forschungsförderung haben uns in den letzten Jahren massiv behindert, weil sie unser Modell bis heute nicht verstehen und unsere Abrechnungsmodalitäten nicht anerkennen wollen. Hier wünsche ich mir ein klares Wort der deutschen Politik an die Adresse in Brüssel, denn schließlich stammt ja ein großer Teil des Brüsseler Etats aus deutschen Steuerquellen. Eine Aufnahme des DFKI-Modells in das Förderhandbuch des BMBF ist auch einer meiner großen Wünsche.
Public Private Partnership in der Forschung ist das Gebot der Stunde. Ich würde mir wünschen, dass man in Deutschland mehr solche Spezial-Institute einrichtet nach dem Motto: klein aber fein. Wir stellen uns auch in regelmäßigen Abständen einer Evaluation. Wenn unser Fachgebiet einmal nicht mehr relevant ist, kann man das DFKI rasch einstellen, da 70% der Stellen befristet sind. Ich halte auch nichts von gigantischen Forschungsinstituten mit Tausenden von Forschern, die meist schnell ineffizient werden. Es ist nach meiner Erfahrung besser, man hat eine kleine fokussierte Mannschaft: Klasse statt Masse. Wichtig ist auch, dass man durch eine gewisse Fluktuation im Mitarbeiterbereich stets eine junge Mannschaft von Forschern hat. Der Altersdurchschnitt am DFKI liegt seit mehreren Jahren bei 34 Jahren. Das DFKI gilt als eine Art Durchlauferhitzer in einer akademischen oder industriellen Karriere.

Sie waren ja mit 29 Jahren Professor, sind mehrfacher Ehrendoktor. Sie darf man also so etwas schon fragen. Wenn Sie die Wahl hätten, würden Sie Ihren Berufsweg wieder so gehen wollen?

Prof. Dr. rer. nat. Wolfgang Wahlster
Auf jeden Fall. Ich glaube allerdings nicht, dass sich das heute auf dem gleichen Gebiet reproduzieren lässt. Ich hatte das Glück, zur richtigen Zeit in dieses neue Wissenschaftsgebiet eingestiegen zu sein. Wenn ich in Physik oder Mathematik promoviert hätte, dann hätte ich im Alter von 29 Jahren sicher nicht schon einen Ruf auf eine Professur erhalten. In der Informatik als junger Disziplin konnte man schneller Erfolge erzielen. Wenn ich in Physik heute etwas Neues machen will, muss ich erst einmal Hunderte von klassischen Veröffentlichungen durcharbeiten.

Ihr berufliches Leben hat eine Bandbreite. Gab es etwas, das Ihnen gefehlt hat?

Prof. Dr. rer. nat. Wolfgang Wahlster
Ich plädiere sehr dafür, dass wir uns in der Forschung, an den Universitäten und Instituten fokussieren - Profil bilden - um im internationalen Wettbewerb bestehen zu können. Diese notwendige Spezialisierung kann ich aber nicht für das Studium empfehlen. Ein vernünftiges Studium sollte immer noch sehr breit angelegt sein. Ich habe im Studium neben Informatik und Linguistik auch Vorlesungen im Bereich Psychologie, Philosophie, Altamerikanistik, Physik und Mathematik gehört. Wenn die Studenten nur noch hinter Scheinen und Punkten in ihrem Studiengang her rennen und im Turbostudium nur noch die einfachsten Kurse belegen, dann ist das eine Fehlentwicklung. Man sollte seine Zeit an der Universität auch nutzen, um über den engeren Fachkontext hinauszublicken und einmal in benachbarte Fachgebiete zumindest hineinzuhören. Ich hatte durch die Förderung der Studienstiftung des deutschen Volkes die tolle Gelegenheit, während des Studiums auf Sommerakademien andere Denkweisen und Wissenschaftsgebiete kennenzulernen und habe dort den enormen Mehrwert interdisziplinären Arbeitens früh kennengelernt.

Womit entspannen Sie sich oder was gibt es außerhalb Ihres Projektes und Ihrer Tätigkeit?

Prof. Dr. rer. nat. Wolfgang Wahlster
Ich habe lange Hockey als Leistungssport betrieben. Jetzt spiele ich mit meiner Frau Tennis sowie Golf und fahre mit Begeisterung Ski. Bei oftmals 100 Arbeitsstunden pro Woche komme ich aber leider oft viel zu wenig zum Sport. Ich tanze gerne und interessiere mich für moderne Kunst. Aber ein Hobby im traditionellen Sinne verfolge ich nicht, da ich ja mein „Hobby“ zum Beruf gemacht habe.

Letzte Frage, was wünschen Sie sich für die Zukunft?

Prof. Dr. rer. nat. Wolfgang Wahlster
Die Energie und notwendige Gesundheit, noch lange Jahre das weiter zu machen, was ich bis jetzt gemacht habe - Forschung in der Künstlichen Intelligenz, noch viele erfolgreiche Projekte durchzuführen und ein paar wichtige Forschritte in meinem Forschungsgebiet zu erzielen. Wenn man in unserer Fakultät 60 wird, werten die Kollegen aus, wie viele Schüler man produziert hat, die selbst Professoren der Informatik geworden sind. Am DFKI haben wir neben etlichen Jungunternehmern und Führungskräften für die Industrie in den letzten zehn Jahren 34 neue ProfessorInnen „gezeugt“ und ich wünsche mir, dass sich diese sehr erfreuliche Entwicklung so fortsetzen lässt. Schließlich hoffe ich sehr, dass wir unsere Forschungsergebnisse auch weiterhin rasch zusammen mit der Wirtschaft umsetzen können und dass sich damit auch in der Wirtschaft gut Geld verdienen lässt.

Weitere Details

Lebensläufe

Prof. Dr. rer. nat. Wolfgang Wahlster

2.2.1953
geboren in Saarbrücken, Saarland
1972
Abitur
1972 – 1977
Studium der Informatik und Computerlinguistik an der Universität Hamburg
1981
Promotion über Künstliche Intelligenz an der Universität Hamburg
1982
Ruf an die Universität des Saarlandes, Saarbrücken, Lehrstuhl für Künstliche Intelligenz im Fachbereich Informatik
1984
Rufe an die Universitäten Karlsruhe und Hamburg, jeweils Lehrstuhl für Künstliche Intelligenz
1985 – 1995
Vorstandsmitglied im Sonderforschungsbereich „Künstliche Intelligenz“ der Deutschen Forschungsgemeinschaft
1987
Gastprofessor, University of California, Berkeley, USA
seit 1989
Wissenschaftlicher Direktor, seit 1993 Mitglied der Unternehmensleitung des Deutschen Forschungszentrums für Künstliche Intelligenz (DFKI gemeinnützige GmbH)
1991 – 1993
Präsident des Weltverbandes für Künstliche Intelligenz, IJCAI Inc., Palo Alto, Kalifornien, USA
1993 – 2000
Wissenschaftlicher Leiter des BMBF-Verbundprojektes VERBMOBIL
seit 1996
Vorstandsmitglied im Sonderforschungsbereich „Ressourcen-adaptive Kognitive Prozesse“ der Deutschen Forschungsgemeinschaft
seit 1996
Vorsitzender der Geschäftsführung des DFKI, Saarbrücken und Kaiserslautern
1996 – 2000
Präsident des Europäischen Verbandes für Künstliche Intelligenz, ECCAI, Brüssel, Belgien
2000
Präsident der International Association for Computational Linguistics (ACL) in New Jersey, USA

Ehrungen:

1991
Fritz-Winter-Preis für Forschungen zur intelligenten Mensch-Maschine-Kommunikation
1993
Ernennung zum Fellow der AAAI, Stanford, Kalifornien, USA
1995
ITEA-Preis (Information Technology European Award) der EU, Brüssel
1998
Verleihung der Ehrendoktorwürde der Universität Linköping, Schweden
1999
Ernennung zum Fellow der ECCAI, Brüssel
2000
Karl Heinz Beckurts-Preis
2001
Verleihung der Ehrendoktorwürde der Technischen Universität Darmstadt

Kontakt

Projektsprecher

Prof. Dr. rer. nat. Wolfgang Wahlster
Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI)
Stuhlsatzenhausweg 3
66123 Saarbrücken
Tel.: +49 (0) 681 / 30 25 252
Fax: +49 (0) 681 / 30 25 341
E-Mail: wahlster@dfki.de

Pressekontakt

Reinhard Karger
Leiter Unternehmenskommunikation
DFKI
Stuhlsatzenhausweg 3
66123 Saarbrücken
Tel.: +49 (0) 681 / 30 25 253
Fax: +49 (0) 681 / 30 25 341
E-Mail: karger@dfki.de

Beschreibung der Institute und Unternehmen zu ihren nominierten Projekten

Durch die Fortschritte auf dem Gebiet der Sprachtechnologie wird der Computer vom komplexen Werkzeug für Experten zum allgegenwärtigen Assistenten und Dialogpartner, der menschliche Alltagssprache versteht und selbst auch spricht. Prof. Wahlster und seiner Arbeitsgruppe ist nach zwanzig Jahren intensiver Grundlagenforschung mit der Entwicklung einer innovativen Sprachverarbeitungsmethode ein international vielbeachteter Durchbruch gelungen: Das Verbmobil-System, dessen Software Ende 2000 vollständig realisiert wurde, erkennt gesprochene Spontansprache, analysiert die Eingabe, übersetzt sie in eine Fremdsprache (derzeit: Englisch, Japanisch, Chinesisch), erzeugt einen Satz und spricht ihn aus. Damit kann ein Mobiltelefon im Ausland zur Übersetzungshilfe werden. Technisch wird automatisch eine Dreierkonferenz zwischen zwei menschlichen Gesprächspartnern, die unterschiedliche Sprachen sprechen, und dem Verbmobil-System als Dolmetschhilfe geschaltet. Das Verbmobil-System übersetzt wechselweise zwischen den Gesprächspartnern, wobei nur eine geringe Verzögerung durch die automatische Sprachverarbeitung entsteht.

Die maschinelle Sprachverarbeitung ist wissenschaftlich eines der ehrgeizigsten Ziele unseres Zeitalters. Nur durch die von Prof. Wahlster über acht Jahre vorangetriebene enge multidisziplinäre Zusammenarbeit von Informatikern, Linguisten, Sprachpsychologen, Nachrichtentechnikern, Kommunikationswissenschaftlern, sowie Spezialisten der Computerlinguistik und des Bereiches „Künstliche Intelligenz“, waren die jetzt erzielten Fortschritte bei der automatischen Sprachverarbeitung möglich. Für die Konstruktion von natürlichsprachlichen Dialogsystemen ist es notwendig, vom akustischen Signal eines Sprechers durch Spracherkennung zunächst zu einer symbolischen Repräsentation der eingegebenen Äußerung zu kommen. Darauf setzen dann Verfahren der Sprachanalyse sowie des Sprachverstehens auf. Nach der inhaltlichen Interpretation des Dialogbeitrags erfolgt die Sprachgenerierung für die Rückäußerung des Systems. Schließlich wird die symbolische Form der geplanten Systemausgabe durch die Sprachsynthese wieder in ein akustisches Sprachsignal verwandelt. „Hörende und sprechende Computer“ setzen also sehr komplexe Signal-Symbol-Signal Transformationen voraus.

Durch die extrem hohe Variabilität des Sprachsignals bei unterschiedlichen Sprechern, aber auch bei demselben Sprecher in verschiedenen Sprechsituationen und Äußerungskontexten, ist es nicht möglich, fließend gesprochene Sprache ohne Zusatzwissen direkt in eine eindeutige Wortfolge zu überführen. Neben der Vielzahl der Aussprachevarianten für ein Wort müssen dadurch, dass Wortgrenzen im Sprachsignal nicht immer klar erkennbar sind und Laute verschliffen werden, Tausende von Worthypothesen alternativ überprüft werden. Auf den verschiedenen Ebenen der Sprachverarbeitung werden schrittweise immer mehr Wissensquellen in die Verarbeitung eingeführt, so dass die Unsicherheit darüber, was der Sprecher mit seiner Äußerung letztlich will, auf jeder Verarbeitungsebene weiter reduziert wird. Wegen der starken Mehrdeutigkeit von Alltagssprache im lexikalischen und syntaktischen Bereich kann meist nur über ein explizites Modell des Gesprächskontextes oder Wissen über das Gesprächsthema ein eindeutiges Verstehen erreicht werden. Oft erweist sich die zunächst verfolgte Satzhypothese, die auf Grund vom Spracherkenner als wahrscheinlichste Wortfolge eingestuft wurde, auf späteren Ebenen der Sprachverarbeitung durch das Hinzuziehen von syntaktischen und semantischen Modellen und von Weltwissen als falsch, so dass ein alternativer Pfad durch den vom Spracherkenner erzeugten Worthypothesengraphen als Interpretation gewählt werden muss.

Der Kern der Innovation des Projektes besteht in der semantischen Integration und der konfidenzbasierten Selektion multipler und konkurrierender Analyse- und Übersetzungspfade, die erstmals hohe Robustheits- und Realzeitanforderungen mit variabler Verstehenstiefe und Analysekorrektheit verbindet. Der entscheidende technische Fortschritt ist ein innovatives Verfahren zur wechselseitigen, synergistischen Ergänzung flacher, statistischer Algorithmen und tiefer, wissensbasierter Analyseverfahren für spontane Umgangssprache in einer hybriden Multi-Blackboard-Architektur. Die Idee zu einer solchen Informationsfusion auf der semantischen Ebene hatte Prof. Wahlster bereits 1991 erstmals im Rahmen seines XTRA-Projektes entwickelt. In diesem Grundlagenprojekt war es mit Hilfe von typisierter Graphunifikation zum ersten Mal gelungen, die Ergebnisse von Spracheingaben und sprachbegleitenden Gesten auf einer semantischen Ebene so zu integrieren, dass eine wechselseitige Auflösung von Mehrdeutigkeiten erreicht wird. Hier wurde erstmals das später in den Jahren 1993 bis 2000 in Verbmobil auf breiter Basis eingesetzte Prinzip verwirklicht, dass die Verknüpfung verschiedener, in sich mehrdeutiger Analyseergebnisse schließlich ein eindeutiges Resultat liefern, wenn man die wechselseitigen Bedeutungsbeschränkungen bei der Informationsfusion auswertet. Um ausgehend von der Kerninnovation ein vollständig implementiertes Sprachdialogsystem bis zum Jahr 2000 erfolgreich zu entwickeln, war im Rahmen des Verbmobil-Systems die Integration von 69 Softwaremodulen notwendig, die von über 100 Mitarbeitern unter Leitung von Prof. Wahlster entwickelt und in 800 Publikationen dokumentiert wurden. Das Verbmobil-System wurde anhand von 3.200 Dialogen mit 1,5 Millionen Wörtern und 85.000 Syntaxbäumen trainiert und auf der Basis von 30.000 Übersetzungsbeispielen evaluiert.

Aus den im Rahmen des Verbmobil-Prototyps erprobten sprachtechnologischen Innovationen sind inzwischen bereits sechs Spin-Off Firmenneugründungen mit dreihundert neuen Hightech-Arbeitsplätzen und zwanzig marktfähige Produkte (z.B. FairCar zur sprachbasierten Produktsuche im Internet, Beagle zur natürlichsprachlichen Musiksuche, FränKi zur vollautomatischen Kinoauskunft über Telefon) hervorgegangen. Mit den Ergebnissen von Verbmobil hat Deutschland heute im Bereich der Sprachtechnologie eine internationale Spitzenstellung erreicht.

Im derzeit laufenden Nachfolgeprojekt SmartKom, das ebenfalls von Prof. Wahlster geleitet wird, arbeitet ein Konsortium aus Industrieunternehmen und Forschungsinstituten an einem multimodalen Sprachdialogsystem, das die Sprache, Gestik und Mimik eines Benutzers als sich wechselseitige ergänzende Eingabemodi im Dialogzusammenhang inhaltlich interpretiert. Neuartig dabei ist auch, dass auch auf der Ausgabeseite Sprache, Gestik und Mimik kombiniert werden, wobei anthropomorph visualisierte Kommunikationsassistenten als virtuelle Charaktere auf dem Bildschirm erscheinen.

Die Sprachtechnologie zählt deshalb zu den Schlüsseltechnologien bei der Verwirklichung der Wissensgesellschaft, weil sich bislang keine mathematischen Kunstsprachen, sondern nur die menschlichen Sprachen zur Formulierung, Speicherung und Weitergabe komplexer Sachverhalte, Gedanken und Wissensinhalte eignen. Der weltweite Zugriff auf das gesamte digital gespeicherte Wissen für jedermann, zu jeder Zeit und an jedem Ort würde daher im Zeitalter des mobilen Internet und von UMTS ohne den Einsatz von sprachverstehenden Computersystemen eine Fiktion bleiben.

Erst wenn es prinzipiell für jeden Menschen möglich wird, in seiner Muttersprache spontan eine Anfrage oder ein Kommando in Computersysteme zu sprechen, und wenn die entsprechende Antwort oder Reaktion wiederum für ihn verständlich in Alltagssprache ertönt, wird die Mensch-Computer-Interaktion den Stand erreicht haben, der den Computer zum integralen Bestandteil einer universalen Technik für die Wissensgesellschaft macht. Da elektronische Interaktion ein integraler Bestandteil des täglichen Lebens, der Arbeit und der Erziehung sein wird, könnten rasch Nachteile für diejenigen Menschen entstehen, die nicht in der Lage sind, solche Interaktionen auszuführen. Um diesen Personenkreis von der Wissensgesellschaft nicht auszuschließen, wurden mit Hilfe der Sprachtechnologie von Prof. Wahlster und seinen Teams ein Weg zu neuartigen Dialogschnittstellen für informationstechnische Dienste geschaffen, die jedermann, unabhängig von seinem Bildungsstand und seinem Lebensalter, völlig intuitiv über seine Alltagssprache bedienen kann. Maus und Tastatur werden durch natürliche Sprache und intuitive Gestik ersetzt. Damit muss sich der Mensch bei der Computerbenutzung weniger der Maschine anpassen, sondern der Computer passt sich dem Menschen und seinen wichtigsten Kommunikationsmitteln an.

Informationen und Kontakt zum Deutschen Zukunftspreis unter:

E-Mail: info@deutscher-zukunftspreis.de
Internet: www.deutscher-zukunftspreis.de

Das Vorschlagsrecht zum Deutschen Zukunftspreis obliegt den führenden deutschen Einrichtungen aus Wissenschaft und Wirtschaft sowie Stiftungen.

Das Projekt „Sprachverstehende Computer als Dialog- und Übersetzungsassistenten“ wurde vom Bundesministerium für Bildung und Forschung und von der Karl Heinz Beckurts-Stiftung vorgeschlagen.

Preisträger 2001 · TEAM 1