Print-Logo Deutscher Zukunftspreis

Nominiert 2011

6-D-Vision

6-D-Vision – Gefahren schneller erkennen als der Mensch

Dr.-Ing. Uwe Franke (Sprecher)
Dr. rer. nat. Stefan Gehrig
Dr.-Ing. Clemens Rabe
Daimler AG, Stuttgart

(v.l.n.r) Dr. rer. nat. Stefan Gehrig, Dr.-Ing. Uwe Franke, Dr.-Ing. Clemens Rabe

Die Zahl der Verkehrstoten nimmt in Deutschland seit Jahrzehnten ab. Doch immer noch sterben viele Menschen im Straßenverkehr – und jeder Tote ist einer zu viel. Wie lässt sich das Autofahren künftig noch sicherer machen?

Dr. Uwe Franke, Dr. Stefan Gehrig und Dr. Clemens Rabe sind überzeugt: Intelligente Fahrerassistenzsysteme können die Zahl der Toten und Verletzten auf den Straßen drastisch reduzieren. Sie haben dazu eine Technologie entwickelt, die ganz neue Möglichkeiten zur Unterstützung der Autofahrer bietet. Gefahren lassen sich damit erkennen, und viele Unfälle können durch eine rasche Reaktion des Wagens vermieden werden. Uwe Franke leitet die Arbeitsgruppe „Bildverstehen“ der Daimler Forschung und Vorentwicklung in Sindelfingen, der auch Stefan Gehrig und Clemens Rabe angehören.

Um dem Fahrer in komplizierten Verkehrssituationen beistehen zu können, müssen künstliche Sinne des Wagens zuverlässig erkennen, was um ihn herum geschieht. Und der elektronische Assistent muss in der Lage sein, zu „ahnen“, wie sich andere Verkehrsteilnehmer weiter verhalten werden – etwa, ob ein anderes Auto mit dem eigenen Wagen kollidieren oder ein spielendes Kind auf die Fahrbahn laufen wird. Bisherige Systeme konnten viele kritische Situationen nicht erfassen und waren mit der Auswertung von Messdaten zu lange beschäftigt, um schnell genug reagieren zu können.

Und der elektronische Assistent muss in der Lage sein, zu „ahnen“, wie sich andere Verkehrsteilnehmer weiter verhalten werden – etwa, ob ein anderes Auto mit dem eigenen Wagen kollidieren oder ein spielendes Kind auf die Fahrbahn laufen wird. Bisherige Systeme konnten viele kritische Situationen nicht erfassen und waren mit der Auswertung von Messdaten zu lange beschäftigt, um schnell genug reagieren zu können.

Den nominierten Forscher bei Daimler gelang es, das Geschick der technischen Gefahrenerkennung enorm zu verbessern. Dazu nahmen sie die Funktion der menschlichen Augen und des Gehirns zum Vorbild, deren Fähigkeiten sie sogar übertreffen konnten. So gelingt es der neuen „6D-Vision“-Technologie, tollende Kinder am Straßenrand in weniger als 0,2 Sekunden zu erkennen – ein Mensch braucht dazu mehr als doppelt so lang. Um solche Meisterleistungen zu schaffen, nimmt eine Stereokamera in rascher Folge dreidimensionale Bilder der Umgebung vor und neben dem Fahrzeug auf. Ein eigens dafür entwickelter Algorithmus wertet sie blitzschnell aus. Durch den Vergleich aufeinanderfolgender Bilder erkennt er auch, ob und wie schnell sich Objekte wie Radfahrer, Fußgänger oder Autos bewegen. Das funktioniert selbst bei schlechtem Wetter und Dämmerlicht sehr zuverlässig.

Daimler wird 6D-Vision schon bald serienmäßig in Mercedes-Fahrzeugen einsetzen – als Basis innovativer Assistenzsysteme, die Fußgänger erkennen, dem Fahrer beim Passieren unübersichtlicher Kreuzungen helfen oder durch enge Autobahnbaustellen lotsen. Die Forscher aus Sindelfingen hoffen, dass ihre Innovationen eine weite Verbreitung in der Automobilindustrie finden – damit möglichst vielen Verkehrsteilnehmern zusätzliche Sicherheit gegeben ist. Um das zu gewährleisten, beabsichtigt das Unternehmen die 6D-Vision-Technologie auch anderen Herstellern zugänglich zu machen. 6D-Vision hat das Potenzial, das elektronische Sehen nicht nur in Autos zu revolutionieren, sondern etwa auch bei autonom agierenden Servicerobotern. Die sollen künftig als Helfer im Haushalt dienen oder bei der Pflege von gebrechlichen Menschen assistieren. Dazu müssen sie in der Lage sein, ihr Umfeld zu überschauen und zu erkennen, wo und wie sich ihr Pflegling bewegt. Der sechsdimensionale Blick aus der Automobilforschung ermöglicht das.

Das Vorschlagsrecht zum Deutschen Zukunftspreis obliegt den führenden deutschen Einrichtungen aus Wissenschaft und Wirtschaft sowie Stiftungen.

Das Projekt "6D-Vision – Gefahren schneller erkennen als der Mensch" wurde vom BDI - Bundesverband der Deutschen Industrie e.V. vorgeschlagen.

Inhalt konnte nicht geladen werden

Bitte ändern Sie ihre Privatsphäreneinstellung und aktivieren sie die Kategorie "Externe Inhalte"

Jetzt ändern

Deutscher Zukunftspreis 2011 Erklärfilm ZDF Team 1

"Wir sind überzeugt, dass wir unseren Autos beibringen müssen, ihre Umwelt so zu sehen, wie wir Menschen das tun."

Dr.-Ing. Uwe Franke

Fragen an die Nominierten

Ihr Projekt bewegt sich im Bereich Mensch–Maschine – ein Verhältnis, das nicht immer ganz ungetrübt ist. Maschinen helfen den Menschen, sie ermöglichen es, Entfernungen zu überbrücken, sind aber auch gefährlich für den Menschen. Vom Auto beispielsweise geht eine Gefährdung für die Insassen und auch für die weiteren Verkehrsteilnehmer aus. Das ist der Ausgangspunkt Ihrer Arbeiten. Was kann man Ihrer Meinung nach tun, um die Anzahl der Verkehrsunfälle weiter zu reduzieren? Wie viele Menschen sterben im Verkehr, wo sind die Hauptgefährdungspunkte?

Dr.-Ing. Uwe Franke
In diesem Jahr werden wir etwa 3.500 Tote im deutschen Straßenverkehr zu beklagen haben. Unser Ziel muss es sein, diese Zahl zu verringern. Aber wir kommen von viel höheren Zahlen her, 1970 zählten wir mehr als 20.000 Opfer. Man kann es kaum glauben: 20.000 Tote! Zum Glück ist es gelungen, diese Zahl im Mittel alle 15 Jahre zu halbieren. Jetzt brauchen wir neue Methoden, um die Zahl der Verkehrstoten in den kommenden 15 Jahren noch einmal zu halbieren. Wir brauchen vorausschauende Sensoren, die gefährliche Situationen frühzeitig erkennen, damit wir den Fahrern helfen können, Unfälle zu vermeiden. Wir sind überzeugt, dass wir unseren Autos beibringen müssen, ihre Umwelt so zu sehen, wie wir Menschen das tun.

Dr. rer. nat. Stefan Gehrig
Der größte Unfallschwerpunkt sind Straßenkreuzungen mit rund 30 Prozent aller Unfälle mit Verletzten. Unfälle ereignen sich beim Einbiegen in eine Kreuzung, beim Abbiegen, beim Längsverkehr entlang der Kreuzung und beim Queren, sowohl mit als auch ohne Ampelanlage. Fußgängerunfälle kommen mit weiteren zehn Prozent dazu, und auch Unfälle mit Fahrradbeteiligung sind mit fünf Prozent nicht gerade selten.

Die Automobilindustrie unternimmt seit Jahren große Anstrengungen, solche Gefahren zu verringern; auch in Ihrem Haus entstanden dazu wesentliche Entwicklungen. Welche waren das?

Dr.-Ing. Uwe Franke
Gehen Sie in die 1950er-Jahre zurück, da gab es das erste Mal eine Knautschzone. In den 1980er-Jahren kamen die elektronischen Helfer ABS und ESP® hinzu, von denen wir heute wissen, dass sie sehr viele Unfälle verhindern. Im Jahr 2000 kam dann der erste Spurassistent für Lkw auf den Markt, für den ich selbst die Bildverarbeitung entwickelt habe. Diese Systeme sind heute auch in vielen Pkw verfügbar und helfen dort, das Fahren sicherer zu machen. Seit 2006 hilft die PRE-SAFE®-Bremse mit ihrem Radar, Auffahrunfälle zu verhindern oder zumindest durch eine starke Bremsung die Folgen zu mindern.

Ihr Projekt hat eine längere Entwicklung in verschiedenen Schritten hinter sich. Wie ging das vonstatten?

Dr.-Ing. Uwe Franke
Es begann Anfang der 1990er-Jahre, als wir das erste Mal eine Kamera hinter der Windschutzscheibe befestigten. Damals haben wir uns gefragt: Wie kann man das Abkommen von der Fahrbahn verhindern? Später haben wir versucht, Abstände zu vorausfahrenden Fahrzeugen zu messen. Da wurde uns schnell klar, dass das nur dann wirklich gut geht, wenn wir unseren Autos zwei „Augen“ geben. Ein Fahrzeug muss dreidimensional sehen – wie der Mensch. Schon 1996 habe ich deshalb unser erstes Stereosystem aufgebaut. Damit konnten wir einen Fußgänger erkennen, allerdings nur, wenn er direkt vor dem Fahrzeug stand – eine Chance, beispielsweise ein auf die Straße laufendes Kind frühzeitig zu erkennen, hatten wir nicht. Das war die große Herausforderung. Anfang 2000 gab es dazu einen ersten Ansatz, der aber noch nicht ausgereicht hat. Die zündende Idee kam dann 2004, sodass wir heute in der Lage sind, innerhalb einer sehr kurzen Zeit – wir reden von 200 Millisekunden – akute Unfallgefahren zu erkennen.

Welche Technologieentwicklungen waren dazu notwendig?

Dr.-Ing. Clemens Rabe
Die erste große Herausforderung war, dem Rechner das beizubringen, was wir Menschen schon von Natur aus können, nämlich dreidimensional zu sehen, also zu jedem Bildpunkt die 3D-Position relativ zum Fahrzeug zu messen. Das war ein grundlegender Schritt, denn damit können wir Hindernisse erkennen, die sich direkt vor dem Fahrzeug befinden. Der zweite wichtige Schritt war, zusätzlich die Bewegungsinformation zu nutzen. Ein Verkehrsteilnehmer, der sich unmittelbar vor dem Fahrzeug befindet oder sich von uns wegbewegt, stellt keine Gefahr dar. Taucht er allerdings von der Seite auf, wird die Situation schnell gefährlich.

Verbindet man die 3D- und die Bewegungsinformation in einem naiven Ansatz, merkt man sehr schnell, dass man nicht weit kommt. Daher haben wir uns zusammengesetzt und das 6D-Vision-Verfahren entwickelt, das es uns erlaubt, die Bewegungsinformation über die Zeit zu filtern. Nur dadurch sind wir nach 200 Millisekunden in der Lage, mit Sicherheit zu sagen: Hier bewegt sich etwas auf uns zu und könnte für uns riskant werden. Das schaffen andere Verfahren nicht.

Welcher dieser einzelnen Schritte war denn der schwierigste oder der technisch anspruchsvollste? Wie kam es zu dem entscheidenden Moment, dass es dann funktioniert hat?

Dr.-Ing. Clemens Rabe
Die zeitliche Filterung der 3D-Punkte war etwas, was man sich am Anfang nicht so recht traute, weil sie extrem rechenaufwendig ist. Doch wir waren einfach so dreist und haben es probiert. Und mit entsprechenden Optimierungen sind wir mittlerweile in der Lage, diese 3D-Bewegung an bis zu 10.000 Punkten im Bild in Echtzeit – das heißt 25 Mal pro Sekunde – zu ermitteln.

Dr.-Ing. Uwe Franke
Das war letztendlich das Verdienst von Herrn Rabe. Am Anfang war die Berechnung fürchterlich langsam. Aber wir wollten das Verfahren unbedingt im Auto testen und nicht nur auf einer Workstation. Clemens hat es geschafft, das System um mehr als den Faktor 100 zu beschleunigen, sodass es auch im Auto erlebbar wurde. Während der Entwicklung hatten wir immer nur wenige kurze Bildsequenzen untersucht, und plötzlich konnten wir stundenlang durch Esslingen fahren und sehen, dass alles tatsächlich so funktionierte, wie wir es uns vorgestellt hatten.

Dr. rer. nat. Stefan Gehrig
Für mich war der entscheidende Moment der, als wir beim Simulieren sahen, dass wir auch bei stark verrauschten Daten langsame Bewegungen in großen Entfernungen richtig messen konnten.

Wie läuft das ab? Das „Gerät“, die Kamera und alles, was dahintersteckt, erkennt eine Gefahr, dann reagiert das Auto und bremst, und der Mensch, der darin sitzt, erschrickt?

Dr. rer. nat. Stefan Gehrig
Das würde typischerweise in mehreren Stufen verlaufen. Wenn das Sicherheitssystem – die Kamera im Auto – eine Gefahr wahrnimmt und der Mensch nicht darauf reagiert, würde es erst einmal den Fahrer warnen, zum Beispiel akustisch, mit einem Warnton. Wenn dann der Fahrer weiterhin nicht reagiert und der Unfall unmittelbar bevorsteht, dann wird ein wirklich leistungsfähiges System auch eingreifen. Das ist der Augenblick, in dem man sehr froh ist, wenn das Auto etwas von alleine macht, weil es genau dann den möglicherweise folgenschweren Unfall verhindern kann.

Und die Reaktionszeit – das sagt ja der Titel Ihres Projektes – ist bei der Maschine kürzer als beim Menschen?

Dr. rer. nat. Stefan Gehrig
Genau, die Reaktion ist mindestens um den Faktor 2,5 besser. Selbst die aufmerksamsten Menschen haben keine Chance, eine Gefahr in einer Straßenszene in weniger als 500 Millisekunden wahrzunehmen. Man muss erst einmal die visuellen Reize verarbeiten. Dann ist meistens die Gefahr nicht unmittelbar dort, wo man hinschaut, man muss also noch eine Blickzuwendung vollziehen und neue visuelle Reize verarbeiten, was bekanntermaßen mehrere 100 Millisekunden dauert. In Summe ist dann selbst der aufmerksamste Autofahrer, der hellwach ist, mindestens eine halbe Sekunde damit beschäftigt zu erkennen, dass es sich um eine Gefahr handelt. Und um dann das Bremspedal zu betätigen, vergeht noch einmal eine halbe Sekunde – das alles summiert sich zu der berühmten Schrecksekunde.

Dr.-Ing. Uwe Franke
Das hat nichts mit dem Alter eines Autofahrers zu tun, sondern ist schlicht und einfach physiologisch bedingt. Wir Menschen brauchen eben eine Sekunde, bis wir bei einer plötzlich auftretenden Gefahr eine Reaktion zeigen. Genau das ist der Punkt: Weil wir mit unserem neuen System immer aufmerksam sind und extrem schnell sehen können, können wir schneller reagieren als der Mensch. Wenn Sie in der Stadt mit 50 km/h fahren – das sind ungefähr 14 Meter pro Sekunde – und nur ein halbe Sekunde früher bremsen, stehen Sie sieben Meter früher – sieben Meter, die über Tod oder Leben entscheiden können.

Wie groß war das Team, und wie haben Sie zusammengearbeitet? Gab es externe Partner oder weitere wissenschaftliche Unterstützung im Projekt?

Dr.-Ing. Uwe Franke
Das Ganze ist weitgehend eine Entwicklung hier im Hause Daimler. Wie bereits erwähnt, hatte ich 1996 das erste Kamerasystem mit zwei Kameras aufgebaut. Wir haben das drei-dimensionale Sehen über mehrere interne Projekte, aber auch in vom BMBF und BMWi geförderten Verkehrsprojekten, schrittweise weiterentwickelt. Natürlich pflegen wir auch intensive Kontakte zu Universitäten und Forschungseinrichtungen und tauschen uns auf Konferenzen aus. Und wir hatten einen kompetenten Partner in Zürich, der uns geholfen hat, die Basisfähigkeit „Stereosehen“ auf einen fahrzeugtauglichen, preisgünstigen Prozessor zu implementieren.

Dr. rer. nat. Stefan Gehrig
Das ist ein gutes Beispiel dafür, wie wir mit Partnern zusammenarbeiten. Das „Stereosehen“ ist letztendlich ein Verfahren, auf das wir auf einer Konferenz gestoßen sind; dort wurde es zum ersten Mal publiziert. Es wurde von einem Kollegen von der DLR entwickelt. Wir haben gesehen, dass es sehr gut funktioniert, und gleich mit ihm gesprochen, wie man es für unsere Anforderungen konkret umsetzen kann. Dann haben wir es als ersten Schritt mit einer Implementierung auf dem PC versucht. Das Verfahren arbeitete einfach besser als jedes andere und hatte das Potenzial, in Echtzeit zu laufen. Das funktionierte aber nicht, weshalb wir dann mit den Kollegen aus Zürich, den Spezialisten für Hardware und Optimierung, zusammengekommen sind, um das Verfahren auf einem kleinen Spezialchip zu implementieren.

Dr.-Ing. Uwe Franke
Ein 3-GHz-PC mit einer Leistungsaufnahmen von 300 Watt – das geht im Auto nicht. Wenn etwas serienmäßig ins Auto eingebaut werden soll, muss es klein sein, vor allem darf es nicht viel Strom brauchen. Dabei geht es in diesem Fall nicht um den Spritverbrauch. Das Problem ist, dass die Prozessoren zu viel Wärme entwickeln, und wir wollen unser Kamerasystem ja an der Scheibe hinter dem Rückspiegel montieren.

Wenn man sich die einzelnen Schritte in diesem Projekt anschaut: Was ist das wirklich Innovative an dem Projekt, das nun mit der Nominierung gewürdigt wird?

Dr.-Ing. Uwe Franke
Das Innovative ist zum einen, dass wir es geschafft haben, die wesentlichen Merkmale menschlichen Sehens, nämlich das räumliche Sehen und die Wahrnehmung von Bewegung, in ein preisgünstiges technisches System zu packen. Und dass es uns zum anderen gelungen ist, dieses System so robust zu machen, dass man damit Fahrerassistenzsysteme bauen kann, die auch bei schlechtem Wetter funktionieren und so das Fahren wirklich sicherer machen.

Das System befindet sich noch im Erprobungsstadium, es ist noch nicht auf dem Markt. Wann wird das der Fall sein? Und ist es dann ein neues Sicherheits-Tool, das als Luxus für den Käufer hochpreisiger Wagen dient – oder anders gefragt: Ist es nur eine kleine Minderheit, die mit Ihrem System zur Unfallverhütung beitragen kann?

Dr.-Ing. Uwe Franke
Wie Sie vielleicht gelesen haben, wird die nächste Generation der Mercedes-Benz S-Klasse ein Stereokamerasystem bekommen. Wir werden diese Stereokamera in den nächsten Jahren in viele unserer Fahrzeuge sukzessive einbringen und entwickeln aktuell ein ganzes Bündel von Fahrerassistenzsystemen auf dieser Basis.

Das heißt aber doch, dass das neue Sicherheitssystem vorerst nur Käufern einer gewissen Preiskategorie zur Verfügung stehen wird. Oder haben wir eine Entwicklung zu erwarten wie zum Beispiel beim Airbag, der heute selbst im kleinsten Fahrzeug vorhanden ist?

Dr.-Ing. Uwe Franke
Das Zweite trifft zu. Es gibt eine ganz klare Politik bei Daimler. Und die ist – wie beim Airbag, wie bei ESP®, ABS oder ähnlichen Sicherheitsverbesserungen –, dass nach einer bestimmten Zeit Innovationen auch anderen Automobilherstellern zugänglich gemacht werden. Wir werden nicht bei unseren Oberklassefahrzeugen stehen bleiben, sondern diesen neuen Sensor sehr schnell in die anderen Fahrzeugklassen einbauen. Wenn wir den Verkehr sicherer machen wollen, müssen möglichst viele Autos mit solchen Systemen ausgerüstet werden.

Dr. rer. nat. Stefan Gehrig
Die entwickelte Stereotechnologie ist schon jetzt für weitere Interessenten erhältlich. Es gibt andere Forschungs- und Entwicklungseinrichtungen, die ebenfalls an räumlicher Bildanalyse interessiert sind.

Gibt es denn Wettbewerb? Und wie stellen sich die Vorteile Ihres Systems gegenüber denen der Wettbewerber dar?

Dr. rer. nat. Stefan Gehrig
Wettbewerber sind natürlich, viele Automobilhersteller haben ebenfalls Fahrerassistenzsysteme am Markt. In Japan beispielsweise gibt es eine sehr lebhafte Fahrerassistenzkultur: Dort hat Toyota 2006 ein Stereosystem auf den Markt gebracht, das zunächst einmal Komfortfunktionen für das adaptive Tempomatfahren erfüllt, aber auch unterstützend bei Notbremssituationen im Längsverkehr Sensordaten liefert. Was diese Systeme allerdings nicht adressieren, sind Situationen, in denen Verkehrsteilnehmer noch nicht in meiner eigenen Fahrspur sind, sondern erst auf dem Weg dahin – also gerade der Fußgänger, der im Begriff ist, auf die Straße zu laufen. Solche Situationen werden von keinem existierenden System beherrscht.

Dr.-Ing. Uwe Franke
Das Stereosehen, also das dreidimensionale Sehen, ist dort vorhanden, aber die zeitliche Komponente, die 6D-Vision ausmacht, fehlt völlig. Wir müssen jedoch die Bewegung gefährdeter Objekte so früh messen, damit wir eine Kollisionsgefahr erkennen, bevor zum Beispiel das Kind auf die Straße gelaufen ist. Wenn der Fahrer das Kind direkt vor der Nase hat, ist es leider meistens schon zu spät.

Dr. rer. nat. Stefan Gehrig
Diese vorausschauende Komponente ist umso wichtiger, je höher die Geschwindigkeit des anderen Verkehrsteilnehmers ist, zum Beispiel für Fahrradfahrer oder ein Auto, das von der Seite kommt. Mit 6D-Vision können wir ein Kreuzen der Fahrspur in einer Sekunde voraussagen.

Dr.-Ing. Uwe Franke
Wir sollten uns in unserem Gespräch nicht zu sehr auf den Fußgänger fokussieren, denn das ist ja gerade das Besondere an unserem System, dass wir beliebige Objekte, die unsere Fahrtrichtung kreuzen könnten, sehr schnell anhand ihrer Bewegung erfassen. Das kann ein Auto sein, aber auch ein Fahrradfahrer, ein Rollstuhlfahrer – oder auch ein Tier.

Ist Ihre Innovation patentrechtlich abgesichert?

Dr.-Ing. Uwe Franke
Ja, wir haben Schutzrechte darauf angemeldet, 2004 und 2005, in der Zeit, als wir die Grundlagen gelegt haben. Das geschieht immer mit Erfindungen, von denen wir glauben, dass sie eines Tages relevant werden können. Für Details der Stereoanalyse gibt es weitere Patente aus den vergangenen Jahren.

Dr. rer. nat. Stefan Gehrig
Inzwischen ist das Verfahren an unseren Zulieferer lizenziert worden, der mit uns zusammen die ersten 6D-Vision-Funktionen für die kommenden Fahrzeuggenerationen realisiert.

Ihre Innovation ist für den Verkehr, den Einsatz in Autos, gedacht. Gibt es noch andere Anwendungsmöglichkeiten für das Prinzip?

Dr.-Ing. Clemens Rabe
Ja, natürlich. Vor allem für das leistungsfähige Stereoverfahren, das wir auf einem kleinen und preiswerten Chip implementieren konnten, bieten sich viele Möglichkeiten. In der industriellen Fertigung werden unzählige Kameras und teure Laserscanner eingesetzt. Viele davon können auf Dauer durch unser Stereosystem ersetzt werden. Ein völlig neues Feld sind die künftigen 3D-Fernseher. Wir stehen mit einem Hersteller in Kontakt, der in jedem Fernseher eine komplette Stereoanalyse vornehmen möchte. Natürlich kann man das Verfahren auch für Computerspiele verwenden. Aber das ist mit der Einführung von Microsofts Kinect-Technologie bei der Xbox vielleicht nicht mehr ganz so attraktiv.

In jeden Fall bietet die Robotik typische Anwendungsmöglichkeiten, nämlich zur Navigation von autonomen Robotern oder bei Servicerobotern. Mit diesem System kann man die Umwelt eben nicht nur in 3D, sondern in 3D plus Bewegung wahrnehmen.

Ein Kriterium der Nominierung zum Deutschen Zukunftspreis ist es, dass mit der Innovation Arbeitsplätze geschaffen werden Wie sieht das in Ihrem Projekt aus?

Dr. rer. nat. Stefan Gehrig
Innerhalb des Unternehmens haben wir jetzt schon eine „Abteilungs-Teilung“ für die 6D-Vision-Technologie vorgenommen, da sind aus einer Abteilung zwei geworden – das entspricht einem Zuwachs von etwa 20 jungen Ingenieurinnen und Ingenieuren. In der Forschung und Vorentwicklung haben wir ein neues Team aufgebaut, das sich mit Anwendungen der Technik beschäftigt. Auf der Seite unseres Zulieferers sind ebenfalls Dutzende Einstellungen in diesem Zusammenhang vorgenommen worden. Langfristig erwarten wir bei entsprechender Verbreitung der Technologie viele zusätzliche Arbeitsplätze, von der Entwicklung über das Testen bis zur Produktion. Die zusätzlichen positiven Effekte im Bereich der Elektroniklieferanten kann ich nicht abschätzen.

Dr.-Ing. Uwe Franke
Stefan hat recht. Nicht nur die Entwicklungsabteilungen aller Autofirmen, die die Kameratechnik in die Fahrzeuge bringen, wachsen schnell, auch in der gesamten Zulieferkette entstehen viele attraktive Arbeitsplätze für Ingenieure und Informatiker. Wenn man derzeit in Deutschland einen Uni-Abgänger mit Background Bildverarbeitung sucht, hat man ein Riesenproblem: Man findet keinen.

Was wäre denn eine optimale Ausbildung? Muss man Ingenieur und Informatiker sein? Was würden Sie jemandem empfehlen, der sich dafür interessiert und vor der Studienwahl steht?

Dr.-Ing. Clemens Rabe
Wenn ein technisches Grundverständnis, der Wille und die Motivation da sind, kommt der Rest von allein. Es kommt nicht so sehr darauf an, ob jemand in seinem Studium nur Einser geschrieben hat, sondern ich finde es wichtig, dass er sich auch außerhalb des Studiums mit der Thematik befasst und vor allem selbstständig arbeiten kann.

Dr.-Ing. Uwe Franke
Die Anfänge der Bildverarbeitung liegen in der Nachrichtentechnik, im Elektrotechnikbereich. Das hat sich heute in die Informatik verlagert. Der ideale Mitarbeiter hätte auf beiden Seiten Erfahrung – aber das ist eher selten. In einigen Universitäten gibt es Informatik mit Schwerpunkt Bildverarbeitung, das ist natürlich das Optimum. Die Mitarbeiter meines Teams bei Daimler sind Informatiker, Elektrotechniker und Physiker– vielleicht gerade gut, dass jeder einen anderen Blick auf das Ganze hat.

Ihre Entwicklung stellt sich als konsequenter Prozess dar – Entwicklungsschritt folgt auf Entwicklungsschritt. Gibt es so etwas wie Kreativität in einem solchen Prozess? Ist die überhaupt gefordert?

Dr.-Ing. Uwe Franke
Unbedingt. Ja, man hat eine Vision, man weiß, wo man hin will. Aber niemand sagt einem, wie man dahin kommt. Es gibt kein Lehrbuch, keine Anleitung, die man studieren könnte, oder ein Kochrezept, wie die Probleme zu lösen sind. Da ist eine Menge von Kreativität gefordert, geeignete Lösungsverfahren zu finden, um, wie in unserem Fall, einer Maschine das Sehen beizubringen. Aber das ist ja das Reizvolle an der Forschung.

Dr.-Ing. Clemens Rabe
Ich denke, nach den Designern haben wir einen der kreativsten Jobs in der Firma.

Und wie haben Sie diese Kreativität entwickelt?

Dr.-Ing. Uwe Franke
Wir arbeiten sehr intensiv als Team zusammen. Wesentlich ist, dass wir viel über die zu lösenden Probleme sprechen und versuchen herauszufinden, in welche Richtung wir uns bewegen müssen. Was hat sich als erfolgreich erwiesen, was nicht? Das kann auch aus ganz anderen Aufgabenstellungen resultieren. Wenn bei einem anderen Problem ein Weg erfolgreich war, fragen wir uns: Können wir das nicht auch hier wieder einsetzen?

Auf diese Weise kommt Teil für Teil kontinuierlich zusammen. Und trotzdem gibt es immer wieder einen Moment, an dem man den großen Schritt tut. Wo einer nur etwa vor sich hinsagt, und ein anderer hakt ein: „Stopp mal, das ist doch eigentlich das, wonach wir suchen!“

Hatten Sie irgendwann mal das Gefühl: Das wird jetzt nichts? Oder einen Punkt, an dem Sie sagten: Falscher Ansatz, so kommen wir nicht weiter?

Dr.-Ing. Uwe Franke
Ja, wir hatten ja in einer ersten Arbeit im Jahr 2000 angefangen, die Bewegung, die wir von Bild zu Bild messen, mit der räumlichen Information zu kombinieren. Aber der gewählte Ansatz war einfach nicht robust genug ist. Das heißt: Viel zu viele Bildpunkte haben gerufen: Hallo, ich bewege mich!, obwohl sie zu unbewegten Gegenständen gehörten. Doch dann gab es glücklicherweise die Diplomarbeit von Clemens Rabe, die er damals auf einem ganz anderen Gebiet bei mir schrieb. Als wir seine Ergebnisse neben unser Problem stellten, kam plötzlich die zündende Idee. Wir haben sofort die Arbeiten an dem ersten Ansatz sein lassen und – aber alle Mann! – angefangen, unsere neue Idee umzusetzen, die dann am Ende 6D-Vision geworden ist.

Sie arbeiten hier mit einem eher kleinen Team, das viele Dinge ausprobieren wollte. Lässt man Sie in einem so großen Konzern machen oder werden Sie gedrängt, nach den Ergebnissen gefragt – wie viele Freiheiten hat man in einem solchen Prozess?

Dr. rer. nat. Stefan Gehrig
Ich würde sagen, wir können uns nicht beklagen über die Freiheiten, die wir haben. Selbstverständlich steht hinter jeder Projektfragestellung auch irgendwann einmal ein Produkt. Insofern ist es gut, relativ schnell Ergebnisse vorzuzeigen und sich damit die Freiräume dafür zu schaffen, über die angefragten Projekteigenschaften hinaus noch Verbesserungen umzusetzen. Das ist etwas, das sich bei uns bewährt hat.

Dr.-Ing. Uwe Franke
Wir hatten das Glück, immer Chefs zu haben, die nicht nur Vertrauen in uns hatten, sondern die selbst von der Idee fasziniert waren, Autos das Sehen beizubringen. Die das Vorhaben von den Anfängen an begleitet haben, schon mit den allerersten Projekten zu Beginn der 1990er-Jahre, und die immer an unsere gemeinsame Vision geglaubt haben – auch in Krisenzeiten. Das hat uns sehr viel Rückenwind gegeben.

Löst Ihre Innovation so etwas wie ein gesellschaftliches Problem?

Dr.-Ing. Uwe Franke
Wenn Verletzte und Tote im Verkehr ein gesellschaftliches Problem sind, tragen wir hoffentlich einen Teil zur Lösung bei.

Dr. rer. nat. Stefan Gehrig
Wir haben natürlich eine Wirkanalyse für 6D-Vision gemacht. Dabei schaut man sich die aktuellen Unfallzahlen und den Unfallhergang an. Nun überlegt man sich: Wie viele dieser Unfälle hätten wir mit dem 6D-Vision-System rechtzeitig detektiert, und auf welche hätten wir auch noch entsprechend reagieren können? Dabei kommt für zwei unserer Sicherheitsinnovationen zusammengerechnet eine Unfallzahlenreduktion – das betrifft die Schwerverletzten und Toten – um 15 Prozent heraus. Und wir arbeiten ja an weiteren sicherheitsrelevanten Innovationen, die wir noch nicht untersucht haben. Da ist das Potenzial schon relativ groß. Und es lässt sich noch deutlich erweitern, wenn wir das Sichtfeld der Kamera weiter vergrößern. Das ist eine große Herausforderung, was das Thema Rechenzeit betrifft, aber ansonsten ist es vom Prinzip 6D-Vision her problemlos möglich.

Was macht denn Ihren Beruf, Ihrer Aufgabe, spannend? Und warum sollte man sich für so ein Arbeitsumfeld entscheiden? Sie, Dr. Rabe – frisch promoviert –, sind ja derjenige, der das gerade hinter sich hat.

Dr.-Ing. Clemens Rabe
Ganz einfach: Es macht Spaß! Sachen zu erfinden und in einem Superteam zusammenarbeiten, das ist schon an sich viel. Was mir am meisten gefällt, ist, dass man etwas programmiert und sofort sieht, ob es funktioniert oder nicht. Das ist das Tolle bei Bildverarbeitung: Sie sehen sofort, was passiert, das ist ein enormer Vorteil. Und die Freiheit, in der Forschung auch einmal einen vielversprechenden Seitenast gehen zu können, etwas Neues auszuprobieren, ohne 1.000 Unterschriften einholen zu müssen, ist einfach super. Das gibt Freiräume, in denen man wachsen und dann auch seine Verantwortlichkeiten zum Teil selber definieren kann. Das ist optimal.

Dr.-Ing. Uwe Franke
Man sieht es im täglichen Leben – die wirklich spannenden Innovationen gibt es heute in der Kommunikationstechnik, der Medientechnik, in der Informationsverarbeitung. Das sind Berufe, in denen man wirklich kreativ sein kann und wo das auch gefordert ist. Man muss aber auch die Freiräume bekommen, die es erlauben, Kreativität zu entfalten, neue, noch ganz ungedachte Ideen zu entwickeln. Solche Dinge sind spannend und jeden Tag neu, und unser Job ist morgen nicht der gleiche wie heute. Das ist einfach toll.

Dr. rer. nat. Stefan Gehrig
Was auch noch schön ist: Wir haben diese Kombination aus neuen Techniken, Informationstechnik und Bildverarbeitung, und wir sind unterwegs im klassischen Auto, das es ja schon seit 125 Jahren gibt. Das ist natürlich eine schöne Kombination, dass wir diese Bildverarbeitungstechnik auch ins Auto bringen und so wirklich einen spürbaren, sichtbaren Mehrwert stiften.

Welche Vorstellung von einem Beruf hatten Sie als sehr junger Mensch oder als Kind?

Dr.-Ing. Clemens Rabe
Als Kind wollte ich entweder Gärtner oder „Daniel Düsentrieb“ werden. Die Idee mit dem Gärtner hat sich schnell erledigt, ich habe einfach keinen grünen Daumen. Und die Vorstellung, als Erfinder zu arbeiten, geriet mit der Zeit in den Hintergrund, spätestens als ich Informatik studierte und Programmierer werden wollte. Mein Einstieg in dieses Team hat sich durch meine Diplomarbeit bei Uwe Franke ergeben. Das war der zündende Funke. Ich wollte damals in ein großes Unternehmen und hatte mir drei Wunschthemen herausgesucht, die für mich komplett neu waren. Eines dieser Themen war die Bildverarbeitung. Dieses Gebiet hat mir von Anfang an sehr viel Spaß gemacht. Vielleicht bin ich jetzt beides, Programmierer und Erfinder.

Dr. rer. nat. Stefan Gehrig
Von der Kindheit an war Technik immer dabei. Ich hatte Leistungskurs Mathe und Physik. Begonnen habe ich im Studium mit der technischen Informatik, weil ich auch schon früh Spaß am Computer hatte. Das war mir dann aber ein bisschen zu praktisch. Und so bin ich an die Uni, habe Physik studiert, die Mutter aller Naturwissenschaften. Das habe ich gerne gemacht, bin in die theoretische Physik eingestiegen und habe dann in der Teilchenphysik meine Diplomarbeit geschrieben. Das waren erkenntnistheoretische Arbeiten, nicht Dinge, die man im Alltag später unmittelbar gebrauchen kann.

Und so habe ich mich nach diesen zwei Ausbildungsschritten für den Mittelweg entschieden, die industrielle Forschung. Weiterhin forschen, Grundlagen entwickeln, aber mit einem konkreten Ziel, einer Anwendung im Hintergrund. Und dafür war die Industriepromotion bei Daimler perfekt. Es war auch relativ einfach, diese Stelle hier zu finden. Ich hatte schon in meinem ersten Studium Kontakt zu Uwe Franke und habe ihm dann aus Amerika, wo ich die Diplomarbeit verfasst habe, einfach geschrieben: Wie sieht es denn aus? Könnte ich da nicht einsteigen? Eben mit dem Hintergrund, dass man promovieren und so den Mittelweg zwischen Grundlagenforschung und Anwendung gehen kann.

Dr.-Ing. Uwe Franke
Bei mir beginnt es schon viel früher. Ich bin quasi erblich vorbelastet, mein Vater gehörte zu den ersten Programmierern in Deutschland. Ich habe bereits zum Ende der Schule hin mit meinem Physiklehrer den Informatikunterricht für die nachfolgende Generation aufgebaut. Dann habe ich Elektrotechnik studiert. Nach dem Vordiplom bin ich von dem Professor für Nachrichtentechnik angesprochen worden, ob ich nicht bei ihm als Student arbeiten wollte. Wollte ich! Das Thema war Bildkodierung, was Sie heute aus Ihrem Alltag kennen: jpg-Codierung, mpg-Codierung – daran durfte ich mitarbeiten und habe später auch auf diesem Gebiet promoviert. Dann hörte ich zufällig, dass hier bei Mercedes-Benz mein künftiger Chef einen neuen Mitarbeiter suchte, der sich im Bereich Bildverarbeitung auskannte, denn er wollte mithilfe einer Kamera Autos automatisch fahren lassen. Diese Vision hat uns dann 20 Jahre lang gemeinsam voranschreiten lassen. Deshalb habe ich allen Versuchungen, die Firma zu verlassen, widerstanden und bereue das auf keinen Fall. So kam es, dass ich mich seit dem Studium, mein ganzes Leben lang, mit Bildern beschäftigt habe – erst mit der Kompression, dann mit der Verarbeitung, und heute beginnen unsere Computer wirklich die Welt des Verkehrs zu verstehen.

Ist es noch eine Vision, hat es noch die Faszination, die Sie früher verspürten?

Dr.-Ing. Uwe Franke
Auch wenn wir schon viel erreicht haben: Es ist immer noch eine Vision, und es ist immer noch faszinierend. Was wir heute sehr gut können, ist, Abstände messen, Bewegungen wahrnehmen. Doch wir träumen davon, dass Autos ihre Umgebung wirklich verstehen – so wie wir Menschen das tun. Der Mensch fährt die Straße entlang, sieht ein Kind und weiß intuitiv aufgrund seines Verhaltens, ob es ihn gesehen hat oder nicht. Was wir dabei tun, ist eigentlich auch Bildverarbeitung. Wir schauen: Dreht es den Kopf, wie ist die Körperbewegung? Diese Absichtserkennung, die beim Menschen erfolgt, die wollen, die müssen wir in den nächsten Jahren unserem Fahrzeug beibringen. Aber ich bin überzeugt, dass wir auch diese Herausforderung meistern werden.

Bringen Sie dem Rechner so etwas wie „Lebenserfahrung“ bei?

Dr. rer. nat. Stefan Gehrig
Irgendwann einmal wird das Auto ein Gedächtnis bekommen. Wenn man selbst an einer Stelle vorbeigefahren ist, die besonders eng ist und man nicht schnell um die Kurve fahren kann, entsteht Zusatzwissen, das man über die Zeit ansammelt und irgendwo ablegt. Wenn man wieder an diese Stelle kommt, ruft man das ab. So etwas ist im technischen Horizont absolut drin.

Es gibt auch viele statistische Verfahren in der Bildverarbeitung. Man zeigt dem Rechner Beispiele: So sieht ein Kind aus, das mich gesehen hat, und so sieht eines aus, das mich nicht wahrgenommen hat. Auf diese Beispiele hin kann ich den Computer trainieren, und er kann dann genau diese zwei Situationen – das aufmerksame Kind und das nicht aufmerksame Kind – voneinander unterscheiden.

Dr.-Ing. Uwe Franke
Wir haben einen Doktoranden im Team, der sich genau mit dieser Frage beschäftigt. Er hat viele Videosequenzen von Fußgängern, die auf die Straße zulaufen, dort anhalten oder eben weiterlaufen, und versucht, das wissenschaftlich zu greifen und dem Rechner beizubringen. Die aktuellen Ergebnisse machen mich optimistisch.

Lassen Sie uns noch einmal auf Ihr persönliches Leben kommen. Gab es Vorbilder, Personen, die Sie in Ihrem Werdegang beeindruckt oder beeinflusst haben?

Dr.-Ing. Uwe Franke
Ja, da gab es zwei. Das erste Vorbild war mein Mathematikprofessor, der vier Semester Mathematik aus dem Stegreif vortragen konnte und uns allen die Angst vor der Mathematik genommen hat. Für ihn war Mathematik was ganz Einfaches, was ganz Logisches, man muss es einfach nur tun. Das zweite Vorbild war mein späterer Doktorvater. Von ihm habe ich gelernt, auch komplizierte Dinge so darzustellen, dass jeder Mensch sie verstehen kann. Das versuche ich umzusetzen.

Dr. rer. nat. Stefan Gehrig
Bei mir war der Physiklehrer mitverantwortlich, dass ich letztendlich in der technischen Schiene mit Informatik und Physik gelandet bin. Auch er hatte die Fähigkeit – obwohl er die wüstesten Gleichungen angeschrieben hat –, einem die Angst zu nehmen, wie man eine solche Gleichung angeht. Er verwendete immer sehr einfache Verfahren, wie man so etwas praktisch löst. Da wurde viel mit Anschauung, mit Bildern statt Formeln gearbeitet, und das ist, glaube ich, essentiell, dass man nicht nur das Ganze in einer Formel niederschreibt, sondern auch in bildliche Analogien fasst. Vielleicht resultiert daraus auch meine Affinität zur Bildverarbeitung. Ein Bild sagt mehr als tausend Worte, und auch eine Formel ist manchmal im Bild besser beschrieben als in den entsprechenden Formelzeichen.

Dr.-Ing. Clemens Rabe
Die Begeisterung für Technik habe ich von meinem Vater geerbt. Schon als Kind hat es mir sehr viel Spaß gemacht, mit Fischer Technik kleine Roboter zu basteln und später kleine elektronische Schaltungen zu bauen. Nachdem mein Vater den ersten Computer gekauft hatte, habe ich mir das Programmieren selber beigebracht, da hatte ich kein Vorbild.

Zeigen Sie denn auch Interessierten, Schülern und Studenten, was Sie tun?

Dr.-Ing. Uwe Franke
Sehr gerne. Wir haben immer wieder Schülergruppen zu Besuch und gute Kontakte zur Hochschule für Technik in Stuttgart; jedes Jahr kommt eine Gruppe interessierter Studenten zu uns. Stefan Gehrig hält derzeit Vorlesungen an der Dualen Hochschule Baden-Württemberg. Ich habe das auch viele Jahre lang gemacht, als Werbung für das Fachgebiet. Heute werde ich regelmäßig zu Vorträgen an Universitäten eingeladen, um Studenten zu zeigen, wohin sich unser Gebiet entwickelt und dass sie mit dem, was sie studieren, begeisternde Dinge tun können.

Wie ist es denn inzwischen mit dem Frauenanteil? Kommen die in Ihren Bereichen nach?

Dr.-Ing. Clemens Rabe
Ja, langsam kommen sie nach. Ich denke, wir haben einen Anteil, der über dem Durchschnitt der Studenten liegt, so bei 20 Prozent. Phasenweise waren wir sogar das Team mit den meisten Frauen. Frauen können mindestens so gut Mathematik wie Männer, das sieht man ja schon in der Schule. Wir würden uns freuen, wenn sich mehr Abiturientinnen für die Informatik interessieren würden.

Dr. rer. nat. Stefan Gehrig
An der Hochschule in meinen Vorlesungen gibt es bis zu 20 Prozent Frauenanteil. Aber schon in den 1980er-Jahren waren in meinem Studienjahrgang 25 Prozent Frauen. Das war auch für damalige Verhältnisse schon etwas Besonderes.

Dr.-Ing. Uwe Franke
In Amerika liegt die Frauenquote in Computer Science bei 30 Prozent. Es ist nicht wirklich verständlich, warum es bei uns in Deutschland so anders ist.

Womit motivieren Sie sich, was ist Ihr Antrieb?

Dr.-Ing. Uwe Franke
Sehen Sie: Unser Traum wird wahr, Autos können sehen. Wenn das nicht motiviert! Aber Anerkennung von außen muss auch sein. Für uns Forscher heißt das: Vorträge halten auf wissenschaftlichen Konferenzen, eingeladen werden zu Vorträgen von Leuten, die wissen, dass man schon lange auf diesem Gebiet erfolgreich arbeitet – das ist das Salz in der Suppe. Für wissenschaftliche Veröffentlichungen arbeiten unsere Doktoranden Tag und Nacht. Sie kämpfen dafür, dass ein wirklich guter Beitrag entsteht, und wenn dann – wie wir es voriges Jahr gleich drei Mal erleben durften – ein Artikel auch noch als bester Beitrag der Konferenz ausgezeichnet wird – ja, das ist Munition, das ist Antrieb für ein ganzes weiteres Jahr.

Dr. rer. nat. Stefan Gehrig
Mich motiviert erst einmal das Thema an sich, das ich super spannend finde. Was mich zusätzlich motiviert, ist, dass man die Freiräume bekommt für Dinge, die einem am Herzen liegen, zum Beispiel eine Publikation zu schreiben. Das ist nicht das, was den Firmengewinn der Daimler AG unmittelbar nach oben schnellen lässt. Aber für solche Dinge die Freiräume und auch Anerkennung innerhalb der Firma zu bekommen, das motiviert schon sehr. Nicht motivierend ist bürokratischer Kleinkram, der kann einem mitunter den Tag vermiesen.

Dr.-Ing. Clemens Rabe
Ich finde es – neben Anerkennung natürlich – besonders motivierend, wenn man in einem Projekt mitarbeitet und am Ende sieht, dass es funktioniert. Besonders wenn es die eigenen Erwartungen übertrifft. Natürlich gibt es dann auch wieder Tage, an denen es nicht so gut läuft, zum Beispiel wenn man die Lösung für ein Problem noch nicht gefunden hat. Hat man dann das Problem aber gelöst, ist das umso motivierender.

Was machen Sie außerhalb Ihrer Tätigkeit hier? Was gibt es noch in Ihrem Leben?

Dr. rer. nat. Stefan Gehrig
Den Hauptteil meiner Freizeit verbringe ich mit meinen Kindern. Die gehen irgendwann schlafen, dann gibt es noch Gelegenheit für andere Hobbys. Ich tanze sehr gern, wozu ich leider, seit die Kinder da sind, viel zu selten komme. Ich fahre gern Mountainbike, das kann ich sogar mit dem Weg zur Arbeit verbinden. Und Reisen unternehme ich auch sehr gerne.

Dr.-Ing. Clemens Rabe
Bis vergangenes Jahr war mein Hobby Doktorarbeit schreiben, da blieb wenig Zeit für andere Dinge. Mittlerweile bin ich auf der Suche nach neuen Freizeitaktivitäten. Ich gehe gerne Wandern, beispielsweise mit meinen ehemaligen Studienkollegen, zu denen ich noch guten Kontakt habe. Aber ich sitze auch gerne zu Hause am Computer und programmiere oder probiere neue Dinge aus.

Dr.-Ing. Uwe Franke
Unsere Freizeit wird wesentlich mit Musik verbracht. Meine Frau ist Musiklehrerin. Wir sind in zwei Chören aktiv, das heißt zwei Mal in der Woche Chorprobe, Veranstaltungen, Auftritte … Daneben Sport, es locken die Berge. Im Winter geht es auf Skitour – auch schon mal sehr hoch hinaus – und im Sommer auf Trekkingtour, entweder in das Himalaja, in die Anden oder, wie jetzt, nach Kirgisien. Da gibt es kein Handy, und man ist weit weg von der Arbeit.

Weitere Details

Lebensläufe

Dr.-Ing. Uwe Franke

11.03.1958
Geboren in Witzenhausen
1976
Abitur am Zeppelin-Gymnasium Lüdenscheid
1977   1983
Studium der Elektrotechnik, Schwerpunkt Nachrichtentechnik an der Rheinisch-Westfälischen Technischen Hochschule (RWTH) Aachen
1983
Diplomarbeit „Untersuchung und Programmierung universeller Störkanäle für Satellitenkanäle“
1983   1988
Wissenschaftlicher Mitarbeiter am Institut für Elektrische Nachrichtentechnik, RWTH Aachen
1988
Dissertation „Regionenorientierte Bildbeschreibung – Algorithmen und Möglichkeiten“ bei Prof. Dr. H.D. Lüke, Rheinisch-Westfälischen Technischen Hochschule (RWTH) Aachen
Seit 1989
Wissenschaftlicher Mitarbeiter der Daimler AG
Seit 2000
Leiter der Arbeitsgruppe „Bildverstehen“ der Daimler Forschung und Vorentwicklung

Weitere Tätigkeiten:

seit 2007
Mitglied im Technischen Komitee der Deutschen Arbeitsgemeinschaft für Mustererkennung (DAGM)
 
Program Chair des IEEE Intelligent Vehicles Symposium IV 2002 in Versailles
 
Mitglied in verschiedenen Programm-Komitees, Gutachter für Konferenzen und Journale
1989   2004
Lehrauftrag der Berufsakademie Stuttgart

Ehrungen:

1988
DAGM (Deutschen Arbeitsgemeinschaft für Mustererkennung) Anerkennungspreis
1988
Preis der ITG (Informationstechnische Gesellschaft)
1989
1989: Wilhelm Borchers-Medaille der der Rheinisch-Westfälischen Technischen Hochschule (RWTH) Aachen
2010
Best Paper Award des IEEE Intelligent Vehicles Symposium IV 2010, San Diego
2010
DAGM Preis (Deutschen Arbeitsgemeinschaft für Mustererkennung)

Dr. rer. nat. Stefan Gehrig

07.08.1968
Geboren in Sindelfingen
1987
Abitur am Otto-Hahn-Gymnasium, Böblingen
1988   1991
Studium der Technischen Informatik, Schwerpunkt Prozessdatenverarbeitung an der Berufsakademie Stuttgart
1991
Diplomarbeit „Erstellung eines heuristischen Verfahrens zur Trendberechnung und Visualisierung am Beispiel „Niedrigwassermenge im Bereich Kernkraftwerk Neckarwestheim““
1990   1997
Studium der Physik an den Universitäten Stuttgart, Tübingen, San Jose und Berkeley
1997
Diplomarbeit „Design and Simulated Performance of the Level 1 Trigger System for the BaBar CP-Violation Experiment“, durchgeführt am LBNL, Berkeley, University of California, CA, USA
1997   2000
Doktorand bei der Daimler AG in Kooperation mit der Eberhard Karls Universität, Tübingen
2000
Dissertation „Design, Simulation, and Implementation of a Vision-Based Vehicle Following System“ bei Prof. H. Ruder, der Eberhard Karls Universität, Tübingen
Seit 2000
Wissenschaftlicher Angestellter bei der Daimler AG in Forschung und Vorentwicklung

Weitere Tätigkeiten:

seit 2005
Mitglied im Arbeitskreis „Bildverarbeitung im Sicherheitsversuch“
 
Mitglied in verschiedenen Programm-Komitees, Gutachter für Konferenzen und Journale
Seit 2002
Lehrauftrag an der Dualen Hochschule Baden-Württemberg Stuttgart

Ehrungen:

2009
Best Paper Award der Intelligent Computer Vision Systems Conference ICVS, Lüttich

Dr.-Ing. Clemens Rabe

08.02.1979
Geboren in Lahn-Gießen
1989   1998
Abitur am Wirsberg-Gymnasium Würzburg
1999   2005
Studium der Informatik, Schwerpunkt Technische Informatik an der FH Würzburg-Schweinfurt
2005
Diplomarbeit „Detektion von Hindernissen vor Fahrzeugen durch Bewegungsanalyse“
2005   2008
Doktorand bei der Daimler AG in der Arbeitsgruppe „Bildverstehen“
2008   2010
Wissenschaftlicher Mitarbeiter der Christian-Albrechts-Universität zu Kiel und Externer Mitarbeiter bei der Daimler AG
Seit 2010
Wissenschaftlicher Mitarbeiter der Daimler AG
2011
Dissertation „Detection of Moving Objects by Spatio-Temporal Motion Analysis“ bei Prof. Dr.-Ing. Reinhard Koch, Universität Kiel

Weitere Tätigkeiten:

1996   2004
Diverse Nebentätigkeiten u.a. als Gesellschafter der Firma Stefan Barwanietz & Clemens Rabe GbR, Programmierer und Wissenschaftliche Hilfskraft am Fraunhofer Institut für Silicatforschung in Würzburg.
2004
Referent zum Thema Musterprogrammierung im Rahmen des Workshops „Pattern CamPP“, Würzburg
2009
Referent zum Thema GPU-Programmierung der NVidia-Konferenz, NVision“, Kalifornien

Kontakt

Projektsprecher

Herr Dr.-Ing. Uwe Franke
Leiter des Teams "Bildverstehen" in Forschung und Entwicklung der Daimler AG
Daimler AG
GR/PAP, HPC G024-BB
71059 Sindelfingen
Tel.: +49 (0) 70 31 / 43 89 873
Fax: +49 (0) 70 31 / 43 89 264
Mobil: +49 (0) 160 / 86 70 975
E-Mail: uwe.franke@daimler.com
Web: www.daimler.com

Pressekontakt

Andrea Häussler
Research, Development and Environmental Communications
Daimler AG
Epplestrasse 225
HPC 000 | 1103
70546 Stuttgart
Tel.: +49 (0) 711 / 17 93 039
Fax: +49 (0) 711 / 17 79 01 10 00
Mobil: +49 (0) 160 / 86 39 074
E-Mail: andrea.haeussler@daimler.com
Web: www.daimler.com

Benjamin Oberkersch
Global Communications Mercedes-Benz Cars (COM/MBC)
Research, Development and Environmental Communications
Daimler AG
Tel.: +49 (0) 711 / 17 93 307
Fax: +49 (0) 711 / 17 79 02 26 21
Mobil: +49 (0) 151 / 58 62 00 19
E-Mail: benjamin.oberkersch@daimler.com
Web: www.daimler.com

Beschreibung der Institute und Unternehmen zu ihren nominierten Projekten

Auch wenn die Zahlen in den letzten Jahren stetig zurückgegangen sind, ereignen sich in Deutschland noch immer ca. 200.000 Unfälle mit Personenschaden allein im innerstädtischen Straßenverkehr. Jetzt lernen Autos das „Sehen“, um die oft komplexen Verkehrssituationen sicher und umfassend zu verstehen. Das ist eine zentrale Voraussetzung, um die Unfallzahlen weiter signifikant zu senken. Insbesondere andere Verkehrsteilnehmer müssen in Sekundenbruchteilen erkannt und Kollisionsgefahren zuverlässig ermittelt werden. Eine rechtzeitige Warnung oder eine blitzschnelle Reaktion kann helfen, folgenschwere Unfälle zu vermeiden. Die Neu- und Weiterentwicklung von Assistenzsystemen, die den Fahrer dabei unterstützen, typische Unfallarten in Kreuzungsbereichen oder Kollisionen mit querendem Verkehr zu vermeiden, stehen daher im Fokus der intensiven Sicherheitsentwicklungen von Mercedes-Benz.

Dr. Uwe Franke, Leiter des Teams „Bildverstehen“ in Forschung und Entwicklung der Daimler AG, Dr. Stefan Gehrig, Experte für Stereobildverarbeitung, sowie Dr. Clemens Rabe, Experte für Echtzeitrealisierung, eröffnen mit ihrem Forschungsprojekt „6D-Vision“ völlig neue Möglichkeiten bei der Gefahrenerkennung und Unfallvermeidung. Ihnen ist es gelungen, mit Hilfe eines Kamerapaars (einer sogenannten Stereokamera) und neuer Algorithmen beliebige bewegte Objekte wie Fahrzeuge, Fahrradfahrer oder Fußgänger in kürzester Zeit zu erkennen und neben ihrer Position auch ihre Bewegungsrichtung und Geschwindigkeit zu messen. Dadurch ist es möglich, genaue Vorhersagen des Kollisionsrisikos zu liefern und das sogar, wenn Verkehrsteilnehmer teilweise von anderen Hindernissen verdeckt werden, beispielsweise wenn von einem auf die Straße rennenden Kind nur Kopf und Oberkörper zu sehen sind.

Das Prinzip: Wir Menschen nehmen mit unseren beiden Augen die Umwelt dreidimensional wahr. Durch „längeres Hinsehen“ sind wir außerdem in der Lage, die Bewegung von Objekten zu schätzen und so potenzielle Gefahren zu erkennen, auch dann, wenn wir uns selbst schnell bewegen. Mit 6D-Vision gelingt es, diese zentrale Fähigkeit des Menschen auf einer kleinen, leistungsfähigen und fahrzeugtauglichen Hardware nachzubilden. Analog zum menschlichen Vorbild verwendet 6D-Vision ein Kamerapaar, aus dessen Bildern die dreidimensionale Geometrie der Szene vor dem Fahrzeug berechnet wird. Zusätzlich werden ausgewählte Bildpunkte von Bild zu Bild verfolgt. Da in jedem Bild wieder die Position in der Welt ermittelt wird, kann durch geeignete Filterung die Bewegungsrichtung und Geschwindigkeit berechnet werden. Gleichzeitig bestimmt 6D-Vision präzise die Bewegung des eigenen Fahrzeugs, so dass stehende und bewegte Hindernisse schnell und sicher unterschieden werden können. Die simultane Bestimmung der Position (3 Dimensionen) und der Bewegung (weitere 3 Dimensionen) relevanter Bildpunkte gab dem neuen Verfahren den Namen 6D-Vision.

Dreidimensional Sehen
Die räumliche Wahrnehmung durch Stereobildverarbeitung steht seit den Anfängen der digitalen Bildverarbeitung in den 1970er Jahren im Blickfeld der Forschung. Sie beruht auf der Tatsache, dass Objekte in den Bildern der rechten und linken Kamera (oder unserer Netzhaut) leicht verschoben abgebildet werden. Diese als „Disparität“ bezeichnete Verschiebung wird mit zunehmender Entfernung immer kleiner. Klassische Verfahren der Stereobildverarbeitung berechnen die Entfernung nur für einzelne Bildpunkte und zeigen signifikante Schwächen bei schwierigen Sichtbedingungen. Im Gegensatz dazu liefern moderne Stereoverfahren, die aufwändige globale Optimierungstechniken einsetzen, zu jedem Bildpunkt eine Messung. Wegen ihres hohen Rechenaufwands konnten sie bis vor kurzem nicht schnell genug gerechnet werden.

Das Forschungsteam um Dr. Uwe Franke hat nach eingehenden Untersuchungen das im Jahr 2005 vom Deutschen Zentrum für Luft- und Raumfahrt (DLR) vorgestellte dichte Stereobildverarbeitungsverfahren „Semi-Global Matching“ – kurz SGM – ausgewählt, das bei internationalen Vergleichen einen Spitzenplatz einnimmt. Die Daimler Forscher haben dieses Verfahren optimiert und so weiter entwickelt, dass es auch nachts und bei schlechtem Wetter robust und zuverlässig arbeitet. Zusammen mit Hardware-Experten der schweizer Firma Supercomputing Systems AG gelang 2008 die weltweit erste fahrzeugtaugliche Umsetzung auf einem preisgünstigen FPGA (field programmable gate array), die es schafft, die Stereoberechnung 25 mal pro Sekunde durchzuführen. FPGAs sind programmierbare Logik-Schaltungen, die gleichzeitig viele Eingangsdaten verarbeiten können. Sie bieten die Rechenleistung von Hochleistungs-PCs auf einem Quadratzentimeter Silizium und werden millionenfach in modernen Fernsehern und Smartphones eingesetzt. Dank der hohen Genauigkeit des auf diesen Prozessoren realisierten Stereoverfahrens sind Positionsbestimmungen beliebiger Objekte und Hindernisse in Entfernungen bis zu 50 Metern möglich. Zum Vergleich: die menschliche Stereowahrnehmung endet bei ca. 10-12 Metern.

Vom Standbild zum Bewegtbild
Um die für 6D-Vision wichtige Wahrnehmung der Bewegung zu realisieren, ist es notwendig, präzise Werte des „optischen Flusses“, – also die Verschiebungen der Bildpunkte in einer Bildfolge – zu ermitteln. Die in der wissenschaftlichen Literatur beschriebenen Verfahren berechnen keine sehr große Bildpunktverschiebungen, jedoch treten diese speziell im Nahbereich eines Fahrzeuges bei hoher Geschwindigkeit oder bei Kurvenfahrten auf. Der von Daimler im Jahre 2004 entwickelte Algorithmus „PowerFlow“ löst dieses Problem erstmals. Er ermittelt beliebig große Bildverschiebungen mit konstant kleiner Rechenzeit und liefert auch bei hohen Fahrzeuggeschwindigkeiten, schlechten Witterungsverhältnissen oder Beleuchtungsschwankungen zuverlässige Ergebnisse.

In dem von den Forschern entwickelten Stereokamerasystem werden in einem sich anschließenden Verarbeitungsschritt räumlich benachbarte 6D-Punkte mit gleicher Bewegung zu Objekten zusammengefasst. Mit Hilfe intelligenter Filtermethoden können dann sogar Beschleunigung und Lenkeinstellung kreuzender und entgegenkommender Fahrzeuge ermittelt werden. Dies ist erforderlich, um die zeitliche Bewegung anderer Verkehrsteilnehmer über ein bis zwei Sekunden vorherzusagen und so potenzielle Unfallsituationen von unkritischen Situationen unterscheiden zu können.

Gerade bei teilverdeckten, eng benachbarten Objekten und problematischen Sichtbedingungen zeigen sich die Vorteile des entwickelten Verfahrens deutlich. Auf Basis der 6D-Bewegungsinformation lässt sich ein Gefahrenpotential für jeden einzelnen Bildpunkt ableiten, bewegte Objekte „verraten“ sich somit bereits auf Bildpunktebene. Noch bevor der gefährliche bzw. gefährdete Verkehrsteilnehmer vor dem Fahrzeug auftaucht, kann der Computer die drohende Gefahr erkennen, selbst wenn nur Teile des Verkehrsteilnehmers zu sehen sind. Der Fahrer kann so in komplexen Verkehrssituationen sofort optimal unterstützt werden.

Gefahren erkennen – schneller als der Mensch
Kinder, die unerwartet auf die Straße laufen, werden in 0,2 Sekunden im gesamten Blickfeld der Kamera wahrgenommen. Auf Grund unseres stark selektiven Sehverhaltens benötigt ein aufmerksamer Mensch dafür circa 0,5 Sekunden, war der Fahrer abgelenkt, kommen mindestens weitere 0,5 Sekunden hinzu. Da auch die Bewertung der Situation und die Reaktion Zeit erfordern, kommt es immer zur bekannten „Schrecksekunde“, die ein Mensch unabhängig vom Alter braucht, um eine gefährliche Situation zu erkennen und eine Aktion einzuleiten. In dieser Sekunde legt ein Fahrzeug bei einer Geschwindigkeit von 50 km/h eine Strecke von rund 14 Metern zurück. Praktische Messungen zeigen, dass das Fahrzeug bei einer durch das Sicherheitssystem eingeleiteten Notbremsung bereits sieben Meter früher zum Stehen kommt – ein entscheidender Vorteil zur Unfallvermeidung im innerstädtischen Verkehr.

Unfälle vermeiden, den Menschen helfen
6D-Vision ist eine Basistechnologie, die neue Möglichkeiten für künftige Fahrerassistenzsysteme eröffnet. Sie erlaubt, Unfallrisiken signifikant zu senken und einen weiteren großen Schritt auf den Weg zum Unfallfreien Fahren zu gehen. Basierend darauf arbeitet Daimler an möglichen Fahrerassistenzsystemen, darunter Bremsassistenten, die bei querenden Fahrradfahrern oder Fußgängern aktiv werden, Kreuzungsassistenten, die Kollisionen beim Abbiegen durch Bremsen verhindern sollen und einen Ausweichassistent, der durch ein schnelles Lenkmanöver helfen kann, Unfälle im letzten Moment zu vermeiden. Neben sicherheitsrelevanten Fahrerassistenzsystemen kann 6D-Vision auch helfen, den Fahrer zu entlasten und den Komfort zu erhöhen, beispielsweise im Stop&Go-Verkehr oder in engen Baustellenbereichen. Das Einsatzspektrum von 6D-Vision geht jedoch weit über die Anwendung im Automobil hinaus und bietet Potenzial für alle Bereiche, in denen eine exakte Erfassung und Interpretation dynamischer Szenen erforderlich ist, beispielsweise in den vielfältigen Einsatzbereichen der Robotik und der Mensch-Maschine-Interaktion. Ein weiteres Einsatzgebiet zeichnet sich in modernen 3D-Fernsehern ab, in denen in Zukunft eine Stereoanalyse und eine on-line Bewegungsschätzung durchgeführt werden soll, um einen variablen Tiefeneindruck zu ermöglichen.

Die Tatsache, dass moderne Kameras kontinuierlich leistungsfähiger und preisgünstiger werden und 6D-Vision Hardwarekomponenten aus dem Bereich der Consumer-Elektronik verwendet, lässt eine schnelle Verbreitung in alle Fahrzeugklassen zu. Da die 6D-Vision Technologie signifikant zur Senkung von Verkehrsunfällen beitragen kann, beabsichtigt Daimler, diese Technologie – wie zuvor bei ABS und ESP® geschehen – zukünftig auch anderen Herstellern zugänglich zu machen.

Unternehmensprofil Daimler
Die Firmengründer Gottlieb Daimler und Carl Benz haben mit der Erfindung des Automobils im Jahr 1886 Geschichte geschrieben. 125 Jahre später, im Jubiläumsjahr 2011, ist die Daimler AG eines der erfolgreichsten Automobilunternehmen der Welt. Mit den Geschäftsfeldern Mercedes-Benz Cars, Daimler Trucks, Mercedes-Benz Vans, Daimler Buses und Daimler Financial Services gehört der Fahrzeughersteller zu den größten Anbietern von Premium-Pkw und ist der größte weltweit aufgestellte Nutzfahrzeug-Hersteller. Daimler Financial Services bietet ein umfassendes Finanzdienstleistungsangebot mit Finanzierung, Leasing, Versicherungen und Flottenmanagement.

Als Pionier des Automobilbaus gestaltet Daimler auch heute die Zukunft der Mobilität: Das Unternehmen setzt dabei auf innovative und grüne Technologien sowie auf sichere und hochwertige Fahrzeuge, die ihre Kunden faszinieren und begeistern. Daimler investiert bei der Entwicklung alternativer Antriebe als einziger Automobilhersteller sowohl in den Hybrid-, als auch in den Elektromotor und in die Brennstoffzelle mit dem Ziel, langfristig das emissionsfreie Fahren zu ermöglichen. Denn Daimler betrachtet es als Anspruch und Verpflichtung, seiner Verantwortung für Gesellschaft und Umwelt gerecht zu werden. Das bedeutet für Daimler auch die Verpflichtung, Innovationsführer auf dem Gebiet der Sicherheit zu sein. Mercedes-Entwicklungen wie ABS/ESP, Airbag und PreSafe sind aus modernen Fahrzeugen nicht mehr wegzudenken.

Daimler vertreibt seine Fahrzeuge und Dienstleistungen in nahezu allen Ländern der Welt und hat Produktionsstätten auf fünf Kontinenten. Zum heutigen Markenportfolio zählen neben Mercedes-Benz, der wertvollsten Automobilmarke der Welt, die Marken smart, Maybach, Freightliner, Western Star, BharatBenz, Fuso, Setra, Orion und Thomas Built Buses. Das Unternehmen ist an den Börsen Frankfurt und Stuttgart notiert (Börsenkürzel DAI). Im Jahr 2010 setzte der Konzern mit mehr als 260.000 Mitarbeitern 1,9 Mio. Fahrzeuge ab. Der Umsatz lag bei 97,8 Mrd. €, das EBIT betrug 7,3 Mrd. €.

Das Vorschlagsrecht zum Deutschen Zukunftspreis obliegt den führenden deutschen Einrichtungen aus Wissenschaft und Wirtschaft sowie Stiftungen.

 

Das Projekt „6D-Vision – Gefahren schneller erkennen als der Mensch“ wurde vom BDI - Bundesverband der Deutschen Industrie e.V. vorgeschlagen.