„Unsere Intention ist es, das Leben von Menschen zu verbessern“
Schon heute können Menschen mit Maschinen kommunizieren, sie im Internet eigenständig nach Dingen suchen oder die Einkäufe erledigen lassen. Programme wie Siri, Alexa und Google Assistant sind für viele Menschen zu den persönlichen, digitalen Assistenten im Alltag geworden. Prof. Dr. Philipp Cimiano lehrt und forscht zu den Themen Sprachverstehen, Wissensrepräsentation und Künstliche Intelligenz an der Universität Bielefeld. Er arbeitet daran, dass uns Maschinen immer besser verstehen. Im Interview mit Ben Schröder erklärt er, wie das funktioniert und welchen Einfluss seine Forschung in Zukunft auf verschiedene Wirtschaftszweige haben könnte.
Ben Schröder: Herr Cimiano, Sie lehren und forschen an der Universität Bielefeld im Bereich „Semantische Datenbanken“. Womit genau beschäftigen Sie sich im Rahmen Ihrer Arbeit?
Philipp Cimiano: Der Schwerpunkt meiner Forschung liegt auf dem Bereich der automatischen Verarbeitung von unstrukturierten Datenmengen. Insbesondere geht es dabei um große Bestände von Text-Daten aus dem Internet, Social Media und wissenschaftlichen Publikationen. Genauer gesagt entwickle ich Programme, die Computer in die Lage versetzen, große Mengen von Texten nicht nur zu überblicken, sondern auch den Sinn in diesen zu verstehen.
Wie sind Sie auf diesen Forschungsbereich gekommen?
Ich bin schon seit 20 Jahren in diesem Bereich aktiv. In den 90er-Jahren habe ich dazu an der Universität Stuttgart meine Diplomarbeit geschrieben. Sie müssen wissen: Stuttgart war in den 90er-Jahren eine Hochburg der maschinellen Sprachverarbeitung. Bis heute sind wir in Deutschland Vorreiter in diesem Bereich, auch wenn andere Nationen momentan aufholen. Vor allem die großen IT-Konzerne aus dem Silicon Valley haben sich dem Thema in den vergangenen Jahren stark gewidmet und eigene Technologien auf den Markt gebracht: Siri von Apple, Alexa von Amazon, Google Assistant … Auch China holt auf, da investiert die Regierung Milliarden in die Erforschung von künstlicher Intelligenz. Aber: Auch heute kommen noch viele Innovationen und Forschungsergebnisse in diesem Bereich aus Deutschland. Darauf können wir stolz sein.
Sie sprachen eben von „unstrukturierten Datenmengen“, die ein Computer auf Grundlage Ihrer Forschung analysieren kann. Können Sie genauer erklären, um welche Daten es sich dabei handelt?
Strukturierte Daten befinden sich bereits in einer Form, mit der eine Maschine etwas anfangen kann. Denken Sie an eine Excel-Tabelle: Zelle A1 beinhaltet eine bestimmte Information, Zelle A2 eine andere. Die Daten sind klar strukturiert und können von Maschinen leicht verarbeitet werden. Sie können sich zum Beispiel die Summe aus zwei nummerischen Zellen ausgeben lassen. Unstrukturierten Daten folgen dagegen keiner bestimmten Form. Ein Post bei Facebook beinhaltet zum Beispiel unstrukturierte Daten. Genauso wie ein Video bei YouTube, auch wenn wir in der Regel Textdaten meinen, wenn wir von unstrukturierten Daten sprechen. Wir schätzen, dass heute rund 80 bis 90 Prozent der gesamten Daten unstrukturiert sind.
Die spannenden Fragen für mich und meine Forschungsarbeit sind nun: Was braucht ein Computer, um Textdaten nicht nur verstehen, sondern auch in einen größeren Kontext einordnen zu können? Wie können Maschinen von uns Menschen lernen und dieses Wissen einsetzen, um einen Kontext zu erfassen?
Wir bewegen uns also im Bereich der künstlichen Intelligenz (KI). Nehmen Sie uns einmal mit: Wie genau funktioniert das technisch?
Zunächst: Computer müssen in der Lage sein, gewisse Regelmäßigkeiten zu suchen und zu erkennen. Genauso, wie wir Menschen das im Kindesalter tun. Als Kinder versuchen wir, unsere Umwelt zu erfassen: durch Tasten, Schmecken, Hören, Sehen. So lernen wir, wie die Welt um uns herum funktioniert und erschaffen für uns Strukturen und Kontexte. Mein Ziel ist, das auch Maschinen beizubringen.
Die Grundlage meiner Arbeit sind sogenannte Lernalgorithmen. Bei sogenannten maschinellen Lernalgorithmen geben wir einer Maschine einen gewissen Rahmen vor, innerhalb dessen die Maschine nach gewissen Mustern sucht. Diese Strukturen nennen wir auch Modelle, es handelt sich dabei um mathematische Beschreibungen eines Entscheidungsraums. Die Maschine erlernt dann selbst durch sogenannte Parametrisierung dieses Raumes, in welchen Fällen eine bestimmte Entscheidung angebracht ist. Wir orientieren uns dabei an der Struktur menschlicher Gehirne, die sehr komplex ist: tausende Schichten von Neuronen bauen aufeinander auf. Es gibt Schichten, die für das Wahrnehmen zuständig sind, andere abstrahieren vom Wahrgenommenen und ordnen die Eindrücke in einen Kontext ein. In jeder einzelnen Schicht entstehen weitere Abstraktionen. Solange, bis man schließlich bei der letzten angekommen ist und eine konkrete Handlung folgen kann. Unsere Leistung als Forscher besteht in vielen Fällen darin, die richtigen Rahmenbedingungen für die Algorithmen vorzugeben damit sie sich optimal entfalten können.
Das klingt, als brauche es uns Menschen bald nicht mehr …
Ganz im Gegenteil. Algorithmen werden oft als eine Art Magie angesehen, die ganz von allein funktioniert. Das stimmt natürlich nicht. Hinter jeder Maschine steht ein Mensch, der ihr den richtigen Rahmen, das Maß für die Bewertungen und Güte von Lösungen vorgibt. Der Mensch wird als Maß aller Dinge und „Bewerter“ immer noch benötigt und er muss hochqualifiziert sein, viel Expertise mitbringen. Das bleibt meiner Meinung nach auf absehbare Zeit unverzichtbar, um die Technologien weiterzuentwickeln.
Was sind potenzielle Anwendungsgebiete für die von Ihnen entwickelten Algorithmen?
In der Firma Semalytix GmbH, die sich aus meinem Lehrstuhl an der Universität heraus gegründet hat, arbeiten wir zum Beispiel mit der Pharmaindustrie zusammen. Die Pharmabranche hat in den vergangenen Jahren erkannt, dass sie deutlich patientenorientierter arbeiten muss. Das heißt: Die Konzerne versuchen heute mehr denn je zu verstehen, was ihre Patienten umtreibt. Da kommen wir ins Spiel: Unsere Algorithmen können Textdaten aus dem Internet – zum Beispiel aus einem Post bei Facebook – erfassen und auswerten. So ein Post kann für die Unternehmen durchaus wichtige Informationen enthalten: Welche Bedürfnisse haben die Patienten? Wie reagieren sie auf ein bestimmtes Medikament oder eine bestimmte Behandlungsmethode? Wie zufrieden sind sie mit der gesundheitlichen Versorgung in ihrer Region?
Ein weiterer Anwendungsbereich ist die Auswertung großer Datenmengen, die Menschen selbst kaum noch leisten können. Denken Sie an medizinwissenschaftliche Literatur. Da gibt es mittlerweile unzählige Publikationen, die ein Arzt allein niemals voll überblicken kann. Eine Maschine mit einem entsprechenden Algorithmus kann die gesamte Literatur durchforsten und zusammenfassen – zum Beispiel in Form von Metastudien.
Besteht dabei nicht die Gefahr, dass der Algorithmus Literatur nach bestimmten Kriterien selektiert und so ein von einem Menschen gewünschtes Ergebnis ausspuckt?
Klar. Jede neue Technologie bietet das Potenzial, missbraucht zu werden. Algorithmen können von Menschen so trainiert werden, dass sie bestimmte Präferenzen haben und so Ergebnisse verzerren. Das ist aber nicht unsere Intention als Wissenschaftlerinnen und Wissenschaftler. Unsere Intention ist es, das Leben von Menschen zu verbessern, die Erhöhung von Transparenz und Objektivität. Wenn ein Mediziner mit Hilfe von unserem Algorithmus größere Publikationsmengen überblicken kann, kann er seine Patienten auch fundierter und ausgewogener beraten.
Abgesehen von der Pharmaindustrie und der Medizinbranche: Welche Anwendungsbereiche Ihrer Algorithmen sind noch denkbar?
Grundsätzlich beschäftigen sich fast alle Wirtschaftszweige mit der Frage, wie Prozesse automatisiert werden können. Für Unternehmen bieten neue Technologien vor allem dann einen Mehrwert, wenn mit ihnen Prozesse, die vorher manuell abgelaufen sind, automatisiert und damit effizienter gestaltet werden können. Die Automobilindustrie ist da in Deutschland sicher ein großer Vorreiter, mehr und mehr Teile der Produktionskette werden automatisiert und von Robotern oder anderen Maschinen abgewickelt.
Auch für andere Branchen bieten KI-basierte Technologien – auch unsere – sicher viel Potenzial. Wie bestimmte Innovationen in den Produktionsprozess integriert werden können, muss aber sicher immer branchenspezifisch bewertet werden: Wie eben angesprochen ist dafür viel menschliches Know-How in der entsprechenden Branche nötig.
Was kann es für eine Stadt wie Bielefeld bedeuten, dass auch in Ostwestfalen KI-Innovationen entstehen – und nicht nur im Silicon Valley in Kalifornien?
Was die Innovationsbereitschaft angeht hat sich hier in Ostwestfalen meiner Meinung nach in den vergangenen Jahren viel getan. Die Forschung beschäftigt sich hier sehr intensiv mit dem Thema, es gibt viele junge Entwicklerinnen und Entwickler, die versuchen, Innovationen auf die Straße zu bringen. Das tut der Region sicher gut.
Von der Politik würde ich mir in diesem Bereich noch etwas mehr Mut wünschen. Zum Beispiel in Bezug auf das Thema Zukunft der Mobilität: Wie schließen wir Regionen an, die nicht gut an unsere Städte angebunden sind? Wie schaffen wir es, dass Menschen – unabhängig davon, wo sie wohnen – mobil bleiben und nicht zwingend auf das Auto angewiesen sind? Das sind Fragen, auf die wir bisher nicht wirklich antworten haben, denen wir uns aber unbedingt stellen müssen. Denn: Von den Antworten, die wir auf diese Fragen finden, hängt sicher auch ein stückchenweit der Wohlstand und die Produktivität in Deutschland in Zukunft ab.
Kommentar verfassen