An der Universitat Politècnica de Catalunya erlebten sie eine nie dagewesene Ehrung, als Oriol Vinyals (Sabadell, 1983) Ende November als Ehrendoktor ausgezeichnet wurde. Minutenlange Standing Ovations des Publikums würdigten den ehemaligen Studenten der Doppelwissenschaft in Telekommunikationsingenieurwesen und Mathematik, der entscheidend zur Entwicklung der Künstlichen Intelligenz beigetragen hat. Tatsächlich zählt er zu den zehn meistzitierten Forschern im Bereich der KI weltweit.
Nach seinem Studium an der UPC zog Vinyals 2006 in die USA, wo er promovierte und als Forscher zu Google Brain stieß. Dort spezialisierte er sich auf zwei Bereiche der KI: maschinelles Lernen und tiefes Lernen. Seit 2016 ist er Vizepräsident für Forschung und Teamleiter für tiefes Lernen bei Google DeepMind in London.
Dieser Sabadeller war am Entwicklungsprozess von AlphaFold beteiligt, einem KI-System, das eines der größten Probleme in der Biologie gelöst hat: die Vorhersage von Proteinen anhand ihrer Aminosäuresequenz. AlphaFold gewann 2024 den Nobelpreis für Chemie. Darüber hinaus war er technischer Co-Direktor bei der Entwicklung von Gemini, dem fortschrittlichsten multimodalen KI-Modell von Google.
Vor kurzem führte er eine „Masterclass“ an seiner Alma Mater, der UPC, durch, an der über 500 Personen teilnahmen. Viele standen am Ende der Veranstaltung, da kein Platz mehr war.
„Es war nicht das erste Mal, dass ich zur UPC zurückkehrte, seit ich ins Ausland gegangen bin, aber diesmal habe ich nicht mit so vielen persönlichen Emotionen gerechnet, die sich um mich drehten. Die Zeremonie zur Ehrendoktorwürde war sehr besonders und emotional, die Menschen standen und applaudierten unaufhörlich. Ich konnte nicht aufhören zu denken, was ich getan habe, um hierher zu kommen. Tatsächlich war das Thema meines Vortrags, darüber zu sprechen, um vielleicht einige der Studierenden im Publikum zu inspirieren“,
erklärte Vinyals.
Er kehrt an die Universität zurück, wo derzeit eine intensive Debatte über die Nutzung dieser Werkzeuge stattfindet. In den meisten Fällen, so wird gesagt, bestraft die Verwendung von KI die Studierenden, und es wird wieder zu mündlichen Prüfungen gewechselt.
„Alle Technologien haben eine doppelte Verwendung. Hier konzentrieren wir uns darauf, wie ein Student an einer Spitzenuniversität diese nutzt, was in Ordnung ist. Aber ich, als Entwickler, denke an die Regionen des Planeten, wo es keine Universität gibt oder wo die nächste mehr als drei Stunden mit dem Auto entfernt ist, was den Zugang zur Bildung stark einschränkt. KI bietet diesen Personen einen personalisierten Tutor. Global gesehen verändern diese Werkzeuge den Zugang zu Ressourcen, Tutoren und Wissen. Das ist der Grund, warum wir diese Werkzeuge entwickeln. Jedes Unternehmen hat einen anderen Ansatz, aber in diesem Fall führt Google Tests durch, bevor es die Werkzeuge der Gesellschaft zur Verfügung stellt und potenzielle Probleme analysiert. Im Bereich Bildung und KI verfügen wir über ein großes Team innerhalb von Google Education, das diese Belange überprüft. KI ist ein Werkzeug, das bleiben wird, und es ist wichtig, die Gesellschaft so gut wie möglich aufzuklären, um Debatten über ihren Einsatz führen zu können. Vielleicht müssen an den Universitäten andere Dinge gelehrt werden.“
Was könnten diese Dinge sein?
„Fähigkeiten wie Verhandeln, Reden, Kommunizieren, Führen und die Technologie so zu nutzen, dass sie die gesamte Ausbildung einer Person optimiert, sowohl um Ableitungen zu machen als auch um zu verstehen, wie die Welt funktioniert und wie man in eine produktive Gesellschaft eintritt.“
Aber nicht alles, was die KI lehrt, ist korrekt.
„Richtig. Und wenn du ein bestimmtes Thema, wie Algebra, nicht beherrschst oder alles, was du weißt, mit KI gelernt hast, wirst du nicht in der Lage sein, kritisch zu sein. Wir benötigen Wissen, um das, was dir die KI sagt, infrage zu stellen, zu überdenken, zu korrigieren und kritisch zu sein. In Zukunft wird sie keine Fehler mehr machen, aber das tut sie jetzt. Deshalb ist es wichtig, diesen kritischen Punkt zu haben. Ein Professor der UPC, Ferran Marquès, erzählte mir, dass er während seiner Prüfungen den Studierenden zwei KI-gestützte Lösungen zu Fragen zeigt, und der Test darin besteht, die Fehler zu finden. Ich halte das für eine sehr gute, konstruktive Methode, um ein wenig in die Zukunft zu blicken, denn das Modell wird sich in jeder Hinsicht erheblich verbessern.“
Wie kann man talentierte Menschen von jenen unterscheiden, die die KI gut nutzen?
„Vielleicht müssen wir neu definieren, was Talent ist. Anpassungsfähigkeit an den ständigen Wandel wird heute als wertvoller angesehen als beispielsweise die Fähigkeit, mit 500 Ziffern zu rechnen. Vor dem Aufkommen von Taschenrechnern war es jedoch sehr geschätzt, dies zu können. Wenn jemand heute die Tools [der KI] gut nutzt und dabei sehr gute Ergebnisse erzielt, ist das auch ein Talent.“
Was ist seins?
„Meines? Sicherlich niemals aufhören zu lernen. Das ist eine meiner Konstanten. Ich wähle immer, in Bereichen zu sein, in denen ich Neues lerne. Bei Google Brain habe ich die Verfeinerung des tiefen Lernens gelernt. Als ich nach London zu DeepMind zog, vertiefte ich mich in das Bereich des Reinforcement Learning, was ein ganz neues Gebiet war. Ich habe auch das Talent zu führen. Das habe ich beispielsweise bei Gemini getan.“
Vinyals erklärt, dass seine Tochter derzeit nicht mit Bildschirmen in Kontakt kommt. Als guter Wissenschaftler betont er, dass er zunächst die Auswirkungen von Technologien auf Kinder verstehen muss, bevor er sie seiner dreijährigen Tochter vorstellt. Indirekt ist sie jedoch bereits damit in Berührung gekommen. Am Tag vor seiner Abreise nach Barcelona, um an der Ehrendoktorverleihung an der UPC teilzunehmen, ging Vinyals in die Kindertagesstätte seiner Tochter in London, um eine Geschichte vorzulesen. „Ich bat Gemini, mir eine Geschichte für Kinder in diesem Alter über die Geschichte von AlphaFold zu erstellen“, erklärt er. Das war, was er den jungen Zuhörern vorlas. „Es war ein großer Erfolg“, sagt er stolz.
Einige argumentieren, dass KI die Kreativität banalisiert. ChatGPT hat die Büchse der Pandora geöffnet, indem es ermöglicht, Fotos im Stil des japanischen Animationsstudios Ghibli, gegründet von Hayao Miyazaki, zu transformieren. Es gibt weitreichende Diskussionen darüber, ob dies gegen das Urheberrecht verstößt.
„Wir haben Gesetze und Systeme geschaffen, um das Urheberrecht in einem Rahmen zu schützen, der davon ausgeht, dass wir die einzigen Intellekte auf diesem Planeten sind. Aber wenn wir darüber nachdenken, tun diese Werkzeuge dasselbe wie Menschen: Sie lernen von dem, was bereits gemacht wurde und umschaffen das Wissen. Ist das nicht auch das, was Künstler tun, die von Künstlern der Vergangenheit lernen, sich inspirieren lassen und ihr eigenes Werk schaffen?“
Trägt der Algorithmus auch zur Kreativität bei?
„Bei DeepMind ist es beispielsweise unsere Mission, den wissenschaftlichen Fortschritt zu fördern. Wir haben ein System namens Co-Scientist, das Forschungsartikel in einem bestimmten Bereich liest und versucht, neue Ideen zu finden, die dann von den Forschern weiterentwickelt werden können. Wir finden viele Beispiele für echte Kreativität aus dem, was du die Modelle fragst, insbesondere in stark spezialisierten Bereichen wie der Mathematik. KI-Modelle können ein Hilfsmittel für Brainstorming sein. Es ist klar, dass sie nicht perfekt sind, aber Experten können unterscheiden und die Anfragen anpassen. Ich selbst verwende einen KI-gestützten persönlichen Assistenten.“
Welche Aufgaben übernimmt dieser?
„Ich leite ein sehr großes Team und wir teilen Dokumente mit Ideen. Der Assistent hat Zugang dazu und weist mich darauf hin, wenn ich auf einen bestimmten Kanal aufmerksam machen sollte, weil dort gute Ideen vorhanden sind, oder wenn ich mit jemandem aus dem Team über eine Idee sprechen sollte. Das Ergebnis ist, dass er Verbindungen herstellt. Er liest auch die wissenschaftlichen Studien in meinem Bereich, fasst die innovativsten Ideen für mich zusammen und schlägt neue Arbeitslinien vor. Wir müssten Konzepte wie Talent und Kreativität überdenken, weil diese Werkzeuge den Fortschritt beschleunigen.“
Werden diese KI-Modelle irgendwann ein Bewusstsein entwickeln?
„Ich betrachte die Debatte über das Bewusstsein der KI sehr pragmatisch. Wenn ich mit den Modellen interagiere, habe ich zumindest heute nicht das Gefühl, dass sie ein Bewusstsein besitzen. Die Zukunft wird davon abhängen, wohin sich die Technologie entwickelt. Es ist möglich, dass sie ein gewisses Niveau von Bewusstsein oder Existenz entwickeln.“
Es gibt bereits Fälle von Menschen, die mit einer KI geheiratet haben, oder die aufgrund von Ratschlägen eines Chatbots Suizid begangen haben.
„Insbesondere wenn ein Werkzeug in großem Maßstab eingesetzt wird, gibt es das Risiko des Missbrauchs. Es wird immer Minderheiten geben, die sich in extremen Fällen positionieren, aber man muss sich daran erinnern, dass die häufigsten Verwendungen positiv sind.“
Es gibt Besorgnis über die Präsenz des Katalanischen in einem von Englisch dominierten Ökosystem.
„Das ist eine sehr relevante Frage für Nutzer von Chatbots. Es steht fest, dass die beste Möglichkeit, derzeit gute Ergebnisse bei einer Anfrage an die KI zu erzielen, auf Englisch ist, da es die dominante Sprache im Internet und die universelle Sprache der Wissenschaft ist. Wie wir im maschinellen Lernen tun, können wir berechnen, was passiert, wenn wir dieselbe Frage auf Englisch oder Katalanisch stellen; numerische Unterschiede zu messen, ermöglicht es uns, mit der Optimierung zu beginnen und zu verstehen, wie wir die Sprachen einführen können. Erst dann verbessert sich das Werkzeug. Bei Google ist es jetzt eine Priorität, dass Gemini in vielen Sprachen präzise ist. Und wir verbessern uns stetig! Tatsächlich arbeiten viele Katalanen bei Google, und es gibt offensichtlich großes Interesse. Vielleicht gibt es noch Unterschiede zwischen Englisch und anderen Sprachen, aber sie werden mit den neuen Generationen des Modells zunehmend weniger wahrnehmbar sein.“
Was werden wir in fünf Jahren mit KI tun, das wir uns jetzt nicht vorstellen können?
„Unsere Interaktion wird viel reicher und multimodal sein. Jetzt können wir Dinge tun wie den Modellen zu bitten, eine Zeichnung inspiriert von einem Podcast zu generieren. Oder sie visuell mit Grafiken darzustellen. Wir können sogar um eine Videozusammenfassung eines sehr langen Interviews bitten und sie mit visuellen Elementen anreichern. In fünf Jahren wird das weiter zunehmen: Wir werden personalisierte Tutoren in Form von Videos haben. Wenn wir beispielsweise lernen wollen, wie ein Nuklearreaktor funktioniert, wird das Modell eine kleine Simulation erstellen, mit der wir interagieren können; eine Infografik des Reaktors. Die Antworten werden viel reicher sein, mit einer grafischen Oberfläche, die sich an dich anpasst.“
Der Ressourcenverbrauch der KI wird weiterhin steigen…
„Bei Google haben wir uns zum Ziel gesetzt, kohlenstoffneutral zu sein. Offensichtlich wächst die Nachfrage nach KI enorm. Unser Ziel ist es, die Technologie der ganzen Welt zugänglich zu machen, insbesondere den Menschen, die keinen Zugang zur Bildung haben. Gleichzeitig wollen wir die Emission von Treibhausgasen reduzieren, Bäume pflanzen und unbegrenzte Solarpanels in Wüsten anbringen. Dass die Modelle immer schneller werden, hängt mit der Rechenintensität zusammen. Die Chips, die wir herstellen, benötigen 30 Mal weniger Watt, um dieselbe Berechnung von der Generation 2 zur Generation 6 durchzuführen. Die Energie, die wir verbrauchen, insbesondere beim Training von Modellen, ist vertretbar und wir optimieren den Prozess erheblich. Darüber hinaus nutzen wir die Technologie, um neue Fusionsmaterialien zu entdecken. Ja, wir verwenden Energie, aber wir beschleunigen Fortschritte in der Supraleitung oder Fusionsforschung, die wiederum dazu beitragen werden, den Energieverbrauch zu senken und dem Klimawandel entgegenzuwirken.“











