Pim de Witte, ein 30-jähriger Niederländer, wird das Jahr 2025 nicht so schnell vergessen. Die Grundlagen für das, was er im vergangenen Jahr erlebte, wurden jedoch bereits vor acht Jahren gelegt. Zusammen mit einem Jugendfreund gründete er Medal.tv, eine Online-Plattform, auf der Gamer kurze Videos ihrer Spielhöhepunkte aufnehmen und teilen können.
De Witte beschreibt das ursprüngliche Ziel als die Schaffung eines sozialen Netzwerks für Spieler. Doch alles änderte sich, als er ein Paper von Google las. In dieser Veröffentlichung zeigten Forscher, dass neue Generationen von KI-Modellen, sogenannte ‚Weltmodelle‘, mit Spielvideos trainiert werden können. Plötzlich erkannte der Niederländer, dass er auf einer potenziellen Goldgrube saß; Medal.tv verzeichnet jährlich eine Milliarde Uploads, fast so viel wie YouTube.
De Witte nahm Kontakt zu KI-Unternehmen im Silicon Valley auf und fragte, ob er etwas mit dieser riesigen Datenbank anfangen könnte. Schnell erhielt er zahlreiche Übernahmeangebote, darunter eines von OpenAI, dem Unternehmen hinter ChatGPT, das angeblich sogar eine halbe Milliarde Dollar bot.
„Natürlich habe ich darüber nachgedacht“, sagt De Witte. „Aber Medal lief bereits gut. Und in Europa gibt es nicht viele gute KI-Unternehmen. Bald wurde mir klar, dass ich selbst aktiv werden wollte.“
Die Herausforderungen im KI-Bereich
„Alles geht wahnsinnig schnell“, findet er. „Ich musste mich daran gewöhnen, dass man mich anders wahrnahm. Aber ich habe gute Leute um mich herum. Langsam fühle ich mich in dieser Welt zuhause.“
Der junge Niederländer befindet sich in einer Schlüsselposition für das, was Experten die nächste große Durchbruch in der KI nennen. Seit der Einführung von ChatGPT haben Tech-Unternehmen massiv in sogenannte Sprachmodelle investiert. Trotz der signifikanten Verbesserungen in den letzten drei Jahren wird zunehmend die Frage laut, ob wir nicht allmählich an ihre Grenzen stoßen.
Selbst Ilya Sutskever, Mitbegründer von OpenAI und einer der Schlüsselpersonen hinter dem Durchbruch von ChatGPT, äußerte kürzlich in einem KI-Podcast von Dwarkesh Patel, dass „2020 bis 2025 die Ära der Skalierung war“. Er fügte hinzu: „Aber die Grenzen sind erreicht. Man kann große Sprachmodelle noch hundertmal größer machen, aber das wird sie nicht wesentlich verbessern. Wir müssen zurück in eine Zeit des Forschens.“
Die Notwendigkeit von Weltmodellen
Sprachmodelle wie ChatGPT und Gemini sind auf einer gewaltigen Menge an Text trainiert, jedoch reicht Text allein aus, um die gesamte Realität zu erfassen. Um Roboter und selbstfahrende Autos zu steuern, ist es nicht ausreichend, dass ein Chatbot das gesamte Werk von Dostojewski gelesen hat.
Hier kommen die Weltmodelle ins Spiel. Diese KI-Modelle verstehen, wie die physische Welt funktioniert. „Sie denken eigentlich mehr wie Menschen“, sagt Professor Pieter Simoens, der im DECIDE-Labor von UGent/imec Weltmodelle entwickelt, um Roboter zu schulen. „Wie wir lernen sie aus physischen Erfahrungen und sagen vorher, welche Konsequenzen ihre Handlungen in der Welt haben. So können sie besser auf andere reagieren.“
Nicht nur Google und OpenAI setzen darauf. Nvidia veröffentlichte im vergangenen Jahr Cosmos, ein Weltmodell zur Schulung von Robotern. Auch Elon Musks xAI experimentiert mit Weltmodellen, um ein KI-Spiel zu entwickeln, das ständig neue Szenen generiert. Der KI-Pionier Yann LeCun verließ kürzlich Meta, um bei einer neuen Firma an Weltmodellen zu arbeiten.
Dennoch bleiben solche Modelle eine enorme technische Herausforderung. Denn um ein visuelles Verständnis der Welt zu erhalten, benötigen sie immense Rechenleistung und Daten. „Es ist eine Sache, eine Anwendung zu erstellen, die ein Fußballspiel simuliert“, sagt AI-Professor Bart Dhoedt (UGent/imec). „Aber wenn eine KI alles lernen soll, was mit einem Ball in der Welt passieren kann, ist das eine ganz andere Geschichte.“
Die Bedeutung der Medal-Datenbank
Genau deswegen ist die Gaming-Datenbank von Medal so begehrt. Sie enthält Milliarden von Bildern von Handlungen, die Menschen in virtuellen Welten wie Roblox und Minecraft durchführen. Zudem ist bei all diesen Videos vermerkt, welche Tasten die Gamer auf ihrem Controller drückten und in welche Richtung. „Das ist genau das, was ein Weltmodell lernen muss: welche Auswirkungen haben meine Handlungen in der Welt?“, erklärt Dhoedt. „Das macht diesen Datensatz in der Tat ziemlich selten.“
Gründung von General Intuition
Das ist De Witte bewusst. Anstatt seine Spieldaten zu verkaufen, hat er mittlerweile das Unternehmen General Intuition gegründet, um selbst Weltmodelle zu entwickeln. Bei einer ersten Kapitalrunde im Oktober sammelte er 115 Millionen Euro ein. Und trotz der Konkurrenz von Google und anderen Tech-Giganten lässt er sich nicht abschrecken. „Sie haben vielleicht mehr Rechenleistung, aber daran arbeiten wir jetzt intensiv. Wir besitzen einzigartige Daten, die man nicht mit Geld kaufen kann.“
In diesem Jahr hofft er, mit General Intuition ein erstes Weltmodell zu verkaufen, das Robotern in Fabriken helfen kann, sich zu orientieren. Obwohl er inzwischen selbst in New York lebt, sind De Wittes Unternehmen nach wie vor bei unseren Nachbarn im Norden angesiedelt.
Derzeit ist Europa keineswegs ein Vorreiter in der KI. Doch in Bezug auf Weltmodelle sieht De Witte die Situation nicht allzu schlecht. „Meine Teams bestehen fast ausschließlich aus Europäern, denn im Bereich komplexer Mathematik und Physik haben wir viel Expertise. Wenn Europa die Rechenleistung skalieren kann, sehe ich die Zukunft optimistisch.“











