Die Herausforderungen der Künstlichen Intelligenz bei Statistikdaten

In diesem Jahr erschien eine KI-Zusammenfassung in den finnischen Google-Suchergebnissen, was zu einem Rückgang der Besucherzahlen auf den Webseiten des Statistikamts führte. Zwischen Januar und November verzeichnete die Institution 17 Prozent weniger Zugriffe über Google im Vergleich zum Vorjahr in demselben Zeitraum.

Nach Angaben des Statistikamts könnte dies darauf hindeuten, dass ein Teil der Informationssuchenden mit den bereitgestellten KI-Zusammenfassungen zufrieden ist und nicht zu den detaillierten statistischen Informationen weiterverweist. Dieser Meinung ist der Direktor Ville Vertanen vom Statistikamt.

Die Informationen, die Künstliche Intelligenz bereitstellt, sind jedoch oft falsch, da diese nicht direkt auf die Datenbank für statistische Informationen zugreift. Stattdessen erfolgt die Antwortgenerierung aus dem Cache oder aus Texten auf den Seiten des Statistikamts oder anderen Quellen, erläutert Vertanen weiter.

„Aufgrund der Natur der Statistiken sollte immer die aktuellste Information abgerufen werden, doch die KI trifft dabei möglicherweise nicht die richtige Wahl. Wir haben festgestellt, dass die Daten von Suchhilfen häufig falsch sind“, so Vertanen.

Seiner Einschätzung nach ist diese Situation besorgniserregend und beschränkt sich nicht nur auf Finnland. Die Probleme der KI-Aggregatoren sind gegenwärtig ein heiß diskutiertes Thema in internationalen Foren der Statistiker.

Der Bedarf an einem Interpretationsmechanismus für KI

Das Statistikamt hat bereits mit der Entwicklung einer Lösung begonnen. Laut Vertanen optimiert das Amt seit 20 Jahren seine Webseite und offenen Datenbanken für Menschen und Suchmaschinen. Jetzt müsse jedoch auch eine Optimierung für Künstliche Intelligenz erfolgen.

Das Statistikamt benötigt einen „Übersetzer“ für die Datenbanken, der der Künstlichen Intelligenz erklärt, wie Statistiken zu lesen sind. Auf diese Weise könnte die KI den Nutzern erweiterte Antworten auf Fragen basierend auf statistischen Informationen bereitstellen, was die Informationssuche erleichtern würde, beschreibt Vertanen.

„Die KI könnte beispielsweise aus der Datenbank eine Antwort auf die Frage, wie sich die Inflation in Finnland in den letzten drei Jahren entwickelt hat, abrufen“, berichtet Vertanen.

Technische Lösung: MCP

Als technische Lösung wird das Model Context Protocol (MCP) vorgeschlagen, das eine Schnittstelle zwischen großen Datenmengen und umfassenden Sprachmodellen darstellt.

Einfache Anwendung für alle Statistiknutzer

Wenn es dem Statistikamt gelingt, einen KI-Übersetzer für die statistischen Datenbanken zu schaffen, wird die Nutzung von Statistiken erheblich erleichtert, so die Einschätzung von Vertanen.

Die Datenbank des Statistikamts enthält über 5.500 Datenwürfel, die insgesamt zig Milliarden Zellen und eine enorme Anzahl an Variablen umfassen. Aufgrund dieser Fülle kann es schwierig sein, Informationen zu finden.

„Das wird das Leben aller Statistiknutzer erleichtern, egal ob sie Beamte, Bürger, Journalisten oder Forscher sind“, sagt Vertanen.

Das Statistikamt plant, im nächsten Jahr die Analyse von statistischen Daten mit Hilfe von Künstlicher Intelligenz zu testen.