Eulerpool News

KI stößt bei Geschichte an ihre Grenzen: Neue Studie offenbart Schwächen

19. Januar 2025, 17:20 Uhr · Quelle: Eulerpool News
Eine neue Studie zeigt, dass KI-Modelle wie GPT-4 Turbo in historischen Fragen oft versagen, mit einer Trefferquote von nur 46 Prozent. Trotz ihrer Schwächen sehen Forscher Potenzial für künftige Anwendung bei Historikern, insbesondere durch verbesserte Datenintegration.

Künstliche Intelligenz zeigt herausragende Leistungen in Bereichen wie Programmierung und der Erstellung von Podcasts, aber bei komplexen historischen Fragestellungen versagt sie oft. Zu diesem Ergebnis kommt eine aktuelle Studie, die drei führende Large Language Models (LLMs) – GPT-4 Turbo von OpenAI, Llama von Meta und Gemini von Google – auf ihre Kenntnis von Geschichte getestet hat.

Die Forscher schufen dafür einen neuen Maßstab namens Hist-LLM, der die Korrektheit der Antworten anhand der Seshat Global History Databank überprüft. Die Ergebnisse, die auf der bekannten NeurIPS-Konferenz vorgestellt wurden, enttäuschten: Das beste Modell, GPT-4 Turbo, kam auf eine Trefferquote von nur 46 Prozent, was knapp über dem Niveau des bloßen Ratens liegt.

Maria del Rio-Chanona, Mitautorin des Papiers und Informatik-Professorin am University College London, erklärte: „LLMs sind beeindruckend, ihnen fehlt jedoch die Tiefe des Verständnisses für fortgeschrittene geschichtliche Fragestellungen. Für grundlegende Fakten sind sie geeignet, aber bei nuancierteren, auf PhD-Niveau angesiedelten historischen Anfragen versagen sie.“

Ein Beispiel: Auf die Frage nach Schuppenpanzern im antiken Ägypten antwortete GPT-4 Turbo fälschlicherweise mit "Ja", obwohl diese erst 1.500 Jahre später erschienen. Solche Fehler kommen, weil LLMs oft von prominenten historischen Daten extrapolieren und es schwerfällt, weniger bekannte Informationen abzurufen, so del Rio-Chanona.

Besondere Schwierigkeiten zeigten die Modelle bei Fragen zu Regionen wie Afrika südlich der Sahara, was auf mögliche Verzerrungen im Trainingsmaterial hinweist. Trotz dieser Schwächen sehen die Forscher Potenzial darin, dass LLMs Historikern zukünftig helfen könnten. Sie arbeiten daran, ihre Maßstäbe durch mehr Daten aus unterrepräsentierten Regionen zu verfeinern und komplexere Fragen zu integrieren.

Peter Turchin, Studienleiter und Fakultätsmitglied des Complexity Science Hub, betont, dass LLMs in bestimmten Bereichen Menschen nicht ersetzen können. Dennoch unterstreicht das Papier die Möglichkeit, dass diese Modelle in der historischen Forschung nützlich sein könnten.

AI
[Eulerpool News] · 19.01.2025 · 17:20 Uhr
[0 Kommentare]
JLab präsentiert Neuheiten auf der CES 2026
JLab, ein führender Anbieter für persönliche Audiotechnologie, präsentiert seine neuesten Innovationen und Produkt-Updates auf der CES 2026 und unterstreicht damit erneut das Engagement für hochwertige, verbrauchsorientierte Audiolösungen. Im Fokus stehen die Markteinführung der JBuds Mini ANC, des neuen Go Work 3 Headsets sowie die neue Farbvariante „Cloud White“ für die beliebten JBuds Open- […] (00)
vor 2 Stunden
Nach Stromausfall im Südwesten Berlins
Berlin (dpa) - Berlins Regierender Bürgermeister Kai Wegner kommt wegen seines Agierens im längsten Stromausfall der Berliner Nachkriegsgeschichte unter Druck. Der CDU-Politiker räumte ein, am Samstag wenige Stunden nach Beginn des Blackouts im Berliner Südwesten Tennis gespielt zu haben - während sich 100.000 Betroffene ohne Strom und Heizung, Internet und Handy-Empfang mitten im Winter große Sorgen machten, vor Ort eilig […] (04)
vor 1 Stunde
Kernkraft aus dem Flugzeugträger: Ein neuer Ansatz gegen den Energieengpass der KI
Rechenzentren, die große KI-Modelle trainieren und betreiben, treiben den Strombedarf stark nach oben und verschärfen damit die Suche nach kontinuierlich verfügbarer Energie. Eine ungewöhnliche Idee aus den USA setzt dabei auf Technik, die ursprünglich für Flugzeugträger entwickelt wurde: Marine-Reaktoren sollen an Land verlegt und als Kraftwerksmodule für Rechenzentren genutzt werden. Dabei steht […] (00)
vor 4 Stunden
Zusammenarbeit mit NVIDIA GeForce für ein gelungenes PC Erlebnis von 007 First Light
IO Interactive, der preisgekrönte Entwickler und Publisher hinter der weltweit gefeierten  HITMAN -Reihe, und Amazon MGM Studios geben stolz eine Zusammenarbeit mit NVIDIA GeForce bekannt, um ein verbessertes PC-Erlebnis für  007 First Light  zu liefern, das am 27. Mai 2026 veröffentlicht wird.  007 First Light erscheint für PS5, Xbox Series X|S, Xbox ROG Ally X, Xbox ROG Ally, Nintendo […] (00)
vor 2 Stunden
Andy Friendly im Alter von 74 Jahren gestorben
Friendly, einer der prägenden Köpfe hinter dem US-Entertainmentjournalismus und langjähriger Medienmanager bei King World und CNBC, ist tot. Der frühere Fernsehmanager und Emmy-nominierte Produzent Andy Friendly ist am Sonntag, 4. Januar, im Alter von 74 Jahren in seinem Haus in Bel-Air gestorben. Dies bestätigte seine Familie. Friendly gehörte über Jahrzehnte zu den einflussreichen Persönlichkeiten des amerikanischen Fernsehens und war […] (00)
vor 1 Stunde
Marc-André ter Stegen
Dschidda (dpa) - Marc-André ter Stegen ist nach Angaben von FC Barcelonas Sportdirektor Deco nicht schwerer am Knie verletzt. Dem deutschen Fußball-Nationaltorwart gehe es gut, sagte Deco vor dem Halbfinale des spanischen Supercups in Dschidda dem Sender Movistar. Ter Stegen wird in Barcelona von dem Arzt untersucht, der ihn zuletzt auch am Knie operiert hatte.  «Er hatte ein ungutes Gefühl im […] (00)
vor 11 Minuten
bitcoin, crypto, finance, coin, money, currency, cryptocurrency, blockchain, investment, closeup, bitcoin, bitcoin, bitcoin, bitcoin, bitcoin, crypto, cryptocurrency
Aktionärskonflikt über Strategie und Unternehmensführung YZi Labs, ein bedeutender Investor des auf Blockchain spezialisierten Unternehmens CEA Industries Inc., das an der Nasdaq unter dem Kürzel BNC gehandelt wird, hat eine öffentliche Kampagne gegen dessen Vorstand gestartet. Der Vorwurf: Versuche, die Aktionäre zum Schweigen zu bringen. Im Zentrum des Konflikts stehen Fragen der […] (00)
vor 55 Minuten
Sichere Zugänge und Schutz auf dem Dach
Wangen im Allgäu, 07.01.2026 (PresseBox) - Auf der Dach+Holz International in Köln (24.-27. Februar, Halle 8, Stand 604) präsentiert HYMER-Steigtechnik Lösungen für sicheres Arbeiten in der Höhe. Der Schwerpunkt des Messeauftritts liegt auf Systemen für sichere Zugänge und Absturzsicherung: die modularen HYGHTS-Geländersysteme, Steigleitern für dauerhafte Zugänge sowie praxisorientierte Serienleitern für den handwerklichen Einsatz. Das Portfolio […] (00)
vor 4 Stunden
 
Shokz präsentiert sein neues Flagschiff
Shokz, der Branchenpionier für Open-Ear-Kopfhörer, stellt auf der CES 2026 die OpenFit Pro vor […] (00)
PNY Technologies – GeForce RTX 50 Serie im Slim Design mit starker Performance
PNY Technologies hat heute die Einführung von drei neuen Slim Modellen der  GeForce RTX 50 […] (00)
iPhone 17e mit Dynamic Island und A19-Chip erwartet
Das kommende Apple iPhone 17e soll nach Angaben eines chinesischen Leakers mit einem A19-Chip […] (00)
Brände in Kalifornien
Los Angeles (dpa) - Ein Jahr nach Ausbruch der verheerenden Feuer im Großraum Los Angeles hat […] (00)
Franziska Preuß
Oberhof (dpa) - Wegen möglicher Wetter-Kapriolen wird das Wettkampfprogramm beim Biathlon- […] (00)
Dolby präsentiert Neuheiten auf der CES 2026
Dolby Laboratories, ein führender Anbieter von immersiven Unterhaltungserlebnissen, wird auf […] (00)
Airbus-Aktie weiter gefragt: Lieferziel offenbar knapp übertroffen
Bericht stützt Erholung der Airbus-Aktie Die Aktie von Airbus bleibt zum Wochenstart gefragt. […] (00)
NBA 2K26 lässt euch mit Season 4 in das neue Jahr starten
Heute gab 2K bekannt, dass  NBA  2K26  Season 4 Freitag, den 9. Januar, mit brandneuen […] (00)
 
 
Suchbegriff