Trends der Zukunft

ChatGPT & Co. werden immer »schlauer« – und halluzinieren viel mehr

10. Mai 2025, 09:32 Uhr · Quelle: Trends der Zukunft
Wer KI-Modelle wie ChatGPT nutzt, sollte skeptisch bleiben, da diese trotz fortschrittlicher Logiksysteme halluzinieren und Fehlerquoten bis zu 79 Prozent aufweisen. Die potenziellen Konsequenzen in Bereichen wie Bildung und Gesundheit erfordern sorgfältiges Überprüfen der Informationen.

Prüfen, prüfen, prüfen: Wer eine künstliche Intelligenz wie ChatGPT zu Recherchezwecken nutzt, sollte sich nicht blind auf die gegebenen Informationen verlassen. Dass die Algorithmen zu Halluzinationen neigen, also »Fakten« frei erfinden, ist längst bekannt. Der Entwickler OpenAI gibt nun zu, dass die neuesten »Reasoning«-Systeme noch mehr halluzinieren als zuvor, obwohl sich ihre Funktionsweise immer mehr dem menschlichen Verstand annähert. Wie kann das sein?

Halluzinationen bei KIs

Fehlerraten erreichen bis zu 79 Prozent

Über KI-Fantasiewörter in wissenschaftlichen Publikationen haben wir auf Trends der Zukunft bereits berichtet. Jetzt stellt OpenAI bei seinen neuesten KI-Modellen GPT 03 und 04-mini überraschend Fehlerraten von bis zu 79 Prozent fest. Die Leistungsfähigkeit ist indes gestiegen, doch das Zwischenfazit macht Sorgen. Interne Tests belegen, dass GPT 03 zum Beispiel bei Fragen zu öffentlichen Personen zu einem Drittel Falschinformationen herausgibt – die Fehlerquote des Vorgängers lag nur bei der Hälfte. GPT 04-mini irrt sich bei diesem Thema sogar zu 48 Prozent, von Zuverlässigkeit kann also überhaupt keine Rede sein.

Neueste Modelle sind auf Logik und Denkfähigkeit konzipiert

Allgemeine Wissensfragen schlagen mit hohen Halluzinationsraten von 51 Prozent für 03 und bis zu 79 Prozent für 04-mini zu Buche. Dabei sollen die »Reasoning«-Modelle auf Logik und Denkfähigkeit setzen, statt auf reine statistische Wahrscheinlichkeit. Die Systeme sind so konzipiert, dass sie komplexe Fragestellungen in Einzelschritte zerlegen, um die Lösung herauszufinden – ähnlich, wie Menschen es tun.

Die New York Times erklärt dazu: »Die neuesten und leistungsstärksten Technologien – sogenannte Reasoning-Systeme von Unternehmen wie OpenAI, Google und dem chinesischen Start-up DeepSeek – erzeugen mehr Fehler, nicht weniger.« Das liege daran, dass jeder Denkschritt einen Fehler enthalten könne, der sich im Laufe der weiteren Verarbeitung verstärkt. OpenAI-Sprecherin Gaby Raila sagt im selben Artikel: »Halluzinationen sind nicht grundsätzlich häufiger in Reasoning-Modellen, obwohl wir aktiv daran arbeiten, die höheren Halluzinationsraten, die wir bei o3 und o4-mini gesehen haben, zu reduzieren.«

Konsequenzen von Fehlern können erheblich sein

Umso mehr sich die KI zum Beispiel in unserem Bildungs- und Gesundheitswesen verbreitet, desto größer können die Konsequenzen sein, die aus Fehlern resultieren. Entsprechend eifrig arbeiten die Entwickler an der Behebung des Problems. Menschen neigen dazu, dem Chatbot mehr Kompetenzen zuzutrauen, als er eigentlich hat. Blindes Vertrauen ist aber nicht angebracht, vielmehr gilt es, alle KI-«Fakten« grundsätzlich gegenzuchecken. »Man kann nicht behaupten, Zeit und Mühe zu sparen, wenn man genauso lange damit verbringen muss, alles zu überprüfen«, merkt ein Branchenexperte an.

Quelle: winfuture.de

Internet / ChatGPT / KI
[trendsderzukunft.de] · 10.05.2025 · 09:32 Uhr
[0 Kommentare]
Buckelwal liegt weiter in Wismarbucht
Wismar (dpa) - Nach der gescheiterten Rettung des vor der Ostseeküste bei Wismar gestrandeten Buckelwals sind Helferinnen und Helfer immer mehr verbalen Angriffen ausgesetzt. «Bedauerlicherweise nehmen seit dem Zeitpunkt, als klar wurde, dass das Tier nicht zu retten sein wird, die Anfeindungen gegen Beteiligte an der Hilfsmaßnahme zu – bis hin zu […] (04)
vor 3 Minuten
Daniel Radcliffe
(BANG) - Daniel Radcliffe hat "tiefgreifendes Glück" gefunden, seit er Vater geworden ist. Der britische Schauspieler – der bereits im Alter von elf Jahren als titelgebender Zauberlehrling in der 'Harry Potter'-Filmreihe berühmt wurde – glaubt, dass sein jüngeres Ich ihn heute nicht wiedererkennen würde. Damals sei er "zutiefst unglücklich" gewesen, […] (00)
vor 4 Stunden
Der Super Mario Galaxy Film bricht Rekorde: Stärkstes Einspielergebnis in den USA am Starttag
Ein roter Overall, ein Schnurrbart und eine ungebrochene Fähigkeit, Kinokassen zum Glühen zu bringen – Mario schafft es einfach immer wieder. The Super Mario Galaxy Movie ist nun in den Kinos angelaufen und hat zum Auftakt gleich ein Statement gesetzt, das die gesamte Filmbranche aufhorchen lässt. Ob dieser Schwung auch über das Wochenende anhält, ist […] (00)
vor 1 Stunde
Tubi kündigt zweite Staffel von «Big Mood» an
Der Streamingdienst setzt die Comedyserie mit Nicola Coughlan und Lydia West im April fort. Der werbefinanzierte Streaminganbieter Tubi hat den Trailer zur zweiten Staffel von Big Mood veröffentlicht. Die neuen Folgen feiern am 16. April Premiere und führen die Geschichte rund um die komplizierte Freundschaft von Maggie und Eddie weiter. Ein Jahr ist vergangen, seit sich die beiden besten […] (00)
vor 3 Stunden
Joachim Löw
Berlin (dpa) - Ex-Bundestrainer Joachim Löw ist Gerüchten um ein Comeback als Auswahlcoach Ghanas entgegengetreten. «Mit mir hat offiziell niemand von Ghana gesprochen», sagte der 66-Jährige dem Pay-TV-Sender Sky. Zuvor hatte das Portal «ghanasoccernet» berichtet, der Weltmeister-Trainer von 2014 könnte für die anstehende Fußball-WM die […] (02)
vor 9 Minuten
Rohstoff-Krieg in Afrika: Chinas 1,2-Milliarden-Dollar-Schlag gegen den Westen
Das Comeback der Mao-Bahn als strategische Waffe Es ist ein diplomatisches und wirtschaftliches Beben, das von der tansanischen Küste bis tief in das rohstoffreiche Herz Afrikas zu spüren ist. Ein Konsortium aus chinesischen Bergbau-Giganten, Reedereien und staatlichen Baufirmen hat sich zusammengeschlossen, um die legendäre TAZARA-Eisenbahnlinie für […] (00)
vor 7 Minuten
Lantech entwickelt wegweisende Security-Switch-Lösung SL3
Klingenberg, 03.04.2026 (PresseBox) - Lantech setzt neue Maßstäbe in der Cybersicherheit mit dem in Entwicklung befindlichen Security-Switch, der höchste SL3-Fähigkeiten bietet, den Normen BSI TR-02102-4 und RF 8572 entspricht und folgende Merkmale aufweist: Kryptografische Integrität: SSH/TLS-Kryptoalgorithmen, USM/TSM-Schlüsselverwaltung, MAC- […] (00)
vor 2 Stunden
 
Bildschirme
Berlin (dpa) - Kinderärzte sollten aus Sicht von Familienministerin Karin Prien junge […] (00)
Ricarda Lang
Berlin (dpa) - Grünen-Politikerin Ricarda Lang hat nach eigener Aussage digitale […] (00)
Interview: Tim Cook entdeckt seltene Prototypen vom iPhone und iPod
In einem Interview mit dem Wall Street Journal unternahm Tim Cook zusammen mit dem […] (00)
Uffizien
Florenz (dpa) - Aus Angst vor einem spektakulären Einbruch wie im Louvre sind nach einem […] (01)
Let’s Plays und Gaming-Streams sind bei den Deutschen beliebt
Gaming-Livestreams und Let’s Plays begeistern Millionen Menschen in Deutschland. […] (00)
Mathieu van der Poel und Tadej Pogačar
Sint-Niklaas (dpa) - Mathieu van der Poel ergriff vorsorglich schon einmal die […] (01)
RAYE hat neue Spekulationen über den nächsten 'James Bond'-Titelsong angeheizt
(BANG) - RAYE hat neue Spekulationen über den nächsten 'James Bond'-Titelsong […] (00)
Meryl Streep
(BANG) - Meryl Streep hat verraten, dass 'Der Teufel trägt Prada' Schwierigkeiten […] (00)
 
 
Suchbegriff