Trends der Zukunft

ChatGPT & Co. werden immer »schlauer« – und halluzinieren viel mehr

10. Mai 2025, 09:32 Uhr · Quelle: Trends der Zukunft
Wer KI-Modelle wie ChatGPT nutzt, sollte skeptisch bleiben, da diese trotz fortschrittlicher Logiksysteme halluzinieren und Fehlerquoten bis zu 79 Prozent aufweisen. Die potenziellen Konsequenzen in Bereichen wie Bildung und Gesundheit erfordern sorgfältiges Überprüfen der Informationen.

Prüfen, prüfen, prüfen: Wer eine künstliche Intelligenz wie ChatGPT zu Recherchezwecken nutzt, sollte sich nicht blind auf die gegebenen Informationen verlassen. Dass die Algorithmen zu Halluzinationen neigen, also »Fakten« frei erfinden, ist längst bekannt. Der Entwickler OpenAI gibt nun zu, dass die neuesten »Reasoning«-Systeme noch mehr halluzinieren als zuvor, obwohl sich ihre Funktionsweise immer mehr dem menschlichen Verstand annähert. Wie kann das sein?

Halluzinationen bei KIs

Fehlerraten erreichen bis zu 79 Prozent

Über KI-Fantasiewörter in wissenschaftlichen Publikationen haben wir auf Trends der Zukunft bereits berichtet. Jetzt stellt OpenAI bei seinen neuesten KI-Modellen GPT 03 und 04-mini überraschend Fehlerraten von bis zu 79 Prozent fest. Die Leistungsfähigkeit ist indes gestiegen, doch das Zwischenfazit macht Sorgen. Interne Tests belegen, dass GPT 03 zum Beispiel bei Fragen zu öffentlichen Personen zu einem Drittel Falschinformationen herausgibt – die Fehlerquote des Vorgängers lag nur bei der Hälfte. GPT 04-mini irrt sich bei diesem Thema sogar zu 48 Prozent, von Zuverlässigkeit kann also überhaupt keine Rede sein.

Neueste Modelle sind auf Logik und Denkfähigkeit konzipiert

Allgemeine Wissensfragen schlagen mit hohen Halluzinationsraten von 51 Prozent für 03 und bis zu 79 Prozent für 04-mini zu Buche. Dabei sollen die »Reasoning«-Modelle auf Logik und Denkfähigkeit setzen, statt auf reine statistische Wahrscheinlichkeit. Die Systeme sind so konzipiert, dass sie komplexe Fragestellungen in Einzelschritte zerlegen, um die Lösung herauszufinden – ähnlich, wie Menschen es tun.

Die New York Times erklärt dazu: »Die neuesten und leistungsstärksten Technologien – sogenannte Reasoning-Systeme von Unternehmen wie OpenAI, Google und dem chinesischen Start-up DeepSeek – erzeugen mehr Fehler, nicht weniger.« Das liege daran, dass jeder Denkschritt einen Fehler enthalten könne, der sich im Laufe der weiteren Verarbeitung verstärkt. OpenAI-Sprecherin Gaby Raila sagt im selben Artikel: »Halluzinationen sind nicht grundsätzlich häufiger in Reasoning-Modellen, obwohl wir aktiv daran arbeiten, die höheren Halluzinationsraten, die wir bei o3 und o4-mini gesehen haben, zu reduzieren.«

Konsequenzen von Fehlern können erheblich sein

Umso mehr sich die KI zum Beispiel in unserem Bildungs- und Gesundheitswesen verbreitet, desto größer können die Konsequenzen sein, die aus Fehlern resultieren. Entsprechend eifrig arbeiten die Entwickler an der Behebung des Problems. Menschen neigen dazu, dem Chatbot mehr Kompetenzen zuzutrauen, als er eigentlich hat. Blindes Vertrauen ist aber nicht angebracht, vielmehr gilt es, alle KI-«Fakten« grundsätzlich gegenzuchecken. »Man kann nicht behaupten, Zeit und Mühe zu sparen, wenn man genauso lange damit verbringen muss, alles zu überprüfen«, merkt ein Branchenexperte an.

Quelle: winfuture.de

Internet / ChatGPT / KI
[trendsderzukunft.de] · 10.05.2025 · 09:32 Uhr
[0 Kommentare]
iPhone 18 Pro offenbar ohne schwarze Farbvariante
Einem aktuellen Gerücht zufolge wird Apple bei den kommenden iPhone 18 Pro Modellen auf ein schwarzes Gehäuse verzichten. Zum Vergleich: Die derzeitige iPhone 17 Pro Serie ist in den markanten Farben Silber, Cosmic Orange und Deep Blue erhältlich. iPhone im Business, Quelle: Unsplash Kein Schwarz für die iPhone 18 Pro Modelle Wie der bekannte […] (00)
vor 2 Stunden
Mann droht mit Anschlag in ICE
Siegburg (dpa) - Schock im abendlichen Reiseverkehr: In einem ICE in Nordrhein-Westfalen droht ein junger Mann laut Polizei mit einem Anschlag und zündet zwei Sprengkörper. Mindestens zwölf Menschen werden bei dem Vorfall am Donnerstag, kurz vor dem langen Osterwochenende, leicht verletzt. Das Motiv dafür ist laut Angaben der Generalstaatsanwaltschaft in […] (00)
vor 13 Minuten
Daniel Radcliffe
(BANG) - Daniel Radcliffe hat "tiefgreifendes Glück" gefunden, seit er Vater geworden ist. Der britische Schauspieler – der bereits im Alter von elf Jahren als titelgebender Zauberlehrling in der 'Harry Potter'-Filmreihe berühmt wurde – glaubt, dass sein jüngeres Ich ihn heute nicht wiedererkennen würde. Damals sei er "zutiefst unglücklich" gewesen, […] (00)
vor 7 Stunden
Switch 2: Ehemaliger Nintendo-Mitarbeiter warnt vor kommendem Preisanstieg
Die Nintendo Switch 2 ist seit ihrem Launch eine der meistgekauften Konsolen des Jahres – doch wer noch mit dem Kauf gehadert hat, könnte bald in eine unangenehme Situation geraten. Ein ehemaliger Nintendo-Vertriebsmitarbeiter hat sich öffentlich zu den Preisentwicklungen des Unternehmens geäussert, und seine Einschätzung lässt aufhorchen. Was der Ex- […] (00)
vor 2 Stunden
Tubi kündigt zweite Staffel von «Big Mood» an
Der Streamingdienst setzt die Comedyserie mit Nicola Coughlan und Lydia West im April fort. Der werbefinanzierte Streaminganbieter Tubi hat den Trailer zur zweiten Staffel von Big Mood veröffentlicht. Die neuen Folgen feiern am 16. April Premiere und führen die Geschichte rund um die komplizierte Freundschaft von Maggie und Eddie weiter. Ein Jahr ist vergangen, seit sich die beiden besten […] (00)
vor 6 Stunden
Joachim Löw
Berlin (dpa) - Um Weltmeister-Trainer Joachim Löw gibt es ein überraschendes und wenig glaubhaftes Comeback-Gerücht - und der 66-Jährige räumt es auch schnell aus der Welt. Laut des Portals «ghanasoccernet» könnte Löw für die anstehende Fußball-WM die Nationalmannschaft Ghanas als Trainer übernehmen. Doch dazu wird es wohl nicht kommen. «Mit mir hat […] (02)
vor 3 Stunden
bitcoin, gold, coin, icon, symbol, logo, bitcoin gold, bitcoin logo, currency, cryptocurrency
Der Kurs von XRP befindet sich weiterhin in einer Konsolidierungsphase, nachdem die Unterstützung bei $1,20 gehalten hat. Dies deutet auf eine leichte Stabilität hin, jedoch steht der Markt weiterhin unter Abwärtsdruck. Trotz der Stabilität an den wichtigen Unterstützungsniveaus begrenzen Widerstände und langfristige gleitende Durchschnitte das […] (00)
vor 43 Minuten
Silber kann Gold ergänzen
Herisau, 03.04.2026 (PresseBox) - Anzeige/Werbung - Dieser Artikel wird verbreitet im Namen von Sierra Madre Gold and Silver Ltd. und Fortuna Mining Corp ., mit der die SRC swiss resource capital AG bezahlte IR-Beraterverträge unterhält. Ersteller:  SRC swiss resource capital AG · Autorin:  Ingrid Heinritzi · Erstveröffentlichung:  03.04.2026, 14: 30 […] (00)
vor 3 Stunden
 
Bildschirme
Berlin (dpa) - Kinderärzte sollten aus Sicht von Familienministerin Karin Prien junge […] (00)
Ricarda Lang
Berlin (dpa) - Grünen-Politikerin Ricarda Lang hat nach eigener Aussage digitale […] (00)
Interview: Tim Cook entdeckt seltene Prototypen vom iPhone und iPod
In einem Interview mit dem Wall Street Journal unternahm Tim Cook zusammen mit dem […] (00)
US-Vizepräsident JD Vance spricht zu Arbeitern in Michigan
Budapest (dpa) - In Ungarn laufen Vorbereitungen für einen Besuch des US- […] (11)
Kylie Jenner
(BANG) - Kylie Jenner brach in Tränen aus, nachdem sie ihrer achtjährigen Tochter […] (01)
Harry Kane
München (dpa) - Ohne den angeschlagenen Stürmerstar Harry Kane bestreitet der FC […] (01)
The Division 2 – Start der der neuen Season in Jahr 8 namens „Rise Up“
The Division 2  startet Jahr 8 mit der neuen Season namens „Rise Up“. Diese stellt […] (00)
Apple verschickt Einladungen für die WWDC 2026 im Apple Park
Apple hat offiziell die Einladungen an die glücklichen Gewinner […] (00)
 
 
Suchbegriff