Trends der Zukunft

ChatGPT & Co. werden immer »schlauer« – und halluzinieren viel mehr

10. Mai 2025, 09:32 Uhr · Quelle: Trends der Zukunft
Wer KI-Modelle wie ChatGPT nutzt, sollte skeptisch bleiben, da diese trotz fortschrittlicher Logiksysteme halluzinieren und Fehlerquoten bis zu 79 Prozent aufweisen. Die potenziellen Konsequenzen in Bereichen wie Bildung und Gesundheit erfordern sorgfältiges Überprüfen der Informationen.

Prüfen, prüfen, prüfen: Wer eine künstliche Intelligenz wie ChatGPT zu Recherchezwecken nutzt, sollte sich nicht blind auf die gegebenen Informationen verlassen. Dass die Algorithmen zu Halluzinationen neigen, also »Fakten« frei erfinden, ist längst bekannt. Der Entwickler OpenAI gibt nun zu, dass die neuesten »Reasoning«-Systeme noch mehr halluzinieren als zuvor, obwohl sich ihre Funktionsweise immer mehr dem menschlichen Verstand annähert. Wie kann das sein?

Halluzinationen bei KIs

Fehlerraten erreichen bis zu 79 Prozent

Über KI-Fantasiewörter in wissenschaftlichen Publikationen haben wir auf Trends der Zukunft bereits berichtet. Jetzt stellt OpenAI bei seinen neuesten KI-Modellen GPT 03 und 04-mini überraschend Fehlerraten von bis zu 79 Prozent fest. Die Leistungsfähigkeit ist indes gestiegen, doch das Zwischenfazit macht Sorgen. Interne Tests belegen, dass GPT 03 zum Beispiel bei Fragen zu öffentlichen Personen zu einem Drittel Falschinformationen herausgibt – die Fehlerquote des Vorgängers lag nur bei der Hälfte. GPT 04-mini irrt sich bei diesem Thema sogar zu 48 Prozent, von Zuverlässigkeit kann also überhaupt keine Rede sein.

Neueste Modelle sind auf Logik und Denkfähigkeit konzipiert

Allgemeine Wissensfragen schlagen mit hohen Halluzinationsraten von 51 Prozent für 03 und bis zu 79 Prozent für 04-mini zu Buche. Dabei sollen die »Reasoning«-Modelle auf Logik und Denkfähigkeit setzen, statt auf reine statistische Wahrscheinlichkeit. Die Systeme sind so konzipiert, dass sie komplexe Fragestellungen in Einzelschritte zerlegen, um die Lösung herauszufinden – ähnlich, wie Menschen es tun.

Die New York Times erklärt dazu: »Die neuesten und leistungsstärksten Technologien – sogenannte Reasoning-Systeme von Unternehmen wie OpenAI, Google und dem chinesischen Start-up DeepSeek – erzeugen mehr Fehler, nicht weniger.« Das liege daran, dass jeder Denkschritt einen Fehler enthalten könne, der sich im Laufe der weiteren Verarbeitung verstärkt. OpenAI-Sprecherin Gaby Raila sagt im selben Artikel: »Halluzinationen sind nicht grundsätzlich häufiger in Reasoning-Modellen, obwohl wir aktiv daran arbeiten, die höheren Halluzinationsraten, die wir bei o3 und o4-mini gesehen haben, zu reduzieren.«

Konsequenzen von Fehlern können erheblich sein

Umso mehr sich die KI zum Beispiel in unserem Bildungs- und Gesundheitswesen verbreitet, desto größer können die Konsequenzen sein, die aus Fehlern resultieren. Entsprechend eifrig arbeiten die Entwickler an der Behebung des Problems. Menschen neigen dazu, dem Chatbot mehr Kompetenzen zuzutrauen, als er eigentlich hat. Blindes Vertrauen ist aber nicht angebracht, vielmehr gilt es, alle KI-«Fakten« grundsätzlich gegenzuchecken. »Man kann nicht behaupten, Zeit und Mühe zu sparen, wenn man genauso lange damit verbringen muss, alles zu überprüfen«, merkt ein Branchenexperte an.

Quelle: winfuture.de

Internet / ChatGPT / KI
[trendsderzukunft.de] · 10.05.2025 · 09:32 Uhr
[0 Kommentare]
iPhone 18 Pro offenbar ohne schwarze Farbvariante
Einem aktuellen Gerücht zufolge wird Apple bei den kommenden iPhone 18 Pro Modellen auf ein schwarzes Gehäuse verzichten. Zum Vergleich: Die derzeitige iPhone 17 Pro Serie ist in den markanten Farben Silber, Cosmic Orange und Deep Blue erhältlich. iPhone im Business, Quelle: Unsplash Kein Schwarz für die iPhone 18 Pro Modelle Wie der bekannte […] (00)
vor 20 Stunden
Bundesverteidigungsministerium
Berlin (dpa) - Mit dem neuen Wehrdienstgesetz müssen sich grundsätzlich alle Männer im Alter von 17 bis 45 Jahren Auslandsaufenthalte von mehr als drei Monaten von der Bundeswehr genehmigen lassen. Das Bundesverteidigungsministerium bestätigte auf dpa-Anfrage entsprechende Informationen aus einem Bericht der «Frankfurter Rundschau». Doch fügte ein […] (00)
vor 4 Minuten
Kelly Osbourne teilte dieses Foto von Kiinicki auf Instagram
(BANG) - Kelly Osbourne hat neue Liebesspekulationen ausgelöst, nachdem sie einige Schnappschüsse in den sozialen Medien geteilt hat. Wenige Wochen nach ihrer Trennung von ihrem Verlobten Sid Wilson veröffentlichte die Reality-TV-Bekanntheit mehrere Instagram-Schnappschüsse von Kiinicki, einer in Los Angeles ansässigen nichtbinären Person, die als […] (00)
vor 2 Stunden
Neue PS5-Entwicklerkit-Leaks deuten darauf hin, dass die PS6 nicht mehr weit entfernt ist
Sony schweigt offiziell zur PlayStation 6, aber die Hinweise aus dem Inneren des Entwicklerprozesses sprechen eine immer deutlichere Sprache. Ein neuer Bericht des bekannten Tech-YouTubers Moore’s Law is Dead beleuchtet aktuelle Leaks aus Sonys Entwicklerdokumentationen – und die zeigen, dass die nächste Konsolengeneration bereits tief in die aktuelle […] (00)
vor 46 Minuten
3sat zeigt Highlights der Grimme-Preisverleihung 2026 aus Marl
Der Kultursender strahlt die wichtigsten Momente der diesjährigen Preisvergabe am späten Freitagabend aus. Am Freitag, den 24. April um 22.25 Uhr zeigt 3sat die Verleihung des 62. Grimme-Preises 2026 aus dem Theater Marl. Die Aufzeichnung der Veranstaltung, die bereits am selben Tag stattfand, ist zudem langfristig in der Mediathek abrufbar. Der Grimme-Preis zählt zu den renommiertesten […] (00)
vor 1 Stunde
Joachim Löw
Berlin (dpa) - Um Weltmeister-Trainer Joachim Löw gibt es ein überraschendes und wenig glaubhaftes Comeback-Gerücht - und der 66-Jährige räumt es auch schnell aus der Welt. Laut des Portals «ghanasoccernet» könnte Löw für die anstehende Fußball-WM die Nationalmannschaft Ghanas als Trainer übernehmen. Doch dazu wird es wohl nicht kommen. «Mit mir hat […] (06)
vor 21 Stunden
cryptocurrency, business, finance, money, wealth, gold, cash, monetary, investment, ethereum
Bitcoin (BTC) hält sich derzeit in der wichtigen Zone zwischen $65.000 und $66.000. Cathie Wood, CEO von Ark Invest, äußerte sich zu den aktuellen Marktentwicklungen und betonte, dass die Zeiten extremer Kursrückgänge vorbei seien. 50% Korrektur bei Bitcoin als „echter Sieg“ In einem Interview mit CNBC erklärte Cathie Wood, dass Bitcoin in den letzten […] (00)
vor 28 Minuten
Durchhaltevermögen: Die innere Kraft, die über Erfolg entscheidet
Höchst i. Odw., 04.04.2026 (lifePR) - In einer schnelllebigen Welt voller Herausforderungen, Leistungsdruck und ständiger Veränderungen wird Durchhaltevermögen (auch mentale Stärke oder Resilienz) zu einer der wichtigsten Fähigkeiten. Es beschreibt die Fähigkeit, trotz Rückschlägen, Erschöpfung oder Hindernissen an Zielen festzuhalten, Aufgaben mit […] (00)
vor 4 Stunden
 
Interview: Tim Cook entdeckt seltene Prototypen vom iPhone und iPod
In einem Interview mit dem Wall Street Journal unternahm Tim Cook zusammen mit dem […] (00)
Apple verschickt Einladungen für die WWDC 2026 im Apple Park
Apple hat offiziell die Einladungen an die glücklichen Gewinner […] (00)
Apple iPad Air 3 WLAN landet auf der Vintage-Liste
Apple hat nun auch die WLAN-Version des iPad Air 3 offiziell in seine sogenannte […] (00)
Buckelwal liegt weiter in Wismarbucht
Wismar (dpa) - Der vor Wismar gestrandete Buckelwal lebt noch. Der Zustand des Tieres […] (02)
Italiens bisheriger Nationaltrainer Gennaro Gattuso
Rom (dpa) - Italiens abermaliges Scheitern in einer WM-Qualifikation hat nun auch […] (05)
CNN zeigt FlashDoc «Money Madness: College Basketball at a Crossroads»
Die neue Dokumentation beleuchtet die Schattenseiten des US-College-Basketballs und ist bereits […] (00)
Christian Ulmen
(BANG) - Die Vorwürfe gegen Schauspieler Christian Ulmen sorgen derzeit bundesweit […] (00)
Steigende Kündigungstrends in der Technologie Im März hat der Technologiesektor einen bemerkenswerten Anstieg der Ankündigungen von Kündigungen verzeichnet und führt damit alle US- […] (00)
 
 
Suchbegriff