Trends der Zukunft

ChatGPT & Co. werden immer »schlauer« – und halluzinieren viel mehr

10. Mai 2025, 09:32 Uhr · Quelle: Trends der Zukunft
Wer KI-Modelle wie ChatGPT nutzt, sollte skeptisch bleiben, da diese trotz fortschrittlicher Logiksysteme halluzinieren und Fehlerquoten bis zu 79 Prozent aufweisen. Die potenziellen Konsequenzen in Bereichen wie Bildung und Gesundheit erfordern sorgfältiges Überprüfen der Informationen.

Prüfen, prüfen, prüfen: Wer eine künstliche Intelligenz wie ChatGPT zu Recherchezwecken nutzt, sollte sich nicht blind auf die gegebenen Informationen verlassen. Dass die Algorithmen zu Halluzinationen neigen, also »Fakten« frei erfinden, ist längst bekannt. Der Entwickler OpenAI gibt nun zu, dass die neuesten »Reasoning«-Systeme noch mehr halluzinieren als zuvor, obwohl sich ihre Funktionsweise immer mehr dem menschlichen Verstand annähert. Wie kann das sein?

Halluzinationen bei KIs

Fehlerraten erreichen bis zu 79 Prozent

Über KI-Fantasiewörter in wissenschaftlichen Publikationen haben wir auf Trends der Zukunft bereits berichtet. Jetzt stellt OpenAI bei seinen neuesten KI-Modellen GPT 03 und 04-mini überraschend Fehlerraten von bis zu 79 Prozent fest. Die Leistungsfähigkeit ist indes gestiegen, doch das Zwischenfazit macht Sorgen. Interne Tests belegen, dass GPT 03 zum Beispiel bei Fragen zu öffentlichen Personen zu einem Drittel Falschinformationen herausgibt – die Fehlerquote des Vorgängers lag nur bei der Hälfte. GPT 04-mini irrt sich bei diesem Thema sogar zu 48 Prozent, von Zuverlässigkeit kann also überhaupt keine Rede sein.

Neueste Modelle sind auf Logik und Denkfähigkeit konzipiert

Allgemeine Wissensfragen schlagen mit hohen Halluzinationsraten von 51 Prozent für 03 und bis zu 79 Prozent für 04-mini zu Buche. Dabei sollen die »Reasoning«-Modelle auf Logik und Denkfähigkeit setzen, statt auf reine statistische Wahrscheinlichkeit. Die Systeme sind so konzipiert, dass sie komplexe Fragestellungen in Einzelschritte zerlegen, um die Lösung herauszufinden – ähnlich, wie Menschen es tun.

Die New York Times erklärt dazu: »Die neuesten und leistungsstärksten Technologien – sogenannte Reasoning-Systeme von Unternehmen wie OpenAI, Google und dem chinesischen Start-up DeepSeek – erzeugen mehr Fehler, nicht weniger.« Das liege daran, dass jeder Denkschritt einen Fehler enthalten könne, der sich im Laufe der weiteren Verarbeitung verstärkt. OpenAI-Sprecherin Gaby Raila sagt im selben Artikel: »Halluzinationen sind nicht grundsätzlich häufiger in Reasoning-Modellen, obwohl wir aktiv daran arbeiten, die höheren Halluzinationsraten, die wir bei o3 und o4-mini gesehen haben, zu reduzieren.«

Konsequenzen von Fehlern können erheblich sein

Umso mehr sich die KI zum Beispiel in unserem Bildungs- und Gesundheitswesen verbreitet, desto größer können die Konsequenzen sein, die aus Fehlern resultieren. Entsprechend eifrig arbeiten die Entwickler an der Behebung des Problems. Menschen neigen dazu, dem Chatbot mehr Kompetenzen zuzutrauen, als er eigentlich hat. Blindes Vertrauen ist aber nicht angebracht, vielmehr gilt es, alle KI-«Fakten« grundsätzlich gegenzuchecken. »Man kann nicht behaupten, Zeit und Mühe zu sparen, wenn man genauso lange damit verbringen muss, alles zu überprüfen«, merkt ein Branchenexperte an.

Quelle: winfuture.de

Internet / ChatGPT / KI
[trendsderzukunft.de] · 10.05.2025 · 09:32 Uhr
[0 Kommentare]
Apple iPad Air 3 WLAN landet auf der Vintage-Liste
Apple hat nun auch die WLAN-Version des iPad Air 3 offiziell in seine sogenannte Vintage-Liste aufgenommen. Damit folgt das Tablet den Mobilfunk-Modellen, die diesen Status bereits zuvor erreicht hatten. Das beliebte Gerät feierte vor gut sieben Jahren, im März 2019, seine Markteinführung. Augmented Reality auf dem iPad, Quelle: Patrick […] (00)
vor 5 Stunden
Günther Sautter
Berlin (dpa) - Nach der Kritik von US-Präsident Donald Trump an Deutschland und anderen europäischen Nato-Partnern hat der außenpolitische Berater von Bundeskanzler Friedrich Merz, Günter Sautter, US-Außenminister Marco Rubio in Washington getroffen. Eine Regierungssprecherin in Berlin bestätigte einen entsprechenden Bericht von «Table.Briefings».  Das […] (00)
vor 4 Minuten
Dass dein Körper auf Nikotinentzug reagiert, ist kein Zeichen von Schwäche, sondern eine ganz natürliche und erwartbare Reaktion deines Körpers auf die plötzliche Zufuhr-Abstinenz von einem Stoff, an den sich dein Gehirn gewöhnt hat. Und genau deshalb ist die Entwöhnung nicht so geradlinig, wie viele Menschen sich das wünschen. Viele erleben in den […] (02)
vor 5 Stunden
Super Mario Bros Wonder Switch 2 Edition im Test: Mehr Chaos, mehr Koop, mehr Mario
Manchmal braucht es kein komplett neues Spiel, sondern einfach die Version, die sich von Anfang an „richtig“ anfühlt. Genau das liefert die Nintendo Switch 2 Edition von Super Mario Bros. Wonder + Gemeinsam im Bellabel Park – und zeigt dabei ziemlich eindrucksvoll, wie ein modernes Re-Release aussehen sollte. Wenn ihr wissen wollt, wie Kollege Manuel […] (00)
vor 1 Stunde
Netflix sichert sich «The Corrections» mit Meryl Streep
Der Streamingdienst adaptiert den gefeierten Roman als Miniserie. Der Streaminganbieter Netflix hat die Produktion der Miniserie The Corrections bestätigt. In der Hauptrolle wird Meryl Streep zu sehen sein, die zugleich auch als Executive Producerin fungiert. Die Serie basiert auf dem gleichnamigen Bestseller von Jonathan Franzen. Die Geschichte erzählt von einer dysfunktionalen Familie aus […] (00)
vor 2 Stunden
Bayern München - Manchester United
München (dpa) - Nach der kleinen Sternstunde für die Fußballerinnen des FC Bayern in der Champions League schnappte sich Nationalspielerin Linda Dallmann ein Megafon und heizte in der Münchner Fankurve ausgelassen den eigenen Anhang an. Der deutsche Doublesieger zog vor der Vereinsrekordkulisse von 25.000 Zuschauern in der Königinnenklasse erstmals seit […] (00)
vor 26 Minuten
Sprit-Hammer um Punkt 12: Die neue Tank-Falle schnappt erbarmungslos zu
Was als Schutz für die Verbraucher gedacht war, entpuppt sich am ersten Tag seiner Gültigkeit als finanzieller Vernichtungsschlag für Pendler und Logistiker. Seit diesem Mittwoch darf in Deutschland das Gesetz der Straße nur noch einmal am Tag nach oben korrigiert werden: Punkt 12 Uhr mittags. Doch statt der erhofften Stabilität erlebten die Tankstellen […] (00)
vor 1 Stunde
Wenn der Vorplatz zum Showroom wird
Sinsheim, 02.04.2026 (lifePR) - Wenn sich am ersten Sonntag im Monat von 9 bis 14 Uhr der Vorplatz des Technik Museum Speyer mit automobilen Raritäten füllt, ist wieder Benzingespräch-Zeit. Von April bis September 2026 (ausgenommen Mai) lädt das Museum zum beliebten Treffpunkt für Old- und Youngtimerfans ein – im Jubiläumsjahr erstmals mit zusätzlichen […] (00)
vor 4 Stunden
 
Speicherplatz eines WhatsApp-Chats
Berlin (dpa/tmn) - Hier ein Foto, dort ein Video: Gerade in großen WhatsApp-Gruppen […] (00)
Terminbuchungen über E-Patientenakten geplant
Berlin (dpa) - Terminanfragen bei Ärztinnen und Ärzten sind oft keine ganz einfache […] (00)
TP-Link – Tapo RV50 Pro Omni erreicht das neuste Saug- und Wischroboter-Modell auch die Schweiz
TP-Link,  ein weltweit führender Anbieter von Smart-Home- und Netzwerkprodukten, […] (00)
Julia Klöckner (Archiv)
Berlin - Bundestagspräsidentin Julia Klöckner (CDU) wird vom 8. bis 10. April Estland […] (00)
«Vehicle Motion Cues» auf einem iPhone
Berlin (dpa/tmn) - Geschichten, Nachrichten, Chats, Social Media - da möchte man […] (00)
Victoria Carl
Planegg/Bonn (dpa) - Langläuferin Victoria Carl ist nach einem positiven Dopingtest […] (01)
Preisanstieg in den Innenstädten Laut einer Analyse des Kiel Instituts für […] (00)
Megan Thee Stallion
(BANG) - Megan Thee Stallion wurde ins Krankenhaus eingeliefert, nachdem sie während […] (00)
 
 
Suchbegriff