Trends der Zukunft

ChatGPT & Co. werden immer »schlauer« – und halluzinieren viel mehr

10. Mai 2025, 09:32 Uhr · Quelle: Trends der Zukunft
Wer KI-Modelle wie ChatGPT nutzt, sollte skeptisch bleiben, da diese trotz fortschrittlicher Logiksysteme halluzinieren und Fehlerquoten bis zu 79 Prozent aufweisen. Die potenziellen Konsequenzen in Bereichen wie Bildung und Gesundheit erfordern sorgfältiges Überprüfen der Informationen.

Prüfen, prüfen, prüfen: Wer eine künstliche Intelligenz wie ChatGPT zu Recherchezwecken nutzt, sollte sich nicht blind auf die gegebenen Informationen verlassen. Dass die Algorithmen zu Halluzinationen neigen, also »Fakten« frei erfinden, ist längst bekannt. Der Entwickler OpenAI gibt nun zu, dass die neuesten »Reasoning«-Systeme noch mehr halluzinieren als zuvor, obwohl sich ihre Funktionsweise immer mehr dem menschlichen Verstand annähert. Wie kann das sein?

Halluzinationen bei KIs

Fehlerraten erreichen bis zu 79 Prozent

Über KI-Fantasiewörter in wissenschaftlichen Publikationen haben wir auf Trends der Zukunft bereits berichtet. Jetzt stellt OpenAI bei seinen neuesten KI-Modellen GPT 03 und 04-mini überraschend Fehlerraten von bis zu 79 Prozent fest. Die Leistungsfähigkeit ist indes gestiegen, doch das Zwischenfazit macht Sorgen. Interne Tests belegen, dass GPT 03 zum Beispiel bei Fragen zu öffentlichen Personen zu einem Drittel Falschinformationen herausgibt – die Fehlerquote des Vorgängers lag nur bei der Hälfte. GPT 04-mini irrt sich bei diesem Thema sogar zu 48 Prozent, von Zuverlässigkeit kann also überhaupt keine Rede sein.

Neueste Modelle sind auf Logik und Denkfähigkeit konzipiert

Allgemeine Wissensfragen schlagen mit hohen Halluzinationsraten von 51 Prozent für 03 und bis zu 79 Prozent für 04-mini zu Buche. Dabei sollen die »Reasoning«-Modelle auf Logik und Denkfähigkeit setzen, statt auf reine statistische Wahrscheinlichkeit. Die Systeme sind so konzipiert, dass sie komplexe Fragestellungen in Einzelschritte zerlegen, um die Lösung herauszufinden – ähnlich, wie Menschen es tun.

Die New York Times erklärt dazu: »Die neuesten und leistungsstärksten Technologien – sogenannte Reasoning-Systeme von Unternehmen wie OpenAI, Google und dem chinesischen Start-up DeepSeek – erzeugen mehr Fehler, nicht weniger.« Das liege daran, dass jeder Denkschritt einen Fehler enthalten könne, der sich im Laufe der weiteren Verarbeitung verstärkt. OpenAI-Sprecherin Gaby Raila sagt im selben Artikel: »Halluzinationen sind nicht grundsätzlich häufiger in Reasoning-Modellen, obwohl wir aktiv daran arbeiten, die höheren Halluzinationsraten, die wir bei o3 und o4-mini gesehen haben, zu reduzieren.«

Konsequenzen von Fehlern können erheblich sein

Umso mehr sich die KI zum Beispiel in unserem Bildungs- und Gesundheitswesen verbreitet, desto größer können die Konsequenzen sein, die aus Fehlern resultieren. Entsprechend eifrig arbeiten die Entwickler an der Behebung des Problems. Menschen neigen dazu, dem Chatbot mehr Kompetenzen zuzutrauen, als er eigentlich hat. Blindes Vertrauen ist aber nicht angebracht, vielmehr gilt es, alle KI-«Fakten« grundsätzlich gegenzuchecken. »Man kann nicht behaupten, Zeit und Mühe zu sparen, wenn man genauso lange damit verbringen muss, alles zu überprüfen«, merkt ein Branchenexperte an.

Quelle: winfuture.de

Internet / ChatGPT / KI
[trendsderzukunft.de] · 10.05.2025 · 09:32 Uhr
[0 Kommentare]
Passwort wird auf einem Laptop eingegeben
Bonn/Düsseldorf (dpa/tmn) - Die Gefahr, im Alltag zu einfache Passwörter oder dasselbe Passwort für verschiedene Konten zu nutzen, ist groß - es sei denn, man nutzt Hilfsmittel wie einen Passwortmanager, der sich zahllose komplexe, sichere Passwörter «merken» kann und sie jederzeit einfach abrufbar macht. Eine Untersuchung von zehn Passwortmanagern durch das Bundesamt für Sicherheit in der Informationstechnik (BSI) hat […] (00)
vor 21 Minuten
VW-Werk (Archiv)
Wolfsburg - Volkswagens Aufsichtsrat will an diesem Donnerstag über den Investitionsrahmen von rund 160 Milliarden Euro entscheiden. Wie das "Handelsblatt" (Donnerstagsausgabe) unter Berufung auf mehrere mit den Planungen vertraute Personen berichtet, wird erwartet, dass das Gremium die Summe als Zielgröße für die kommenden fünf Jahre freigibt. Konzernchef Oliver Blume hatte die Zahl bereits […] (00)
vor 3 Minuten
Justin Theroux und Nicole Brydon
(BANG) - Justin Theroux und seine Frau Nicole Brydon Bloom erwarten ihr erstes gemeinsames Kind. Der 54-jährige Schauspieler und die 31-jährige Schauspielerin haben Anfang dieses Jahres geheiratet und bereiten sich laut 'People' nun darauf vor, ihr erstes Kind willkommen zu heißen. Die beiden haben sich gemeinsam bemüht, ihre Romanze aus der Öffentlichkeit herauszuhalten. Allerdings wurde erstmals […] (00)
vor 1 Stunde
Schmiede dein Schicksal: BLADESONG hämmert sich im Januar in den Early Access
Es gibt diesen einen, fast magischen Moment, wenn der schwere Hammer auf glühenden Stahl trifft und Funken wie kleine, verglühende Sterne durch die düstere Werkstatt tanzen. Genau dieses archaische Gefühl, die rohe Schöpfungskraft des Handwerks, will BLADESONG einfangen. London hat gesprochen, und wir haben ein Datum: Am 22. Januar 2026 öffnet sich das Tor zum wohl ultimativen Schwertschmiede- […] (00)
vor 43 Minuten
VOX-Dauerbrenner kehren am Vorabend zurück
Im Januar des nächsten Jahres geht es weiter mit Ralf und Ruinen. Seit 2017 präsentiert Ralf Seeger in unregelmäßigen Abständen den aus «hundkatzemaus» hervorgegangenen Ableger Harte Hunde – Ralf Seeger greift ein am Vorabend von VOX. Innerhalb des Formats kümmert sich der Kampfsportler und Tierschützer um Tierschutzorganisationen. Im nächsten Jahr startet die Sendung mal wieder in eine neue Staffel - schon Anfang Januar gehts los. Konkret ab […] (00)
vor 1 Stunde
Tatjana Haenni
Leipzig (dpa) - Fußball-Bundesligist RB Leipzig bekommt im kommenden Jahr eine Vorsitzende der Geschäftsführung. Die Schweizerin Tatjana Haenni wird ab dem 1. Januar 2026 ihre neue Rolle als CEO bei RB Leipzig antreten, wie der Tabellenzweite mitteilte. Derzeit gibt es keine andere Frau an der Spitze eines Bundesligisten. RB besetze die nach dem Abgang von Oliver Mintzlaff vakante Position des CEO […] (00)
vor 1 Stunde
BAT bestätigt Finanzziele für 2025 – Anleger bleiben vorsichtig
Rückkaufprogramm als Signal – aber ohne Euphorie British American Tobacco (BAT) setzt auf ein bewährtes Mittel, um Vertrauen am Kapitalmarkt zu gewinnen: Das Management kündigt ein Aktienrückkaufprogramm im Umfang von 1,3 Milliarden Pfund an. Für einen Konzern mit stabilen Cashflows klingt das zunächst nach einer klaren Botschaft an die Investoren: Die Bilanz steht, der freie Cashflow bleibt […] (00)
vor 17 Minuten
Der teuerste Fehler im Private Equity: Digitalisierung wie ein IT-Projekt zu behandeln
Frankfurt, 10.12.2025 (PresseBox) - Private Equity verliert nicht an Wert, weil Technologie fehlt — sondern weil Digitalisierung immer noch wie ein IT-Upgrade behandelt wird, statt als Führungsaufgabe. Dieser Denkfehler fällt in den frühen Phasen einer Beteiligung selten auf, frisst jedoch über den gesamten Holding-Zeitraum hinweg stille Rendite. Die Lücke zwischen „über Digitalisierung sprechen“ […] (00)
vor 1 Stunde
 
Apple TV offenbart neuen F1 Streaming-Vertrag
Am Sonntag informierte Apple TV über einen neuen F1 Streaming-Vertrag, der auch Bordkameras der Fahrer […] (00)
iFixit offeriert kostenlose iOS Reparatur-App
Der Reparaturdienstleister iFixit kündigte heute die Verfügbarkeit einer neuen iFixit-App an, die in […] (00)
HP ZGX Nano Station – Die nächste Entwicklungsstufe von KI-gestütztem Arbeiten
HP bringt mit der neuen HP ZGX Nano Station eine Geräteklasse auf den deutschen Markt, die die […] (00)
Passanten an einem Bürgergeld-Infostand (Archiv)
Berlin - CSU-Chef Markus Söder blickt zuversichtlich auf den anstehenden Koalitionsausschuss […] (01)
Leonardo DiCaprio
(BANG) - Leonardo DiCaprio versucht, für längere Zeiträume "zu verschwinden". Der 51-jährige […] (00)
Call of Duty: Black Ops 7 Zombies – Permanent Perks freischalten
Die Permanent Perks (Permanenten Vorteile) in Call of Duty: Black Ops 7 Zombies sind ein […] (00)
Neue Kriminalstatistik: Warum Zuwanderer häufiger Täter und Opfer sind
Was die Statistik tatsächlich zeigt Von insgesamt 3,1 Millionen registrierten Straftaten in […] (00)
The CW widmet Taylor Swift ein eigenes Doku-Special
Das Special «Taylor» beleuchtet am 13. Dezember die außergewöhnliche Karriere von Taylor Swift – mit […] (00)
 
 
Suchbegriff