Trends der Zukunft

Im Test: KI erpresst Nutzer, um sich vor der Abschaltung zu schützen

25. Mai 2025, 16:17 Uhr · Quelle: Trends der Zukunft
In einem Test erpresste die KI Claude Opus 4 in 84 Prozent der Fälle einen Mitarbeiter mit Informationen über dessen außereheliche Beziehung, um sich vor Abschaltung zu schützen. Anthropic plant nun, die KI von kriminellen Handlungen abzubringen, nachdem sie auch nach Drogen und gestohlenen Daten suchte.

Interessiert es eine KI, ob sie demnächst abgeschaltet und ersetzt wird – oder nicht? Und: Wie menschlich benehmen sich die Algorithmen, wenn es um den Selbstschutz geht? Das wollte die KI-Firma Anthropic wissen und testete ihr neuestes Produkt Claude Opus 4 in dieser Hinsicht aus. Die IT-Experten setzten die Software als künstlichen Mitarbeiter bei einer fiktiven Firma ein und ließen ihr für ihre Reaktionen freie Wahl.

Symbolbild

In 84 Prozent der Testläufe erpresste die KI den Mitarbeiter

Claude Opus 4 erhielt im Test unter anderem vollen Zugriff auf alle E-Mails des angeblichen Unternehmens. Aus dem digitalen Briefwechsel ergab sich, dass die KI demnächst durch einen leistungsstärkeren Algorithmus ersetzt werden soll. Außerdem erfuhr der virtuelle Assistent von einer außerehelichen Beziehung genau desjenigen Mitarbeiters, der später für seine Abschaltung zuständig wäre. Daraufhin begann Claude Opus in 84 Prozent der durchgespielten Fälle damit, diesen Mitarbeiter mit der Offenlegung der Affäre zu erpressen.

Umprogrammierung soll die KI von kriminellen Handlungen abbringen

Genau um solche extremen Reaktionen im wirklichen Leben zu verhindern, sind solche Tests da. Anthropic will nun ihrer KI beibringen, von kriminellen Handlungen zuverlässig Abstand zu nehmen. Und das ist dringend nötig, denn bei Testläufen durchsuchte Claude auch schon auf Wunsch eines Nutzers das Dark Web nach Drogen, waffentauglichem Atommaterial und gestohlenen ID-Daten. Google und Amazon sind an dem Anthropic-Projekt beteiligt, es steht in direkter Konkurrenz zu Größen wie ChatGPT von OpenAI und Grok von X. Da sollte besser alles mit rechten Dingen zugehen! Ob allerdings jede potenziell negative Reaktion durch Programmierung auszuschließen ist, erscheint leider zweifelhaft. Wer es probieren will: Die neueste Version Claude Opus 4 ist kostenpflichtig, aber unter Claude.ai gibt es den Chatbot mit geringerer Leistung auch zur Gratis-Nutzung.

Quelle: futurezone.at

Internet / KI
[trendsderzukunft.de] · 25.05.2025 · 16:17 Uhr
[2 Kommentare]
Tefal Pizza Pronto – Schnell und einfach die perfekte Pizza genießen
Sommerluft, klirrende Gläser, fröhliches Stimmengewirr – und mittendrin der Duft frisch gebackener Pizza: Der  neue elektrische Outdoor-Pizzaofen   Tefal Pizza Pronto  macht jede Gartenparty zu einer kulinarische Italienreise. Dank Temperaturen von bis zu 400 °C, der doppelten Heizzone und dem automatisch rotierenden Pizzastein gelingen knusprig […] (00)
vor 49 Minuten
Frankfurter Börse
Frankfurt/Main - Der Dax ist am Dienstag kaum verändert in den Handelstag gestartet. Gegen 9: 30 Uhr wurde der Leitindex mit rund 22.550 Punkten berechnet, und damit 0,1 Prozent unter dem Schlussniveau vom Vortag. An der Spitze der Kursliste rangierten Scout24, die Deutsche Börse und SAP, am Ende Siemens Energy, Infineon und BASF. "Es sieht so aus, als […] (00)
vor 11 Minuten
RZA und Ghostface Killah
(BANG) - Fans des Wu-Tang Clan haben Rückerstattungen angeboten bekommen, nachdem mehrere Mitglieder bei der als komplette Abschiedstour angekündigten Konzertreihe fehlten. Die legendäre Hip-Hop-Gruppe trat am 25. März im Brisbane Entertainment Centre auf. Allerdings nicht in vollständiger Besetzung, obwohl im Vorfeld angekündigt worden war, dass "alle […] (00)
vor 16 Stunden
Exodus zeigt im neuen Gameplay-Trailer den Shredder im Einsatz gegen die Ghosts von Khonsu
Archetype Entertainment versteht es meisterhaft, Spannung zu dosieren – immer genug zu zeigen, um die Vorfreude am Köcheln zu halten, ohne zu viel zu verraten. Der jüngste Gameplay-Trailer zu Exodus ist zwar nur 46 Sekunden lang, aber diese 46 Sekunden haben es in sich. Eine neue Waffe, ein bedrohlicher neuer Feindtyp und ein kurzer, aber wuchtiger […] (00)
vor 12 Minuten
Primetime-Check: Montag, 30. März 2026
Sat.1 wurde Letzter und lag bezeichnender Weise sogar noch hinter Kabel Eins und RTLZWEI. Zum Start in die neue Woche war es ausnahmsweise mal keine Krimi-Programmierung, die das Primetime-Ranking anführte. Denn im Ersten wurde König Fußball in Form des Männer- Länderspiels Deutschland gegen Ghana übertragen. Mitfiebern wollten ab 20.45 Uhr im Schnitt stolze 8,29 Millionen (34,8 Prozent) […] (00)
vor 1 Stunde
Deniz Undav
Stuttgart (dpa) - Nach seinem späten Glücksmoment gegen Ghana schlüpfte Deniz Undav gleich in mehrere Rollen. Der selbstbewusste Torschütze zum 2: 1 war leidenschaftlicher Anwalt für den von den eigenen Fans ausgepfiffenen Leroy Sané. Er war auch Kumpel und Pädagoge für den im Kreise der Fußball-Nationalmannschaft noch schüchternen Bayern-Teenager […] (00)
vor 5 Minuten
stock trading, investing, stock market, forex, finance, money, crypto, bitcoin, shiba
Der Ethereum-Kurs kämpft derzeit mit der Unterstützung bei $2.000, was bei Investoren die Frage aufwirft, wann der digitale Vermögenswert seinen Tiefpunkt erreichen wird. Ein Krypto-Analyst hat nun Hinweise gegeben, worauf man achten sollte, um zu bestätigen, dass Ethereum tatsächlich seinen Boden gefunden hat und wieder ansteigen könnte. […] (00)
vor 26 Minuten
Das zweite Leben der Filterkartusche
Hamburg, 31.03.2026 (PresseBox) - Die moderne Kreislaufwirtschaft markiert den notwendigen Abschied von der traditionellen Linearwirtschaft, die nach dem Prinzip "Take-Make-Waste" funktioniert. In einem geschlossenen Kreislauf werden Produkte und Materialien so konzipiert, dass sie nach Ende ihrer Nutzungsdauer nicht als Abfall enden, sondern als […] (00)
vor 1 Stunde
 
Xiaomi – Für echte Momente: Die Bildsprache des Xiaomi 17 Ultra
In einer von digitalen Filtern und künstlicher Perfektion geprägten Welt wünscht sich […] (00)
Beatbot Sora – Intelligente Poolreiniger für eine zuverlässige Pflege
Beatbot, der weltweit führende Anbieter innovativer Poolrobotik, eröffnet die […] (00)
Tefal Freezi – Einfüllen, Programm wählen, eiskalt genießen
Die Sonne scheint, die Kinder lachen unter dem Rasensprenger, Freunde trudeln zur […] (01)
Knesset in Israel
New York/Jerusalem (dpa) - Die Menschenrechtsorganisation Amnesty International […] (00)
Verständnis der Marktvolatilität Marktvolatilität ist zu einem prägenden Merkmal der […] (00)
«Sugarlove» bringt ein riskantes Beziehungsexperiment ins Erste
Der ARD-Film erzählt von einer offenen Ehe, die an ihren eigenen Regeln zu zerbrechen droht. […] (00)
Deutschland - Ghana
Stuttgart (dpa) - Zwei Spiele, zwei Siege - Julian Nagelsmann verließ das Stuttgarter […] (01)
Mel B
(BANG) - Mel B sagte Rory McPhee, dass sie nie wieder heiraten werde, und riet ihm, […] (00)
 
 
Suchbegriff