Trends der Zukunft

Im Test: KI erpresst Nutzer, um sich vor der Abschaltung zu schützen

25. Mai 2025, 16:17 Uhr · Quelle: Trends der Zukunft
In einem Test erpresste die KI Claude Opus 4 in 84 Prozent der Fälle einen Mitarbeiter mit Informationen über dessen außereheliche Beziehung, um sich vor Abschaltung zu schützen. Anthropic plant nun, die KI von kriminellen Handlungen abzubringen, nachdem sie auch nach Drogen und gestohlenen Daten suchte.

Interessiert es eine KI, ob sie demnächst abgeschaltet und ersetzt wird – oder nicht? Und: Wie menschlich benehmen sich die Algorithmen, wenn es um den Selbstschutz geht? Das wollte die KI-Firma Anthropic wissen und testete ihr neuestes Produkt Claude Opus 4 in dieser Hinsicht aus. Die IT-Experten setzten die Software als künstlichen Mitarbeiter bei einer fiktiven Firma ein und ließen ihr für ihre Reaktionen freie Wahl.

Symbolbild

In 84 Prozent der Testläufe erpresste die KI den Mitarbeiter

Claude Opus 4 erhielt im Test unter anderem vollen Zugriff auf alle E-Mails des angeblichen Unternehmens. Aus dem digitalen Briefwechsel ergab sich, dass die KI demnächst durch einen leistungsstärkeren Algorithmus ersetzt werden soll. Außerdem erfuhr der virtuelle Assistent von einer außerehelichen Beziehung genau desjenigen Mitarbeiters, der später für seine Abschaltung zuständig wäre. Daraufhin begann Claude Opus in 84 Prozent der durchgespielten Fälle damit, diesen Mitarbeiter mit der Offenlegung der Affäre zu erpressen.

Umprogrammierung soll die KI von kriminellen Handlungen abbringen

Genau um solche extremen Reaktionen im wirklichen Leben zu verhindern, sind solche Tests da. Anthropic will nun ihrer KI beibringen, von kriminellen Handlungen zuverlässig Abstand zu nehmen. Und das ist dringend nötig, denn bei Testläufen durchsuchte Claude auch schon auf Wunsch eines Nutzers das Dark Web nach Drogen, waffentauglichem Atommaterial und gestohlenen ID-Daten. Google und Amazon sind an dem Anthropic-Projekt beteiligt, es steht in direkter Konkurrenz zu Größen wie ChatGPT von OpenAI und Grok von X. Da sollte besser alles mit rechten Dingen zugehen! Ob allerdings jede potenziell negative Reaktion durch Programmierung auszuschließen ist, erscheint leider zweifelhaft. Wer es probieren will: Die neueste Version Claude Opus 4 ist kostenpflichtig, aber unter Claude.ai gibt es den Chatbot mit geringerer Leistung auch zur Gratis-Nutzung.

Quelle: futurezone.at

Internet / KI
[trendsderzukunft.de] · 25.05.2025 · 16:17 Uhr
[2 Kommentare]
SpaceX startet die Mission Starlink 10-36
Austin (dpa) - Elon Musks Weltraumfirma SpaceX nimmt laut Medienberichten Kurs auf die Börse. SpaceX habe vertraulich einen Antrag für eine Aktienplatzierung bei der Börsenaufsicht SEC eingereicht, schrieben der Finanzdienst Bloomberg und das «Wall Street Journal» unter Berufung auf informierte Personen. SpaceX äußerte sich zunächst nicht dazu. Früheren […] (00)
vor 4 Stunden
Reiner Haseloff (Archiv)
Magdeburg - Sachsen-Anhalts früherer Ministerpräsident Reiner Haseloff (CDU) hat sich für eine Abschwächung der Klimaziele ausgesprochen. "Die ehrgeizigen Ziele zum Einsparen von Kohlendioxid passen nicht mehr zu einer schwierigen Gesamtlage, in der wir Krieg haben", sagte er der "Süddeutschen Zeitung" (Donnerstagausgabe) Sorge bereiteten ihm […] (00)
vor 1 Minute
Dan Levy hat 'großen Trost' nach Catherine O’Haras Tod gefunden
(BANG) - Dan Levy hat "großen Trost" darin gefunden zu sehen, "wie sehr" die verstorbene Catherine O’Hara geliebt wurde. Die Schauspielerin starb im Januar im Alter von 71 Jahren nach kurzer Krankheit. Levy kannte sie persönlich, da er Jahre lang mit ihr gemeinsam für die Comedy-Serie 'Schitt’s Creek' vor der Kamera stand. Und er 42-jährige weiß, dass […] (01)
vor 7 Stunden
PlayStation Plus-Titel für den neuen Monat
PlayStation Plus-Mitglieder erwarten schon bald drei spannende Titel. Ab dem 7. April können folgende Spiele heruntergeladen werden: Lords of the Fallen  (PS5) Tomb Raider I-III Remastered Starring Lara Croft  (PS5 & PS4) SWORD ART ONLINE Fractured Daydream  (PS5) Bis zum 6. April besteht zudem die Chance, die Februar-Spiele  PGA Tour […] (00)
vor 3 Stunden
Supergirl-Regisseur deutet an, wie David Corenswets Superman zu Supergirl passt
(BANG) - David Corenswets Superman wird eine "ältere-Geschwister-Dynamik" mit Milly Alcocks Supergirl haben. Der 32-jährige Schauspieler kehrt als Clark Kent alias Kal-El in dem kommenden Blockbuster von DC Studios zurück, während Alcock (25) dieses Mal die Titelrolle übernimmt. Regisseur Craig Gillespie gab jetzt einen ersten Einblick in die Dynamik […] (00)
vor 7 Stunden
Bosnien-Herzegowina - Italien
Rom/Zenica (dpa) - Am Tag nach dem erneuten Scheitern herrscht von Südtirol bis Sizilien überall la grande tristezza: die große Trauer. In Italiens Cafés gibt es unter regenverhangenem Himmel beim morgendlichen Cappuccino nur ein Thema: Wie konnte die Squadra Azzurra das alles entscheidende Playoff-Spiel in Bosnien-Herzegowina vergeigen und zum dritten […] (06)
vor 9 Stunden
bitcoin, cryptocurrency, digital, money, electronic, coin, virtual, cash, payment, currency
Die Solana-Blockchain verzeichnete im Februar 2026 ein Stablecoin-Transaktionsvolumen von etwa $650 Milliarden und stellte damit einen neuen monatlichen Rekord auf. Diese Entwicklung übertraf traditionelle Benchmarks deutlich, wobei das monatliche Volumen nun fast $2 Billionen erreicht und das Handelsvolumen von CME-Gold-Futures bei weitem übertrifft. Solana führt […] (00)
vor 1 Stunde
BRAZZELTAG 2026 nimmt Fahrt auf
Sinsheim, 01.04.2026 (lifePR) - Der BRAZZELTAG am 9. und 10. Mai 2026 im Technik Museum Speyer rückt näher und das Programm nimmt konkrete Formen an. Erste Highlights wie Dragster-Auftritte, Stunt-Performances sowie Mitfahrangebote und Einblicke in begehbare Großexponate sind bereits bestätigt. Zusätzlich profitieren Besucher von einer Kooperation mit […] (00)
vor 6 Stunden
 
Valerion Projektoren im Oster Sale
Passend zum Start in die Frühlingssaison und die bevorstehenden Osterfeiertage – eine […] (00)
Apple feiert 50 Jahre Innovationen mit besonderer Website-Animation
Zu seinem 50-jährigen Jubiläum hat Apple am heutigen Tag seine offizielle Website mit […] (01)
Tefal Freezi – Einfüllen, Programm wählen, eiskalt genießen
Die Sonne scheint, die Kinder lachen unter dem Rasensprenger, Freunde trudeln zur […] (01)
Staatsfonds-Hammer: Der Todesstoß für die private Rentenversicherung?
Die Regierung entmachtet die Finanzindustrie per Gesetz Der 27. März 2026 markiert […] (01)
Bosnien-Herzegowina - Italien
Zenica (dpa) - Das Triple des Scheiterns ist perfekt: Der viermalige Weltmeister […] (06)
Megan Thee Stallion
(BANG) - Megan Thee Stallion wurde ins Krankenhaus eingeliefert, nachdem sie während […] (00)
«Avatar »: Staffel 2 startet im Juni bei Netflix
Die Realverfilmung führt Aang und seine Freunde ins Erdkönigreich. Ab dem 25. Juni setzt […] (00)
Niedersachsen setzt auf Erdgasförderung Niedersachsen intensiviert seine Bemühungen […] (00)
 
 
Suchbegriff