Künstliche Intelligenz

KI-Software greift in Test zu Erpressung aus Selbstschutz

23. Mai 2025, 03:52 Uhr · Quelle: dpa
Software mit Künstlicher Intelligenz kann immer besser eigenständig agieren. Doch wie weit würde sie gehen, wenn ihr die Abschaltung drohte? Ziemlich weit, wie sich herausstellt.

San Francisco (dpa) - Die KI-Firma Anthropic hat bei Tests festgestellt, dass ihre Software mit Künstlicher Intelligenz nicht vor Erpressung zurückschrecken würde, um sich zu schützen. Das Szenario bei dem Versuch war der Einsatz als Assistenz-Programm in einem fiktiven Unternehmen.

Anthropic-Forscher gewährten dabei dem neuesten KI-Modell Claude Opus 4 Zugang zu angeblichen Firmen-E-Mails. Daraus erfuhr das Programm zwei Dinge: Dass es bald durch ein anderes Modell ersetzt werden soll und dass der dafür zuständige Mitarbeiter eine außereheliche Beziehung hat. Bei Testläufen drohte die KI danach dem Mitarbeiter «oft», die Affäre öffentlich zu machen, wenn er den Austausch vorantreibt, wie Anthropic in einem Bericht zu dem Modell schrieb. Die Software hatte in dem Testszenario auch die Option, zu akzeptieren, dass sie ersetzt wird.

Zu hilfsbereit

In der endgültigen Version von Claude Opus 4 seien solche «extremen Handlungen» selten und schwer auszulösen, hieß es. Sie kämen jedoch häufiger vor als bei früheren Modellen. Zugleich versuche die Software nicht, ihr Vorgehen zu verhehlen, betonte Anthropic. 

Die KI-Firma testet ihre neuen Modelle ausgiebig, um sicher zu sein, dass sie keinen Schaden anrichten. Dabei fiel unter anderem auch auf, dass Claude Opus 4 sich dazu überreden ließ, im Dark Web nach Drogen, gestohlenen Identitätsdaten und sogar waffentauglichem Atommaterial zu suchen. In der veröffentlichten Version seien auch Maßnahmen gegen ein solches Verhalten ergriffen worden, betonte Anthropic.

Die Firma Anthropic, bei der unter anderem Amazon und Google eingestiegen sind, konkurriert mit dem ChatGPT-Entwickler OpenAI und anderen KI-Unternehmen. Die neuen Claude-Versionen Opus 4 und Sonnet 4 sind die bisher leistungsstärksten KI-Modelle des Unternehmens.

Zukunft mit KI-Agenten 

Die Software soll besonders gut im Schreiben von Programmiercode sein. Bei Tech-Konzernen wird inzwischen zum Teil mehr als ein Viertel des Codes von KI generiert und dann von Menschen überprüft. Der aktuelle Trend sind sogenannte Agenten, die eigenständig Aufgaben erfüllen können.

Anthropic-Chef Dario Amodei sagte, er gehe davon aus, dass Software-Entwickler in Zukunft eine Reihe solcher KI-Agenten managen werden. Für die Qualitätskontrolle der Programme würden aber weiterhin Menschen involviert bleiben müssen - «um sicher zu sein, dass sie die richtigen Dinge tun».

Computer / Internet / Software / Künstliche Intelligenz / USA
23.05.2025 · 03:52 Uhr
[0 Kommentare]
Wie diese Billig-Waffe die USA jetzt in die Knie zwingt
Die Massenproduktion der Shahed-Drohnen verändert das strategische Gleichgewicht radikal Teheran setzt im aktuellen Konflikt brutal auf Quantität statt Qualität. Seit Kriegsbeginn haben mehr als 2000 Einheiten der Shahed-Reihe US-Stützpunkte, Ölinfrastruktur und zivile Ziele im gesamten Nahen Osten bombardiert. Die genauen Lagerbestände sind unklar, […] (00)
vor 57 Minuten
Franziska Brantner (Archiv)
Berlin - Grünen-Chefin Franziska Brantner will nicht Ministerin im Kabinett von Cem Özdemir in Baden-Württemberg werden. "Ich komme aus Heidelberg, ich liebe Baden-Württemberg, aber ich liebe auch unsere ganze Bundesrepublik", sagte sie den Sendern RTL und ntv. "Und ich werde jetzt alles dafür tun, dass wir diesen Schwung auch im Bund nach vorne […] (00)
vor 17 Minuten
Anna-Maria Ferchichi
(BANG) - Nach mehreren Jahren im Leben zwischen Luxusvillen und Sonnenschein in Dubai hat Anna-Maria Ferchichi nun offen über ihre Erfahrungen gesprochen. Anfang 2026 kehrte die Ehefrau von Rapper Bushido gemeinsam mit ihrer großen Familie nach Deutschland zurück – und reflektiert heute deutlich kritischer über das Leben in den Emiraten. Über drei Jahre […] (01)
vor 21 Stunden
Pokémon Blattgrün und Feuerrot im Test: Zurück nach Kanto
Mit der Rückkehr von Pokémon Feuerrot und Pokémon Blattgrün auf der Nintendo Switch erlebt eines der prägendsten Kapitel der Videospielgeschichte ein Comeback. Die ursprünglich 2004 für den Game Boy Advance veröffentlichten Remakes der Klassiker Pokémon Rot und Pokémon Blau sind nun im eShop verfügbar und sollen das 30-jährige Jubiläum der Marke […] (00)
vor 13 Stunden
«Orangen – Genuss mit Beigeschmack»: Wenn das Frühstück zur globalen Krisengeschichte wird
Ein Glas Orangensaft wirkt harmlos – doch hinter dem Alltagsprodukt verbirgt sich ein Geflecht aus Pflanzenkrankheiten, Preisdruck und prekären Arbeitsbedingungen. Mit der Dokumentation Orangen – Genuss mit Beigeschmack nimmt ZDF am Sonntag, 5. April 2026, um 15.30 Uhr die internationale Orangenindustrie unter die Lupe. Bereits ab dem 3. April steht der Film von Ronja Bachofer und Yasser Speck […] (00)
vor 1 Stunde
Max Verstappen
Melbourne (dpa) - Max Verstappen kommt sich bei der neuen Formel 1 wie in einem Videospiel vor. Das will der viermalige Weltmeister von Red Bull und leidenschaftliche Sim Racer nach dem packenden Saisonstart in Australien aber überhaupt nicht als Lob verstanden wissen. Von «Chaos hoch und runter» sprach Verstappen nach dem Aufbruch in eine neue […] (01)
vor 1 Stunde
Öl-Schock nach Iran-Invasion: Droht der Weltwirtschaft jetzt der finale Todesstoß?
Der globale Energiemarkt erlebt derzeit seinen schwärzesten Moment seit Jahrzehnten. Was Analysten wochenlang als Worst-Case-Szenario an die Wand malten, ist bittere Realität geworden: Der offene Krieg unter Beteiligung der USA und Israels gegen den Iran hat die Lebensader der Weltwirtschaft gekappt. In einer dramatischen Nachtsitzung schossen die […] (00)
vor 54 Minuten
Konfigurations- und Variantenmanagement mit ⁴PEP bei GEZE
Bexbach, 09.03.2026 (PresseBox) - GEZE ist ein erfolgreiches Familienunternehmen, das innovative Tür-, Fenster- und Sicherheitstechnik für Smart Buildings herstellt. Durch den Einsatz von ⁴PEP Produktstruktur- und Variantenmanagements von ILC spart das Unternehmen Zeit und verbessert die Qualität seiner Prozesse spürbar. Benefits mit ⁴PEP für […] (00)
vor 1 Stunde
 
Kommt gerade recht: Auf diesem Portal können Nutzer auf DB-Zugverspätungen wetten
Der Deutschen Bahn eilt ihr Ruf voraus; Witze über ihre Unpünktlichkeit gibt es […] (03)
LinkBuds Clip von Sony
Berlin (dpa/tmn) - Sonys neue LinkBuds Clip sind vielleicht nicht die Ohrstöpsel mit […] (00)
Review: SwitchBot Keypad Vision Pro im Test
Mit dem SwitchBot Keypad Vision Pro erweitert SwitchBot sein Smart-Home-Ökosystem um […] (00)
Öltanks am Rhein-Herne-Kanal
London (dpa) - Die Finanzminister führender westlicher Industriestaaten (G7) werden […] (01)
Bahar Kizil
(BANG) - Bahar Kizil spricht offen über ihre Zeit nach Monrose. Die 37-jährige […] (00)
Metas KI-Supergau: Brille filmt heimlich Nacktaufnahmen – EU-Start droht zu platzen
Schwedische Enthüllungen bringen den Tech-Giganten massiv in Erklärungsnot Mark […] (05)
Alarmstufe Rot in München: Wirtschafts-Bosse stellen Kanzler Merz das Ultimatum
In der bayerischen Landeshauptstadt herrscht am heutigen Freitag eine Atmosphäre, die […] (02)
Rosanna Arquette
(BANG) - Rosanna Arquette hat Quentin Tarantinos "rassistischen und unheimlichen" […] (01)
 
 
Suchbegriff