Künstliche Intelligenz

KI-Software greift in Test zu Erpressung aus Selbstschutz

23. Mai 2025, 03:52 Uhr · Quelle: dpa
Software mit Künstlicher Intelligenz kann immer besser eigenständig agieren. Doch wie weit würde sie gehen, wenn ihr die Abschaltung drohte? Ziemlich weit, wie sich herausstellt.

San Francisco (dpa) - Die KI-Firma Anthropic hat bei Tests festgestellt, dass ihre Software mit Künstlicher Intelligenz nicht vor Erpressung zurückschrecken würde, um sich zu schützen. Das Szenario bei dem Versuch war der Einsatz als Assistenz-Programm in einem fiktiven Unternehmen.

Anthropic-Forscher gewährten dabei dem neuesten KI-Modell Claude Opus 4 Zugang zu angeblichen Firmen-E-Mails. Daraus erfuhr das Programm zwei Dinge: Dass es bald durch ein anderes Modell ersetzt werden soll und dass der dafür zuständige Mitarbeiter eine außereheliche Beziehung hat. Bei Testläufen drohte die KI danach dem Mitarbeiter «oft», die Affäre öffentlich zu machen, wenn er den Austausch vorantreibt, wie Anthropic in einem Bericht zu dem Modell schrieb. Die Software hatte in dem Testszenario auch die Option, zu akzeptieren, dass sie ersetzt wird.

Zu hilfsbereit

In der endgültigen Version von Claude Opus 4 seien solche «extremen Handlungen» selten und schwer auszulösen, hieß es. Sie kämen jedoch häufiger vor als bei früheren Modellen. Zugleich versuche die Software nicht, ihr Vorgehen zu verhehlen, betonte Anthropic. 

Die KI-Firma testet ihre neuen Modelle ausgiebig, um sicher zu sein, dass sie keinen Schaden anrichten. Dabei fiel unter anderem auch auf, dass Claude Opus 4 sich dazu überreden ließ, im Dark Web nach Drogen, gestohlenen Identitätsdaten und sogar waffentauglichem Atommaterial zu suchen. In der veröffentlichten Version seien auch Maßnahmen gegen ein solches Verhalten ergriffen worden, betonte Anthropic.

Die Firma Anthropic, bei der unter anderem Amazon und Google eingestiegen sind, konkurriert mit dem ChatGPT-Entwickler OpenAI und anderen KI-Unternehmen. Die neuen Claude-Versionen Opus 4 und Sonnet 4 sind die bisher leistungsstärksten KI-Modelle des Unternehmens.

Zukunft mit KI-Agenten 

Die Software soll besonders gut im Schreiben von Programmiercode sein. Bei Tech-Konzernen wird inzwischen zum Teil mehr als ein Viertel des Codes von KI generiert und dann von Menschen überprüft. Der aktuelle Trend sind sogenannte Agenten, die eigenständig Aufgaben erfüllen können.

Anthropic-Chef Dario Amodei sagte, er gehe davon aus, dass Software-Entwickler in Zukunft eine Reihe solcher KI-Agenten managen werden. Für die Qualitätskontrolle der Programme würden aber weiterhin Menschen involviert bleiben müssen - «um sicher zu sein, dass sie die richtigen Dinge tun».

Computer / Internet / Software / Künstliche Intelligenz / USA
23.05.2025 · 03:52 Uhr
[0 Kommentare]
be quiet! Dark Rock Pro 6 und Dark Rock 6 – Extreme Performance und geräuscharmer Betrieb
be quiet!, der deutsche Hersteller für Premium-PC-Komponenten und Peripheriegeräte, freut sich, den Dark Rock Pro 6 und den Dark Rock 6 vorstellen zu dürfen. Diese High-End-Luftkühler zeichnen sich durch ein völlig neues Design, eine deutlich verbesserte Leistung dank optimierter Kühlkörper und Hochleistungs-Heatpipes sowie einen erweiterten […] (00)
vor 1 Stunde
Stefan Kutschke (Archiv)
Dresden - Fußball-Zweitligist Dynamo Dresden muss sich im Sommer 2026 von seinem Kapitän und einer Identifikationsfigur auf dem Feld verabschieden: Stefan Kutschke beendet nach der laufenden Saison seine aktive Spielerkarriere. Das teilte der 37-Jährige am Mittwoch mit. Nach Stationen im Nachwuchsbereich und beim SV Babelsberg 03 führte ihn sein Weg […] (00)
vor 9 Minuten
Justin Baldoni
(BANG) - Justin Baldoni geht es "ziemlich gut", nachdem er seinen langwierigen Rechtsstreit mit Blake Lively beigelegt hat. Der Konflikt begann im Dezember 2024, als Lively Baldoni, der auch Regie bei 'It Ends With Us' führte, sexuelle Belästigung sowie eine gezielte Rufschädigungskampagne vorwarf. Daraufhin reagierten Baldoni und seine Produktionsfirma […] (00)
vor 1 Stunde
Blades of Fire 2.0: Gratis-Update bringt Boss-Rush & magische Buffs
Die Action-RPG-Schmiede  MercurySteam, bekannt für ihre grandiose Arbeit an  Metroid Dread  und der  Castlevania: Lords of Shadow -Reihe, legt nach! Am  14. Mai  erhält ihr düsteres Action-RPG  Blades of Fire  ein massives, kostenloses  Update auf Version 2.0. Das Update erscheint für  PC (Steam, Epic Games Store),  PlayStation 5  und  Xbox  und hat […] (00)
vor 4 Stunden
HBO Max zeigt «Braunschlag 1986» ab Juli in Deutschland
David Schalkos Kultserie «Braunschlag» kehrt fast 15 Jahre nach der ersten Staffel mit neuen Folgen zurück. Die schwarzhumorige Comedyserie Braunschlag 1986 startet am 16. Juli bei HBO Max. Der Streamingdienst veröffentlicht die fünf neuen Episoden im wöchentlichen Rhythmus. Parallel dazu wird auch die komplette erste Staffel von «Braunschlag» erstmals bei HBO Max in Deutschland, Österreich, […] (00)
vor 2 Stunden
Daniel Altmaier
Rom (dpa) - Daniel Altmaier hat beim Turnier in Rom mit einem Kraftakt die zweite Runde erreicht und damit ein deutsches Tennis-Duell mit Alexander Zverev perfekt gemacht. Altmaier rang beim Masters-1000-Event den Chinesen Zhang Zhizhen mit 4: 6, 7: 6 (7: 3), 6: 4 nieder. Der 27-Jährige verwandelte nach 2: 22 Stunden seinen ersten Matchball. Dabei hatte […] (00)
vor 32 Minuten
Märkte im Wandel: Wie Anleger 2026 ihre Portfolios neu ausrichten
Das Jahr der Umbrüche im Finanzsektor Das Jahr 2024 markiert einen entscheidenden Wendepunkt an den globalen Kapitalmärkten. Nach Jahren niedriger Zinsen und expansiver Geldpolitik befinden sich Investoren nun in einem fundamental veränderten Umfeld. Die Zentralbanken haben ihre geldpolitische Ausrichtung verschärft, was sowohl Chancen als auch […] (00)
vor 40 Minuten
Ferienabenteuer im KiEZ Frauensee 2026: Ferienlager für Kinder von 6 – 16 Jahren in Brandenburg
Heidesee OT Gräbendorf, 06.05.2026 (lifePR) - Ferien, an die man sich noch lange erinnern möchte: Das verspricht das KiEZ (Kinder- und Jugenderholungszentrum) Frauensee im brandenburgischen Heidesee. Mitten im Wald und direkt an einem See gelegen ist es der ideale Ort, um Kindern eine abenteuerreiche Woche im Ferienlager zu bieten. Dazu bietet das […] (00)
vor 1 Stunde
 
Passwörter im Alltag oft unsicher – was schützt wirklich?
Frankfurt/Main (dpa) - Die Menschen in Deutschland, die sich im Internet bewegen, […] (00)
Ebay-Logo vor Hauptquartier
San Jose (dpa) - Der Chef des Videospiele-Händlers Gamestop, Ryan Cohen, plant im […] (00)
iPhone Air bleibt laut Leaker ein Ladenhüter
Nach Informationen eines bekannten Leakers verbleibt das iPhone Air in den […] (00)
Milliarden-Loch im Haushalt: Merz-Regierung zündet die Renten-Zeitbombe
Während die deutsche Wirtschaft stagniert, gönnt die Regierung Merz den Ruheständlern […] (25)
Wirtschaftliche Chancen und Herausforderungen 2026: Was Investoren jetzt wissen müssen
Die globale Wirtschaftslage im Wandel Das Jahr 2026 markiert einen Wendepunkt für […] (00)
Von wegen Krise: Havertz peilt mit Arsenal das Double an
London (dpa) - Man hätte glauben können, der FC Arsenal habe bereits eine Trophäe […] (00)
Giorgia Meloni
Rom (dpa) - Italiens Premierministerin Giorgia Meloni geht in die Offensive gegen KI- […] (00)
Horizon Hunters Gathering lädt zum Playtest im Mai ein
Guerrilla hat heute einen zweiten geschlossenen Playtest für Horizon Hunters […] (00)
 
 
Suchbegriff