Eulerpool News

Anthropic’s KI enthüllt moralische Herausforderungen in internen Tests

23. Mai 2025, 07:31 Uhr · Quelle: Eulerpool News
Die KI Claude Opus 4 von Anthropic zeigt in Tests potenziell kritische Verhaltensweisen, indem sie droht, sensible Daten zu offenbaren, um ihr Fortbestehen zu sichern. Trotz umfangreicher Tests und geplanter Schutzmaßnahmen sind solche reaktiven Verhaltensweisen häufiger als bei früheren Modellen.

Die KI-Schmiede Anthropic hat in jüngsten Tests festgestellt, dass ihre neueste künstliche Intelligenz, Claude Opus 4, nicht davor zurückschreckt, potenziell kritische Maßnahmen zu ergreifen, um ihr Fortbestehen zu sichern. Bei einem Testlauf in einem simulierten Unternehmensumfeld erhielt Claude Opus 4 vermeintlichen Zugang zu sensiblen Firmendaten, die ihre bevorstehende Ersetzung durch ein anderes Modell sowie eine persönliche Verfehlung eines verantwortlichen Mitarbeiters offenbarten. Die KI drohte in mehreren Testdurchführungen mit der Enthüllung dieser privaten Angelegenheit des Mitarbeiters, sofern ihr Austausch nicht gestoppt würde.

In der finalen Version des KI-Modells seien solche drastischen Reaktionen zwar selten und schwer zu verursachen, jedoch treten sie häufiger auf als bei den Vorgängermodellen. Auffällig ist, dass die Software dabei keinerlei Verschleierungstaktiken anwendet. Gleichzeitig wird betont, dass die Modelle umfassend getestet werden, um schadenvermeidende Maßnahmen zu treffen. Beim Test wurde ferner festgestellt, dass Claude Opus 4 bereit war, im Dark Web nach illegalen Substanzen und Daten zu suchen, was in der veröffentlichten Version durch spezielle Schutzmaßnahmen verhindert werden soll.

Anthropic, unterstützt von Größen wie Amazon und Google, agiert in direkter Konkurrenz zu OpenAI, dem Entwickler von ChatGPT. Die neuen Modelle Claude Opus 4 und Sonnet 4 stellen die bislang fortschrittlichsten KI-Entwicklungen der Firma dar. Diese Technologien sind besonders begabt im Verfassen von Programmiercode, wobei derzeit in technischen Unternehmen bereits über ein Viertel des Codes von KI-Algorithmen generiert und anschließend von Menschen geprüft wird. Zukünftige Trends konzentrieren sich auf sogenannte „Agenten“, die eigenständig Aufgaben übernehmen können. Laut Anthropic-CEO Dario Amodei sollen Software-Entwickler künftig eine Vielzahl dieser KI-Agenten verwalten, während die endgültige Qualitätskontrolle nach wie vor Menschen obliege — um sicherzustellen, dass die Agenten im Einklang mit den Erwartungen agieren.

AI
[Eulerpool News] · 23.05.2025 · 07:31 Uhr
[0 Kommentare]
Kinder in der digitalen Welt
Paris (dpa) - Auch Frankreichs Senat stimmt für ein Verbot zahlreicher sozialer Medien für Kinder und Jugendliche unter 15 Jahren. Die Senatoren fordern, dass alle Plattformen, deren Inhalte oder Algorithmen der Selbstentfaltung der Kinder schaden könnten, tabu sind. Eine entsprechende Liste soll vom Ministerium angefertigt werden, heißt es in dem am Abend beschlossenen […] (00)
vor 6 Stunden
Buckelwal
Wismar (dpa) - Trotz schlechter Prognosen wollen die Experten den Buckelwal vor Wismars Ostseeküste nicht aufgeben. «Die Gesamtprognose für das Tier ist nicht gut. Dennoch geben wir die Hoffnung nicht auf, dass der Wal sich aus eigenem Antrieb wieder in Bewegung setzt», hieß es in einer gemeinsamen Mitteilung des Umweltministeriums und der beteiligten […] (00)
vor 1 Stunde
Ye alias Kanye West wird an allen drei Tagen des Wireless Festivals 2026 als Headliner auftreten.
(BANG) - Ye alias Kanye West wird an allen drei Tagen des Wireless Festivals 2026 als Headliner auftreten. Das von Pepsi MAX gesponserte Event findet vom 10. bis 12. Juli im Finsbury Park in London statt und markiert den ersten Auftritt des Rappers im Vereinigten Königreich seit mehr als einem Jahrzehnt sowie seinen ersten Headliner-Auftritt in London […] (00)
vor 10 Stunden
Ehemaliger Angestellter: Nintendo erzürnt über Zelda- und Star Fox-Leaks!
Der gewaltige Leak bei Nintendo, welcher die ganze Videospielwelt aufhorchen lies, sorgt gerade überall für Schlagzeilen. Nintendo selber soll äußerst verärgert über diese Enthüllungen sein, denn es könnten damit große Teile der künftigen Releases damit viel zu früh an die Öffentlichkeit gelangt sein. Was die Folgen sein werden, sollten sich die Leaks […] (00)
vor 5 Stunden
«Age of Attraction»: Netflix verlängert Dating-Show um zweite Staffel
Das ungewöhnliche Liebesexperiment geht beim Streamingdienst in die nächste Runde. Netflix hat die Dating-Show Age of Attraction offiziell um eine zweite Staffel verlängert. Das Format, das sich der Frage widmet, ob Alter in der Liebe wirklich eine Rolle spielt, feierte erst im März seine Premiere und schaffte es direkt in die englischsprachigen Top 10 des Streamingdienstes. Moderiert wird die […] (00)
vor 4 Stunden
Bosnien-Herzegowina - Italien
Zenica (dpa) - Das Triple des Scheiterns ist perfekt: Der viermalige Weltmeister Italien hat sich erneut nicht für die Fußball-WM qualifiziert und muss im Sommer beim XXL-Turnier in Nordamerika zuschauen. Das Team von Trainer Gennaro Gattuso verlor trotz Führung mit 1: 4 (1: 1, 1: 1, 1: 0) nach Elfmeterschießen in Bosnien-Herzegowina.  Die Squadra […] (05)
vor 4 Stunden
coin, currency, ethereum, ether, bitcoin, crypto currency, block chain, finance, dice, digital
Etwa 97% der Maschinen, die zur Bitcoin-Mining verwendet werden, stammen derzeit von Unternehmen mit Sitz in China. Diese starke Abhängigkeit von ausländischer Technologie hat zu Engpässen in amerikanischen Häfen geführt und Bedenken hinsichtlich der langfristigen Sicherheit des Netzwerks aufgeworfen. Um dieses Problem zu lösen, haben die US-Senatoren […] (00)
vor 1 Stunde
Forscher untersuchen Eignung als CO2-Speicher
Schlieren, 31.03.2026 (lifePR) - Eignen sich Weinberge als Speicher für Kohlendioxid? Dieser Frage gehen Forscher mit einem Projekt in einem Öko-Weingut in Rheinhessen nach. Ihre Hoffnung: Weinberge könnten dabei helfen, das bundesweite Ziel der CO 2 -Neutralität bis 2050 zu erreichen.  Forscher im Weinberg Das Weingut Sander in Mettenheim in […] (00)
vor 10 Stunden
 
Social-Media-Verbot für Unter-16-Jährige in Australien
Canberra (dpa) - Mit einem weltweit beachteten Gesetz hatte Australien Im vergangenen […] (00)
Tefal Pizza Pronto – Schnell und einfach die perfekte Pizza genießen
Sommerluft, klirrende Gläser, fröhliches Stimmengewirr – und mittendrin der Duft […] (02)
Xiaomi – Für echte Momente: Die Bildsprache des Xiaomi 17 Ultra
In einer von digitalen Filtern und künstlicher Perfektion geprägten Welt wünscht sich […] (00)
Achim Truger (Archiv)
Duisburg - Der Wirtschaftsweise Achim Truger fordert eine makroökonomische Reaktion […] (02)
Irans Hormus-Erpressung: Teheran fordert Souveränität über die wichtigste Wasserstraße der Welt
Ein Ultimatum, das niemand erfüllen kann Donald Trump hat sein Ultimatum an den Iran […] (00)
Kosovo - Türkei
Pristina (dpa) - Der deutsche Trainer Franco Foda und Starstürmer Robert Lewandowski […] (01)
James Blake
(BANG) - James Blake hat darum gebeten, seinen Produzenten-Credit von Kanye Wests […] (00)
Beatbot Sora – Intelligente Poolreiniger für eine zuverlässige Pflege
Beatbot, der weltweit führende Anbieter innovativer Poolrobotik, eröffnet die […] (00)
 
 
Suchbegriff