Eulerpool News

Anthropic verstärkt Schutzmechanismen gegen missbräuchliche KI-Nutzung

05. Februar 2025, 04:37 Uhr · Quelle: Eulerpool News
Anthropic entwickelt neue Schutzmechanismen gegen missbräuchliche KI-Nutzung – Konkurrenz unter Druck, Betriebskosten steigen erheblich.

Anthropic hat eine neue Sicherheitsmaßnahme vorgestellt, die verhindern soll, dass Nutzer seine KI-Modelle für illegale oder gefährliche Zwecke missbrauchen. Der sogenannte „Constitutional Classifier“ soll als Schutzschicht über großen Sprachmodellen wie dem Claude-Chatbot liegen und sowohl Eingaben als auch Ausgaben auf problematische Inhalte überwachen.

Die Entwicklung kommt zu einem Zeitpunkt, an dem Technologieunternehmen wie Microsoft und Meta zunehmend unter Druck stehen, ihre KI-Modelle gegen „Jailbreaking“ abzusichern – Methoden, mit denen Nutzer Sicherheitsmaßnahmen umgehen, um an verbotene Informationen zu gelangen. Dazu gehören Anleitungen zur Herstellung chemischer Waffen oder anderer gefährlicher Inhalte.

Microsoft führte bereits im März 2024 einen „Prompt Shield“ ein, während Meta im Juli ein Schutzsystem präsentierte, das später nach Schwachstellenkorrekturen verbessert wurde.

Laut Anthropic-Mitarbeiter Mrinank Sharma wurde das neue System vor allem als Reaktion auf sicherheitskritische Bedrohungen im chemischen Bereich entwickelt. Der Vorteil liege darin, dass sich die Schutzmechanismen flexibel an neue Bedrohungen anpassen ließen. „Das Wichtigste an unserer Arbeit ist, dass wir glauben, dieses Problem sei lösbar“, so Sharma.

Die „Constitutional Classifier“ basieren auf einem festgelegten Regelwerk, das genau definiert, welche Inhalte erlaubt und welche verboten sind. Dadurch lassen sich gezielt bestimmte Risiken adressieren.

Um die Effektivität des Systems zu testen, bot Anthropic Prämien von bis zu 15.000 US-Dollar für Sicherheitsforscher an, die versuchten, die Schutzmaßnahmen zu umgehen. Diese „Red Teamer“ verbrachten mehr als 3.000 Stunden damit, das System anzugreifen. Das Ergebnis: Der Claude 3.5 Sonnet-Algorithmus blockierte mit aktivierten Schutzmechanismen über 95 Prozent der Angriffe – ohne Schutzmaßnahmen lag die Erfolgsquote bei nur 14 Prozent.

Ein häufiges Problem von KI-Sicherheitssystemen ist die Balance zwischen Schutz und Nutzerfreundlichkeit. Zu strenge Filter können dazu führen, dass auch harmlose Anfragen fälschlicherweise abgelehnt werden. Anthropic gibt an, dass die neuen Maßnahmen die Ablehnungsrate nur um 0,38 Prozentpunkte erhöhten.

Allerdings steigen durch solche Schutzmechanismen auch die Betriebskosten. Der zusätzliche Rechenaufwand zur Implementierung der Classifier würde die sogenannten „Inference Overhead“-Kosten um rund 24 Prozent erhöhen, so Anthropic.

Sicherheitsexperten warnen, dass generative KI-Modelle immer mehr Menschen Zugang zu gefährlichen Informationen ermöglichen könnten – ohne dass diese über spezielle Vorkenntnisse verfügen. „Früher musste man sich Sorgen über hochentwickelte Bedrohungen durch Staaten machen“, sagte Ram Shankar Siva Kumar, Leiter des AI-Red-Teams bei Microsoft. „Heute ist einer meiner potenziellen Angreifer ein Teenager mit schlechter Ausdrucksweise.“

Finanzen / KI
[Eulerpool News] · 05.02.2025 · 04:37 Uhr
[0 Kommentare]
btc, bitcoin, cryptocurrency, currency, crypto, gold, digital, blockchain, cryptography, 3d, coin, payment, virtual, btc, btc, btc, bitcoin, bitcoin, cryptocurrency, cryptocurrency, crypto, crypto, crypto, crypto, crypto
Solana (SOL) handelt in der Nähe einer wichtigen monatlichen Unterstützungszone, mit einem Preis von etwa $132. In der vergangenen Woche ist er um 3% gefallen, während die täglichen Verluste bei 1% liegen. Händler beobachten diesen Bereich aufmerksam, da er mit einem langfristigen aufsteigenden Kanal-Unterstützungsniveau übereinstimmt. Test der langfristigen Unterstützung […] (00)
vor 1 Stunde
Pommes mit Majo (Archiv)
Dresden - Der Dresdner Lebensmittelchemiker Thomas Henle wirbt für mehr Gelassenheit im Umgang mit hochverarbeiteten Lebensmitteln. Derzeit sehe er keinen wissenschaftlichen Beleg dafür, dass diese generell ungesund seien, sagte Henle dem "Spiegel". Das Problem vieler Studien zu dem Thema sei, "dass sie keine Belege liefern, sondern lediglich auf Beobachtungen beruhen". Der Forscher der TU Dresden […] (01)
vor 43 Minuten
Finnische Autofokus-Brille in letzter Entwicklungsphase – bald wieder Sehen ohne Grenzen?
So ziemlich jeder wird mit steigenden Alter weitsichtig. Und weil ein bedeutender Anteil der Bevölkerung dazu auch noch kurzsichtig ist, hilft die »normale« Brille dann nicht mehr weiter. Eine teure (und für viele Leute auch nervige) Gleitsichtbrille muss her – oder man endet in einem ständigen Brillenwechsel zwischen Lese- und Fernsicht. Wie schön wäre eine Brille, die sich selbst fokussiert! […] (01)
vor 6 Stunden
Review: Turtle Beach Vulcan II TKL Pro – Ein Stern unter den TKL Tastaturen
Die Turtle Beach Vulcan II TKL ist eine Tastatur, die sich nicht nur durch ihr kompaktes Tenkeyless-Design auszeichnet, sondern auch durch eine Vielzahl an Features, die sie von der Konkurrenz abheben. In diesem erweiterten Review gehe ich noch detaillierter auf die Stärken ein, stelle die wichtigsten Mitbewerber im direkten Vergleich vor und beleuchte die Möglichkeiten der Swarm II Software […] (00)
vor 5 Stunden
Review: Turtle Beach Burst II Pro – Gaming Maus oder graues Mäuschen
Die Turtle Beach Burst II Pro will nicht „nur“ schnell sein, sondern konsistent schneller und präziser als das, was du gewohnt bist. Das merkt man schon an der Architektur: echte 8K‑Wireless‑Polling‑Rate, ein Sensor, der nach oben wie nach unten ungewöhnlich fein skaliert, sowie ein konsequent leichtes, symmetrisches Gehäuse ohne Hohlraum-Skelet-Design. Dazu kommt eine Software, die nicht bloß […] (00)
vor 4 Stunden
Neuer Einsatz für Frank Koops: «Harter Brocken» am 25. Dezember
Der Weihnachtskrimi mit Aljoscha Stadelmann und Anna Fischer soll an den Festtagen gute Quoten holen. Am 25. Dezember um 20: 15 Uhr feiert der neue Film der beliebten Reihe Harter Brocken Premiere. In „Die Erpressung“ muss Dorfpolizist Frank Koops (Aljoscha Stadelmann) diesmal einen besonders undurchsichtigen Fall lösen – mit Verbindungen zu ehemaligen DDR-Agenten, tödlichen Geheimnissen und einem Fall, der weit über das beschauliche […] (00)
vor 8 Stunden
New York Knicks - Orlando Magic
New York (dpa) - Der deutsche Basketball-Topstar Franz Wagner hat sich in der NBA verletzt und droht lange auszufallen. Im Spiel seiner Orlando Magic bei den New York Knicks verdrehte sich der Welt- und Europameister das linke Bein nach einem Foul von Landsmann Ariel Hukporti. Der 24 Jahre alte Wagner musste humpelnd, mit schmerzverzerrtem Gesicht und von zwei Leuten gestützt das Feld verlassen. Die Magic teilten mit, dass […] (00)
vor 5 Minuten
Neuer ZVO-Stipendiat an der TU Ilmenau
Hilden, 07.12.2025 (PresseBox) - Janos Lörincz absolvierte zunächst ein Chemie-Studium (B.Sc.) an der Johannes Gutenberg-Universität in Mainz. Daran schloss sich ein Lehramtsstudium in den Fächern Chemie und Geschichte an, ebenfalls an der Johannes Gutenberg-Universität. Im Oktober 2025 begann er das Masterstudium der Elektrochemie und Galvanotechnik an der TU Ilmenau. Sein Interesse für Chemie […] (00)
vor 13 Stunden
 
Jungheinrich erhöht EBIT-Prognose – Russland-Verkauf verzögert sich deutlich
Das Unternehmen rechnet nun mit einem EBIT zwischen 220 und 260 Millionen Euro. Zuvor lag die Spanne […] (00)
Regierung legt Sicherheitsstrategie vor – und rechnet mit Europa ab
Rückkehr zur Monroe-Doktrin Gleich zu Beginn signalisiert das Papier eine strategische […] (00)
Die stille Pleitewelle: Warum Deutschlands Billigshops massenhaft kippen
Die Regale sind voll, die Preise niedrig – doch der Kundenzustrom reichte nicht mehr aus. […] (00)
Benjamin Netanjahu (Archiv)
Jerusalem - Bundeskanzler Friedrich Merz (CDU) hat dem israelischen Ministerpräsidenten […] (00)
Fußball-WM 2026 - Auslosung Vorrunde
Washington (dpa) - Nach einem amerikanischen WM-Crashkurs mit der umstrittenen FIFA-Huldigung […] (01)
Rückkehr aus der Krise: Warum Block plötzlich wieder Hoffnung macht
Block hat ein Jahr hinter sich, das selbst für den durch Turbulenzen gewohnten Fintech-Sektor […] (00)
Fallout-Mitbegründer Tim Cain kehrt aus dem „Halb-Ruhestand“ zurück zu Obsidian
Für viele Rollenspiel-Fans ist Tim Cain mehr als nur ein Designer. Er ist eine der […] (00)
Amerikas Abrechnung: Trumps Sicherheitsstrategie erklärt Europa zum Problemfall
Washington setzt die neue Prioritätenkarte durch Die Nationale Sicherheitsstrategie der USA […] (00)
 
 
Suchbegriff