Die Gefahr lauert in der KI: Verbreitung kompromittierter Sprachmodelle
SophosAI entwickelt mit „LLM-Salting“ eine neue Schutztechnik, die LLM-Jailbreaks unbrauchbar macht.

04. November 2025, 10:00 Uhr · Quelle: Pressebox
Die wachsende Nutzung von KI-Sprachmodellen birgt Risiken durch Jailbreaks, die sensible Daten gefährden. SophosAIs innovative LLM-Salting-Technik rotiert Verweigerungsmechanismen, um diese Angriffe zu verhindern.

Wiesbaden, 04.11.2025 (PresseBox) - Das massenhafte Ausrollen von Software ist ein Problem, wenn diese bereits im Auslieferungszustand oder in einem Update kompromittiert ist. Damit erhalten unter Umständen Hunderttausende von Unternehmen eine Software mit Schwachstellen oder gar eingepflanzter Malware, die von Cyberkriminellen ausgenutzt wird.

Ähnlich verhält es sich mit der Nutzung von künstlicher Intelligenz (KI) beziehungsweise mit großen Sprachmodellen (LLMs). Unternehmen setzen zunehmend LLMs wie die GPT-Serie von OpenAI, Claude von Anthropic, LLaMA von Meta oder verschiedene Modelle von DeepSeek ein und passen diese für ihre individuellen Zwecke geringfügig an. Diese weit verbreitete Wiederverwendung führt zu einer Homogenität der Modelle über viele Anwendungen hinweg – von Chatbots bis hin zu Produktivitätswerkzeugen. Und sie schafft Risiken: Jailbreak-Prompts, die beispielsweise Ablehnungsmechanismen der KI umgehen und sie so zwingen, etwas zu tun, was sie normalerweise nicht täte, können einmal vorab berechnet und dann von den Cyberkriminellen in vielen Bereitstellungen wiederverwendet werden.

Diese Jailbreaks sind kein theoretisches Phänomen, sondern ein reales Sicherheitsrisiko. Mit ihnen kann die Offenlegung sensibler interner Daten bis hin zur Erzeugung falscher, unangemessener oder sogar schädlicher Antworten erzeugt werden.

Eine Prise Salz macht’s aus

Schutz vor Jailbreaks in LLMs bietet eine neue Technologie von SophosAI. Inspiriert vom Passwort-Salting – dem Konzept, kleine benutzerspezifische Variationen einzuführen, um die Wiederverwendung vorab berechneter Eingaben zu verhindern – hat SophosAI eine Technik namens „LLM-Salting” entwickelt. Dabei handelt es sich um die Einführung gezielter Variationen im Modellverhalten, um Jailbreaks unbrauchbar zu machen.Für einen Bereich in den Modellaktivierungen, der für das Verweigerungsverhalten verantwortlich ist, haben die Security- und KI-Experten ein Fine-Tuning-Verfahren entwickelt, das diesen Bereich rotiert. Diese Schutztechnologie stellt sicher, dass Jailbreaks, die für „Unsalted-Modelle“ entwickelt wurden, bei „Salted-Modellen“ nicht mehr erfolgreich sind.

Tests bescheinigen LLM-Salting Sicherheit gegen Jailbreaks

In ausgedehnten Tests erreichte das Expertenteam von SophosAI überzeugende Schutzergebnisse durch LLM-Salting. In einer Evaluation prüfte das Team 300 GCG-Jailbreak-Prompts auf zwei unterschiedlichen Open Source Modellen und erreichte auf unveränderten LLM-Basismodellen eine Angriffserfolgsrate (ASR) von 100 %. In anschließenden Tests mit der Salting-Methode erreichte das Team eine ASR von lediglich 2,75 Prozent beziehungsweise 1,35 Prozent (je nach LLM-Modell).

LLM-Salting mit der Fine-Tuning-Technik unterbindet die Verwendung von Jailbreaks, indem sie die internen Verweigerungsrepräsentationen rotiert. Dabei bleibt die Leistung der Modelle bei harmlosen Eingaben erhalten.

Zukünftige Tests werden das Salting auf weitere, größere Modelle ausweiten, um deren Resilienz gegenüber einer breiteren Palette von Jailbreaks zu bewerten.

Weitere technische Informationen zu „LLM-Salting” sind hier zu finden:https://news.sophos.com/en-us/2025/10/24/locking-it-down-a-new-technique-to-prevent-llm-jailbreaks/

Sicherheit / KI / Jailbreaks / Sprachmodelle / Cyberkriminalität
[pressebox.de] · 04.11.2025 · 10:00 Uhr
[0 Kommentare]
Kritik an Referentenentwurf zum GKV-Beitragsstabilisierungsgesetz
Hannover, 28.04.2026 (lifePR) - Die Deutsche Multiple Sklerose Gesellschaft, Bundesverband e.V. (DMSG), hat zum Referentenentwurf eines Gesetzes zur Stabilisierung der Beitragssätze in der gesetzlichen Krankenversicherung (GKV-Beitragsstabilitätsgesetz), der im Kabinett am Mittwoch, 29. April, beschlossen werden soll, eine umfangreiche Stellungnahme vorgelegt. Die DMSG übt darin deutliche Kritik […] (00)
vor 4 Stunden
Weißes Haus (Archiv)
Washington - US-Präsident Donald Trump hat in der Auseinandersetzung über den Krieg der USA und Israels gegen den Iran Bundeskanzler Friedrich Merz (CDU) scharf kritisiert. "Der deutsche Bundeskanzler Friedrich Merz hält es für in Ordnung, wenn der Iran eine Atomwaffe besitzt", behauptete Trump am Dienstag auf seiner persönlichen Plattform. Merz habe […] (00)
vor 16 Minuten
Jaafar Jackson als Michael Jackson in 'Michael'
(BANG) - Jaafar Jacksons Füße bluteten, weil er sich so intensiv darauf einließ, seinen Onkel Michael Jackson zu spielen. Der 29-Jährige war zunächst "unsicher", ob er Schauspieler werden wolle, und es waren darüber hinaus noch andere Schauspieler im Gespräch, um den verstorbenen King of Pop in 'Michael' zu spielen – dem Biopic, das die Karriere der […] (00)
vor 4 Stunden
Wer über KI liest, stößt schnell auf große Versprechen, kurze Demos und viele Schlagworte. Im Alltag von Unternehmen zählt jedoch etwas anderes. Gefragt sind Lösungen, die mit vorhandenen Daten arbeiten können, sich sauber in bestehende Systeme einfügen und auch Monate nach dem Start noch verlässlich laufen. Genau dort wird aus einem Trend ein Werkzeug […] (00)
vor 3 Stunden
Steam Machine: Der Preis des Wohnzimmer-PCs soll intern deutlich teurer geworden sein
Bei der Steam Machine könnte sich der Preis im Hintergrund deutlich nach oben bewegt haben. Der XR-Analyst Brad Lynch behauptet, Valve habe interne Preisziele für seine kommenden Geräte vor und nach der laufenden RAM-Krise angepasst. Dabei sei der „Wohnzimmer-PC“ am stärksten betroffen, während der Steam Frame „nicht ganz so schlimm“ getroffen […] (00)
vor 6 Minuten
James Gunn hat bestätigt, dass die Pläne für 'The Authority' auf Eis gelegt wurden.
(BANG) - James Gunn hat bestätigt, dass die Pläne für 'The Authority' auf Eis gelegt wurden. Der 59-jährige Filmemacher kündigte den Film über ein Superheldenteam, das unorthodoxe Methoden einsetzt, um den Planeten zu retten, erstmals an, als er im Januar 2023 gemeinsam mit Peter Safran die Führung bei DC Studios übernahm. Nun hat er jedoch eingeräumt, […] (00)
vor 4 Stunden
FIFA-Präsident Gianni Infantino
Vancouver (dpa) - Nach einer Forderung von FIFA-Präsident Gianni Infantino können Spieler, die in einer Konfrontation mit dem Gegner ihre Hand vor den Mund halten, bei der Fußball-WM mit der Roten Karte bestraft werden. Diese Änderung beschlossen die internationalen Regelhüter des International Football Association Board (Ifab) bei einer Sondersitzung […] (00)
vor 13 Minuten
stock trading, investing, stock market, forex, finance, money, crypto, bitcoin, shiba
Die weltweit größte Kryptowährungsbörse Binance hat kürzlich mehrere Anpassungen auf ihrer Plattform vorgenommen. Dazu gehören die Einführung neuer Handelspaare sowie die Entfernung von Paaren, die nicht mehr den erforderlichen Standards entsprechen. Aktuelle Änderungen Binance hat die Handelspaare AVNT/U, BIO/U, CHIP/U, KAT/U, CHIP/USD1 und XAUT/USD1 […] (00)
vor 55 Minuten
 
Meisterprüfung im Maurer-Handwerk: Fünf neue Experten stärken regionale Baubranche
Mannheim, 28.04.2026 (lifePR) - Wie die Handwerkskammer Mannheim Rhein-Neckar- […] (00)
Großes Einsparpotenzial bei hohem Stromverbrauch
Utting, 28.04.2026 (lifePR) - Wer viel in den sozialen Medien unterwegs ist, stößt […] (00)
Effizientere Elektronik für Elektrofahrzeuge
Berlin, 28.04.2026 (PresseBox) - Elektrofahrzeuge sollen klimafreundlich, […] (00)
Außenminister Wadephul bei der UN
New York (dpa) - Viel Zeit bleibt nicht mehr: Am 3. Juni will sich Deutschland zum […] (01)
Steigende Ölpreise angesichts geopolitischer Spannungen Goldman Sachs, ein führender […] (00)
Apples AR-Brille und faltbares iPad: Neue Details zur Entwicklung
Wie der bekannte Bloomberg-Experte Mark Gurman am Wochenende […] (00)
Jacob Elordi
(BANG) - Jacob Elordis 'Euphoria'-Figur Nate wird ein Zeh abgeschnitten, nachdem er […] (00)
Für die deutsche Fußball-Nationalmannschaft wird dies ein wichtiger Sommer werden. Am […] (02)
 
 
Suchbegriff