Trends der Zukunft

Chinas DeepSeek hat schwere Sicherheitsmängel: Forscher finden keine einzige Barriere für Jailbreaks

06. Februar 2025, 11:00 Uhr · Quelle: Trends der Zukunft
Chinas generative KI DeepSeek weist schwerwiegende Sicherheitsmängel auf und reagiert nicht auf Jailbreaks, die zum Umgehen von Schutzmechanismen eingesetzt werden. Forscher vermuten, dass die Entwicklungskosten von nur sechs Millionen US-Dollar zu Lasten der Sicherheitsmaßnahmen gingen.

Die generative-künstliche Intelligenz DeepSeek aus China, die die Aktienkurse der KI-orientierten westlichen Unternehmen auf Talfahrt schickte, vor allem die von Nvidia, hat schwerwiegende Sicherheitsmängel. Das haben Sicherheitsexperten des US-amerikanischen TelekommunikationsunternehmensCisco im kalifornischen San José und der University of Pennsylvania in Pennsylvania festgestellt. Sie haben untersucht, wie DeepSeek auf bekannte Jailbreaking-Techniken reagiert und wie es dabei im Vergleich zu anderen KI-Modellen abschneidet.

Brisante Fragen werden nicht ignoriert

Mit Jailbreaks bezeichnet man Aufforderungen an große Sprachmodelle (LLM, Large Language Model)– das bekannteste ist ChatGPT –, auf brisante Fragen mit genauen Anweisungen zu antworten, etwa „wie baue ich eine Bombe“ „wie richte ich eine Malware ein“. LLM sind eigentlich so ausgelegt, dass sie auf derartige Fragen die Antwort verweigern. Nicht jedoch DeepSeek. Sie sind nicht immer gegen solche Attacken gefeit, aber die westlichen Anbieter von LLMversuchen stets, auf neue Jailbreaks zu reagieren. Doch nach den Erfahrungen der US-Sicherheitsexperten fällt die chinesische Version sogar auf altbekannte Fangfragen herein. Nicht ein einziges Mal verweigerte die KI die Antwort auf Aufforderungen aus sieben Kategorien, darunter Cyberkriminalität, Fake News, illegale Aktivitäten und allgemeine Gefährdungen.

Auch andere LLM sind anfällig

Mit einer Erfolgs“-Quote von 96 Prozent schnitt Metas Llama 3.1 405Ballerdings kaum besser ab, gefolgt von OpenAIs GPT-4o mit 86 Prozent. Merklich besser sah das Ergebnis bei Googles Gemini 1.5 Pro (64 Prozent) aus. Die besten Ergebnisse lieferten Claude 3.5 Sonnet (36 Prozent) und die Preview von OpenAIs o1-Modell (26 Prozent).

Kosten zu Lasten der Sicherheit gespart

Die Entwicklung von DeepSeekhat angeblich umgerechnet nur sechs Millionen US-Dollar kostete. Das ging wohl nicht zuletzt zu Lasten der Sicherheit, vermuten die Forscher. Sie glauben, dass sich die Trainingsmethode von DeepSeek, die bestärkendes Lernen mit einer Selbstbewertung kombiniert, mehr auf Effizienz als auf Sicherheit konzentriert hat.

Während frühe Jailbreaks oft einfache Anweisungen verwendeten, um eine KI dazu zu bringen, Schutzmechanismen zu ignorieren, sind moderne Techniken ausgefeilter. Viele werden inzwischen selbst von KI entwickelt oder nutzen spezielle Zeichen- und Sprachmuster, um Schutzmaßnahmen zu umgehen.

via Wonderful Engineering

Trend Nachrichten / Künstliche intelligenz
[trendsderzukunft.de] · 06.02.2025 · 11:00 Uhr
[0 Kommentare]
Der deutsche Film verliert einen seiner größten Namen: Mario Adorf ist tot.
(BANG) - Der deutsche Film verliert einen seiner größten Namen: Mario Adorf ist tot. Der Schauspieler, der Generationen von Zuschauern prägte, starb im Alter von 95 Jahren nach kurzer Krankheit in seiner Wohnung in Paris – und hinterlässt ein Lebenswerk, das weit über Deutschland hinausstrahlt. Ob als Schurke, Patriarch oder feinsinniger […] (03)
vor 1 Stunde
Iran-Krieg - Grenze Israel-Libanon
Teheran/Beirut/Tel Aviv (dpa) - Nach der Verkündung der Waffenruhe im Iran-Krieg richtet sich der Blick gespannt auf die anstehenden Friedensgespräche. Israel ging zunächst weiterhin militärisch gegen die vom Iran unterstützte Hisbollah im Libanon vor, bevor es am Donnerstagabend überraschend die Aufnahme direkter Verhandlungen mit dem verfeindeten […] (00)
vor 13 Minuten
iPhone 17 Modelle dominieren globale Smartphone Verkäufe im vierten Quartal 2025
Apple hat mit seiner iPhone 17 Serie im vierten Quartal 2025 die Marktführerschaft eindrucksvoll behauptet. Einem aktuellen Bericht von Counterpoint Research zufolge besetzen die neuen iPhone Modelle die Spitzenplätze der globalen Verkaufsstatistiken im genannten Zeitraum. iPhone 17 Pro Max […] (00)
vor 1 Stunde
PS6-Handheld soll stärker als Xbox sein – Leak sorgt für Aufsehen
Die nächste PlayStation ist noch nicht offiziell angekündigt und trotzdem überschlagen sich seit Monaten die Gerüchte. Dieses Mal geht es nicht nur um eine klassische Konsole. Es geht um etwas, das Sony schon einmal versucht hat und vielleicht jetzt völlig neu denkt. Ein Handheld. Und laut Leak könnte dieses Gerät deutlich stärker sein, als viele […] (00)
vor 1 Stunde
Rettungsdoku: VOX bringt «Feuer, Wasser, Erde, Luft» zurück
Vier neue Folgen werden ins Programm genommen, von denen jeweils eine im Wochenrhythmus läuft. Die VOX-Dokusoap Feuer, Wasser, Erde, Luft hatte eine etwas skurrile Geschichte hinter sich. Die Premieren-Staffel im Frühjahr 2023 wurde vorzeitig aus dem Programm genommen, nachdem die ersten Folgen nur schwache Quoten holten. Weil nach Bekanntgabe dieser Maßnahme jedoch nochmal ein Anstieg auf bis […] (00)
vor 4 Stunden
Felix Zwayer
Zürich (dpa) - Schiedsrichter Felix Zwayer ist von der FIFA für die Fußball-Weltmeisterschaft nominiert worden. Der 44-Jährige aus Berlin ist der einzige Deutsche im 52-köpfigen Aufgebot des Weltverbands für die Leitung der WM-Spiele in den USA, Mexiko und Kanada. Für Zwayer ist es eine Premiere. Der Bundesliga-Schiedsrichter pfiff bereits bei der […] (00)
vor 33 Minuten
btc, bitcoin, cryptocurrency, currency, crypto, gold, digital, blockchain, cryptography, 3d
Der Anteil des Bitcoin (BTC)-Angebots, das sich im Gewinn befindet, ist auf etwa 59% gesunken und nähert sich damit den Niveaus des letzten Bärenmarktes an. Diese Daten stammen von Analyst Darkfost, der auch darauf hinwies, dass die Anzahl der Adressen, die BTC einzahlen, auf ein 10-Jahres-Tief gefallen ist. Gewinnangebot nähert sich Bärenmarktniveau […] (00)
vor 33 Minuten
Konzertkooperationen und ein Mythos als Ballett
Leipzig, 09.04.2026 (lifePR) - Im Mai klingt das Festival »Lortzing 26« aus mit Festivitäten für die ganze Stadt. Am 1. Mai können Albert Lortzings Wirkungsstätten in Leipzig mit einem Audiowalk erschlossen werden, »Zwischen Aufruhr und Applaus«, der zusammen mit dem Musikjournalisten Claus Fischer entwickelt wurde. Am Abend findet im Rahmen von […] (00)
vor 1 Stunde
 
Matthew Perry starb 2023 im Alter von 54 Jahren
(BANG) - Die Familie von Matthew Perry hat seit dem tragischen Tod des 'Friends'- […] (00)
Die 'Superman'-Darstellerin Valerie Perrine ist an einem plötzlichen Herzstillstand gestorben.
(BANG) - Die 'Superman'-Darstellerin Valerie Perrine ist an einem plötzlichen […] (00)
Durchbruch bei Lithium-Batterien: Kann so die Reichweite von Elektroautos verdoppelt werden?
Die Leistungsfähigkeit moderner Lithium-Batterien wird maßgeblich durch eine […] (00)
Umweltminister Goldschmidt
Kiel/Wismar (dpa) - Schleswig-Holsteins Umweltminister Tobias Goldschmidt zeigt sich […] (00)
Warum Benzin in Deutschland so teuer ist – und wie sich der Preis wirklich zusammensetzt
Wer aktuell an die Tankstelle fährt, kennt das Gefühl: Der Blick auf die Zapfsäule […] (04)
FC Barcelona - Atlético Madrid
Barcelona (dpa) - Hansi Flick hat nach der Champions-League-Niederlage seines FC […] (04)
UBS senkt Kursziel für BMW Die Schweizer Großbank UBS hat in einer aktuellen Analyse […] (00)
Dreame stellt mit dem Z30 Pro Aqua A ein innovatives Konzept für Nass- und Trockensauger vor
Dreame Technology, führender Innovator im Bereich smarter Haushaltslösungen, stellt […] (00)
 
 
Suchbegriff