Trends der Zukunft

Chinas DeepSeek hat schwere Sicherheitsmängel: Forscher finden keine einzige Barriere für Jailbreaks

06. Februar 2025, 11:00 Uhr · Quelle: Trends der Zukunft
Chinas generative KI DeepSeek weist schwerwiegende Sicherheitsmängel auf und reagiert nicht auf Jailbreaks, die zum Umgehen von Schutzmechanismen eingesetzt werden. Forscher vermuten, dass die Entwicklungskosten von nur sechs Millionen US-Dollar zu Lasten der Sicherheitsmaßnahmen gingen.

Die generative-künstliche Intelligenz DeepSeek aus China, die die Aktienkurse der KI-orientierten westlichen Unternehmen auf Talfahrt schickte, vor allem die von Nvidia, hat schwerwiegende Sicherheitsmängel. Das haben Sicherheitsexperten des US-amerikanischen TelekommunikationsunternehmensCisco im kalifornischen San José und der University of Pennsylvania in Pennsylvania festgestellt. Sie haben untersucht, wie DeepSeek auf bekannte Jailbreaking-Techniken reagiert und wie es dabei im Vergleich zu anderen KI-Modellen abschneidet.

Brisante Fragen werden nicht ignoriert

Mit Jailbreaks bezeichnet man Aufforderungen an große Sprachmodelle (LLM, Large Language Model)– das bekannteste ist ChatGPT –, auf brisante Fragen mit genauen Anweisungen zu antworten, etwa „wie baue ich eine Bombe“ „wie richte ich eine Malware ein“. LLM sind eigentlich so ausgelegt, dass sie auf derartige Fragen die Antwort verweigern. Nicht jedoch DeepSeek. Sie sind nicht immer gegen solche Attacken gefeit, aber die westlichen Anbieter von LLMversuchen stets, auf neue Jailbreaks zu reagieren. Doch nach den Erfahrungen der US-Sicherheitsexperten fällt die chinesische Version sogar auf altbekannte Fangfragen herein. Nicht ein einziges Mal verweigerte die KI die Antwort auf Aufforderungen aus sieben Kategorien, darunter Cyberkriminalität, Fake News, illegale Aktivitäten und allgemeine Gefährdungen.

Auch andere LLM sind anfällig

Mit einer Erfolgs“-Quote von 96 Prozent schnitt Metas Llama 3.1 405Ballerdings kaum besser ab, gefolgt von OpenAIs GPT-4o mit 86 Prozent. Merklich besser sah das Ergebnis bei Googles Gemini 1.5 Pro (64 Prozent) aus. Die besten Ergebnisse lieferten Claude 3.5 Sonnet (36 Prozent) und die Preview von OpenAIs o1-Modell (26 Prozent).

Kosten zu Lasten der Sicherheit gespart

Die Entwicklung von DeepSeekhat angeblich umgerechnet nur sechs Millionen US-Dollar kostete. Das ging wohl nicht zuletzt zu Lasten der Sicherheit, vermuten die Forscher. Sie glauben, dass sich die Trainingsmethode von DeepSeek, die bestärkendes Lernen mit einer Selbstbewertung kombiniert, mehr auf Effizienz als auf Sicherheit konzentriert hat.

Während frühe Jailbreaks oft einfache Anweisungen verwendeten, um eine KI dazu zu bringen, Schutzmechanismen zu ignorieren, sind moderne Techniken ausgefeilter. Viele werden inzwischen selbst von KI entwickelt oder nutzen spezielle Zeichen- und Sprachmuster, um Schutzmaßnahmen zu umgehen.

via Wonderful Engineering

Trend Nachrichten / Künstliche intelligenz
[trendsderzukunft.de] · 06.02.2025 · 11:00 Uhr
[0 Kommentare]
Wer im Sommer unter Hitze unterm Dach leidet, merkt schnell, wie belastend aufgeheizte Räume im Alltag sein können. Genau deshalb suchen immer mehr Menschen nach einer wirksamen Lösung für das Dachgeschoss. Wer eine Split Klimaanlage kaufen möchte, denkt dabei meist nicht nur an angenehme Temperaturen, sondern auch an besseren Schlaf, mehr Wohnkomfort […] (01)
vor 1 Stunde
Anzeigetafel in der Frankfurter Börse
Frankfurt/Main - Am Donnerstag hat der Dax deutlich nachgelassen. Zum Xetra-Handelsschluss wurde der Index mit 23.807 Punkten berechnet, ein Minus in Höhe von 1,1 Prozent im Vergleich zum Vortagesschluss. Der Dax rutschte am Donnerstag nach anfänglichen Einbußen tiefer ins Minus. "Die Anleger in Frankfurt reagieren weiter sehr sensibel auf die […] (00)
vor 5 Minuten
Die Anforderungen im Außendienst steigen stetig. Versorgungsunternehmen sehen sich mit einem wachsenden Anlagenvolumen, einer sich vergrößernden Qualifikationslücke und der Verantwortung für die Sicherheit ihrer Mitarbeiter konfrontiert. Zeitgleich wächst der Druck auf Effizienz, Transparenz sowie schnelle Reaktionszeiten. Digitale Lösungen verleihen komplexen Abläufen Struktur und […] (00)
vor 53 Minuten
Halo-Remake kommt früher? Release-Leak nennt überraschenden Termin
Die Wartezeit könnte deutlich kürzer sein, als viele gedacht haben. Ein neuer Leak bringt Bewegung in eines der spannendsten Projekte rund um die Halo-Reihe und plötzlich steht ein möglicher Release-Zeitraum im Raum, der überrascht. Fans von Halo: Combat Evolved könnten schon im Sommer zurück auf den Ring kehren. Leak nennt konkrete Release-Termine […] (00)
vor 28 Minuten
Rettungsdoku: VOX bringt «Feuer, Wasser, Erde, Luft» zurück
Vier neue Folgen werden ins Programm genommen, von denen jeweils eine im Wochenrhythmus läuft. Die VOX-Dokusoap Feuer, Wasser, Erde, Luft hatte eine etwas skurrile Geschichte hinter sich. Die Premieren-Staffel im Frühjahr 2023 wurde vorzeitig aus dem Programm genommen, nachdem die ersten Folgen nur schwache Quoten holten. Weil nach Bekanntgabe dieser Maßnahme jedoch nochmal ein Anstieg auf bis […] (00)
vor 3 Stunden
Ella Seidel
Oeiras (dpa) - Den deutschen Tennis-Frauen droht beim Billie Jean King Cup der nächste Abstieg. Das Team von Cheftrainer Torben Beltz verlor in Oeiras nahe Lissabon auch das zweite Spiel gegen Schweden mit 1: 2. Schon das Auftaktduell gegen die gastgebenden Portugiesinnen hatte die DTB-Auswahl mit 1: 2 verloren. Der Traum von der schnellen Rückkehr in […] (01)
vor 4 Stunden
nahaufnahme von bitcoin-symbolschildern im freien, die moderne kryptowährungstrends widerspiegeln.
Bitcoin hat möglicherweise den schlimmsten Schock überstanden, doch die Daten deuten darauf hin, dass es sich eher um eine Stabilisierung als um einen Ausbruch handelt. Ein Bitcoin-Reset im Gange? Laut aktuellen Analysen deutet die derzeitige Marktlage auf einen Reset hin, bei dem Bitcoin eine umfassende Entschuldungsphase durchläuft. Trotz der […] (00)
vor 31 Minuten
Präzision beginnt mit klarer Sicht - Saubere Optik für jeden Einsatz
Aham, 09.04.2026 (lifePR) - Wer auf die Jagd geht oder als Militär- oder Polizeikraft tätig ist, weiß: jedes Detail kann entscheidend sein. Staub, Fett oder Fingerabdrücke auf der Optik stören nicht nur die Sicht, sie verringern auch die Präzision. Gerade bei wechselnden Wetterbedingungen oder häufiger Nutzung ist eine gründliche und rückstandsfreie Reinigung unerlässlich. Das Optik-Reiniger-Set […] (00)
vor 1 Stunde
 
Dan Levy wollte das 'warme und kuschelige' 'Schitt's Creek' für seine neue Serie hinter sich lassen.
(BANG) - Dan Levy wollte das "warme und kuschelige" 'Schitt's Creek' für seine neue […] (00)
Britney Spears und Madonna bei den VMAs 2003
(BANG) - Madonna soll sehr daran interessiert sein, Britney Spears für ihr neues […] (00)
Klingel gegen den Algorithmus: Eine analoge Idee überlistet die Noise-Cancelling-Technologie
Wer in einer Großstadt Fahrrad fährt, kennt die Situation: Fußgänger: innen mit […] (05)
Autobahn (Archiv)
Berlin - Die SPD bewertet die Überlegungen von Bundeskanzler Friedrich Merz (CDU) zu […] (03)
Glorious Gaming – GHS Eternal und GHS Eternal RGB bereiten den Weg in eine neue Produktkategorie
Glorious Gaming, ein weltweit führender Anbieter von PC-Gaming-Hardware, kündigt […] (01)
Absatzrückgang durch China Im ersten Quartal 2023 musste Mercedes-Benz einen […] (00)
Hailee Steinfeld kann der 'Niedlichkeit' ihrer Haustiere oft nicht widerstehen.
(BANG) - Hailee Steinfeld kann der "Niedlichkeit" ihrer Haustiere oft nicht […] (00)
Starfield bringt mit dem Free Lanes Update endlich Verbesserungen, auf die Fans lange gewartet haben
Es ist kein kleines Pflaster und auch kein reines Marketingversprechen – das Free […] (00)
 
 
Suchbegriff