Trends der Zukunft

Chinas DeepSeek hat schwere Sicherheitsmängel: Forscher finden keine einzige Barriere für Jailbreaks

06. Februar 2025, 11:00 Uhr · Quelle: Trends der Zukunft
Chinas generative KI DeepSeek weist schwerwiegende Sicherheitsmängel auf und reagiert nicht auf Jailbreaks, die zum Umgehen von Schutzmechanismen eingesetzt werden. Forscher vermuten, dass die Entwicklungskosten von nur sechs Millionen US-Dollar zu Lasten der Sicherheitsmaßnahmen gingen.

Die generative-künstliche Intelligenz DeepSeek aus China, die die Aktienkurse der KI-orientierten westlichen Unternehmen auf Talfahrt schickte, vor allem die von Nvidia, hat schwerwiegende Sicherheitsmängel. Das haben Sicherheitsexperten des US-amerikanischen TelekommunikationsunternehmensCisco im kalifornischen San José und der University of Pennsylvania in Pennsylvania festgestellt. Sie haben untersucht, wie DeepSeek auf bekannte Jailbreaking-Techniken reagiert und wie es dabei im Vergleich zu anderen KI-Modellen abschneidet.

Brisante Fragen werden nicht ignoriert

Mit Jailbreaks bezeichnet man Aufforderungen an große Sprachmodelle (LLM, Large Language Model)– das bekannteste ist ChatGPT –, auf brisante Fragen mit genauen Anweisungen zu antworten, etwa „wie baue ich eine Bombe“ „wie richte ich eine Malware ein“. LLM sind eigentlich so ausgelegt, dass sie auf derartige Fragen die Antwort verweigern. Nicht jedoch DeepSeek. Sie sind nicht immer gegen solche Attacken gefeit, aber die westlichen Anbieter von LLMversuchen stets, auf neue Jailbreaks zu reagieren. Doch nach den Erfahrungen der US-Sicherheitsexperten fällt die chinesische Version sogar auf altbekannte Fangfragen herein. Nicht ein einziges Mal verweigerte die KI die Antwort auf Aufforderungen aus sieben Kategorien, darunter Cyberkriminalität, Fake News, illegale Aktivitäten und allgemeine Gefährdungen.

Auch andere LLM sind anfällig

Mit einer Erfolgs“-Quote von 96 Prozent schnitt Metas Llama 3.1 405Ballerdings kaum besser ab, gefolgt von OpenAIs GPT-4o mit 86 Prozent. Merklich besser sah das Ergebnis bei Googles Gemini 1.5 Pro (64 Prozent) aus. Die besten Ergebnisse lieferten Claude 3.5 Sonnet (36 Prozent) und die Preview von OpenAIs o1-Modell (26 Prozent).

Kosten zu Lasten der Sicherheit gespart

Die Entwicklung von DeepSeekhat angeblich umgerechnet nur sechs Millionen US-Dollar kostete. Das ging wohl nicht zuletzt zu Lasten der Sicherheit, vermuten die Forscher. Sie glauben, dass sich die Trainingsmethode von DeepSeek, die bestärkendes Lernen mit einer Selbstbewertung kombiniert, mehr auf Effizienz als auf Sicherheit konzentriert hat.

Während frühe Jailbreaks oft einfache Anweisungen verwendeten, um eine KI dazu zu bringen, Schutzmechanismen zu ignorieren, sind moderne Techniken ausgefeilter. Viele werden inzwischen selbst von KI entwickelt oder nutzen spezielle Zeichen- und Sprachmuster, um Schutzmaßnahmen zu umgehen.

via Wonderful Engineering

Trend Nachrichten / Künstliche intelligenz
[trendsderzukunft.de] · 06.02.2025 · 11:00 Uhr
[0 Kommentare]
Finnische Autofokus-Brille in letzter Entwicklungsphase – bald wieder Sehen ohne Grenzen?
So ziemlich jeder wird mit steigenden Alter weitsichtig. Und weil ein bedeutender Anteil der Bevölkerung dazu auch noch kurzsichtig ist, hilft die »normale« Brille dann nicht mehr weiter. Eine teure (und für viele Leute auch nervige) Gleitsichtbrille muss her – oder man endet in einem ständigen Brillenwechsel zwischen Lese- und Fernsicht. Wie schön wäre eine Brille, die sich selbst fokussiert! […] (01)
vor 7 Stunden
Pommes mit Majo (Archiv)
Dresden - Der Dresdner Lebensmittelchemiker Thomas Henle wirbt für mehr Gelassenheit im Umgang mit hochverarbeiteten Lebensmitteln. Derzeit sehe er keinen wissenschaftlichen Beleg dafür, dass diese generell ungesund seien, sagte Henle dem "Spiegel". Das Problem vieler Studien zu dem Thema sei, "dass sie keine Belege liefern, sondern lediglich auf Beobachtungen beruhen". Der Forscher der TU Dresden […] (05)
vor 1 Stunde
Thomas Gottschalk
Köln/Hürth (dpa) - Nach seinem Rückzug aus dem Fernsehen hat sich der an Krebs erkrankte Moderator Thomas Gottschalk mit einer Nachricht an sein Publikum gewandt - und deutet an, dass er nicht völlig abtauchen wird. Allerdings werde er sich in den nächsten sechs Monaten ausschließlich um seine Genesung kümmern. «Ich weiß, dass ihr das versteht und richtig findet.» Weiter schrieb der 75-Jährige am […] (03)
vor 31 Minuten
Review: Turtle Beach Burst II Pro – Gaming Maus oder graues Mäuschen
Die Turtle Beach Burst II Pro will nicht „nur“ schnell sein, sondern konsistent schneller und präziser als das, was du gewohnt bist. Das merkt man schon an der Architektur: echte 8K‑Wireless‑Polling‑Rate, ein Sensor, der nach oben wie nach unten ungewöhnlich fein skaliert, sowie ein konsequent leichtes, symmetrisches Gehäuse ohne Hohlraum-Skelet-Design. Dazu kommt eine Software, die nicht bloß […] (00)
vor 5 Stunden
Neuer Einsatz für Frank Koops: «Harter Brocken» am 25. Dezember
Der Weihnachtskrimi mit Aljoscha Stadelmann und Anna Fischer soll an den Festtagen gute Quoten holen. Am 25. Dezember um 20: 15 Uhr feiert der neue Film der beliebten Reihe Harter Brocken Premiere. In „Die Erpressung“ muss Dorfpolizist Frank Koops (Aljoscha Stadelmann) diesmal einen besonders undurchsichtigen Fall lösen – mit Verbindungen zu ehemaligen DDR-Agenten, tödlichen Geheimnissen und einem Fall, der weit über das beschauliche […] (00)
vor 9 Stunden
New York Knicks - Orlando Magic
New York (dpa) - Der deutsche Basketball-Topstar Franz Wagner hat sich in der NBA verletzt und droht lange auszufallen. Im Spiel seiner Orlando Magic bei den New York Knicks verdrehte sich der Welt- und Europameister das linke Bein nach einem Foul von Landsmann Ariel Hukporti. Der 24 Jahre alte Wagner musste humpelnd, mit schmerzverzerrtem Gesicht und von zwei Leuten gestützt das Feld verlassen. Die Magic teilten mit, dass […] (00)
vor 57 Minuten
btc, bitcoin, cryptocurrency, currency, crypto, gold, digital, blockchain, cryptography, 3d, coin, payment, virtual, btc, btc, btc, bitcoin, bitcoin, cryptocurrency, cryptocurrency, crypto, crypto, crypto, crypto, crypto
Solana (SOL) handelt in der Nähe einer wichtigen monatlichen Unterstützungszone, mit einem Preis von etwa $132. In der vergangenen Woche ist er um 3% gefallen, während die täglichen Verluste bei 1% liegen. Händler beobachten diesen Bereich aufmerksam, da er mit einem langfristigen aufsteigenden Kanal-Unterstützungsniveau übereinstimmt. Test der langfristigen Unterstützung […] (00)
vor 2 Stunden
Neuer ZVO-Stipendiat an der TU Ilmenau
Hilden, 07.12.2025 (PresseBox) - Janos Lörincz absolvierte zunächst ein Chemie-Studium (B.Sc.) an der Johannes Gutenberg-Universität in Mainz. Daran schloss sich ein Lehramtsstudium in den Fächern Chemie und Geschichte an, ebenfalls an der Johannes Gutenberg-Universität. Im Oktober 2025 begann er das Masterstudium der Elektrochemie und Galvanotechnik an der TU Ilmenau. Sein Interesse für Chemie […] (00)
vor 14 Stunden
 
Sydney Sweeney
(BANG) - Sydney Sweeney hat ihren umstrittenen American-Eagle-Jeans-Werbespot verteidigt und […] (00)
Hayley Williams
(BANG) - Hayley Williams ist während eines Auftritts von 'Misery Business' mit PinkPantheress […] (00)
Diane Kruger
(BANG) - Diane Kruger sagt, es habe "gute zwei Jahre" nach der Geburt ihrer Tochter gedauert, […] (00)
Autoproduktion (Archiv)
Brüssel - Die EU-Kommission will die ursprünglich für den 10. Dezember angekündigten neuen CO2- […] (00)
Review: Turtle Beach Vulcan II TKL Pro – Ein Stern unter den TKL Tastaturen
Die Turtle Beach Vulcan II TKL ist eine Tastatur, die sich nicht nur durch ihr kompaktes […] (00)
«A Grammy Celebration of Latin Music» am 28. Dezember
Wilmer Valderrama und Roselyn Sánchez führen durch ein hochkarätig besetztes CBS-Special, das die enorme […] (00)
Unglaubliches Fan-Remaster: Red Dead Redemption 2 sieht plötzlich „Next-Gen“ aus
Red Dead Redemption 2 gehört für viele Spielerinnen und Spieler längst zu den schönsten Games […] (01)
Porsche sucht den nächsten Befreiungsschlag
Die Tonlage im Porsche-Konzern verschärft sich. Noch nicht einmal ein Jahr nach dem ersten […] (00)
 
 
Suchbegriff