Trends der Zukunft

Chinas DeepSeek hat schwere Sicherheitsmängel: Forscher finden keine einzige Barriere für Jailbreaks

06. Februar 2025, 11:00 Uhr · Quelle: Trends der Zukunft
Chinas generative KI DeepSeek weist schwerwiegende Sicherheitsmängel auf und reagiert nicht auf Jailbreaks, die zum Umgehen von Schutzmechanismen eingesetzt werden. Forscher vermuten, dass die Entwicklungskosten von nur sechs Millionen US-Dollar zu Lasten der Sicherheitsmaßnahmen gingen.

Die generative-künstliche Intelligenz DeepSeek aus China, die die Aktienkurse der KI-orientierten westlichen Unternehmen auf Talfahrt schickte, vor allem die von Nvidia, hat schwerwiegende Sicherheitsmängel. Das haben Sicherheitsexperten des US-amerikanischen TelekommunikationsunternehmensCisco im kalifornischen San José und der University of Pennsylvania in Pennsylvania festgestellt. Sie haben untersucht, wie DeepSeek auf bekannte Jailbreaking-Techniken reagiert und wie es dabei im Vergleich zu anderen KI-Modellen abschneidet.

Brisante Fragen werden nicht ignoriert

Mit Jailbreaks bezeichnet man Aufforderungen an große Sprachmodelle (LLM, Large Language Model)– das bekannteste ist ChatGPT –, auf brisante Fragen mit genauen Anweisungen zu antworten, etwa „wie baue ich eine Bombe“ „wie richte ich eine Malware ein“. LLM sind eigentlich so ausgelegt, dass sie auf derartige Fragen die Antwort verweigern. Nicht jedoch DeepSeek. Sie sind nicht immer gegen solche Attacken gefeit, aber die westlichen Anbieter von LLMversuchen stets, auf neue Jailbreaks zu reagieren. Doch nach den Erfahrungen der US-Sicherheitsexperten fällt die chinesische Version sogar auf altbekannte Fangfragen herein. Nicht ein einziges Mal verweigerte die KI die Antwort auf Aufforderungen aus sieben Kategorien, darunter Cyberkriminalität, Fake News, illegale Aktivitäten und allgemeine Gefährdungen.

Auch andere LLM sind anfällig

Mit einer Erfolgs“-Quote von 96 Prozent schnitt Metas Llama 3.1 405Ballerdings kaum besser ab, gefolgt von OpenAIs GPT-4o mit 86 Prozent. Merklich besser sah das Ergebnis bei Googles Gemini 1.5 Pro (64 Prozent) aus. Die besten Ergebnisse lieferten Claude 3.5 Sonnet (36 Prozent) und die Preview von OpenAIs o1-Modell (26 Prozent).

Kosten zu Lasten der Sicherheit gespart

Die Entwicklung von DeepSeekhat angeblich umgerechnet nur sechs Millionen US-Dollar kostete. Das ging wohl nicht zuletzt zu Lasten der Sicherheit, vermuten die Forscher. Sie glauben, dass sich die Trainingsmethode von DeepSeek, die bestärkendes Lernen mit einer Selbstbewertung kombiniert, mehr auf Effizienz als auf Sicherheit konzentriert hat.

Während frühe Jailbreaks oft einfache Anweisungen verwendeten, um eine KI dazu zu bringen, Schutzmechanismen zu ignorieren, sind moderne Techniken ausgefeilter. Viele werden inzwischen selbst von KI entwickelt oder nutzen spezielle Zeichen- und Sprachmuster, um Schutzmaßnahmen zu umgehen.

via Wonderful Engineering

Trend Nachrichten / Künstliche intelligenz
[trendsderzukunft.de] · 06.02.2025 · 11:00 Uhr
[0 Kommentare]
Diese Einführung vermittelt einen Überblick über die wesentlichen Aspekte der professionellen Poolpflege, von der Bedeutung der Wasserpflege über bewährte Techniken bis hin zu saisonalen Anpassungen. Zusätzlich werden innovative Lösungen zur Energieeinsparung und umweltfreundliche Alternativen vorgestellt, die eine nachhaltige Poolnutzung ermöglichen. Experten-Tipps zur optimalen Dosierung von Pflegemitteln und zur effizienten Nutzung von […] (00)
vor 2 Stunden
UN-Flagge
Genf (dpa) - Das UN-Menschenrechtsbüro hat glaubhafte Berichte, dass ukrainische Jugendliche mit Geld zu Sabotageakten verleitet werden. Wer genau dafür verantwortlich sei, werde verschleiert, aber alles deute auf Verantwortliche mit Verbindung zu Russland hin, heißt es in einem Bericht des UN-Menschenrechtsbüros über die Kriegsfolgen für Minderjährige. Mindestens elf Jugendliche zwischen 13 und […] (00)
vor 5 Minuten
Mit dem Frühling rückt die Rasenpflege in den Mittelpunkt der Haushaltsroutine. Traditionelle Roboter-Rasenmäher mit Begrenzungsdraht haben oft Probleme mit ungenauer Positionierung, wodurch einige Bereiche ungemäht bleiben oder mehrfach gemäht werden. Zudem erfordert die manuelle Inspektion beschädigter Drähte viel Zeit. Hochwertige smarte Wettbewerbsprodukte sind intelligenter, aber ihr hoher Preis von bis zu mehreren Tausend Yuan schreckt […] (00)
vor 1 Stunde
Start your engines: Gran Turismo World Series 2025 beginnt am 2. April
Einmal Vollgas, bitte! Die Gran Turismo World Series ist zurück und startet am 2. April 2025 durch. Gamer, Racer und PS-Liebhaber auf der ganzen Welt fiebern bereits der neuen Saison entgegen. Aber was macht das Event so besonders, und warum solltest du (ja, DU! ) daran teilnehmen oder zuschauen? Keine Sorge, wir erklären dir alles, mit ein bisschen Benzin im Blut und einem Augenzwinkern. Was ist […] (00)
vor 19 Minuten
RTL feiert die beliebtesten Let’s Dance-Stars
In der alljährlichen Osterpause bleibt die beliebte Tanzshow dennoch on air. Am Karfreitags-Special stehen die 25 beliebtesten Stars aller bisherigen 17 Staffeln im Mittelpunkt. Am vergangenen Freitag knackte die RTL-Unterhaltungsshow Let’s Dance erstmals die 20-Prozent-Marke in der klassischen Zielgruppe und fuhr damit einen neuen Staffelrekord ein. Die Tanzshow gehört zu den erfolgreichsten Formaten des Kölner Senders, der die Seapoint- […] (00)
vor 2 Stunden
144. Session des Internationalen Olympischen Komitees
Pylos (dpa) - Vor der Neuordnung der olympischen Welt muss Kirsty Coventry erst noch einen Familien-Umzug organisieren. Thomas Bachs IOC-Thronerbin siedelt aus ihrer Heimat Simbabwe mit ihrem Mann und den zwei kleinen Töchtern an den Sitz des Internationalen Olympischen Komitees nach Lausanne um. Ein dreimonatiger Crashkurs bei Bach bleibt der künftigen IOC-Präsidentin noch, bis sie am 24. Juni […] (01)
vor 15 Minuten
Bundesrat
Berlin (dpa) - Baden-Württembergs Ministerpräsident Winfried Kretschmann hat das Aufweichen der Schuldenbremse im Grundgesetz für das Finanzpaket für Verteidigung und Infrastruktur verteidigt. Er wies im Bundesrat auf die sich dramatisch verändernde Sicherheitslage in der Welt hin. «Es geht um nicht weniger als die Selbstbehauptung Europas – sicherheitspolitisch, wirtschaftlich und technologisch», […] (00)
vor 45 Minuten
revolt Wireless-Powerbank, 10.000 mAh, 22,5 Watt PD, USB-A/-C, MagSafe-kompatibel
Buggingen, 21.03.2025 (lifePR) - Die Wireless-Powerbank von revolt mit einer Kapazität von 10.000 mAh ermöglicht schnelles und kabelloses Aufladen unterwegs. Mit einer Ladeleistung von bis zu 22,5 Watt und einem USB-C-Anschluss mit Power Delivery werden Geräte schnell aufgeladen. Die MagSafe-Kompatibilität ermöglicht komfortables kabelloses Laden. Eine LED-Anzeige informiert über den Ladezustand. […] (00)
vor 1 Stunde
 
Travis Kelce musste sich schon als Kind mit Übergewicht auseinandersetzen.
(BANG) - Travis Kelce musste sich schon als Kind mit Übergewicht auseinandersetzen. Der 35- […] (00)
Kim Kardashian
(BANG) - Kim Kardashian hat nach Kanye Wests letztem Social-Media-Rant keine Lust mehr, gute […] (00)
Meghans Brief
(BANG) - Herzogin Meghan meldete sich bei einer Podcasterin, die zuvor Sorgen über die Ehefrau […] (00)
Reisepass (Archiv)
Berlin - Am Rande der Koalitionsverhandlungen hat Bremens Bürgermeister Andreas Bovenschulte […] (02)
Bank of America reformiert Arbeitskultur: Ein Ende der 100-Stunden-Wochen?
Ein radikaler Bruch mit der Wall-Street-Norm Bank of America geht einen ungewöhnlichen […] (00)
QNAP präsentiert den günstigen 4-Port 2,5GbE & 2-Port 10GbE Multi-Gigabit Switch
QNAP Systems, Inc., ein führender Innovator von Computer-, Netzwerk- und Speicherlösungen, hat […] (01)
Katherine Schwarzenegger enthüllt Schockverletzung ihrer Tochter
(BANG) - Die Tochter von Katherine Schwarzenegger hat sich das Handgelenk gebrochen. Die 35- […] (00)
music, e-sports, gamer, man, portrait, e-athlete, e-sports, gamer, gamer, gamer, gamer, gamer
Idea Factory gibt bekannt, dass das Rollenspiel Death end re;Quest Code Z (PS5, PS4, Switch) […] (00)
 
 
Suchbegriff