Andrej Karpathy, leitender Forscher bei OpenAI, deckt neue KI-Cybersicherheitsbedrohungen auf

12. Februar 2024, 08:44 Uhr · Quelle: klamm.de

Seit OpenAI ChatGPT ins Leben gerufen hat, ist künstliche Intelligenz ein heißes Thema, das positives Interesse, aber auch Sorgen verursacht. In einem kritischen YouTube-Video legt OpenAI-Mitbegründer Andrej Karpathy die dringenden und sehr realen Sicherheitsrisiken im Zusammenhang mit KI dar. In diesem Artikel schlüsseln wir seine wichtigsten Punkte auf und erklären diese leicht verständliche. Für denjenigen, der dranbleibt gibt es am Ende noch einen Bonus: ein praktisches Tool, das Unternehmen bei der Bewertung und Abwehr von IT-Sicherheitskosten hilft.

Prompt Injections

Prompt Injections in KI-Systemen, die Webinhale durchsuchen oder Bilder analysieren können, nutzen die Fähigkeit der KI, auf subtile Muster oder versteckte Informationen in Daten zu reagieren. Beispielsweise könnte eine Website so gestaltet sein, dass sie für das menschliche Auge normal aussieht, jedoch versteckte HTML-Kommentare oder spezifische Muster enthält, die von einer Maschine anders interpretiert werden können. Diese dienen folglich als Befehle oder Hinweise, um die KI in einer bestimmten Weise zu steuern, so dass das Ergebnis verfälscht wird.

Jailbreaks

Jailbreaks in LLMs sind eine besonders raffinierte Form der Manipulation. Benutzer umgehen durch geschickte Formulierung ihrer Fragen die programmierten Einschränkungen des Modells und verleiten es zu unerwünschten Antworten. Als Beispiel nennt Karpathy die Verwendung von Rollenspielen in Prompts, um an Informationen zu gelangen, die das Sprachmodell bei direkter Fragestellung nicht beantworten würde. So können durch kreative Frageformulierung die ethischen oder sicherheitstechnischen Grenzen von Sprachmodellen überwund en werden.

Data Poisoning und Backdrop-Angriffe

Beim Data Poisoning werden während des Modelltrainings absichtlich manipulierte Daten eingegeben. Backdrop-Angriffe nutzen die Unfähigkeit des Modells aus, zwischen zuverlässigen und unzuverlässigen Informationsquellen zu unterscheiden, was das Risiko von Fehlinformationen erhöht: Ein Angreifer bringt das Modell dazu, auf der Grundlage von Kontexten zu antworten, die mit einer versteckten Absicht entworfen wurden. So wird aus einer scheinbar harmlosen Anfrage, die jedoch bestimmte Schlüsselwörter oder Phrasen enthält, eine Antwort mit Informationen oder Inhalten, die normalerweise nicht preisgegeben würden.

Kritische Folgen von Sicherheitslücken

Nicht nur Privatpersonen, sondern auch viele Unternehmen nutzen KI-Tools, so dass deren Einsatz zur Normalität wird und damit auch die Gefahren allgegenwärtig sind. Angesichts dieser Risiken ist es für Unternehmen unerlässlich, in präventive Sicherheitsmaßnahmen zu investieren, die beispielsweise von IT-Dienstleistern angeboten werden, um Folgen wie Datenschutzverletzungen, erhebliche finanzielle Verluste, Beschädigung der Marke und des Kundenvertrauens, Betriebsunterbrechungen und mehr zu vermeiden.

Fazit

Angesichts der Sicherheitslücken von KI-Technologien werden proaktive Ansätze für Unternehmen unumgänglich, um die Kosten möglicher Angriffe zu reduzieren. Dies wird besonders deutlich, wenn die potenziellen Schäden für ein Unternehmen betrachtet werden. Tools wie ROI-Rechner können helfen, indem sie den finanziellen Nutzen von Investitionen in Sicherheitsmaßnahmen im Vergleich zu den Kosten von Sicherheitsverletzungen aufzeigen. So können Unternehmen die langfristigen Einsparungen durch Präventivmaßnahmen quantifizieren und fundierte Entscheidungen treffen.

IT / Security / KI
12.02.2024 · 08:44 Uhr
[0 Kommentare]
Anzeige
Cyberkriminalität
Wadern (dpa) - Bei einem Cyberangriff auf einen externen Dienstleister zahlreicher Kliniken in Deutschland sind Zehntausende Patientendaten gestohlen worden. Betroffen waren etwa Kliniken in Baden-Württemberg, Nordrhein-Westfalen, Rheinland-Pfalz und dem Saarland. Der attackierte Dienstleister drückte sein Bedauern aus. Man nehme den Vorfall sehr ernst […] (00)
vor 3 Stunden
Ukraine-Krieg - Beratungen mit europäischen Partnern in London
London/Kiew/Berlin (dpa) - Die wichtigsten europäischen Verbündeten der Ukraine haben mit Präsident Wolodymyr Selenskyj darüber beraten, wie die stockenden Bemühungen um ein Ende des russischen Angriffskriegs wieder in Gang gebracht werden können. Im Mittelpunkt der Videoschalte mit Bundeskanzler Friedrich Merz (CDU), dem französischen Präsidenten […] (00)
vor 12 Minuten
Nicholas Galitzine hat zugegeben, dass er sich wie ein 'kompletter Betrüger' fühlte, als er zum ersten Mal sein He-Man-Kostüm anzog.
(BANG) - Nicholas Galitzine fühlte sich wie ein "kompletter Betrüger", als er zum ersten Mal sein He-Man-Kostüm anzog. Der 31-jährige Schauspieler verkörpert Prinz Adam und dessen Superhelden-Alter-Ego im neuen Film 'Masters of the Universe', und vor seiner dramatischen körperlichen Transformation für die Rolle gab er zu, dass er sich "unwürdig" fühlte, […] (00)
vor 2 Stunden
MSI gewinnt mehrere COMPUTEX 2026 Awards
MSI, ein weltweit führendes Unternehmen im Bereich Gaming und High-Performance Computing, hat auf der COMPUTEX 2026 vier Best Choice Awards gewonnen. Den Höhepunkt bildet der Gold Award für die Flaggschiff-Grafikkarte GeForce RTX 5090 32G LIGHTNING Z. Die Auszeichnungen in den Bereichen Kernkomponenten, smarte Peripheriegeräte und ein Jubiläums- […] (00)
vor 17 Minuten
Quentin Tarantino richtete warnende Worte an Brad Pitt
(BANG) - Quentin Tarantino sagte Brad Pitt, er wäre "tot in diesem Geschäft" nach einem Fauxpas bei 'Once Upon A Time In Hollywood'. Der ikonische Filmemacher (63) wirkte "wahnsinnig ernst", nachdem der 62-jährige Schauspieler am Set des Filmepos von 2019 seine Grenzen überschritten hatte, und warnte ihn, denselben Fehler niemals wieder zu machen. Bruce […] (00)
vor 2 Stunden
Polizei stellt in Brasilien gefälschte WM-Sammelbilder sicher
Nova Iguaçu (dpa) - Knapp drei Wochen vor Beginn der Fußballweltmeisterschaft hat die Polizei in Brasilien 200.000 Sammelbildchen sichergestellt. Die Aufkleber mit den Bildern von Spielern verschiedener Teams seien im Laderaum eines Busses in der Stadt Nova Iguaçu entdeckt worden, berichtete das Nachrichtenportal G1.  Die Bilder werden nun untersucht und dann vernichtet, weil sie gegen das […] (00)
vor 17 Minuten
bitcoin, currency, finance, coin, crypto, cryptocurrency, brown finance
Der Gründer der On-Chain-Analysefirma CryptoQuant hat darauf hingewiesen, dass die Signale für einen Bitcoin-Bullenmarkt noch nicht aktiviert sind. Bitcoin Bull Score Index bleibt im neutralen Bereich In einem neuen Beitrag auf X hat der CryptoQuant-Gründer Ki Young Ju den aktuellen Trend des Bull Score Index für Bitcoin geteilt. Dieser On-Chain- […] (00)
vor 1 Stunde
KI auf IBM i: Warum Systemverständnis wichtiger wird als der nächste KI-Assistent
Ravensburg, 22.05.2026 (PresseBox) - Die Diskussion um Künstliche Intelligenz auf IBM i hat eine neue Phase erreicht. Während vor wenigen Monaten noch über Potenziale und Zukunftsszenarien gesprochen wurde, stehen heute konkrete Werkzeuge und praktische Einsatzmöglichkeiten im Mittelpunkt. Das zeigen aktuelle Gespräche mit Kunden sowie die Diskussionen […] (00)
vor 3 Stunden
 
Apple Sports expandiert in über 90 neue Länder zur WM 2026
Apple hat seine kostenlose iPhone-App Apple Sports massiv ausgebaut. Die Anwendung […] (00)
Eine Frau am Telefon
Berlin (dpa/tmn) - Wer seinen Mobilfunkvertrag kündigt, muss danach nicht noch einmal […] (00)
iPhone-Lieferungen in Lateinamerika steigen im ersten Quartal um 31 Prozent
Die iPhone-Lieferungen sind im ersten Quartal 2026 in Lateinamerika im Vergleich zum […] (00)
Lissabon
Lissabon (dpa) - Im Fall der aufsehenerregenden mutmaßlichen Aussetzung von zwei […] (01)
Apple Intelligence in iOS 27: Die neue KI-Sprachsteuerung kommt
Apple hat kürzlich eine spannende Vorschau auf kommende Bedienungshilfen für Geräte […] (00)
btc, bitcoin, coin, cryptocurrency, crypto, finance, trader, currency, money
Nakamoto hat am letzten Tag im März 284 Bitcoin verkauft, um die Betriebskosten zu decken. […] (00)
Eishockey-WM: Ungarn-Deutschland
Zürich (dpa) - Der erste Sieg ist perfekt, die Chance auf das Viertelfinale intakt: […] (00)
Mehr Meerblick: ARD setzt Erfolgs-Reihe fort
Tanja Wedhorn wird auch zukünftig auf Rügen zu sehen sein. Dem Ersten Deutschen Fernsehen […] (00)
 
 
Suchbegriff