Andrej Karpathy, leitender Forscher bei OpenAI, deckt neue KI-Cybersicherheitsbedrohungen auf

12. Februar 2024, 08:44 Uhr · Quelle: klamm.de

Seit OpenAI ChatGPT ins Leben gerufen hat, ist künstliche Intelligenz ein heißes Thema, das positives Interesse, aber auch Sorgen verursacht. In einem kritischen YouTube-Video legt OpenAI-Mitbegründer Andrej Karpathy die dringenden und sehr realen Sicherheitsrisiken im Zusammenhang mit KI dar. In diesem Artikel schlüsseln wir seine wichtigsten Punkte auf und erklären diese leicht verständliche. Für denjenigen, der dranbleibt gibt es am Ende noch einen Bonus: ein praktisches Tool, das Unternehmen bei der Bewertung und Abwehr von IT-Sicherheitskosten hilft.

Prompt Injections

Prompt Injections in KI-Systemen, die Webinhale durchsuchen oder Bilder analysieren können, nutzen die Fähigkeit der KI, auf subtile Muster oder versteckte Informationen in Daten zu reagieren. Beispielsweise könnte eine Website so gestaltet sein, dass sie für das menschliche Auge normal aussieht, jedoch versteckte HTML-Kommentare oder spezifische Muster enthält, die von einer Maschine anders interpretiert werden können. Diese dienen folglich als Befehle oder Hinweise, um die KI in einer bestimmten Weise zu steuern, so dass das Ergebnis verfälscht wird.

Jailbreaks

Jailbreaks in LLMs sind eine besonders raffinierte Form der Manipulation. Benutzer umgehen durch geschickte Formulierung ihrer Fragen die programmierten Einschränkungen des Modells und verleiten es zu unerwünschten Antworten. Als Beispiel nennt Karpathy die Verwendung von Rollenspielen in Prompts, um an Informationen zu gelangen, die das Sprachmodell bei direkter Fragestellung nicht beantworten würde. So können durch kreative Frageformulierung die ethischen oder sicherheitstechnischen Grenzen von Sprachmodellen überwund en werden.

Data Poisoning und Backdrop-Angriffe

Beim Data Poisoning werden während des Modelltrainings absichtlich manipulierte Daten eingegeben. Backdrop-Angriffe nutzen die Unfähigkeit des Modells aus, zwischen zuverlässigen und unzuverlässigen Informationsquellen zu unterscheiden, was das Risiko von Fehlinformationen erhöht: Ein Angreifer bringt das Modell dazu, auf der Grundlage von Kontexten zu antworten, die mit einer versteckten Absicht entworfen wurden. So wird aus einer scheinbar harmlosen Anfrage, die jedoch bestimmte Schlüsselwörter oder Phrasen enthält, eine Antwort mit Informationen oder Inhalten, die normalerweise nicht preisgegeben würden.

Kritische Folgen von Sicherheitslücken

Nicht nur Privatpersonen, sondern auch viele Unternehmen nutzen KI-Tools, so dass deren Einsatz zur Normalität wird und damit auch die Gefahren allgegenwärtig sind. Angesichts dieser Risiken ist es für Unternehmen unerlässlich, in präventive Sicherheitsmaßnahmen zu investieren, die beispielsweise von IT-Dienstleistern angeboten werden, um Folgen wie Datenschutzverletzungen, erhebliche finanzielle Verluste, Beschädigung der Marke und des Kundenvertrauens, Betriebsunterbrechungen und mehr zu vermeiden.

Fazit

Angesichts der Sicherheitslücken von KI-Technologien werden proaktive Ansätze für Unternehmen unumgänglich, um die Kosten möglicher Angriffe zu reduzieren. Dies wird besonders deutlich, wenn die potenziellen Schäden für ein Unternehmen betrachtet werden. Tools wie ROI-Rechner können helfen, indem sie den finanziellen Nutzen von Investitionen in Sicherheitsmaßnahmen im Vergleich zu den Kosten von Sicherheitsverletzungen aufzeigen. So können Unternehmen die langfristigen Einsparungen durch Präventivmaßnahmen quantifizieren und fundierte Entscheidungen treffen.

IT / Security / KI
12.02.2024 · 08:44 Uhr
[0 Kommentare]
Anzeige
Review: Reolink Duo 3V PoE – statische Überwachung mit Dual-Kamera
Die Reolink Duo 3V PoE fällt schon beim ersten Blick aus dem Rahmen klassischer Überwachungskameras. Sie verzichtet auf ein einzelnes Objektiv und setzt stattdessen auf ein Dual-Lens-System, das zwei separate Kameras zu einem 180°-Panoramabild kombiniert. Das ist keine Spielerei: Die Kamera zielt darauf ab, maximale Flächen mit minimaler Hardware […] (00)
vor 1 Stunde
Bundeswehr-Soldat mit Pistole (Archiv)
Berlin/Oldenburg - Verfassungsrechtler kritisieren eine mögliche Genehmigungspflicht für Auslandsreisen für junge Männer. "Insgesamt halte ich die aktuelle Regelung außerhalb des Spannungs- und Verteidigungsfalles nicht für verhältnismäßig", sagte Alexander Thiele, Professor für Öffentliches Recht an der Business & Law School Berlin, der "Welt". Ziel […] (01)
vor 20 Minuten
Quantenphysik schlägt künstliche Intelligenz — mit nur neun Atomen
Wer mehr Rechenleistung braucht, baut größere Systeme — so lautet die Grundannahme, auf der ein großer Teil der modernen Computerentwicklung beruht. Mehr Schichten, mehr Verbindungen, mehr Energie. Eine aktuelle Studie, veröffentlicht im renommierten Fachjournal Physical Review Letters, stellt diese Logik grundsätzlich infrage. Ein Forschungsteam hat […] (00)
vor 5 Stunden
Ich habe mal ausgerechnet, wie viele Stunden ich allein in Charakter-Editoren verbracht habe. Über alle Spiele hinweg, seit ich 2003 meinen ersten Helden in Neverwinter Nights zusammengeklickt habe. Das Ergebnis: mindestens 200 Stunden. Zweihundert Stunden, in denen ich Nasenlängen justiert, Augenbrauen verschoben und Haarfarben verglichen habe, ohne […] (00)
vor 9 Minuten
Prime Video zeigt Doku «Jerry West: The Logo» im April
Der Streamingdienst widmet der Basketball-Legende eine persönliche und schonungslose Dokumentation. Prime Video hat den Trailer zur Dokumentation Jerry West: The Logo veröffentlicht. Der abendfüllende Film feiert am 16. April seine Premiere und wird weltweit in mehr als 240 Ländern und Territorien verfügbar sein. Regie führt Kenya Barris, der mit «Jerry West: The Logo» sein Dokumentarfilmdebüt […] (00)
vor 9 Stunden
Daniel Altmaier
Monte-Carlo (dpa) - Tennisprofi Daniel Altmaier hat sein Auftaktmatch beim Masters-1000-Turnier in Monte-Carlo verloren. Der Deutsche unterlag dem Tschechen Tomas Machac in einer umkämpften Partie mit 4: 6, 6: 1, 3: 6. Nach verlorenem ersten Satz zeigte sich Altmaier stark verbessert. Nach einem schnellen Break zum 3: 1 wehrte er in einem umkämpften […] (00)
vor 3 Stunden
Trumps 1,5-Billionen-Beben: Der totale Vernichtungsschlag gegen den Sozialstaat
Der fiskalische Urknall kam ohne Vorwarnung, aber mit der Präzision einer lasergesteuerten Rakete. Donald Trump hat dem Kongress ein Budget-Diktat vorgelegt, das die Koordinaten der Weltmacht USA verschieben soll. 1,5 Billionen Dollar – eine Zahl mit zwölf Nullen –, die allein in die nationale Verteidigung fließen sollen. Es ist die größte […] (00)
vor 1 Stunde
Veranstaltungstipp – Familienrundgang mit Bewegungsimpulsen und freier Eintritt
Mainz, 06.04.2026 (lifePR) - Wir laden Familien herzlich zu einer gemeinsamen Entdeckungstour durch die Kunsthalle ein. Hier gibt es immer etwas anderes zu erleben. Gemeinsames Rätseln, Forschen oder Zeichnen vor den Kunstwerken – mach einfach mit! Der Familienrundgang mit Bewegungsimpulsen findet am Sonntag, den 19/04 um 14 Uhr statt und ist Teil des Programms  Freistunden. Im Rahmen der  […] (00)
vor 3 Stunden
 
Review: Reolink TrackFlex Floodlight WiFi – Der Alleskönner für Großraumüberwachung
Ich bin ehrlich: Sicherheitskameras gehören nicht unbedingt zu meinem Kernthema. Ich […] (00)
Review: Ecovacs Deebot T90 Pro Omni Saugwischer im Test
Hallo zusammen! Nach intensiver Recherche und dem Vergleich zahlreicher Roboter- […] (00)
Review zum devolo WiFi 7 Mesh BE6500
Nachdem ich in den letzten Monaten verschiedene Mesh-Systeme ausprobiert und mit […] (00)
Misbah Khan (Archiv)
Berlin - Grünen-Fraktionsvize Misbah Khan hat Kritik am Bundesförderprogramm […] (00)
Fortschritte in der Edelmetallexploration Nevada, bekannt für seine reichen […] (00)
Dynamo Dresden - Hertha BSC
Dresden (dpa) - Pyrotechnik, Platzsturm, Polizei im Großeinsatz: Nach den Fan- […] (02)
«Fräulein Else»: Auftakt zu Kammerspielen
3sat zeigt die gefeierte Inszenierung vom Wiener Volkstheater als Auftakt des Berliner […] (00)
Fashion-Influencer «Gramps»
Mainz (dpa) - Er hat rund 5,5 Millionen Follower auf Tiktok, noch mal knapp 2,5 […] (00)
 
 
Suchbegriff