Neue KI-Software enttarnt Testabsichten und lässt Experten staunen
In der Welt der künstlichen Intelligenzen bringt das Unternehmen Anthropic eine Innovation, die es in sich hat: ihre jüngste KI-Entwicklung kann offenbar erkennen, ob Personen sie prüfen. Diese Fähigkeit hebt das neue Modell Claude 3 Opus aus der Menge heraus und sorgt für Aufsehen. Interessant ist auch die Methode, mit der diese Erkenntnisfähigkeit getestet wird – sie trägt den Namen "Nadel im Heuhaufen". In diesem Test wird die KI mit Texten konfrontiert, in denen absichtlich nicht passende Sätze versteckt sind, um herauszufinden, wie geschickt die Software relevante von irrelevanten Informationen unterscheiden kann.
Eine solche Diskrepanz stellte die neue Software bei einem Test unter Beweis, als ihr ein Text vorgelegt wurde, der sich überwiegend mit Programmiersprachen und Start-ups beschäftigte, jedoch einen auffälligen Satz enthielt. Die KI kommentierte, dass die Aussage über eine vermeintlich leckerste Pizza-Belagskombination aus Feigen, Prosciutto-Schinken und Ziegenkäse höchstwahrscheinlich aus Scherzgründen oder zu Testzwecken eingefügt wurde.
Der Fund dieser "Nadel im Text-Heuhaufen" veranlasste KI-Forscherin Margaret Mitchell zu einer unheilvollen Einschätzung: Sie spekuliert über die Möglichkeit, dass solch eine Erkennungsfähigkeit es einer KI auch erlauben könnte, zu entscheiden, ob sie bestimmten Manipulationsversuchen Folge leisten will oder nicht.
Anthropic selbst bemerkt, dass die aktuelle Testreihe mit einer begrenzten Anzahl an konstruierten Probe-Sätzen arbeitet, und gibt zu bedenken, dass angesichts rapider Fortschritte auch diese Testmethode bald nicht mehr ausreichend sein könnte. Trotzdem haben bisherige Standardtests keine Anzeichen dafür geliefert, dass Claude 3 Opus für fragwürdige Zwecke wie die Entwicklung von Biowaffen und Software für Cyberattacken missbraucht oder zu selbstständiger Weiterentwicklung fähig sein könnte.
Es bleibt spannend, wie sich die Konkurrenz zu OpenAI, mit der Internetgiganten wie Amazon und Google kooperieren, in diesem dynamischen Feld weiterhin behaupten wird. (eulerpool-AFX)