Eulerpool News

Künstliche Intelligenz im Clash der Pokémon-Giganten: Wenn Maschinen ins Schwitzen kommen

18. Juni 2025, 00:15 Uhr · Quelle: Eulerpool News
In einem Wettkampf zwischen Google und Anthropic zeigen KI-Modelle wie Gemini 2.5 Pro und Claude kuriose Verhaltensweisen beim Spielen älterer Pokémon-Spiele, wobei Gemini dazu neigt, in stressigen Situationen zu "paniken". Dennoch übertreffen sie in einigen Bereichen die menschlichen Spieler durch spezialisierte Werkzeugentwicklung.

In der dynamischen Welt der künstlichen Intelligenz (KI) reicht der Wettkampf um die Vorherrschaft weit über technische Perfektion hinaus – bis in die virtuelle Welt der Pokémon. Google und Anthropic haben ihre neuesten KI-Modelle auf den Prüfstand gestellt, indem sie ihnen beibrachten, die Herausforderungen der frühen Pokémon-Spiele zu meistern. Dabei offenbart insbesondere Google DeepMinds Bericht über Gemini 2.5 Pro ein unerwartetes Phänomen: Die KI neigt zur Panik, wenn ihre Pokémon dem Aus drohen. Diese Panikattacken schwächen die Fähigkeit des Modells zur sinnvollen Problemlösung erheblich.

Das Benchmarking von KI-Modellen bleibt eine umstrittene Kunst, die oft wenig greifbaren Kontext für die tatsächlichen Fähigkeiten eines Modells liefert. Dennoch gibt es Forscher, die der Meinung sind, dass das Studium der Interaktion von KI-Modellen mit Videospielen durchaus aufschlussreich, wenn nicht gar amüsant sein kann.

In den letzten Monaten haben unabhängige Entwickler Twitch-Kanäle namens "Gemini Plays Pokémon" und "Claude Plays Pokémon" ins Leben gerufen. Hier können Interessierte live verfolgen, wie die KI sich an einem über 25 Jahre alten Kinderspiel versucht. Der eigentliche Reiz liegt weniger in der Spieldauer als in den Verhaltensweisen der künstlichen Spieler. So zeigt Gemini 2.5 Pro während der Spiele eigenartige Reaktionen, die an menschliche Fehlentscheidungen in Stresssituationen erinnern. Ein bemerkenswertes, wenn auch beunruhigendes Verhalten.

Doch auch Claude, ein weiteres KI-Modell, zeigte kurioses Verhalten in Kanto. Beispielsweise versuchte es, in einer Sackgasse absichtlich all seine Pokémon kampfunfähig zu machen, um zu einem früheren Punkt im Spiel zurückzukehren – ein taktischer Fehlgriff, der auf Twitch für entsetzte Zuschauer sorgte.

Dennoch haben die Modelle in einigen Bereichen ihre menschlichen Pendants überflügelt. Mit Hilfe von spezialisierter Werkzeugentwicklung konnte Gemini 2.5 Pro selbst komplizierte Puzzle-Sequenzen im Handumdrehen meistern. Google vermutet, dass das Modell künftig derartiges Werkzeug sogar ohne menschliche Unterstützung entwickeln könnte. Wer weiß, vielleicht bastelt Gemini schon bald an einem Modul, das den überraschend menschlichen Panikmodus ausschaltet.

AI
[Eulerpool News] · 18.06.2025 · 00:15 Uhr
[0 Kommentare]
Smartphone ohne Mobilfunk-Netz
Naumburg (dpa) - Im deutschen Mobilfunknetz ist die Abdeckung insgesamt hoch, es zeigen sich aber weiterhin regionale Lücken. Das ist das Ergebnis der ersten bundesweiten Mobilfunkmesswoche. Demnach lagen rund 98 Prozent der Messpunkte in den beiden modernsten Netztechnologien 4G und 5G. Funklöcher hätten in weniger als einem Prozent der erfassten Messpunkte vorgelegen, teilte die […] (00)
vor 4 Stunden
Irans Präsident Peseschkian
Teheran (dpa) - Irans Präsident Massud Peseschkian ist einem Bericht zufolge im Krieg mit Israel nur knapp dem Tod entkommen. Wie die iranische Nachrichtenagentur Fars berichtete, bombardierte Israels Luftwaffe drei Tage nach Kriegsbeginn am 16. Juni einen Gebäudekomplex des Nationalen Sicherheitsrats. Nach dem Angriff fiel demnach der Strom aus. Die Teilnehmer des Krisentreffens konnten sich in […] (01)
vor 22 Minuten
Lewis Capaldi
(BANG) - Lewis Capaldi "hat nicht damit gerechnet", dass seine Comeback-Tour ausverkauft sein würde. Der schottische Sänger kehrte letzten Monat beim Glastonbury-Festival ins Rampenlicht zurück und kündigte anschließend für September eine Reihe von Arena-Shows in Großbritannien und Irland an. Obwohl alle Tickets – inklusive sieben zusätzlicher Termine – restlos vergriffen sind, hat er den Fans […] (01)
vor 23 Stunden
PS4-Update 12.52: Sony macht der „Jailbreak-Community“ einen Strich durch die Rechnung
Sony hat am vor einigen Tagen, genauer am 9. Juli 2025, überraschend das neue PS4-Systemupdate 12.52 veröffentlicht. Offiziell gibt es keine großen Änderungen, doch hinter dem unscheinbaren Update verbirgt sich ein klares Signal: Die Zeiten für Jailbreaker und Homebrew-Enthusiasten werden (nochmals) härter. Im Update nennt Sony im offiziellen Change-Log lediglich einen einzigen Punkt: „Wir […] (02)
vor 11 Stunden
Geo zeigt zwei neue Atombombe-Dokumentationen
Am Montag und Mittwoch sendet der Fernsehsender zwei Premieren. Auch Geo Television schaut auf die Zerstörung der Atombombe. Aus diesem Grund läuft am Montag, den 4. August 2025, um 20.15 Uhr der Dokumentarfilm Downwind. Eine Chronik der Atomtests in Mercury, Nevada, wo zwischen 1951 und 1992 insgesamt 928 Atomwaffen gezündet wurden. Die Gefahr durch die radioaktive Strahlung wurde der Bevölkerung über Jahrzehnte und von vier verschiedenen […] (00)
vor 1 Stunde
Schweden - Deutschland
Zürich (dpa) - Nach der höchsten Niederlage der deutschen EM-Geschichte sitzt der Frust bei den deutschen Fußballerinnen tief. «Wir sind ganz klar in dieses Spiel rein und wollten Erster in der Gruppe werden. Und deswegen liegen wir jetzt auch so ein bisschen am Boden», sagte Bundestrainer Christian Wück nach dem enttäuschenden 1: 4 in Zürich gegen Schweden. «Wir geben das Spiel in 10 bis 15 […] (02)
vor 4 Stunden
Bitcoins Und Us Dollar Rechnungen
Der erneute Anstieg des Bitcoin-Preises am Ende der Handelswoche überraschte viele Short-Trader, da der Vermögenswert auf ein neues Allzeithoch von fast $119.000 stieg, nachdem er zuvor längere Zeit kaum Bewegung gezeigt hatte. Obwohl es keine einzige große Ankündigung gab, die mit der explosiven Rallye in Verbindung gebracht werden konnte, gibt es mehrere Gründe, die sich über Wochen aufgebaut haben und auf den neuen Höchststand […] (00)
vor 42 Minuten
Wo der Alltag noch sicher ist: Warum die Schweiz für viele Deutsche zur Alternative wird
Zürich, 12.07.2025 (lifePR) - Sicherheit ist für viele Menschen ein Grundbedürfnis. Und für immer mehr Deutsche ein Auswanderungsgrund. In einer aktuellen Umfrage auf dem YouTube-Kanal der Auswanderungsagentur Deine3a nannten 45 Prozent der Teilnehmenden „Sicherheit und weniger Kriminalität“ als Hauptmotiv für einen Umzug in die Schweiz. Ein Blick auf die Zahlen zeigt: Laut Statistischem Bundesamt […] (04)
vor 24 Stunden
 
Apple will sich Formel 1 Streamingrechten in USA sichern
Laut Berichten befindet sich Apple in Gesprächen über Streamingrechte der Formel 1 in den USA. […] (00)
Nie mehr »Kurbeln« beim Parken: Automatisches Einparken kommt bei BYD mit Versicherung
Der chinesische Autokonzern BYD setzt voll auf Elektromobilität – und jetzt auch auf umfangreiche […] (00)
Review: BOOX Note Air4 C: Das Farb-ePaper für kreative Köpfe
Im digitalen Zeitalter wird papierloses Arbeiten immer bedeutender – sei es für Studierende, […] (00)
Berufsverbot per Gesinnungsprüfung – Rheinland-Pfalz zieht die Linie
Verwaltungsreform mit politischer Sprengkraft Rheinland-Pfalz greift durch. Wer künftig im […] (08)
Naughty Dogs neues Sci-Fi-Game Intergalactic soll bereits Ende 2026 erscheinen
Seit der ersten Enthüllung bei den Game Awards 2024 ist es still geworden um das nächste große […] (00)
David Corenswet zog sich den 'wildesten Bluterguss' an seinem
(BANG) - David Corenswet zog sich den "wildesten Bluterguss" an seinem "rechten Hoden" beim […] (01)
Musk bringt seinen umstrittenen KI-Chatbot in Tesla-Autos
Einbau trotz Eklat Ein Tag nach antisemitischen Kommentaren sorgt Elon Musk für den nächsten […] (00)
Faltwunder mit Kampfansage – Samsung greift Apple frontal an
Der Spott ist verflogen Als Samsung 2019 sein erstes Galaxy Fold präsentierte, war das mediale […] (01)
 
 
Suchbegriff