Fortschritte in der Robotik: Google stellt Gemini-Modelle vor
Google hat kürzlich zwei neue Varianten seines KI-Systems Gemini vorgestellt, welche die Basis für die nächste Generation von hilfreichen Robotern bilden sollen. Das Modell "Gemini Robotics" ermöglicht es dem System, nicht nur Inhalte wie Texte, Bilder oder Videos zu erstellen, sondern auch die Steuerung von Roboteraktionen zu übernehmen. Ein weiteres Modell, das den Zusatz "ER" für "verkörperte Logik" trägt, erweitert besonders die räumlichen Denkfähigkeiten von Google Gemini.
Die Modellvariante Gemini Robotics-ER, die in einem Blogeintrag von Google vorgestellt wurde, hat die Fähigkeit, rasch neue Fertigkeiten zu erlernen. Zum Beispiel kann das KI-System beim Anblick einer Kaffeetasse sofort einen passenden Zwei-Finger-Griff wählen, um die Tasse am Henkel zu greifen und einen sicheren Annäherungsweg berechnen. In Zusammenarbeit mit dem texanischen Start-up Apptronik plant Google, humanoide Roboter zu entwickeln, die in dynamischen Umgebungen sicher und effizient agieren. Apptronik bringt hierbei seine Erfahrungen mit Robotermodellen wie "Apollo" ein, das speziell für logistische und Fertigungsaufgaben konzipiert ist.
Google hebt hervor, dass KI-Modelle in der Robotik drei entscheidende Fähigkeiten benötigen. Sie müssen anpassungsfähig, interaktiv und geschickt sein. Gemini Robotics verspricht signifikante Verbesserungen in all diesen Bereichen und könnte damit den Traum vom universellen Roboter einen Schritt näher bringen. In einem Blogeintrag zeigt Google anhand von Videos, wie das KI-System beispielsweise Gegenstände sortiert, während es sich durch den Raum bewegt, oder auch kunstvoll Origami faltet.
Als Testumgebung für seine Roboter-KI werden führende Robotik-Spezialisten wie Agile Robots, Agility Robots, Boston Dynamics und Enchanted Tools eingebunden. Das Projekt legt enormen Wert auf Sicherheit und integriert fortschrittliche Sicherheitsmechanismen, um Verletzungen zu verhindern. Das KI-Modell hat die Fähigkeit, mögliche Gefährdungen im Kontext zu bewerten und angemessen zu reagieren.