DeepMind enthüllt Genie 3: Ein Meilenstein auf dem Weg zur Allgemeinen KI

Google DeepMind hat mit Genie 3 sein neuestes „World Model“ vorgestellt – ein leistungsstarkes KI-Modell, das interaktive 3D-Welten generieren kann und laut DeepMind als entscheidender Zwischenschritt auf dem Weg zur Artificial General Intelligence (AGI), also einer menschenähnlichen Intelligenz, dient.

Was ist Genie 3?

Genie 3 ist ein generisches Weltmodell, das fotorealistische sowie imaginäre 3D-Umgebungen in Echtzeit generieren kann – basierend auf einfachen Texteingaben. Es schafft Simulationen in 720p und 24 FPS mit mehreren Minuten Laufzeit. Eine Besonderheit: Die generierte Welt bleibt über Zeit hinweg physikalisch konsistent, weil sich das Modell merkt, was es zuvor erzeugt hat – eine Fähigkeit, die DeepMind nicht explizit programmiert hat.

Was macht Genie 3 besonders?

  • Autoregressives Lernen: Das Modell generiert Frame für Frame und berücksichtigt dabei vorherige Inhalte, was die Simulation realitätsnah macht.
  • Promptbare Weltereignisse: Man kann gezielt Veränderungen in der Welt per Textbefehl auslösen.
  • Keine vorgefertigte Physik-Engine: Genie 3 lernt aus Beobachtung, wie sich Objekte bewegen, fallen oder interagieren – ähnlich wie Menschen.

AGI und Lernfähigkeit durch Erfahrung

DeepMind sieht in Genie 3 einen Wendepunkt für das Training von KI-Agenten: Statt nur auf Eingaben zu reagieren, sollen Agenten planen, erkunden und durch Versuch und Irrtum lernen. Ein Beispiel: In einer Simulation mit dem Agenten SIMA musste dieser Aufgaben in einer Lagerhalle erfüllen – etwa „Gehe zum grünen Müllverdichter“. Mithilfe von Genie 3 gelang es SIMA, diese Ziele erfolgreich umzusetzen.

Grenzen und Herausforderungen

  • Physikverständnis nicht perfekt: In einer Demo wurde z. B. Schnee nicht korrekt simuliert.
  • Begrenzte Interaktionszeit: Nur wenige Minuten Simulation – für echtes Training wären Stunden notwendig.
  • Interaktionen zwischen mehreren Agenten sind bisher schwer realisierbar.

Fazit

Genie 3 ist ein beeindruckender Fortschritt im Bereich KI-Simulation. Es bietet die Möglichkeit, Agenten in komplexen, dynamischen Welten zu trainieren – mit der Aussicht auf selbstgesteuertes Lernen und Entwicklung neuer Strategien. Damit rückt ein Move-37-Moment für verkörperte KI-Agenten in greifbare Nähe – ein Meilenstein, der einst AlphaGo zur Legende machte.

DeepMind thinks its new Genie 3 world model presents a stepping stone toward AGI | TechCrunch

Schreibe einen Kommentar