IU Incubator
IMA-XR

Interaktive Motion-Agent:in für XR

Projektbeschreibung

IMA-XR konzentriert sich auf Forschung und Entwicklung im Bereich multimodaler generativer künstlicher Intelligenz (KI)-Methoden für interaktive KI-Agent:innen in virtuellen (VR) und erweiterten Realitäten (XR). Während viele aktuelle Agentensysteme rein textbasiert sind und die Erstellung von 3D-Agent:innen für XR manuelle Arbeit und Expertenwissen in Animation und Scripting erfordert, zielt IMA-XR darauf ab, die Erstellung von KI-Agent:innen durch multimodale generative KI-Methoden zu erleichtern, ohne umfangreiche Expertise, manuelle Arbeit oder sehr hohe Rechenressourcen erforderlich zu machen. Langfristig könnte dies für Entwickler:innen und Content Creators für XR- und Robotikanwendungen, Bildungseinrichtungen und Trainingsanbieter, besonders in Bereichen, die Bewegungsvorführungen für Schulungszwecke beinhalten, sowie Rehabilitations- und Sporttrainer:innen für motorisches Lernen interessant sein.

Wir bauen auf bestehender Arbeit im Bereich kontextbezogenes Verständnis und Beschreibung von Bewegung (aufgezeichnete reale Bewegung) und Bewegungserzeugung auf, wobei der Kontext derzeit durch Sprache und räumliche Bedingungen vorgegeben wird. Der Fokus liegt auf der Erforschung interaktiver und ressourcenschonender Ansätze, um die Benutzerfreundlichkeit und Anpassungsfähigkeit an verschiedene Anwendungsszenarien zu verbessern. Diese Forschung zielt darauf ab, anpassbare Ansätze zu entwickeln, die die Lücke zwischen dialogbasierten (sprachgestützten) Agent:innen und der räumlichen (dreidimensionalen, bewegungsgestützten) Interaktion, die für immersive XR-Erfahrungen inklusiver digitaler Charaktere entscheidend ist, schließen. Während wir in diesem Projekt virtuelle Agent:innen in Betracht ziehen, stellt diese Forschung auch einen Vorabbereich für intuitive reale Interaktionen mit verkörperten Agent:innen (wie Robotern) dar.

Forschungsfragen:

Wie können semantisch codierte Bewegung und Sprache kombiniert werden, um natürliche, kontinuierliche Dialoge mit einem KI-Agenten in interaktiven XR-Umgebungen zu ermöglichen, während eine niedrige Latenzzeit und nutzerzentrierte Anpassung beibehalten werden?
Wie kann die räumliche/umweltbezogene Codierung und Vokabularerweiterung entwickelt werden, um kontextbewusste Bewegung-Sprache-Interaktionen über diverse XR-Anwendungsfälle hinweg zu verbessern, eventuell durch Nutzung multimodaler Eingaben (z. B. Blick, Audio)?
Wie können aktuelle multimodale Agentensysteme für kontextspezifisches Bewegungsverstehen, -beschreibung und -generierung mit minimalen Rechenressourcen angepasst werden, während ein Gleichgewicht zwischen technischer Effizienz und Anforderungen an die Nutzererfahrung (z. B. Natürlichkeit der Bewegung, Komfort) gewahrt wird?

Dauer des Projekts

10/2025 – 09/2027

Weitere Infos

Bertram Taetz
Professor für Data Science & KI
Er promovierte 2012 in Mathematik und Physik an der Ruhr-Universität Bochum. Von 2013 bis 2025 arbeitete er am DFKI und leitete ein Team für die Erfassung, Modellierung und Analyse menschlicher Bewegung basierend auf KI-Methoden. Von 2015 bis 2020 war er stellvertretender Leiter und von 2021 bis 2022 Leiter der wearHEALTH-Gruppe an der RPTU. Im Jahr 2019 mitbegründete er die sci-track GmbH. Seine Kompetenzbereiche umfassen maschinelles Lernen (probabilistische Methoden, Repräsentationslernen, kontinuierliches Lernen), Computer Vision und Sensorfusion, Mensch-Maschine-Interaktion sowie die Erfassung und Analyse menschlicher Bewegung für Anwendungen in Gesundheit, Medizin, Robotik und AR/VR/XR.

Gabriele-Bleser Taetz
Professorin für Robotik

Von 2008 bis 2024 arbeitete sie als leitende Forscherin, von 2013 bis 2014 als stellvertretende Leiterin in der Abteilung Augmented Vision am DFKI. Zuvor war sie als Forscherin am Fraunhofer IGD in Darmstadt tätig. Von 2014 bis 2021 leitete sie die wearHEALTH-Gruppe an der RPTU. Im Jahr 2019 gründete sie die sci-track GmbH mit, wo sie Geschäftsführerin ist. Ihre Forschungsbereiche sind Computer Vision, Sensorfusion, Modellierung, Erfassung und Analyse menschlicher Bewegung für Anwendungen in der Mensch-Maschine-Interaktion, Biomechanik, Ergonomie, Gesundheit, XR und Robotik.

Janki Dodiya

Professorin für Augmented/Virtual Reality und Mensch-Computer-Interaktion

Sie verfügt über mehr als ein Jahrzehnt Erfahrung in der Gestaltung immersiver Technologien für Luft- und Raumfahrt, Transport und Bildung. Zuvor war sie Senior Researcher am DLR (2012–2021) und arbeitete an Teleoperationsanwendungen für On-Orbit-Servicing und Interaktionsdesign für autonome Fahrzeuge. Ihre Forschungsinteressen sind XR, HCI, KI für XR, Avatar-Repräsentation, Benutzerfreundlichkeit und gesellschaftliche Auswirkungen neuer Technologien.

Armin Grasnick

Professor für Augmented & Virtual Reality

Nach dem Studium der technischen Optik begann er seine berufliche Laufbahn als wissenschaftlicher Mitarbeiter für das Design von Hochleistungslinsen. Während der New Economy machte er sich mit einem Start-up zur Entwicklung von 3D-Displays selbstständig und gründete in der Folge weitere Unternehmen mit 3D/VR-Fokus in Deutschland und im Ausland. Im Laufe seiner Karriere hat er mehrere Patente angemeldet und einige Bücher über virtuelle Realität geschrieben. - Generated by Syntea