Die Zukunft personalisierter Robotik: DFKI optimiert Systementwicklung mit hybrider KI und menschlichem Feedback

Robotik

Veröffentlicht 18.10.2024 10:00, Dagmar Finlayson

Die jüngsten Entwicklungen in der Robotik lassen die Vision von Robotern, die als persönliche Assistenten und Interaktionspartner für den Menschen komplexe Aufgaben übernehmen, in greifbare Nähe rücken. Forschende des Deutschen Forschungszentrums für Künstliche Intelligenz (DFKI) in Bremen haben im Rahmen des vom Bundesministerium für Bildung und Forschung (BMBF) geförderten Projekts M-Rock einen wichtigen Schritt in diese Richtung getan. Mit innovativen Ansätzen, die auf hybriden KI-Methoden und menschlichem Feedback basieren, ist es ihnen gelungen, die Sicherheit und Adaptivität des Roboterverhaltens deutlich zu erhöhen.

Die fortschreitende Digitalisierung, leistungsfähige Hardware und KI-basierte Datenverarbeitung schaffen die Voraussetzungen für Roboter als flexible und sichere KI-Assistenten der Zukunft. Diese müssen sich an unterschiedlichste Umgebungen und Anforderungen anpassen können – sei es in der Produktion, der Logistik, der Pflege oder im Alltag. Ihre Akzeptanz hängt aber entscheidend von der Möglichkeit ab, sie individuell zu gestalten. Genau hier setzte das jetzt abgeschlossene Projekt M-Rock an. Als Teil der X-Rock Entwicklungen am DFKI Robotics Innovation Center baut M-Rock auf den Ergebnissen der Projekte D-Rock und Q-Rock auf und trägt zum Gesamtziel von X-Rock bei: Menschen ohne Fachkenntnisse in die Lage zu versetzen, maßgeschneiderte Roboter für ihre Anwendungen zu entwickeln.

Integration von menschlichem Feedback in die Systementwicklung

Während in D-Rock der Aufbau einer umfangreichen Datenbank modularer Roboterkomponenten im Vordergrund stand, ermöglicht der in Q-Rock entwickelte Ansatz die automatische Abbildung komplexer Hard- und Softwarestrukturen auf konkretes Roboterverhalten mittels hybrider KI-Verfahren wie Maschinellem Lernen und strukturellem Schlussfolgern. M-Rock erweitert diesen Ansatz durch die Integration von menschlichem Feedback, um das Verhalten nicht nur softwareseitig an die individuellen Anforderungen des Benutzenden anzupassen, sondern auch eine nachträgliche Optimierung hinsichtlich des Verhaltens und der Hardwareauswahl zu ermöglichen. Damit bietet das Projekt nicht nur eine Lösung zur kontinuierlichen Anpassung von Robotern im laufenden Betrieb, sondern auch ein Werkzeug zur Personalisierung von Roboterdesign und -verhalten.

Studien belegen Nutzen von explizitem und implizitem Feedback

Eine zentrale Neuerung von M-Rock ist die Kombination von explizitem Feedback, z.B. in Form von Skalenbewertungen, mit implizitem Feedback wie Hirn- und Muskelaktivität (EEG- und EMG-Daten) zur automatischen Anpassung eines Roboters an die individuellen Anforderungen und Präferenzen des interagierenden Menschen. Um die Rolle des menschlichen Feedbacks zu untersuchen, führten die Bremer Forschenden vier Studien durch. Dazu zeichneten sie die EEG-Daten von Versuchspersonen auf, die einmal Fehler im kontinuierlichen Roboterverhalten und einmal in menschlichem Verhalten beobachteten. Anschließend analysierten die Forschenden die Daten hinsichtlich des so genannten fehlerbezogenen Potenzials, das im menschlichen Gehirn beim Erkennen von Fehlverhalten ausgelöst wird.

In weiteren Studien wurde sowohl implizites als auch explizites Feedback erhoben. Zum einen bei Versuchspersonen, die das Fehlverhalten einer getragenen Ellenbogenorthese wahrnahmen, zum anderen bei der Beobachtung von Fehlverhalten an einem Pendelroboter. Die Analyse der EEG-Daten zeigte in allen Studien eine hohe Genauigkeit der fehlerbezogenen Potentialerkennung. Es konnte gezeigt werden, dass durch implizites Feedback Fehler in Echtzeit erkannt werden können – sei es bei Robotern, menschlichen Bewegungen oder Orthesen. Dies kann wiederum vom System genutzt werden, um automatisch Anpassungen vorzunehmen, ohne dass der Benutzende aktiv eingreifen muss.

Optimal Cognitive Cores generieren natürliche Roboterbewegungen

Eine weitere Errungenschaft von M-Rock ist die Weiterentwicklung der in Q-Rock eingeführten Cognitive Cores (CCs) zu Optimal Cognitive Cores (OCCs) durch Methoden der optimalen Steuerung. OCCs ermöglichen die Generierung und Ausführung von natürlichem Verhalten für komplexe Systeme und verbessern die Interaktion mit dem Menschen durch präzise Beschreibungen der Roboteraufgaben. Sie verwenden mathematische Modelle, um optimale Lösungen für komplexe Steuerungsprobleme zu finden, wobei Faktoren wie Energieverbrauch, Zeit und Sicherheit berücksichtigt werden. In Versuchen mit dem humanoiden Roboter RH5 ist es den Forschenden gelungen, mit Hilfe von OCCs erfolgreich Tanz- und Gehbewegungen zu erzeugen.

Menschliches Feedback kann zur Verbesserung der Optimal Cognitive Cores (OCCs) und damit zur Verfeinerung des Roboterverhaltens beitragen. Es wird verwendet, um Kostenfunktionen zu erstellen, die bei der Planung optimaler Trajektorien helfen. So lernt der Roboter auf der Grundlage menschlicher Bewertungen, welche Bewegungen effizient sind, und kann besser auf dynamische Umgebungen reagieren.

Erfolgreiche Evaluierung der entwickelten Methoden

Die in M-Rock entwickelten Technologien wurden in zwei Anwendungsszenarien evaluiert. Im ersten Szenario testeten die Forschenden den sogenannten „Assist-as-Needed“-Ansatz eines Exoskeletts, das die robotische Unterstützung individuell an die Nutzenden anpasst. Die Testpersonen führten verschiedene Armbewegungen aus, während ihre Muskelaktivität (EMG-Daten) als Feedback für ein neuronales Netz zur Vorhersage der Gelenkkräfte diente. Die Ergebnisse zeigten, dass das Exoskelett in der Lage ist, die jeweiligen Fähigkeiten der Benutzenden anhand der EMG-Daten zu bewerten und sie flexibel und individuell pro Gelenk zu unterstützen.

Im zweiten Szenario lag der Fokus auf der gemeinsamen Optimierung von Verhaltens- und Designparametern eines vierbeinigen Roboters für Sprünge und Rückwärtssalti. Optimal Cognitive Cores (OCCs) halfen dabei, die Bewegungen des Roboters an die jeweilige Aufgabe anzupassen und die optimale Morphologie auszuwählen. Tests am realen System ergaben, dass längere Oberschenkel für Vorwärtssprünge und längere Unterschenkel für Rückwärtssalti die besten Ergebnisse lieferten.

Die wissenschaftlichen Ergebnisse des Projekts wurden in mehr als 30 Publikationen veröffentlicht, darunter Dissertationen, Artikel in hochrangigen Zeitschriften und Konferenzbeiträge auf international renommierten Robotik-Konferenzen.

M-Rock wurde vom 01.08.2021 bis 31.07.2024 mit Mitteln des Bundesministeriums für Bildung und Forschung unter dem Förderkennzeichen 01IW21002 gefördert.

Bild: M-Rock: Robotersysteme können mithilfe von hybriden KI-Methoden und basierend auf menschlichem Feedback, das z.B. durch EEG-Messungen gewonnen wird, maßgeschneidert entwickelt und im laufenden Betrieb kontinuierlich angepasst werden. ©Meltem Fischer

Quelle: Deutsches Forschungszentrum für Künstliche Intelligenz GmbH, DFKI