Robotics and Biology Laboratory

Learning Robotic Perception Through Prior Knowledge

Rico Jonschkowski

Titel: Learning Robotic Perception Through Prior Knowledge

Zusammenfassung:

Intelligente Roboter müssen in der Lage sein zu lernen; sie müssen in der Lage sein, ihr Verhalten aufgrund von Erfahrungen anzupassen. Eine Verallgemeinerung auf der Grundlage früherer Erfahrungen ist jedoch nur auf der Grundlage von Annahmen oder Vorwissen (kurz: Priors) darüber möglich, wie die Welt funktioniert.

Ich untersuche die Rolle dieser Vorannahmen für das Wahrnehmungslernen. Obwohl Prioritäten beim maschinellen Lernen eine zentrale Rolle spielen, sind sie oft in den Details der Lernalgorithmen verborgen. Wenn wir diese Prioritäten explizit machen, können wir sehen, dass die derzeit verwendeten Prioritäten die Welt aus der Perspektive eines passiven, desinteressierten Beobachters beschreiben. Solche generischen KI-Prioritäten sind nützlich, weil sie für Wahrnehmungsszenarien gelten, in denen es keinen Roboter gibt, wie z. B. bei der Bildklassifizierung. Diese Priors sind zwar für das Erlernen der Roboterwahrnehmung nützlich, aber sie lassen einen wichtigen Aspekt des Problems außer Acht: den Roboter.

Roboter sind weder desinteressiert noch passiv. Sie versuchen, Aufgaben zu erfüllen, indem sie mit der sie umgebenden Welt interagieren, was dem Problem eine zusätzliche Struktur verleiht und neue Arten von Prioritäten ermöglicht, die ich robotische Prioritäten nenne. Die Fragen lauten: Was sind die richtigen Roboterprioritäten und wie können sie zum Lernen genutzt werden? 

Ich untersuche diese Fragen anhand von drei verschiedenen Wahrnehmungsproblemen, die auf rohem visuellem Input basieren: 1. Erlernen der Objektsegmentierung für das Aufnehmen von Objekten in der Amazon Picking Challenge, 2. Erlernen der Zustandsschätzung für Lokalisierung und Tracking und 3. unbeaufsichtigtes Lernen von Zustandsrepräsentationen, die das Reinforcement Learning erleichtern.

Um diese Probleme zu lösen, schlage ich drei Quellen von Vorwissen vor - 1. die Aufgabe des Roboters, 2. die Roboteralgorithmen und 3. die Physik - und entwickle Möglichkeiten, diese Vorannahmen für die entsprechenden Lernprobleme zu kodieren. Einige dieser Vorannahmen lassen sich am besten als harte Einschränkungen kodieren, die den Raum der beim Lernen berücksichtigten Hypothesen einschränken. Andere Prioritäten sind besser geeignet, um als Präferenzen für bestimmte Hypothesen in Form von Lernzielen kodiert zu werden. 

Meine Experimente zu diesen Problemen zeigen durchweg, dass roboterspezifisches Vorwissen zu effizienterem Lernen und besserer Generalisierung führt. Basierend auf diesen Ergebnissen schlage ich vor, eine priorenzentrierte Perspektive auf das maschinelle Lernen einzunehmen, woraus folgt, dass wir robotikspezifische maschinelle Lernmethoden benötigen, die geeignete Priors einbeziehen.

Mai 2018