Single-Shot Lernverfahren zur echtzeitfähigen Erstellung ansichtenbasierter Objektrepräsentationen

J. Bauch


Im Rahmen dieser Arbeit soll ein Verfahren entwickelt und evaluiert werden, das die Anzahl der benötigten Trainingsbilder für eine Objektklassifizierung im Vergleich zu einem konventionellen Training stark reduziert. Im Rahmen eines konventionellen Trainings eines Objektklassifizierers werden sehr viele Beispielbilder benötigt, damit ein Klassifizierer zuverlässige Ergebnisse liefert. Oftmals ist die Beschaffung solcher Beispielbilder aber mit hohem Aufwand verbunden, da diese manuell vorgegeben werden müssen. Dies soll im Rahmen dieser Arbeit dadurch umgangen werden, dass auf einem einzelnen oder mehreren Trainingsbildern geometrische Bildtransformationen ausgeführt werden. Durch die transformierten Bilder wird eine größere Menge an künstlichen Trainingsbildern generiert. Mithilfe der Transformationen sollen Erscheinungsänderungen eines Objekts von Interesse robust beschrieben werden, die etwa durch Änderungen der Objekt- oder Kameraposition entstehen. Des Weiteren soll das Verfahren lernfähig sein, so dass bereits klassifizierte Bilder zu den Trainingsdaten hinzugefügt werden können und dadurch die Zuverlässigkeit des Klassifizierers erhöhen.