KIT - IES - Studentenarbeit

Aktive Objekterkennung durch Planung der nächstbesten Kameraposition

Typ:	Studienarbeit
Betreuer:	Dr.-Ing. Marco Huber
Status:	abgeschlossen
Abgabedatum:	Juli 2011

In der Bildverarbeitung bezeichnet die Objekterkennung die Identifikation eines Objekts bzw. die Zuordnung eines Objekts zu einer bestimmten Klasse. Typischerweise erfolgt die Objekterkennung passiv, d. h. die Parameter der Kamera (Position, Orientierung, Blende, Beleuchtung usw.) werden nicht verändert. Die Erkennung erfolgt somit lediglich algorithmisch ohne Rückkopplung an die Kamera. In dieser Arbeit soll ein Verfahren zur aktiven Objekterkennung entwickelt werden, welches auf der Grundlage der aktuellen Güte der Objekterkennung die Position der Kamera im Raum gezielt variiert, um eine Verbesserung der Objekterkennung zu erzielen. Dieses aktive Vorgehen ist insbesondere bei Objekten sinnvoll, die je nach Perspektive nicht von anderen Objekten unterscheidbar sind oder durch andere Gegenstände (teilweise) verdeckt werden.

In dieser Arbeit wird von statischen Objekten ausgegangen, d. h. die Lage und Erscheinung des Objekts bleiben über die Zeit unverändert. Zur Klassifikation der Objekte wird ein Bayes'scher Klassifikator eingesetzt. Ein informationstheoretisches Gütemaß dient zur Bewertung möglicher nächster Kamerapositionen. Die Beste dieser Positionen wird mittels einer Ein-Schritt-Planung berechnet. Man spricht in diesem Zusammenhang auch von der Nächstbesten-Sicht (engl. Next-Best-View). Zwecks einer schnellen Online-Berechnung, erfolgen das Einlernen des Klassifikators - genauer das Lernen der Likelihood-Funktionen jeder Objektklasse - und die eigentliche Planung entkoppelt, so dass nur die Planung online durchzuführen ist. Im Gegensatz zum Stand der Technik, wird in dieser Arbeit von einem kontinuierlichen Aktionsraum, d. h. unendlich vielen Kamerapositionen, ausgegangen.