Autoencoder zur Merkmalsbestimmung für die Zeichenerkennung
Typ:

Diplomarbeit

Betreuer:

Dipl.-Ing. Martin Grafmüller

Status:

abgeschlossen

Abgabedatum:

Juni 2012

Hintergrund:
Da auch in der Industrie die Zeichenerkennung immer mehr an Bedeutung gewinnt, steigt das Interesse an so genannten Smart Cameras. Sie ermöglichen es nicht nur Bilder zu erfassen, sondern sie werten diese auch aus. Dazu zählt die Segmentierung der Zeichen, Berechnung von Merkmalen, die Klassifikation und schließlich die Ausgabe des Ergebnisses. Das hat den Vorteil, dass externe Rechnersysteme weitgehend überflüssig werden, was zum einen die Kosten reduziert, aber auch eine Platzersparnis mit sich bringt.
Eine wesentliche Rolle, für die Zeichenerkennung, spielt die Berechnung von Merkmalen oder sogenannten Features, da sie den Berechnungsaufwand für den Klassifikator reduzieren und zudem Störeinflüsse unterdrücken sollen. Als Beispiel wäre hier die Discrete-Cosine-Transform (DCT) zu nennen, die auch sehr erfolgreich in der Bilddatenkompression (JPEG) eingesetzt wird. Dabei sollten die verwendeten Merkmale möglichst robust bzgl. Rauschen sein und zudem kleinere Varianzen im Aussehen der Zeichen ausgleichen. Diese Forderungen an die Merkmale sind wichtig, da sie den Klassifikator "entlasten", d.h. die Klassifikation der Zeichen wird nicht durch diese Veränderungen des Zeichens beeinträchtigt, was die Zuverlässigkeit der Klassifikation erhöht.

Aufgabe:
Um sich einen Überblick über bereits erfolgreich in der Zeichenerkennung eingesetzte Merkmale zu verschaffen, ist zunächst eine gründliche Literaturrecherche erforderlich. Weiterhin können aber auch Merkmale aus anderen Bereichen, z. B. der Gesichtserkennung, interessant sein. Hinzu kommt die Möglichkeit verschiedene Merkmale zu kombinieren oder zu erweitern, damit das gesamte Merkmal die geforderten Eigenschaften erfüllt. Eine andere Idee wäre Merkmalsberechnung und Klassifikation geschickt zu kombinieren, um so ein noch besseres Ergebnis zu erzielen. Ziel der Arbeit ist der Vergleich der Merkmale bezüglich Leistungsfähigkeit und Robustheit in Abhängigkeit von kleineren Varianzen im Aussehen und Rauschen. Die daraus gewonnenen Ergebnisse sind in einer schriftlichen Ausarbeitung festzuhalten und in einem Vortrag, hier am IES, vorzustellen.

Was Sie mitbringen sollten:
  • Freude am selbständigen Arbeiten
  • Programmierkenntnisse in C/C++ oder MATLAB
  • Grundkenntnisse der Bildverarbeitung