Erkennungsbasierte Segmentierung von gedruckten Zeichen
Typ:

Diplomarbeit

Betreuer:

Dipl.-Ing. Martin Grafmüller

Status:

abgeschlossen

Abgabedatum:

Juli 2011

In der Verpackungsindustrie benötigt man Systeme, welche automatisch die Korrektheit von aufgedruckten Zeichenketten wie z.B. Seriennummern überprüfen. Dazu wird eine optische Zeichenerkennung (OCR) durchgeführt. Für diese Erkennung benötigt man eine Segmentierung des Textes in seine einzelnen Zeichen. In dieser Arbeit wird ein Ansatz vorgestellt, der diese Segmentierung robust und effizient ausführt. Im Unterschied zu OCR Systemen für Schriftstücke, werden keine Wörterbücher verwendet oder Einschränkungen auf bestimmte Schriftarten gemacht. Erschwerend kommt hinzu, dass die Aufnahmen oftmals nicht optimal sind und vielen Störungen unterliegen. Um möglichst wenige Informationen zu verlieren, werden daher durchgehend Grauwertbilder verwendet.

Die Idee dieser Arbeit ist es zwei Segmentierungsverfahren miteinander zu kombinieren. Dadurch sollen die Schwächen des einen Verfahrens mit den Stärken eines anderen ausgeglichen werden. Hier wird zuerst eine Segmentierung aufbauend auf Projektionsprofilen angewendet. Sie ist schnell und fehlerarm, erkennt jedoch nicht alle Zeichenzwischenräume. Fehlerhafte Bereiche werden dann mit einem Verfahren, aufbauend auf einem vereinfachten kürzesten Pfad Algorithmus, segmentiert. Es segmentiert nahezu alle Zeichen, neigt jedoch dazu, einzelne Zeichen zu zerschneiden. Durch Anwendung des zweiten Verfahrens ausschließlich auf die falschen Segmentierungen des ersten, kombiniert man die Stärken beider Verfahren. Für die Erkennung einer fehlerhaften Segmentierung, wird eine Support Vektor Maschine (SVM) trainiert. Dazu wird die SVM mit einem Datensatz aus gültigen und ungültigen Zeichen trainiert. Zusätzlich werden Ansätze zur Verkleinerung des Merkmalsraums vorgestellt und verglichen, die zudem eine schnelle Klassifikation erlauben.