Projektbeschreibung
Die optische Zeichenerkennung (OCR) wird schon seit ca. 40 Jahren erforscht. Aktuell erhält diese auch in industriellen Anwendungen wie z. B. der Pharma-, Lebensmittel-, Elektronik-, oder Automobilindustrie Einzug. Gründe dafür können sein, die Produkte anhand ihrer Produkt- oder Seriennummer automatisch zu erfassen, um diese in einer Datenbank festzuhalten, zu dokumentieren, in welchem Produkt welche Teile eingebaut wurden oder um die Produkte über den Produktions- oder Auslieferungsprozess zu verfolgen. Daher ist das Ziel, nicht nur einfach die gedruckten Zeichen (engl. Optical Character Verification) zu überprüfen, sondern auch die tatsächliche Bedeutung der Zeichen zu erfassen. Schwierig sind dabei die großen Unterschiede zwischen den verschiedenen Anwendungen. Diese werden durch unterschiedliche Materialien, z. B. Papier, Karton, Holz oder Metall, verursacht, auf denen die Zeichen gelesen werden sollen, zum anderen auch durch die Art, wie die Zeichen auf die Materialien aufgebracht sind, z. B. gedruckt, graviert oder gelasert. Je nach Anwendung variieren auch die Schriftarten. Erschwerend kommt hinzu, dass in vielen Anwendungen Punkt-Matrix-Schriften verwendet werden, deren Punkte sich innerhalb der Zeichen nicht notwendigerweise berühren müssen. Der Vorteil bei den beschriebenen Anwendungen ist, dass in der Regel die Textregion, d. h. die Region in denen die Zeichen stehen, gegeben ist, wodurch eine Suche dieser vermieden wird.
Im Rahmen dieses Projekts werden vor allem Segmentierungsverfahren untersucht, die ein zuverlässiges Ausschneiden der Zeichen aus den Bildern ermöglichen. Dazu gehört auch, dass die Ausrichtung der Zeilen und / oder die Neigung der Zeichen bestimmt wird.
Weiterhin wichtig ist die Wahl geeigneter Merkmale, die möglichst robust gegenüber Störungen sind und zudem redundante Information in den Bildern entfernen. Da bei der Klassifikation das Zusammenspiel zwischen Merkmalen und Klassifikatoren sehr wichtig ist, werden im Rahmen dieser Arbeit unterschiedliche Kombinationen betrachtet und evaluiert. Ziel ist ein robustes Verfahren, dass in den oben beschriebenen Umgebungen besteht und den in der Industrie gestellten Anforderungen genügt.
Titel | Autoren | Quelle |
---|---|---|
Performance improvement of character recognition in industrial applications using prior knowledge for more reliable segmentation | Grafmüller, M.; Beyerer, J. | Expert Systems with Applications 40 Nr. 17, S. 6955-6963, Elsevier, 2013. |
Verfahrensfortschritte in der robusten Echtzeiterkennung von Schriftzeichen | Grafmüller, M. | Dissertation, Schriftenreihe Automatische Sichtprüfung und Bildverarbeitung; 5, KIT Scientific Publishing, 2013. |
Multi-Label Graph Cuts including Prior Knowledge for Character Segmentation | Grafmüller, M. | Technischer Bericht IES-2012-09. In: Beyerer, J.; Pak, A. (Hrsg.), Proceedings of the 2012 Joint Workshop of Fraunhofer IOSB and Institute for Anthropomatics, Vision and Fusion Laboratory, S. 123-137, KIT Scientific Publishing, 2012. |
Robust High Performance Character Segmentation Based on Projections and Graph Cuts | Grafmüller, M.; Beyerer, J. | Rao, K. R. (Hrsg.), Proceedings of the 13th IASTED International Conference on Signal and Image Processing, 2011. |
Adaptive Segmentierung von gedruckten Punkt-Matrix-Zeichen aus Grauwertbildern | Grafmüller, M.; Beyerer, J. | Puente León, F.; Heizmann, M. (Hrsg.), Forum Bildverarbeitung, S. 253-264, KIT Scientific Publishing, 2010. |
A First Approach to Typewritten Character Segmentation using Graph Cuts | Grafmüller, M. | Technischer Bericht IES-2010-11. In: Beyerer, J.; Huber, M. (Hrsg.), Proceedings of the 2010 Joint Workshop of Fraunhofer IOSB and Institute for Anthropomatics, Vision and Fusion Laboratory, Karlsruher Schriften zur Anthropomatik, Bd. 7, S. 151-164, KIT Scientific Publishing, 2010. |
Decision Tree Classifier for Character Recognition Combining Support Vector Machines and Artificial Neural Networks | Grafmüller, M.; Beyerer, J.; Kroschel, K. | Mathematics of Data/Image Coding, Compression, and Encryption with Applications, Proceedings of SPIE Vol. 7799, 2010. |
Segmentation of Printed Gray Scale Dot Matrix Characters | Grafmüller, M.; Beyerer, J. | Baralt, J.; Callaos, N.; Hashimoto, S.; Lesso, W.; Zinn, D. (Hrsg.), Proceedings of the 14th World Multi-Conference on Systemics, Cybernetics and Informatics (WMSCI), Bd. II, S. 87-91, 2010. |
Character Recognition based on Trellis Diagrams | Grafmüller, M.; Beyerer, J.; Kroschel, K. | Proceedings of the 17th International Conference on Systems, Signals and Image Processing (IWSSIP), 2010. |
A First Approach to Trellis-Based Classification | Grafmüller, M. | Technischer Bericht IES-2009-12. In: Beyerer, J.; Huber, M. (Hrsg.), Proceedings of the 2009 Joint Workshop of Fraunhofer IOSB and Institute for Anthropomatics, Vision and Fusion Laboratory, S. 175-185, KIT Scientific Publishing, 2009. |