Automatisierung wird zur Zeit vor allem durch Künstliche Intelligenz vorangetrieben. Dies gilt auch für die Wiedererkennung von Objekten wie Bauteilen oder Baugruppen mittels Bildern. Das mögliche Anwendungsspektrum in der Produktion ist breit. Bildhafte Wiedererkennung ist überall dort interessant, wo herkömmliche Identifikationsverfahren mit Barcode/RFID nicht mehr ausreichen. Dies betrifft die Wareneingangskontrolle genauso wie das Produkttracking in der Produktion, die Ersatzeillogistik und die Rücknahme von Objekten. Durch eine (teilweise) Automatisierung der Objekt-Identifikation können Kosten gespart, Fachwissen erhalten und eine lückenlose Prozessdokumentationen gesichert werden.
Warum der Aufwand für die Erstellung eines Datensatzes so aufwändig ist
Möglich wird eine Automatisierung durch Deep Learning, eine Teildisziplin der Künstlichen Intelligenz. Eine der effizientesten Deep-Learning-Methoden in diesem Bereich sind Faltungsbasierte Neuronale Netze (Convolutional Neural Networks/CNN). Diese Neuronalen Netze erlernen auf Grundlage von Trainingsdaten bestimmte Merkmale aus Bildern zu extrahieren und so das Objekt in einem Bild einer Klasse zuzuordnen. Da das Ergebnis vor allem von den vorliegenden Daten (dem eigentlichen Bild und einer Annotation) abhängig ist, nennt man Faltungsbasierte Neuronale Netze auch “datengetriebene” Algorithmen.
Neben der oft fehlenden Expertise im Bereich KI, ist die Schaffung der erforderlichen Datengrundlage die größte Hürde für eine geplante Umsetzung. Wie groß der Erfassungsaufwand für die Daten ist, kann man aus dem wohl weltweit bekanntesten Datensatz ImageNet ableiten. Er dient in vielen wissenschaftlichen Publikationen zur Evaluierung von CNN-Methoden, denn er enthält circa 1,2 Millionen Bilddaten für 1000 Klassen, also 1200 Daten pro Objekt. Nimmt man an, dass die Aufnahme und Annotation eines Bildes rund 2 Sekunden dauert, so ergibt sich für 1000 annotierte Bilddaten pro Objekt ein zeitlicher Aufwand von circa 30 Minuten. Hat ein Industrieunternehmen beispielsweise 5000 Objekte im Sortiment, dauert die Datensatzerstellung also rund 347 Arbeitstage. Selbst bei 500 Bildern pro Objekt sind es immer noch rund 173 Tage.
Um diesen enormen zeitlichen Aufwand zu reduzieren, befasst sich das Fraunhofer IPK seit mehreren Jahren mit der Frage, auf welchem Wege die erforderliche Menge an Daten verringert und die Schaffung der notwendigen Datengrundlage effizient in bestehende Prozesse eingebunden werden kann.
Mit viel Erfahrung bei der Datenaufnahme, gezielter Augmentierung und vortrainierten Neuronalen Netzen zu schnelleren Ergebnissen
Hierzu werden aktuelle Forschungsergebnisse zu Themen wie Transfer-Learning, Augmentierung (Erweiterung) und effizientem Training genutzt. Beim Transfer-Learning werden beispielsweise vortrainierte Netze für die Aufgabe herangezogen und mit dem Datensatz der Zieldomäne, wie etwa elektrische Komponenten, nur auf diesen Anwendungsfall spezialisiert. So kann man die schon erlernte Fähigkeit der Merkmalsextraktion der vortrainierten Netze nutzen und fokussiert diese auf die zu erkennenden Objekte. Durch Augmentierung, kann ein Datensatz künstlich erweitert werden. Dazu werden die Bilder unter anderem rotiert, gespiegelt oder ein Farbrauschen eingebracht.
Lesen Sie über einen mechatronik.info-Premium-Account weiter und laden Sie sich hier den vollständigen Artikel als PDF-Datei herunter:
Folgen Sie uns @ Social Media!
Facebook: www.facebook.com/MECHATRONIK.INFO
Twitter: www.twitter.com/MECHATRONIK_CM
Instagram: www.instagram.com/mechatronik_cm ut – und es gab keinen Ersatz mehr für die Schallisolierung.“ |