Künstliche Intelligenz verschafft der industriellen Bilderfassung ganz neue, faszinierende Möglichkeiten. Die Technologie hat aber auch ihre Grenzen.

Künstliche Intelligenz verschafft der industriellen Bilderfassung ganz neue, faszinierende Möglichkeiten. Die Technologie hat aber auch ihre Grenzen. (Bild: Adobe Stock – amrets)

Betrachtet man die Entwicklung im Bereich der Consumer-Technologie, so scheint es manchmal, als ob künstliche Intelligenz die Lösung für nahezu jede erdenkliche Aufgabe wäre. Bei neuen Geräten oder Software-Anwendungen erwartet man heutzutage, dass zumindest ein Teil von ihnen auf KI basiert. Zweifellos kann man auch von einem gewissen Hype um die Technologie sprechen, der von ihren vielversprechenden Möglichkeiten und Erfolgen befeuert wird. Selbst in industriellen Anwendungen wie der Automatisierung und Qualitätssicherung von Produktionsprozessen tragen die Fähigkeiten der KI kontinuierlich zu immer fortschrittlicheren Lösungen bei.

In Kürze

● Maschinelles Lernen eröffnet in der Bildverarbeitung neue Möglichkeiten.
● Dabei werden ohne explizite Programmierung Erkenntnisse aus Daten extrahiert.
● Risiko: Mangelnde Qualität des Inputs führt zu mangelhaftem Output.

Insbesondere das maschinelle Lernen eröffnet völlig neue Möglichkeiten, die durch herkömmliche regelbasierte Bildverarbeitung nicht abgedeckt werden können. Trotzdem ist es von entscheidender Bedeutung, die Technologie realistisch und kritisch zu bewerten, um ihre tatsächlichen Anwendungen und Grenzen klar zu verstehen. Denn es ist offensichtlich, dass KI kein vor­übergehender Trend ist, der bald wieder in Vergessenheit gerät. Ihre Fähigkeit, komplexe Aufgaben mit hoher Präzision in vielen Anwendungsbereichen zu bewältigen, macht sie äußerst wertvoll für Unternehmen. Ihre Entwicklung schreitet ständig voran und wird durch Forschungsinvestitionen und Förderprogramme weiter beschleunigt. Langfristig wird KI als Game Changer in nahezu allen Lebensbereichen unverzichtbar sein.

AI-Vision in industriellen Anwendungen

Speziell in Industrieanwendungen stützt sich KI-basierte Bildverarbeitung hauptsächlich auf Methoden des maschinellen Lernens. Bei diesem Ansatz werden Computerprogramme dazu befähigt, aus Erfahrung zu lernen und automatisch Muster und Erkenntnisse aus Daten zu extrahieren, ohne explizite Programmierung. Dies geschieht durch die Anpassung von Algorithmen und Modellen an Daten, um Vorhersagen, Mustererkennung und Entscheidungsfindung zu ermöglichen.

Ihre Stärke beweisen KI-basierte Methoden vor allem bei Bilddaten mit sehr variantenreichen Inhalten. So werden Muster und Merkmale erkannt, die mit regelbasierter BV kaum eindeutig als wiederkehrende Form, Farbe oder Lage zu definieren wären. Die zur Erkennung relevanten Objektmerkmale werden aber nicht mehr durch eine vorab festgelegte Programmabfolge vorgegeben. Neuronalen Netzen wird in einer Lernphase beigebracht, diese durch wiederkehrendes Sehen mit zugeordneten Begriffen (‚Labels‘) zu assoziieren. Das erfordert oft eine große Menge an Beispielbildern der Lerninhalte. Je variantenreicher diese ausfallen, desto stabiler erkennen die ML-Algorithmen im Regelbetrieb deren relevanten Merkmale auch in unbekannten Szenen.

IDS NXT ermöglicht die Umsetzung vieler einfacher Bildanalysen von der Idee bis zum voll funktionsfähigen Embedded-KI-Vision-System, ohne dass dazu Vorkenntnisse erforderlich sind.
IDS NXT ermöglicht die Umsetzung vieler einfacher Bildanalysen von der Idee bis zum voll funktionsfähigen Embedded-KI-Vision-System, ohne dass dazu Vorkenntnisse erforderlich sind. (Bild: IDS)

Unterschied zu bisherigen Herangehensweisen

Regelbasierte Bildverarbeitungsalgorithmen sind oft speziell für bestimmte Anwendungen entwickelt und können nur schwer auf neue Aufgaben übertragen werden. KI-Modelle können hingegen durch das ‚Transferlernen‘ auf eine Aufgabe trainiert und dann auf verwandte Aufgaben übertragen werden, ohne von Grund auf neu trainiert zu werden. Dies erleichtert die Wiederverwendung von Modellen und beschleunigt die Entwicklung neuer Bildverarbeitungsanwendungen.

Die Schlüsselkompetenzen für die Arbeit mit Machine-Learning-Methoden sind jedoch nicht mehr dieselben, wie für regelbasierte Bildverarbeitung. Entscheidend für die Qualität der Ergebnisse ist nicht mehr das Produkt eines manuell entwickelten Programmcodes durch einen Bildverarbeitungsexperten, sondern wird durch den Lernprozess mit geeigneten Beispieldaten bestimmt. Dafür ist ein tiefes Verständnis der jeweiligen Anwendung erforderlich. Mit den richtigen Werkzeugen sind Machbarkeitsanalysen dann allein von Domain-Experten durchführbar, die selbst am meisten Kenntnis von Produkten und deren Besonderheiten haben. Unternehmen sind so in der Evaluationsphase weniger auf Programmierer und Bildverarbeitungsexperten angewiesen.

Industriebereiche profitieren von AI-Vision

KI-Systeme können Bilder in verschiedene Kategorien einordnen, was bei Anwendungen wie Bilderkennung oder der Erkennung und Klassifizierung von Produkten sehr hilfreich ist. Darüber hinaus kann KI-basierte Bildverarbeitung viele Aufgaben automatisieren, die zuvor manuell von Menschen durchgeführt wurden, wie die Identifizierung von Fehlern oder die Sortierung von Objekten auf Förderbändern. Speziell die Fähigkeit, komplexe Muster und Strukturen in Bildern zu erkennen, selbst wenn sie für das menschliche Auge schwer zu erfassen sind, macht sie zu einem wichtigen Werkzeug in der Qualitätssicherung. Insgesamt führt die Integration von KI-basierter Bildverarbeitung in diesen Industriezweigen zu einer Steigerung der Effizienz, Qualität, Sicherheit und Wirtschaftlichkeit.

AI-Vision unterstützt die Nachhaltigkeitsziele der Industrie

Mit der Fähigkeit, Produktionsprozesse zu überwachen und gezielt zu steuern, können Unternehmen Ressourcen wie Wasser, Rohstoffe und Energie viel effizienter einsetzen. Dies trägt zur Reduzierung von Ausschuss und ­Abfall bei, was wiederum Ressourcen und Energie spart. Indem sie die Effi­zienz, Qualität und Nachhaltigkeit von Produktionsprozessen verbessern, können KI-gestützte Industriekameras dazu beitragen, die Umweltauswirkungen der Industrie zu minimieren und gleichzeitig die wirtschaftliche Rentabilität zu steigern.

Qualitätskontrolle und -sicherung mit KI-Unterstützung

Speziell die Methoden zur Anomalie-Erkennung können sehr effektiv darauf trainiert werden, defekte Produkte oder Komponenten zu identifizieren, indem sie Unregelmäßigkeiten, Risse, Abweichungen von Spezifikationen oder andere Mängel in Bildern erkennen. Dies ermöglicht eine sofortige Erfassung von Fehlern und die Aussortierung fehlerhafter Produkte. Ein frühzeitiges Aufspüren von Qualitätsproblemen und die sofortige Aussortierung defekter Produkte reduziert den Ausschuss, was Kosten einspart und die Produktivität steigert. Da die Anomalie-Methode sowohl bekannte als auch unbekannte Abweichungen erkennt wie beispielsweise Verschleißmuster, kann sie auch ideal zur Vorhersage von Wartungsbedarf in Maschinen und Anlagen eingesetzt werden. Jeder Hinweis auf potenzielle Probleme trägt zur präventiven Wartung bei und minimiert damit ungeplante Ausfallzeiten.

Bleiben Sie informiert

Diese Themen interessieren Sie? Mit unserem Newsletter sind Sie immer auf dem Laufenden. Gleich anmelden!

Mehrwert für Embedded Vision

Dass KI-basierte Methoden gänzlich anders funktionieren, ermöglicht Herstellern wie IDS neuartige Entwicklungswerkzeuge für die Bildverarbeitung zu entwickeln, die viel intuitiver einsetzbar sind. Mit ihnen können schon heute menschliche Qualitätsanforderungen auf  Bildverarbeitungssysteme übertragen werden. Davon profitiert gerade die sehr komplexe Entwicklung von Embedded Systemen, die bisher besonderes Fachwissen erfordert.

Das IDS NXT KI-Komplettsystem ist ein gutes Beispiel dafür, wie einfach BV-Prozesse entwickelt und auf einem kleinen PC-unabhängig arbeitenden System in Betrieb gehen können. Alleine die Tatsache, dass ein Großteil des Entwicklungs- und Evaluierungsprozess in einem einfach und intuitiv bedienbaren Cloud-Service erledigt werden kann, ohne dass man dazu spezielle Erfahrung in KI, Anwendungsprogrammierung oder Bildverarbeitung besitzen muss, bringt Embedded Vision ganz neuen Zielgruppen näher.

Des Weiteren lassen sich KI-basierte Algorithmen sehr gut parallelisieren, sprich mit entsprechender Hardware effektiv beschleunigen, um große Datenmengen in Echtzeit zu verarbeiten und zwar nicht nur mit leistungsfähigen GPUs (graphic processing units) in großen Rechenzentren. Durch das Aufkommen von speziellen NPUs (neural processing unit) kann AI-Vision auch sehr energieeffizient mit kleinen Embedded-Vision-Geräten ausgeführt werden. Dies ermöglicht den skalierbaren Einsatz der Technologie, je nach Anwendungsanforderungen auf unterschiedlichen Hardware-Plattformen.

 

Zunehmende Anomalie-Fehler können auf eine Verschlechterung eines Anlagenzustands durch Werkzeugverschleiß, Schmutz oder andere Störeinflüsse hindeuten.
Zunehmende Anomalie-Fehler können auf eine Verschlechterung eines Anlagenzustands durch Werkzeugverschleiß, Schmutz oder andere Störeinflüsse hindeuten. (Bild: IDS)

Wo die Grenzen von AI-Vision liegen

Es ist schwer zu sagen, wo die Grenzen einer Technologie stecken, solange sich diese noch so stark entwickelt und es an Erfahrung fehlt. Grenzen der AI-Vision zeigen sich beispielsweise dann, wenn nicht die gewünschten Ergebnisse erzielt werden. Was nicht zwingend technologisch bedingt sein muss, sondern meist durch mangelnde Erfahrung mit KI-Methoden entsteht. Der größte Aufwand und gleichzeitig das größte Fehlerpotenzial gegenüber regelbasierten Methoden liegt darin, ausreichend gute und passende Beispieldaten für den Lernprozess bereitzustellen.

Mangelnde Qualität des Inputs führt zu mangelhaftem Output. Ein KI-System ist auf Daten angewiesen, von denen es ‚richtiges Verhalten‘ lernen kann. Wenn eine KI unter Laborbedingungen mit Daten aufgebaut wird, die nicht repräsentativ für die späteren Anwendungen sind, oder noch schlimmer, wenn die Muster in den Daten Vorurteile widerspiegeln, wird das System diese Vorurteile adaptieren. Datenverzerrungen, sogenannte Biasse, können die Folge sein, durch die ein neuronales Netz bei der Inferenz voreingenommene Entscheidungen treffen würde.

Doch selbst wenn neuronale Netze für viele visuelle Aufgaben zuverlässig trainiert werden können ergeben sich immer wieder Grenzen und Herausforderungen. Deshalb ist es wichtig, realistische Erwartungen an die Fähig­keiten von KI-Systemen zu haben und anzuerkennen, dass sie in einigen Fällen menschliche Expertise und Interpretation ergänzen, aber nicht vollständig ersetzen können.

Die Herausforderungen in industriellen KI-Projekten

Man sollte sich deshalb klarmachen, dass KI weder Zauberei noch so intelligent ist, erahnen zu können, was wir von ihr erwarten. KI-basierte Bildverarbeitung ist ein mächtiges Werkzeug, wenn es richtig eingesetzt wird. Dazu ist einmal mehr wichtig, die Aufgabe eines Vision-Systems genau zu klären. Je eindeutiger die Frage nach einem bestimmten Ergebnis gestellt wird, desto genauer können die passenden Lerninhalte für den Trainingsprozess vorbereitet werden.

Die Herausforderung liegt des Weiteren darin, unerwünschte Ergebnisse auf den Lernprozess, also auf den Wissenstransfer zurückzuführen, anstatt zu versuchen, die Entscheidungsfindung genau zu kontrollieren, wie es im regelbasierten System notwendig war. Die Inferenz, die viele als Blackbox bezeichnen, ist nur die Summe der richtigen Eingangsdaten. Je besser man das System schult, desto wahrscheinlicher ist das erwartete Ergebnis. Ein gewisses Umdenken ist dazu notwendig.

Die Arbeitsweise eines trainierten neuronalen Netzes basiert zwar lediglich auf Statistiken, Häufigkeiten, also Mathematik – doch rein mit dem menschlichen Verstand ist sie nur schwer nachvollziehbar. Mit Confusion Matrix und Heatmaps gibt es jedoch Werkzeuge, um Entscheidungen und Gründe für Entscheidungen sichtbar und damit verständlich zu machen. Mit Hilfe solcher Software-Werkzeuge können Anwender das Verhalten und die Ergebnisse der Inferenz direkter auf Schwächen innerhalb des Trainingsdatensatzes zurückführen und diese gezielt ausbessern. So wird die KI für jeden erklär- und nachvollziehbarer.

Bleiben Sie informiert

Diese Themen interessieren Sie? Mit unserem Newsletter sind Sie immer auf dem Laufenden. Gleich anmelden!

Umdenken wird sich auszahlen

Es gibt nicht die eine beste Technologie, die für alle Anwendungsaufgaben geeignet ist. Wichtig ist, eine gründliche Analyse durchzuführen, um festzustellen, welcher Ansatz am besten zu den gegebenen Umständen passt. In einigen Fällen können regelbasierte Ansätze immer noch effektiv und effizient sein. Auf der anderen Seite sind die Möglichkeiten von maschinellem Lernen, komplexe Aufgaben mit hoher Präzision zu bewältigen, für viele Unternehmen äußerst wertvoll. Sie ist jedoch nicht in jeder Hinsicht besser und wird regelbasierte Bildverarbeitung auch nicht ersetzen! Um die besten Ergebnisse zu erzielen, ist es daher oft sinnvoll, mehrere Ansätze zu kombinieren. Wer KI erfolgreich einsetzen möchte, muss offen genug sein, um Ideen und Experimente zuzulassen. Anders zu denken, wird sich langfristig in einem ‚Return on Invest‘ auszahlen.

Dipl.-Ing. (FH) Heiko Seitz,

Technischer Autor bei IDS Imaging Development Systems GmbH

Sie möchten gerne weiterlesen?