Was ist optischer Fluss?
Der optische Fluss beschreibt die computergesteuerte Verfolgung von sich bewegenden Objekten durch Analysieren von Inhaltsunterschieden zwischen Videobildern. In einem Video können sich sowohl das Objekt als auch der Betrachter in Bewegung befinden. Der Computer kann Hinweise finden, die die Grenzen, Kanten und Bereiche einzelner Standbilder markieren. Das Erkennen ihrer Verläufe ermöglicht es dem Computer, einem Objekt zeitlich und räumlich zu folgen. Die Technologie wird in Industrie und Forschung eingesetzt, einschließlich des Betriebs unbemannter Luftfahrzeuge (UAV) und Sicherheitssysteme.
Zwei Hauptmethoden erzeugen dieses Computerbild: die gradientenbasierte und die merkmalsbasierte Bewegungserkennung. Der gradientenbasierte optische Fluss misst Änderungen der Bildintensität in Raum und Zeit. Es tastet eine dichte Strömungsfeldebene ab. Feature-basierte Flüsse überlagern Kanten von Objekten in Frames, um den Fortschritt zu markieren.
Diese Technik ähnelt der Bildstabilisierung des Camcorders, sodass ein berechnetes Sichtfeld trotz Verwacklungen in den Rahmen eingeklinkt werden kann. Optische Flussalgorithmen berechnen Übereinstimmungen zwischen Bildern nacheinander. Der Computer unterteilt jedes Bild in quadratische Gitter. Durch Überlagern von zwei Bildern können Vergleiche durchgeführt werden, um die besten Übereinstimmungen der Quadrate zu finden. Wenn der Computer eine Übereinstimmung findet, zeichnet er eine Linie zwischen den Unterschiedspunkten, die manchmal als Nadeln bezeichnet werden.
Algorithmen arbeiten systematisch von grob bis fein. Dies ermöglicht die Bewegungsverfolgung zwischen Bildern mit unterschiedlichen Auflösungen. Der Computer erkennt keine Objekte, sondern erkennt und befolgt nur die Merkmale von Objekten, die zwischen Frames verglichen werden können.
Die Berechnung von optischen Flussvektoren kann Objekte erkennen und verfolgen sowie die dominante Ebene eines Bildes extrahieren. Dies kann die Roboternavigation und die visuelle Entfernungsmessung oder die Ausrichtung und Position des Roboters unterstützen. Es erfasst nicht nur Objekte, sondern auch Umgebungen in drei Dimensionen und verleiht Robotern ein naturgetreueres Raumbewusstsein. Vektoren, die in einer Ebene berechnet werden, ermöglichen es dem Prozessor, aus den Frames extrahierte Bewegungen abzuleiten und darauf zu reagieren.
Einige Schwächen der optischen Flusstechnik sind Datenverlust aufgrund von Quadraten, die der Computer nicht zwischen Bildern zuordnen kann. Diese nicht angepassten Bereiche bleiben frei und erzeugen planare Hohlräume, wodurch die Genauigkeit verringert wird. Klare Kanten oder stabile Elemente wie Ecken tragen zur Durchflussanalyse bei.
Detaillierte Faktoren können verdeckt sein, wenn sich der Betrachter ebenfalls in Bewegung befindet, da er bestimmte Elemente nicht von Bild zu Bild unterscheiden kann. Die Analyse unterteilt Bewegung in scheinbaren globalen Fluss und lokalisierte Objektbewegung oder zB Bewegung. Räumlich-zeitliche Änderungen der Kanten oder der Bildintensität gehen bei der Bewegung der Kamera und dem globalen Fluss der sich bewegenden Umgebung verloren. Die Analyse wird verbessert, wenn der Computer die Auswirkungen des globalen Datenflusses eliminieren kann.