Structure from motion

Da Wikipedia, l'enciclopedia libera.
Modello di superficie digitale di un sito di costruzione di una Intersezione a livelli sfalsati di un'autostrada

Structure from motion o SfM (in italiano: Struttura dal movimento) è una tecnica di range imaging della computer vision e della percezione visiva, con cui il processo di stima di strutture tridimensionali da sequenze di immagini bidimensional che può essere accoppiato con segnali di movimento locali. Nella visione biologica la SfM fa riferimento al fenomeno per cui gli esseri umani ( e altre creature viventi) posso ricostruire strutture 3D da un campo in movimento in proiezione 2D (retinale) di un oggetto o una scena in movimento.

Ottenere informazione 3D da immagini 2D[modifica | modifica wikitesto]

Gli esseri umani ricevono molte informazioni sulla struttura tridimensionale nel loro ambiente muovendosi attraverso. Quando l'osservatore si muove e gli oggetti intorno a lui si muovono, l'informazione è ottenuta da immagini nel tempo[1]. Trovare strutture dal movimento presenti problemi simili a trovare strutture dalla visione stereoscopica. In entrambi i casi, la corrispondenza tra immagini e la ricostruzione di oggetti 3D ha bisogno di essere trovata.

Per trovare corrispondenza tra immagini, le caratteristiche (feature) come i punti d'angolo (lati con gradienti in direzioni multiple) sono tracciate da un'immagine alla prossima. Una delle più rilevatori di caratteristiche usati è il SIFT (Scale-invariant feature transform). Usa come caratteristiche il massimo di una piramide di differenza di gaussiane (DOG) Il primo passo nella SIFT è di trovare una direzione di gradiente dominante. Per renderla invariante alla rotazione, il descrittore è ruotato per adattarne l'orientamento[2]. Un altro rilevatore di caratteristiche molto comune è il SURF (Speeded Up Robust Features). Nel SURF, la DOG è sostituita da un rilevatore hessiano di blob basato su matrici[3]. Inoltre, invece di valutare il gradiente degli istogrammi, SURF calcola le somme dei componenti del gradiente e le somme dei loro valori assoluti[4]. Le caratteristiche rilevate da tutte le immagini saranno poi incrociate. Uno degli algoritmi di matching (per incrociare i dati) che traccia le caratteristiche da un'immagine all'altra è il tracciatore Lukas-Kanade[5].

SfM per l'analisi di struttura del patrimonio culturale[modifica | modifica wikitesto]

Note[modifica | modifica wikitesto]

  1. ^ Linda G. Shapiro, George C. Stockman, Computer Vision, Prentice Hall, 2001, ISBN 0-13-030796-3.
  2. ^ D. G. Lowe, Distinctive image features from scale-invariant keypoints, in International Journal of Computer Vision, 2004.
  3. ^ H. Bay, T. Tuytelaars, and L. Van Gool, Surf: Speeded up robust features, in 9th European Conference on Computer Vision, 2006.
  4. ^ K. Häming and G. Peters, The structure-from-motion reconstruction pipeline – a survey with focus on short image sequences, in Kybernetika, 2010.
  5. ^ B. D. Lucas and T. Kanade, An iterative image registration technique with an application to stereo vision, in IJCAI81.

Bibliografia[modifica | modifica wikitesto]

  • Richard Hartley and Andrew Zisserman, Multiple View Geometry in Computer Vision, Cambridge University Press, 2003, ISBN 0-521-54051-8.
  • Olivier Faugeras and Quang-Tuan Luong and Theodore Papadopoulo, The Geometry of Multiple Images, MIT Press, 2001, ISBN 0-262-06220-8.
  • Yi Ma, S. Shankar Sastry, Jana Kosecka, Stefano Soatto, Jana Kosecka, An Invitation to 3-D Vision: From Images to Geometric Models, Interdisciplinary Applied Mathematics Series, #26, Springer-Verlag New York, LLC, novembre 2003, ISBN 0-387-00893-4.

Voci correlate[modifica | modifica wikitesto]

Collegamenti esterni[modifica | modifica wikitesto]

Software Structure from Motion[modifica | modifica wikitesto]

Soluzioni Open source[modifica | modifica wikitesto]

C++

Matlab

Python

Altri software[modifica | modifica wikitesto]