Structure from motion

Da Wikipedia, l'enciclopedia libera.
Jump to navigation Jump to search
Modello di superficie digitale di un sito di costruzione di una Intersezione a livelli sfalsati di un'autostrada

Structure from motion o SfM (in italiano: Struttura dal movimento) è una tecnica di range imaging della computer vision e della percezione visiva, con cui il processo di stima di strutture tridimensionali da sequenze di immagini bidimensionali che può essere accoppiato con segnali di movimento locali. Nella visione biologica la SfM fa riferimento al fenomeno per cui gli esseri umani (e altre creature viventi) posso ricostruire strutture 3D da un campo in movimento in proiezione 2D (retinale) di un oggetto o una scena in movimento.

Ottenere informazione 3D da immagini 2D[modifica | modifica wikitesto]

Gli esseri umani ricevono molte informazioni sulla struttura tridimensionale nel loro ambiente muovendosi attraverso. Quando l'osservatore si muove e gli oggetti intorno a lui si muovono, l'informazione è ottenuta da immagini nel tempo[1]. Trovare strutture dal movimento presenti problemi simili a trovare strutture dalla visione stereoscopica. In entrambi i casi, la corrispondenza tra immagini e la ricostruzione di oggetti 3D ha bisogno di essere trovata.

Per trovare corrispondenza tra immagini, le caratteristiche (feature) come i punti d'angolo (lati con gradienti in direzioni multiple) sono tracciate da un'immagine alla prossima. Uno dei rilevatori di caratteristiche più usati è il SIFT (Scale-invariant feature transform). Usa come caratteristiche il massimo di una piramide di Differenze di Gaussiane (DOG) Il primo passo nella SIFT è di trovare una direzione di gradiente dominante. Per renderla invariante alla rotazione, il descrittore è ruotato per adattarne l'orientamento[2]. Un altro rilevatore di caratteristiche molto comune è il SURF (Speeded Up Robust Features). Nel SURF, la DOG è sostituita da un rilevatore hessiano di blob basato su matrici[3]. Inoltre, invece di valutare il gradiente degli istogrammi, SURF calcola le somme dei componenti del gradiente e le somme dei loro valori assoluti[4]. Le caratteristiche rilevate da tutte le immagini saranno poi incrociate. Uno degli algoritmi di matching (per incrociare i dati) che traccia le caratteristiche da un'immagine all'altra è il tracciatore Lukas-Kanade[5].

SfM per l'analisi di struttura del patrimonio culturale[modifica | modifica wikitesto]

Software Structure from Motion[modifica | modifica wikitesto]

Soluzioni Open source
Nome Licenza GUI Linguaggio Descrizione
Bundler GNU GPL v2 no C++ Structure from Motion for Unordered Photo Collections by Noah Snavely
openMVG MPL v2 no C++ An Open Multiple View Geometry library + Structure from Motion demonstrators
LibMV MIT no C++ Library for Multiview Reconstruction (LMV), libreria alla base degli algoritmi di SfM di Blender
Theia BSD no C++ A Fast and scalable structure-from-motion library
MicMac CeCILL-B si C++ Programma di fotogrammetria de l'Institut national de l'information géographique et forestière
MVE GNU GPL v3 si C++ The Multi-View Environment
Colmap BSD si C++ Pipeline Structure-from-Motion (SfM) e Multi-View Stereo (MVS) a linea di comando e con interfaccia grafica.
AliceVision MPL v2 no C++ Libreria software per la fotogrammetria
Structure from Motion toolbox for Matlab GNU GPL v3 si Matlab Toolbox creato da Vincent Rabaud
Matlab Functions for Multiple View Geometry MIT si Matlab Toolbox creato da Andrew Zissermann
Structure and Motion Toolkit MSR-EULA si Matlab Toolbox creato da Phil Torr
Matlab Code for Non-Rigid Structure from Motion n.a. si Matlab Toolbox creato da Lorenzo Torresani
AliceVision Meshroom MPL v2 si Python Applicazione GUI (Qt/PySide) basata sulla libreria AliceVision

Altri software[modifica | modifica wikitesto]

Note[modifica | modifica wikitesto]

  1. ^ Linda G. Shapiro, George C. Stockman, Computer Vision, Prentice Hall, 2001, ISBN 0-13-030796-3.
  2. ^ D. G. Lowe, Distinctive image features from scale-invariant keypoints, in International Journal of Computer Vision, 2004.
  3. ^ H. Bay, T. Tuytelaars, and L. Van Gool, Surf: Speeded up robust features, in 9th European Conference on Computer Vision, 2006.
  4. ^ K. Häming and G. Peters, The structure-from-motion reconstruction pipeline – a survey with focus on short image sequences, in Kybernetika, 2010.
  5. ^ B. D. Lucas and T. Kanade, An iterative image registration technique with an application to stereo vision, in IJCAI81.

Bibliografia[modifica | modifica wikitesto]

  • Richard Hartley and Andrew Zisserman, Multiple View Geometry in Computer Vision, Cambridge University Press, 2003, ISBN 0-521-54051-8.
  • Olivier Faugeras and Quang-Tuan Luong and Theodore Papadopoulo, The Geometry of Multiple Images, MIT Press, 2001, ISBN 0-262-06220-8.
  • Yi Ma, S. Shankar Sastry, Jana Kosecka, Stefano Soatto, Jana Kosecka, An Invitation to 3-D Vision: From Images to Geometric Models, Interdisciplinary Applied Mathematics Series, #26, Springer-Verlag New York, LLC, novembre 2003, ISBN 0-387-00893-4.

Voci correlate[modifica | modifica wikitesto]

Collegamenti esterni[modifica | modifica wikitesto]

Informatica Portale Informatica: accedi alle voci di Wikipedia che trattano di informatica