giovedì 4 marzo 2010

PIERANGELO MERLO: Tracking di oggetti in sequenze video

Autore della tesi: Pierangelo Merlo
attualmente studente del CdL magistrale in
Ingegneria dell'Automazione
presso l'Università degli Studi di Padova
cell. 3478546133
e-mail: pier.mlb@gmail.com

Nato il 15 Ottobre 1986 a Montebelluna (TV)
Residente in via Foresto Vecchio 14, 31011 Asolo (TV)

Tesi svolta per in conclusione del CdL triennale in
Ingegneria dell'Informazione
presso l'Università degli Studi di Padova
Anno accademico 2008/2009

Relatore: chiar.mo prof. Paolo Tenti

Titolo della tesi: Tracking di oggetti in sequenze video

Indice di tesi:
1 Introduzione: Computer Vision
2 Metodi di acquisizione delle immagini
2.1 Acquisizione dell’informazione di profondità
2.1.1 Triangolazione
2.1.2 Tempo di volo (Time of Flight)
2.1.3 Differenza di fase
2.2 Acquisizione di sequenze video 2D
2.2.1 Sensore CCD
3 Spazio proiettivo e spazio reale
3.1 Coordinate omogenee
3.2 Movimento sul piano e omografia
4 Localizzazione dell’oggetto
4.1 Localizzazione tramite sottrazione del background
4.1.1 Sottrazione di background semplice
4.1.2 Mixture of Gaussians
4.2 Localizzazione tramite colore
4.2.1 Histogram Backprojection
4.3 Algoritmi basati su spazi di feature
4.3.1 Scale Invariant Feature Transform
5 Tracking dell’oggetto e filtraggio del movimento
5.1 Tracking con filtro di Kalman
5.2 Non linearità/non gaussianità: Particle filter6 Tracking dei contorni
6.1 Active contours - Snakes
6.2 B-Splines
6.3 Shape space
7 Considerazioni finali
7.1 Applicazioni


Sommario

In questa tesi si sono analizzate le modalità in cui è possibile estrarre informazione da immagini e sequenze video, con particolare riferimento alle metodologie che consentono la localizzazione e il tracking di oggetti.
Dopo aver brevemente riepilogato i trascorsi storici e i concetti fondamentali della Computer Vision, si sono studiati gli strumenti che consentono di acquisire immagini del mondo circostante ricavando anche l’informazione di profondità (range scanners), e sottolineando come, per la maggiore economicità e diffusione delle normali camere a colori, sia più conveniente sviluppare metodologie che si basino sull’acquisizione di immagini bidimensionali. Si è studiato a questo proposito il funzionamento del sensore CCD, presente nelle comuni videocamere digitali.
Si sono introdotti i principi fondamentali della geometria proiettiva, e si è sottolineato come l’impiego delle coordinate omogenee possa risultare particolarmente proficuo per relazionare il mondo tridimensionale con il piano proiettivo della videocamera. Si è mostrata un’applicazione di questi strumenti teorici nella definizione di un’omografia tra piani.
Per quanto riguarda la localizzazione vera e propria dell’oggetto ricercato, si sono studiati metodi di sottrazione del background (ad aggiornamento proporzionale e con background modellato in modo statistico – Mixture of Gaussians), metodi basati sul colore (Histogram Backprojection) e metodi basati sull’estrazione di descrittori di feature avanzati (SIFT). In quest’ultimo caso, le feature dell’oggetto e delle immagini analizzate vengono relazionate a un descrittore che è rappresentato da un vettore in un opportuno spazio di feature.
Si sono quindi studiati i vantaggi di istituire un modello dinamico del movimento per migliorare le prestazioni in ambito di tracking (Kalman Filter, Particle Filter).
Infine, si sono visti metodi che consentono di tracciare il contorno di oggetti deformabili tramite linee spezzate (Snakes) e curve polinomiali (B-Splines). Queste ultime permettono di regolarizzare i contorni, istituendo un opportuno spazio delle forme (shape space), del quale si sono solo accennate le potenzialità.
Il lavoro è concluso da considerazioni sui problemi aperti di queste metodologie, e sulle modalità per integrare armoniosamente i vari approcci studiati in modo da creare algoritmi di tracking di impiego generale, che non richiedano un eccessivo intervento di adattamento al task specifico che si vuole eseguire. Si sono inoltre enumerati i principali ambiti applicativi delle tecniche studiate.

Nessun commento:

Posta un commento