Uno degli obiettivi principali della Visione Artificiale è lo sviluppo di algoritmi per percepire e comprendere il nostro mondo tridimensionale. Questo compito è estremamente complesso: gli ambienti in cui operiamo abitualmente sono composti da una pluralità di oggetti con le caratteristiche più disparate. Inoltre, gli algoritmi di visione 3D devono essere robusti a rumore e a outlier che sono inevitabili quando si ha a che fare con dati visuali.
GEOPRIDE (Geometric primitive fitting and decomposition for 3D shapes representation) si propone di indagare in che misura la geometria può essere un “linguaggio universale” che permette di esprimere la complessità del mondo 3D. L’alfabeto di questo linguaggio è composto da un numero relativamente ristretto di primitive geometriche (rette, piani, quadriche, super-quadriche) che permettono di descrivere la complessità di una scena 3D in rappresentazioni più semplici.
Invece di apprendere le primitive geometriche da esempi in un training set, GEOPRIDE svilupperà procedure automatiche di fitting robusto che operano su dati 3D quali mesh, o nuvole di punti. In questo modo è possibile garantire alla decomposizione sia robustezza contro gli outlier che una buona capacità di generalizzazione, dal momento che la stima geometrica è agnostica rispetto alle classi semantiche a cui appartengono i dati. Infine, la ricerca si occupa di investigare come queste rappresentazioni, estremamente compatte, accurate e scalabili, possono essere integrate in pipeline di apprendimento automatico per elaborare e analizzare i dati 3D. In particolare, saranno investigati i vantaggi dell’uso di primitive geometriche in applicazioni centrali per il Geometry Processing quali shape segmentation, object retrieval e object recognition.