1 research outputs found

    Contribuci贸 als m猫todes d'obtenci贸 i representaci贸 de vistes d'objectes reals per aplicacions interactives.

    Get PDF
    En aquesta tesi s'han realitzat una s猫rie d'experiments per tal de cercar, identificar, caracteritzar i comparar diversos m猫todes d'obtenci贸 de vistes d'objectes reals per aplicacions interactives de realitat augmentada, telepres猫ncia o altres que puguin idear-se en el futur. Durant el desenvolupament dels m猫todes trobats, de naturalesa diversa, han sorgit dificultats que han fet aprofundir aquest treball en l'脿mbit de la geometria de la s铆ntesi de vistes, la reconstrucci贸 de l'estructura tridimensional dels objectes, l'acceleraci贸 de certs algoritmes amb l'ajut del maquinari existent o la portabilitat de les dades a trav茅s de la xarxa.Concretament, s'han identificat tres m猫todes que poden satisfer els requeriments plantejats. El primer, acc茅s a vistes d'objectes comprimides en fitxers, es basa en l'organitzaci贸 de les dades presentada, la capacitat de compressi贸 dels algoritmes i el suport del maquinari a la tasca de descompressi贸. El segon m猫tode, reconstrucci贸 tridimensional i projecci贸 emprant el coprocessador gr脿fic, aprofita les altes prestacions d'aquests 煤ltims, impulsats per les necessitats del mercat. El tercer, selecci贸 d'un conjunt representatiu de vistes i interpolaci贸 entre elles, aprofita les propietats de la rectificaci贸 de tres vistes i l'exactitud de la interpolaci贸 de vistes si es disposa d'un mapa de disparitat prou dens. Aquesta necessitat ha connectat aquest m猫tode amb el segon, al que cal el model tridimensional reconstru茂t, ja que hi ha una equival猫ncia entre les dues expressions de la informaci贸. Per la comparaci贸 dels resultats dels m猫todes estudiats, s'han seguit tres criteris: - El primer, 貌bviament, el de la qualitat de les vistes obtingudes de l'objecte. Ha calgut identificar les principals fonts d'error en els processos i cercar uns avaluadors d'aquest error. A m茅s d'aquests num猫rics se n'han cercat de subjectius ja que el destinatari de les vistes ser脿 un 茅sser hum脿. - El temps d'obtenci贸 d'una vista (important per la interactivitat), projectat a les plataformes tecnol貌giques existents o previsibles.- La mida de les dades necess脿ries per cadascun dels m猫todes, que limitar脿 la portabilitat de la visualitzaci贸 dels objectes. Durant la realitzaci贸 d'aquesta tesi, s'han realitzat algunes contribucions, la majoria d'elles ja publicades, que es poden resumir en:- Disseny d'una metodologia per la representaci贸 d'objectes a partir de conjunts de vistes i m猫todes de s铆ntesi. En aquesta metodologia s'ha presentat un protocol per l'adquisici贸 i ordenaci贸 de les dades, idees per la selecci贸 del conjunt m铆nim de vistes, un criteri per gravar la m铆nima informaci贸 necess脿ria, ajuts a l'obtenci贸 de la informaci贸 tridimensional de l'escena necess脿ria, i un algoritme r脿pid i general de s铆ntesi de vistes.- Supressi贸 de les restriccions geom猫triques del m猫tode de s铆ntesi per rectificaci贸 de tres vistes, permetent generalitzar la ubicaci贸 de la c脿mera virtual i optimitzar la dist脿ncia del pla de reprojecci贸 per maximitzar l'脿rea de la vista interpolada.- Especificaci贸 de l'algoritme de s铆ntesi de vistes pel m猫tode de rectificaci贸 de tres vistes, de forma que es pugui implementar amb processadors tipus DSP o conjunts d'instruccions espec铆fiques dels processadors CISC, per assolir les necessitats de les aplicacions interactives.- Presentaci贸 d'un m猫tode de refinament de models tridimensionals obtinguts per space carving mitjan莽ant estereovisi贸. El m猫tode combina dues t猫cniques conegudes de visi贸 per ordinador obtenint un millor resultat en la reconstrucci贸 tridimensional.- Acceleraci贸 del m猫tode de reconstrucci贸 tridimensional per projecci贸 de v貌xels amb la utilitzaci贸 de mapes de dist脿ncia, estructures en arbre i el coprocessador gr脿fic present en els computadors personals. Els resultats obtinguts en la tesi s'han adaptat per aplicar-se a un projecte de simulaci贸 de situacions de conducci贸 en carreteres amb realitat augmentada, desenvolupat per la UPC i la Universitat de Toronto i un segon de representaci贸 remota de vistes d'objectes arqueol貌gics, desenvolupat per la UPC, la UB i un conjunt d'universitats estrangeres.This work shows a set of experiments to identify, characterize and compare several methods for obtaining real object views in interactive applications such as augmented reality, telepresence or other future developments. While developing those methods, the problems found have induced a deeper study of view synthesis geometry, object three-dimensional structure, hardware process acceleration and data portability through the internet. Three methods have been found that meet the ends of this work. First, file-stored object-view access rests in data organization, compression- algorithm capabilities and hardware support to decompression. The second method, 3D object reconstruction and graphic coprocessor based projection, takes advantage of market driven GPU evolution. Finally, the representative view-set selection and interpolation method, uses the three-view-rectification properties and the precision of view interpolation when a dense-enough disparity map is available. This last requirement binds the second and third methods in the need of a good 3D object reconstruction, 3D models and disparity maps being two expressions for the same data. To compare the method results three criteria have been used: - Object view image quality. It has been necessary to identify the main source of errors on the processes and to find some evaluators for those errors. As the results of the process are images to be shown to humans, with those numerical evaluators a subjective evaluator has been used too. - Process time, important for the interactivity aim, calculated with current technology but projected to next foreseeable platforms. - Amount of data that must be recorded in each method, which will be a key point for portability. While developing this work, some contributions have been achieved and they can be summarized as:- Design of a methodology to represent any object view from a reduced set of views and synthesis methods. The methodology includes a protocol to acquire and organize data, ideas for a minimum view set selection, a criterion to record the minimum amount of data, improvements in obtaining the three-dimensional structure of the scene and a fast and general synthesis algorithm.- Suppression of some geometric restrictions in the three-view-rectification method, allowing a more general positioning for the virtual camera and a maximization of the virtual image area through the distance to the reprojection plane.- A complete specification for the modified three-view rectification and view interpolation method allowing its implementation with DSP or MMX instructions to achieve the requirements of interactive applications. - Presentation of a method to refine three-dimensional models obtained by space carving through stereovision. This method combines two well-known computer vision techniques to achieve a better result in 3D reconstruction. - Acceleration of the space carving 3D reconstruction method with the use of an octree voxel organization, projection to special distance maps and taking advantage of the GPU performance to speed-up the projection. Some of the results of this work will be used in the construction of an augmented reality driving simulator (UPC- University of Toronto) and the implementation of a remote viewer of archaeological objects (UPC - UB - other universities)
    corecore