141 research outputs found
Algorithme non intrusif de localisation et de correction de distorsions dans les signaux sonores compressés à bas débits
Des sites de visionnement de contenu audio-vidĂ©o en temps-rĂ©el comme YouTube sont devenus trĂšs populaires. Le tĂ©lĂ©chargement des ïŹchiers audio/vidĂ©o consomme une quantitĂ© importante de bande passante des rĂ©seaux Internet. Lâutilisation de codecs Ă bas dĂ©bit permet de compresser la taille des ïŹchiers transmis aïŹn de consommer moins de bande passante. La consĂ©quence est une diminution de la qualitĂ© de ce qui est transmis. Une diminution de qualitĂ© mĂšne Ă lâapparition de dĂ©fauts perceptibles dans les ïŹchiers. Ces dĂ©fauts sont appelĂ©s des artifices de compression. Lâutilisation dâun algorithme de post-traitement sur les ïŹchiers sonores pourrait augmenter la qualitĂ© perçue de la musique transmise en corrigeant certains artifices Ă la rĂ©ception, sans toutefois consommer davantage de bande passante. Pour rehausser la qualitĂ© subjective des ïŹchiers sonores, il est dâabord nĂ©cessaire de dĂ©terminer quelles caractĂ©ristiques dĂ©gradent la qualitĂ© perceptuelle. Le prĂ©sent projet a donc pour objectif le dĂ©veloppement dâun algorithme capable de localiser et de corriger de façon non intrusive, un artifice provoquĂ© par des discontinuitĂ©s et des incohĂ©rences au niveau des harmoniques qui dĂ©grade la qualitĂ© objective dans les signaux sonores compressĂ©s Ă bas dĂ©bits (8 â 12 kilobits par seconde)
Recherche d'information dans les images de documents
L'image de document est un objet intelligible qui vĂ©hicule de l'information et qui est dĂ©fini en fonction de son contenu. Cette thĂšse prĂ©sente trois modĂšles de repĂ©rage d'information et de recherche d'images pertinentes Ă la requĂȘte d'un utilisateur.
Le premier modÚle de repérage des zones informationnelles est basé sur l'analyse multi échelle traduisant le contraste visuel des régions sombres par rapport au fond de l'image. Chaque région extraite est définie à partir de son contenu et ses caractéristiques statistiques et géométriques. L'algorithme de classification automatique est amélioré par l'application de rÚgles de production déduites des formes des objets extraits. Une premiÚre évaluation de l'extraction du texte, des logos et des photographies sur les images de l'équipe Média Team de l'Université de Washington (UW-1) montre des résultats encourageants.
Le deuxiĂšme modĂšle est basĂ© sur le texte obtenu par Reconnaissance Optique de CaractĂšres (OCR). Des erreurs-grammes et des rĂšgles de production modĂ©lisant les erreurs de reconnaissance de l'OCR sont utilisĂ©es pour l'extension des mots de la requĂȘte. Le modĂšle vectoriel est alors appliquĂ© pour modĂ©liser le texte OCR des images de documents et la requĂȘte pour la recherche d'information (RI). Un apprentissage sur les images MĂ©dia Team (UW-2) et des tests sur un millier d'images Web ont validĂ© cette approche. Les rĂ©sultats obtenus indiquent une nette amĂ©lioration comparĂ©s aux mĂ©thodes standards comme le modĂšle vectoriel sans l'expansion de la requĂȘte et la mĂ©thode de recouvrement 3-grams.
Pour les zones non textuelles, un troisiÚme modÚle vectoriel, basé sur les variations des paramÚtres de l'opérateur multi-échelle SKCS(Separable Kernel with Compact Support) et une combinaison de classifieurs et d'analyse de sous-espace en composantes principales MKL (Multi-espace Karhunen-Loeve) est appliqué sur une base d'apprentissage d'images de documents de Washington University et de pages Web. Les expériences ont montré une supériorité de l'interprétation et la puissance des vecteurs d'indexations déduits de la classification et représentant les zones non textuelles de l'image.
Finalement, un systĂšme hybride d'indexation combinant les modĂšles textuels et non-textuels a Ă©tĂ© introduit pour rĂ©pondre Ă des requĂȘtes plus complexes portant sur des parties de l'image de documents telles un texte, une illustration, un logo ou un graphe. Les expĂ©riences ont montrĂ© la puissance d'interrogation par des mots ou des images requĂȘtes et ont permis d'aboutir Ă des rĂ©sultats encourageants dans la recherche d'images pertinentes qui surpassent ceux obtenus par les mĂ©thodes traditionnelles comme rĂ©vĂšle une Ă©valuation des rappels vs. prĂ©cision conduite sur des requĂȘtes portant sur des images de documents
ChaĂźne de traitement pour une approche discursive de l'analyse d'opinion
La structure discursive d'un texte est un Ă©lĂ©ment essentiel Ă la comprĂ©hension du contenu vĂ©hiculĂ© par ce texte. Elle affecte, par exemple, la structure temporelle du texte, ou encore l'interprĂ©tation des expressions anaphoriques. Dans cette thĂšse, nous aborderons les effets de la structure discursive sur l'analyse de sentiments. L'analyse des sentiments est un domaine de recherche extrĂȘmement actif en traitement automatique des langues. Devant l'abondance de donnĂ©es subjectives disponibles, l'automatisation de la synthĂšse des multiples avis devient cruciale pour obtenir efficacement une vue d'ensemble des opinions sur un sujet donnĂ©. La plupart des travaux actuels proposent une analyse des opinions au niveau du document ou au niveau de la phrase en ignorant la structure discursive. Dans cette thĂšse, nous nous plaçons dans le contexte de la thĂ©orie de la SDRT (Segmented Discourse Representation Theory) et proposons de rĂ©pondre aux questions suivantes : -Existe-t-il un lien entre la structure discursive d'un document et les opinions Ă©mises dans ce mĂȘme document ? -Quel est le rĂŽle des relations de discours dans la dĂ©termination du caractĂšre objectif ou subjectif d'un segment textuel ? -Quel est le rĂŽle des Ă©lĂ©ments linguistiques, comme la nĂ©gation et la modalitĂ©, lors de la dĂ©termination de la polaritĂ© d'un segment textuel subjectif ? -Quel est l'impact de la structure discursive lors de la dĂ©termination de l'opinion globale vĂ©hiculĂ©e dans un document ? -Est-ce qu'une approche basĂ©e sur le discours apporte une rĂ©elle valeur ajoutĂ©e comparĂ©e Ă une approche classique basĂ©e sur la notion de 'sacs de mots'? -Cette valeur ajoutĂ©e est-elle dĂ©pendante du genre de corpus ?The discourse structure of a document is a key element to understand the content conveyed by a text. It affects, for instance, the temporal structure of a text, or the interpretation of anaphoric expressions. The discourse structure showed its usefulness in numerous NLP applications, such as automatic summary, or textual entailment. In this thesis, we will study the effects of the discourse structure on sentiment analysis. Sentiment analysis is an extremely active research domain in natural language processing. The last years have seen the multiplication of the available textual data conveying opinion on the web, and the automation of the summary of opinion documents became crucial for who wants to keep an overview of the opinion on a given subject. A huge interest lies in these data, both for the companies who want to retrieve consumer opinion, and for the consumers willing to gather information. Most of the current research efforts describe an opinion extraction at the document level or at the sentence level, ignoring the discourse structure. In this thesis work, we address opinion extraction through the discourse framework of the SDRT (Segmented Discourse Representation Theory), and try to answer to the following questions: -Is there a link between the discourse structure of a document and the opinions contained in that document? -What is the role of discourse relations in the determination of whether a textual segment is objective or subjective? -What is the impact of the discourse structure in the determination of the overall opinion conveyed by a document? -Does a discourse based approach really bring additional value compared to a classical "bag of words" approach
Contribution à l'analyse de la dynamique des écritures anciennes pour l'aide à l'expertise paléographique
Mes travaux de thÚse s inscrivent dans le cadre du projet ANR GRAPHEM1 (Graphemebased Retrieval and Analysis for PaleograpHic Expertise of Middle Age Manuscripts). Ilsprésentent une contribution méthodologique applicable à l'analyse automatique des écrituresanciennes pour assister les experts en paléographie dans le délicat travail d étude et dedéchiffrage des écritures.L objectif principal est de contribuer à une instrumetation du corpus des manuscritsmédiévaux détenus par l Institut de Recherche en Histoire des Textes (IRHT Paris) en aidantles paléographes spécialisés dans ce domaine dans leur travail de compréhension de l évolutiondes formes de l écriture par la mise en place de méthodes efficaces d accÚs au contenu desmanuscrits reposant sur une analyse fine des formes décrites sous la formes de petits fragments(les graphÚmes). Dans mes travaux de doctorats, j ai choisi d étudier la dynamique del élément le plus basique de l écriture appelé le ductus2 et qui d aprÚs les paléographes apportebeaucoup d informations sur le style d écriture et l époque d élaboration du manuscrit.Mes contributions majeures se situent à deux niveaux : une premiÚre étape de prétraitementdes images fortement dégradées assurant une décomposition optimale des formes en graphÚmescontenant l information du ductus. Pour cette étape de décomposition des manuscrits, nousavons procédé à la mise en place d une méthodologie complÚte de suivi de traits à partir del extraction d un squelette obtenu à partir de procédures de rehaussement de contraste et dediffusion de gradients. Le suivi complet du tracé a été obtenu à partir de l application des rÚglesfondamentales d exécution des traits d écriture, enseignées aux copistes du Moyen Age. Il s agitd information de dynamique de formation des traits portant essentiellement sur des indicationsde directions privilégiées.Dans une seconde étape, nous avons cherché à caractériser ces graphÚmes par desdescripteurs de formes visuelles compréhensibles à la fois par les paléographes et lesinformaticiens et garantissant une représentation la plus complÚte possible de l écriture d unpoint de vue géométrique et morphologique. A partir de cette caractérisation, nous avonsproposé une approche de clustering assurant un regroupement des graphÚmes en classeshomogÚnes par l utilisation d un algorithme de classification non-supervisé basée sur lacoloration de graphe. Le résultat du clustering des graphÚmes a conduit à la formation dedictionnaires de formes caractérisant de maniÚre individuelle et discriminante chaque manuscrittraité. Nous avons également étudié la puissance discriminatoire de ces descripteurs afin d obtenir la meilleure représentation d un manuscrit en dictionnaire de formes. Cette étude a étéfaite en exploitant les algorithmes génétiques par leur capacité à produire de bonne sélection decaractéristiques.L ensemble de ces contributions a été testé à partir d une application CBIR sur trois bases demanuscrits dont deux médiévales (manuscrits de la base d Oxford et manuscrits de l IRHT, baseprincipale du projet), et une base comprenant de manuscrits contemporains utilisée lors de lacompétition d identification de scripteurs d ICDAR 2011. L exploitation de notre méthode dedescription et de classification a été faite sur une base contemporaine afin de positionner notrecontribution par rapport aux autres travaux relevant du domaine de l identification d écritures etétudier son pouvoir de généralisation à d autres types de documents. Les résultats trÚsencourageants que nous avons obtenus sur les bases médiévales et la base contemporaine, ontmontré la robustesse de notre approche aux variations de formes et de styles et son caractÚrerésolument généralisable à tout type de documents écrits.My thesis work is part of the ANR GRAPHEM Project (Grapheme based Retrieval andAnalysis for Expertise paleographic Manuscripts of Middle Age). It represents a methodologicalcontribution applicable to the automatic analysis of ancient writings to assist the experts inpaleography in the delicate work of the studying and deciphering the writing.The main objective is to contribute to an instrumentation of the corpus of medievalmanuscripts held by Institut de Recherche en Histoire de Textes (IRHT-Paris), by helping thepaleographers specialized in this field in their work of understanding the evolution of forms inthe writing, with the establishment of effective methods to access the contents of manuscriptsbased on a fine analysis of the forms described in the form of small fragments (graphemes). Inmy PhD work, I chose to study the dynamic of the most basic element of the writing called theductus and which according to the paleographers, brings a lot of information on the style ofwriting and the era of the elaboration of the manuscript.My major contribution is situated at two levels: a first step of preprocessing of severelydegraded images to ensure an optimal decomposition of the forms into graphemes containingthe ductus information. For this decomposition step of manuscripts, we have proceeded to theestablishment of a complete methodology for the tracings of strokes by the extraction of theskeleton obtained from the contrast enhancement and the diffusion of the gradient procedures.The complete tracking of the strokes was obtained from the application of fundamentalexecution rules of the strokes taught to the scribes of the Middle Ages. It is related to thedynamic information of the formation of strokes focusing essentially on indications of theprivileged directions.In a second step, we have tried to characterize the graphemes by visual shape descriptorsunderstandable by both the computer scientists and the paleographers and thus unsuring themost complete possible representation of the wrting from a geometrical and morphological pointof view. From this characterization, we have have proposed a clustering approach insuring agrouping of graphemes into homogeneous classes by using a non-supervised classificationalgorithm based on the graph coloring. The result of the clustering of graphemes led to theformation of a codebook characterizing in an individual and discriminating way each processedmanuscript. We have also studied the discriminating power of the descriptors in order to obtaina better representation of a manuscript into a codebook. This study was done by exploiting thegenetic algorithms by their ability to produce a good feature selection.The set of the contributions was tested from a CBIR application on three databases ofmanuscripts including two medieval databases (manuscripts from the Oxford and IRHTdatabases), and database of containing contemporary manuscripts used in the writersidentification contest of ICDAR 2011. The exploitation of our description and classificationmethod was applied on a cotemporary database in order to position our contribution withrespect to other relevant works in the writrings identification domain and study itsgeneralization power to other types of manuscripts. The very encouraging results that weobtained on the medieval and contemporary databases, showed the robustness of our approachto the variations of the shapes and styles and its resolutely generalized character to all types ofhandwritten documents.PARIS5-Bibliotheque electronique (751069902) / SudocSudocFranceF
Recognition system for unconstrained handwritten numerals
In this paper, we present a recognition system of unconstrained handwritten numerals . We describe all essential stages to it s
elaboration . We approach the first phase of all recognition system : the extraction of the primitives . A structure that use th e
skeleton of the numeral is used to extract rapidly 55 binary primitives . We specify a method that allows to determine the transmitted
information about the primitives on the problem of the recognition of unconstrained handwritten numerals . Information transmitted
by each primitive providing a criterion allowing to generate a binary decision tree . This criterion is used to select in each nod e
the best primitive . The obtained classifier does not use the totality of 55 binary primitives but solely those that have been retaine d
during the phase of identification of the decision tree . We present an original reject criterion that allows to increase performances
of the recognition system . Finally, We describe the database of American handwritting numerals that serves to test the classifier .
We demonstrate the performance of our system with this database .Nous présentons dans cet article un systÚme de reconnaissance de chiffres manuscrits hors lignes, en décrivant toutes les étapes essentielles à son élaboration. Nous abordons d'abord la premiÚre phase de tout systÚme de reconnaissance: l'extraction de primitives. Une représentation structurée construite à partir du squelette du chiffre est utilisée pour extraire rapidement un jeu de 55 primitives binaires. Nous précisons ensuite une méthode qui permet de déterminer l'information transmise par une primitive sur le problÚme de la reconnaissance des chiffres manuscrits hors lignes. L'information transmise par chaque primitive fournit un critÚre permettant de générer un arbre de décision binaire de maniÚre complÚtement automatique. Ce critÚre est utilisé pour sélectionner au niveau de chaque noeud de l'arbre la primitive la plus informative sur le problÚme de reconnaissance associé au noeud en cours de traitement. Le classifieur obtenu n'utilise pas la totalité des 55 primitives binaires mais uniquement celles qui ont été retenues durant la phase d'identification de l'arbre de décision. Nous présentons ensuite un critÚre de rejet original qui permet d'augmenter les performances du systÚme de reconnaissance de maniÚre significative. Nous décrivons finalement la base de données de chiffres manuscrits américains qui sert à tester le classifieur. Nous donnons les résultats obtenus
Apprentissage automatique pour la détection de relations d'affaire
Les documents publiĂ©s par des entreprises, tels les communiquĂ©s de presse, contiennent une foule dâinformations sur diverses activitĂ©s des entreprises. Câest une source prĂ©cieuse pour des analyses en intelligence dâaffaire. Cependant, il est nĂ©cessaire de dĂ©velopper des outils pour permettre dâexploiter cette source automatiquement, Ă©tant donnĂ© son grand volume. Ce mĂ©moire dĂ©crit un travail qui sâinscrit dans un volet dâintelligence dâaffaire, Ă savoir la dĂ©tection de relations dâaffaire entre les entreprises dĂ©crites dans des communiquĂ©s de presse.
Dans ce mĂ©moire, nous proposons une approche basĂ©e sur la classification. Les mĂ©thodes de classifications existantes ne nous permettent pas dâobtenir une performance satisfaisante. Ceci est notamment dĂ» Ă deux problĂšmes : la reprĂ©sentation du texte par tous les mots, qui nâaide pas nĂ©cessairement Ă spĂ©cifier une relation dâaffaire, et le dĂ©sĂ©quilibre entre les classes. Pour traiter le premier problĂšme, nous proposons une approche de reprĂ©sentation basĂ©e sur des mots pivots câest-Ă -dire les noms dâentreprises concernĂ©es, afin de mieux cerner des mots susceptibles de les dĂ©crire. Pour le deuxiĂšme problĂšme, nous proposons une classification Ă deux Ă©tapes. Cette mĂ©thode sâavĂšre plus appropriĂ©e que les mĂ©thodes traditionnelles de rĂ©-Ă©chantillonnage.
Nous avons testĂ© nos approches sur une collection de communiquĂ©s de presse dans le domaine automobile. Nos expĂ©rimentations montrent que les approches proposĂ©es peuvent amĂ©liorer la performance de classification. Notamment, la reprĂ©sentation du document basĂ©e sur les mots pivots nous permet de mieux centrer sur les mots utiles pour la dĂ©tection de relations dâaffaire. La classification en deux Ă©tapes apporte une solution efficace au problĂšme de dĂ©sĂ©quilibre entre les classes.
Ce travail montre que la dĂ©tection automatique des relations dâaffaire est une tĂąche faisable. Le rĂ©sultat de cette dĂ©tection pourrait ĂȘtre utilisĂ© dans une analyse dâintelligence dâaffaire.Documents published by companies such as press releases, contain a wealth of information on various business activities. This is a valuable source for business intelligence analysis; but automatic tools are needed to exploit such large volume data. The work described in this thesis is part of a research project on business intelligence, namely we aim at the detection of business relationships between companies described in press releases.
In this thesis, we consider business relation detection as a problem of classification. However, the existing classification methods do not allow us to obtain a satisfactory performance. This is mainly due to two problems: the representation of text using all the content words, which do not necessarily a business relationship; and the imbalance between classes. To address the first problem, we propose representations based on words that are between or close to the names of companies involved (which we call pivot words) in order to focus on words having a higher chance to describe a relation. For the second problem, we propose a two-stage classification. This method is more effective than the traditional resampling methods.
We tested our approach on a collection of press releases in the automotive industry. Our experiments show that both proposed approaches can improve the classification performance. They perform much better than the traditional feature selection methods and the resampling method.
This work shows the feasibility of automatic detection of business relations. The result of this detection could be used in an analysis of business intelligence
Segmentation de l'articulation de la hanche Ă partir de radiographies biplanes en utilisant une approche multi-structures
En produisant une paire de radiographies orthogonales en position debout, le systĂšme EOS, beaucoup moins irradiant que le CT scan, offre la possibilitĂ© de reconstruire en 3D des structures osseuses. Pour reconstruire une structure osseuse Ă partir de radiographies biplanes, les contours extraits dans les images sont associĂ©s Ă des informations a priori 3D. Ce mĂ©moire porte sur lâextraction simultanĂ©e de contours des deux structures adjacentes de lâarticulation de la hanche : la tĂȘte fĂ©morale et le cotyle. Cette tĂąche est ardue, notamment Ă cause du bruit Ă©levĂ©, du faible contraste et de la superposition de structures. Nous avons adoptĂ© une approche multi-structures permettant de segmenter simultanĂ©ment deux contours correspondant chacun Ă une structure. La mĂ©thode proposĂ©e requiert une initialisation manuelle au niveau de la tĂȘte fĂ©morale par le tracĂ© dâun cercle pour extraire et localiser la rĂ©gion de lâarticulation. Le processus de segmentation sâapplique sur cette rĂ©gion qui est transformĂ©e dans un espace redressĂ©, oĂč les deux contours recherchĂ©s correspondent Ă deux chemins alignĂ©s. Les arĂȘtes verticales sont dĂ©tectĂ©es dans lâimage redressĂ©e par un opĂ©rateur du gradient horizontal. Deux images de gradient de signe opposĂ© sont gĂ©nĂ©rĂ©es, dans lesquelles la frontiĂšre de chaque structure est reprĂ©sentĂ©e par un chemin. Un volume redressĂ© est construit en combinant ces deux images, permettant dâunir les deux chemins en un seul. Pour cela, un algorithme de recherche dâun chemin minimal 3D dans un volume a Ă©tĂ© dĂ©veloppĂ©. Les contraintes inter-structures sont imposĂ©es durant la recherche. La projection du chemin obtenu donne deux chemins distincts et labellisĂ©s qui sont transformĂ©s dans lâespace de l'image originale pour rĂ©cupĂ©rer ainsi le contour de chaque structure. Nous avons appliquĂ© cette mĂ©thode sur 100 images radiographiques du membre infĂ©rieur, contenant chacune deux articulations de hanche, acquises dans les directions frontale, oblique et latĂ©rale. LâĂ©valuation de la prĂ©cision a donnĂ© une erreur globale point-contour RMS±ĂT de 1,27±0.79 mm pour la tĂȘte fĂ©morale et 1.26±0.74 mm pour le cotyle. Pour la rĂ©pĂ©tabilitĂ©, nous avons obtenu en moyenne 80% de diffĂ©rences locales au-dessous de 1 mm. Les rĂ©sultats rĂ©vĂšlent que la mĂ©thode est prĂ©cise, mais elle dĂ©pend aussi de la complexitĂ© de l'image segmentĂ©e et de la prĂ©sence ou non dâune pathologie, notamment la coxarthrose. Ce travail servira certainement Ă amĂ©liorer le processus de la reconstruction en termes de prĂ©cision
DĂ©tection et localisation des panneaux routiers
Les panneaux routiers -- Obtention et gestion de la position des panneaux -- Description du systÚme d'inspection et présentation des données -- Le systÚme d'inspection -- Segmentation basée sur la couleur -- Détection des panneaux grùce à leur forme -- Solution proposée pour la détection des panneaux -- Pré-reconnaissance de forme -- Localisation des panneaux dans l'image -- Suivi et localisation des panneaux -- Utilisation de la redonnance temporelle -- Suivi des panneaux -- Localisation des panneaux à posteriori -- Simulation de l'inspection d'une portion de route
- âŠ