Search CORE

134 research outputs found

Vers une optimisation du catalogue des Bibliothèques municipales de la Ville de Genève en vue des évolutions des formats et des plateformes catalographiques

Author: Banfi Elisa
Gaudinat Arnaud
Publication venue
Publication date: 07/12/2016
Field of study

À l’heure actuelle, les Bibliothèques municipales de la Ville de Genève relèvent le défi de l’intégration des documents numériques dans leur catalogue. En même temps, elles s’interrogent au sujet de l’impact du Web sémantique, des règles et des formats catalographiques tels que RDA et FRBR. C’est pourquoi la direction des BM a mandaté cette étude sur l’optimisation des formats et des bases catalographiques du réseau bibliothécaire de la Ville de Genève. Cette analyse s’articule autour de trois axes principaux. Tout d'abord les lignes de tendances sur les nouvelles règles et formats catalographiques sont analysées à l'échelon européen, notamment en France, en Allemagne et en Suisse ainsi que sur les décisions stratégiques en terme de gouvernance et de ressources technologiques. Ensuite différents scénarios d’optimisation du catalogage et des bases de données catalographiques du réseau des BM de Genève sont proposés. Ces scénarios concernent les possibilités d’intégration du réseau des BM dans d’autres réseaux de bibliothèques (de lecture publique, patrimoniales, scientifiques) du point de vue cantonal, inter-cantonal, national et international et leurs conséquences en matière d’évolution des formats de catalogage et des bases de données catalographiques. Enfin la situation interne aux BM est étudiée en prenant en compte surtout l’efficacité des activités en lien avec le catalogage et l’indexation, les possibilités d’adaptation de la profondeur du catalogage et leur cohérence avec les besoins du public, de même que les contraintes et les opportunités du téléchargement des notices. L’optimisation de la base catalographique des BM doit donc passer par l’amélioration de la formation du personnel, la normalisation des données concernant le titre et l’auteur, la systématisation et l’uniformisation des données concernant le résumé, l’augmentation du pouvoir de négociation avec les fournisseurs de logiciels, la hiérarchisation des procédures d’harmonisation et l’analyse stratégique des niveaux de gouvernance

RERO DOC Digital Library

Rapport sur la numérisation du patrimoine écrit

Author: Tessier Marc
Publication venue: Ministère de la Culture et de la Communication
Publication date
Field of study

Remis par Marc Tessier au Ministre de la culture et de la communication et portant sur la numérisation des fonds patrimoniaux des bibliothèques

Bibliothèque numérique de l'enssib

Biotechnologies appliquées à l'amélioration des plantes tropicales : Biotrop, unité de recherche du CIRAD. Programmation 1993-1997

Author: CIRAD-BIOTROP - FRA
Publication venue: 'CIRAD (Centre de Cooperation Internationale en Recherche Agronomique Pour le Developpement)'
Publication date: 01/01/1993
Field of study

Missions, organisation et stratégies de l'unité de recherche Biotrop du CIRAD qui se compose de quatre laboratoires : culture in vitro, histologie, analyse du génome (Agétrop) et ingéniérie génétique et pathologie moléculaire (Igépam

Agritrop

Courbes remplissant l'espace et leur application en traitement d'images

Author: Nguyen Giap
Publication venue: HAL CCSD
Publication date: 14/11/2013
Field of study

The space-filling curves are known for the ability to order the multidimensional points on a line while preserving the locality, i.e. the close points are closely ordered on the line. The locality preserving is wished in many applications. Hilbert curve is the best locality preserving space-filling curve. This curve is originally proposed in 2D, i.e. it is only applied to points in a 2D space. For application in the multidimensional case, we propose in this thesis a generalization of Hilbert curve. Generalized curve is based on the essential property of Hilbert curve that creates its level of locality preserving: the adjacency. Thus, it avoids the dependence on the pattern RBG, which is the only pattern of the curve extended by previous researches. The result is a family of curves preserving well the locality. The optimization of the locality preserving is also addressed to find out the best locality preserving curve. For this purpose, we propose a measure of the locality preserving. Based on the parameters, this measure can adapt to different application situations such as the change of metric or locality size. The curve construction is an important part of the thesis. It is the basis of the index calculation used in application. For a rapid index calculation, the self-similar Hilbert curves is used. They are Hilbert curves satisfying the self-similar conditions specified in chapitre 4. The generalized curve is finally applied in image search. It is the question of the content-based image search (CBIR) where each image is characterized by a multidimensionalvector. Images are ordered by the curve of a line, and the search is simplified to the search on an ordered list. By giving an input image, similar images are those corresponding to neighbors of the index of the input. The locality preserving ensures that these indexes correspond to similar images.Les courbes remplissant l'espace sont connues pour la capacité d'ordonner les points multidimensionnels sur une ligne en tout conservant la localité, i.e. les points proches sont toujours proches sur la ligne. La conservation de la localité est beaucoup recherchée dans plusieurs applications. La courbe de Hilbert est la courbe remplissant l'espace qui conserve le mieux la localité. Cette courbe est originalement proposée en 2D, i.e. n'est qu'applicable aux points dans un espace 2D. Pour une perspective d'application dans le cas multidimensionnel, nous proposons dans cette thèse une généralisation de la courbe de Hilbert. La courbe généralisée est définie en s'appuyant sur la propriété essentielle de la courbe de Hilbert qui crée son niveau de conservation de la localité : l'adjacence. Ainsi, elle évite la dépendance du motif primitif RBG qui est le seul motif primitif de la courbe étendu par les recherches précédentes. Le résultat est donc une famille de courbe conservant bien la localité. L'optimisation de la conservation de la localité est aussi abordée pour permettre de retrouver la courbe qui conserve le mieux la localité. Pour cet objectif, nous proposons une mesure de la conservation de la localité. En s'appuyant sur les paramètres, cette mesure peut adapter aux différentes situations applicatives comme le changement de métrique ou de taille de localité. La construction est une partie importante de la thèse, elle est la base du calcul de l'index utilisé dans l'application. Pour un calcul de l'index rapide, la courbe de Hilbert autosimilaire est utilisée. La courbe de Hilbert satisfaisant les conditions de la courbe fait l'objet du chapitre 4. La courbe généralisée est enfin appliquée dans la recherche d'image. Il s'agit d'une recherche par le contenu où chaque image est caractérisée par un vecteur multidimensionnel. Les images sont ordonnées par la courbe sur une ligne ; ainsi, la recherche est simplifiée en une recherche sur une liste ordonnée. En donnant une image d'entrée, les images similaires sont celles correspondantes aux index voisins de l'index de l'image d'entrée. La conservation de la localité garantit que ces index correspondent aux images similaires

Thèses en Ligne

Recherche d'information dans les images de documents

Author: Fataicha Youssef
Publication venue: École de technologie supérieure
Publication date
Field of study

L'image de document est un objet intelligible qui véhicule de l'information et qui est défini en fonction de son contenu. Cette thèse présente trois modèles de repérage d'information et de recherche d'images pertinentes à la requête d'un utilisateur. Le premier modèle de repérage des zones informationnelles est basé sur l'analyse multi échelle traduisant le contraste visuel des régions sombres par rapport au fond de l'image. Chaque région extraite est définie à partir de son contenu et ses caractéristiques statistiques et géométriques. L'algorithme de classification automatique est amélioré par l'application de règles de production déduites des formes des objets extraits. Une première évaluation de l'extraction du texte, des logos et des photographies sur les images de l'équipe Média Team de l'Université de Washington (UW-1) montre des résultats encourageants. Le deuxième modèle est basé sur le texte obtenu par Reconnaissance Optique de Caractères (OCR). Des erreurs-grammes et des règles de production modélisant les erreurs de reconnaissance de l'OCR sont utilisées pour l'extension des mots de la requête. Le modèle vectoriel est alors appliqué pour modéliser le texte OCR des images de documents et la requête pour la recherche d'information (RI). Un apprentissage sur les images Média Team (UW-2) et des tests sur un millier d'images Web ont validé cette approche. Les résultats obtenus indiquent une nette amélioration comparés aux méthodes standards comme le modèle vectoriel sans l'expansion de la requête et la méthode de recouvrement 3-grams. Pour les zones non textuelles, un troisième modèle vectoriel, basé sur les variations des paramètres de l'opérateur multi-échelle SKCS(Separable Kernel with Compact Support) et une combinaison de classifieurs et d'analyse de sous-espace en composantes principales MKL (Multi-espace Karhunen-Loeve) est appliqué sur une base d'apprentissage d'images de documents de Washington University et de pages Web. Les expériences ont montré une supériorité de l'interprétation et la puissance des vecteurs d'indexations déduits de la classification et représentant les zones non textuelles de l'image. Finalement, un système hybride d'indexation combinant les modèles textuels et non-textuels a été introduit pour répondre à des requêtes plus complexes portant sur des parties de l'image de documents telles un texte, une illustration, un logo ou un graphe. Les expériences ont montré la puissance d'interrogation par des mots ou des images requêtes et ont permis d'aboutir à des résultats encourageants dans la recherche d'images pertinentes qui surpassent ceux obtenus par les méthodes traditionnelles comme révèle une évaluation des rappels vs. précision conduite sur des requêtes portant sur des images de documents

Espace ÉTS

Contribution à la définition de modèles de recherche d'information flexibles basés sur les CP-Nets

Author: Boubekeur Fatiha
Publication venue: HAL CCSD
Publication date: 01/07/2008
Field of study

This thesis addresses two main problems in IR: automatic query weighting and document semantic indexing. Our global contribution consists on the definition of a theoretical flexible information retrieval (IR) model based on CP-Nets. The CP-Net formalism is used for the graphical representation of flexible queries expressing qualitative preferences and for automatic weighting of such queries. Furthermore, the CP-Net formalism is used as an indexing language in order to represent document representative concepts and related relations in a roughly compact way. Concepts are identified by projection on WordNet. Concept relations are discovered by means of semantic association rules. A query evaluation mechanism based on CP-Nets graph similarity is also proposed.Ce travail de thèse adresse deux principaux problèmes en recherche d'information : (1) la formalisation automatique des préférences utilisateur, (ou la pondération automatique de requêtes) et (2) l'indexation sémantique. Dans notre première contribution, nous proposons une approche de recherche d'information (RI) flexible fondée sur l'utilisation des CP-Nets (Conditional Preferences Networks). Le formalisme CP-Net est utilisé d'une part, pour la représentation graphique de requêtes flexibles exprimant des préférences qualitatives et d'autre part pour l'évaluation flexible de la pertinence des documents. Pour l'utilisateur, l'expression de préférences qualitatives est plus simple et plus intuitive que la formulation de poids numériques les quantifiant. Cependant, un système automatisé raisonnerait plus simplement sur des poids ordinaux. Nous proposons alors une approche de pondération automatique des requêtes par quantification des CP-Nets correspondants par des valeurs d'utilité. Cette quantification conduit à un UCP-Net qui correspond à une requête booléenne pondérée. Une utilisation des CP-Nets est également proposée pour la représentation des documents dans la perspective d'une évaluation flexible des requêtes ainsi pondéreés. Dans notre seconde contribution, nous proposons une approche d'indexation conceptuelle basée sur les CP-Nets. Nous proposons d'utiliser le formalisme CP-Net comme langage d'indexation afin de représenter les concepts et les relations conditionnelles entre eux d'une manière relativement compacte. Les noeuds du CP-Net sont les concepts représentatifs du contenu du document et les relations entre ces noeuds expriment les associations conditionnelles qui les lient. Notre contribution porte sur un double aspect : d'une part, nous proposons une approche d'extraction des concepts en utilisant WordNet. Les concepts résultants forment les noeuds du CP-Net. D'autre part, nous proposons d'étendre et d'utiliser la technique de règles d'association afin de découvrir les relations conditionnelles entre les concepts noeuds du CP-Nets. Nous proposons enfin un mécanisme d'évaluation des requêtes basé sur l'appariement de graphes (les CP-Nets document et requête en l'occurrence)

Thèses en Ligne

Scientific Publications of the University of Toulouse II Le Mirail

HAL Descartes

Thèses en ligne de l'Université Toulouse III - Paul Sabatier

L’image dans le processus informationnel des élèves en classe de seconde

Author: Lira Mona
Publication venue: HAL CCSD
Publication date: 22/06/2015
Field of study

Cette recherche porte sur les rôles de l’image lors de la recherche d’information des élèves du secondaire dans un cadre scolaire. Pour cela, l’état de la question présente le concept d’image, sous diverses approches ainsi que la place de l’image au sein des pratiques informationnelles des jeunes notamment à travers le besoin d’images, les usages des images ainsi que les rôles de l’image déjà étudiés. Pour recueillir les données, nous avons effectué une observation directe de l’activité de recherche d’information accompagnée de la méthode du « pensez-tout-haut ». Celle-ci permet d’obtenir une description plus détaillée et précise du processus de recherche d’information par la verbalisation des actions des participants pendant l’activité. Ainsi, la présence d’images a pu être observée dans la recherche d’information des élèves. Par ailleurs, plusieurs rôles de l’image dans l’évaluation du document web et dans la stratégie de recherche ont été identifiés. En effet, la présence d’images est un critère de pertinence permettant l’évaluation d’un document web. De plus, l’image, prise comme exemple, est insérée dans la production finale. Enfin, le schéma apporte aux lycéens de nouvelles connaissances

Scientific Publications of the University of Toulouse II Le Mirail

Hal-Diderot