    Retour aux origines de la statistique textuelle : Benzécri et l'école française d'analyse des données

    International audienceIn this article, we have attempted to trace the history of the statistical analysis of textual data, focusing on the influence of BenzĂ©cri's work and school, and to make explicit their theoretical positions, clearly opposed to AI and to Chomskyan linguistics. After a presentation of the intellectual project, as an inductive approach to language based on the exploration of corpora, we present the principles of correspondence analysis, which is the main method developed in the Data Analysis School, used for corpus analysis but also for many other types of datasets. Then, we will focus on textual data analysis. Based on the fact that software programmes have played a major role in the use of these statistical techniques, we shall examine a selection of these, display their specificities and their underlying theoretical bases.RĂ©sumĂ© Cet article revient sur une des deux branches Ă  l'origine de la statistique textuelle, l'Ă©cole d'analyse des donnĂ©es « Ă  la française », dont Jean-Paul BenzĂ©cri peut ĂȘtre considĂ©rĂ© comme l'initiateur. AprĂšs avoir explicitĂ© les orientations thĂ©oriques de l'analyse des donnĂ©es, et le rĂŽle jouĂ© par une approche inductive du langage, nous prĂ©sentons rapidement les principes de l'analyse des correspondances. Ensuite, nous explorerons l'application de l'analyse des donnĂ©es aux corpus de textes en montrant le rĂŽle jouĂ© par les logiciels dans la diffusion de cette approche

    Observer et évaluer les usages de Gallica. Réflexion épistémologique et stratégique

    Ce rapport rend compte d\u27une Ă©tude menĂ©e en partenariat avec la BnF et le dĂ©partement SES de Telecom ParisTech. Il est composĂ© de deux axes : un Ă©tat de l\u27art des nouveaux enjeux scientifiques et organisationnels de l\u27analyse des usages en ligne face aux profondes transformations des services et des pratiques numĂ©riques ; une enquĂȘte qualitative sur la maniĂšre dont les publics et les usages de Gallica sont envisagĂ©s et questionnĂ©s au sein de la BnF. Il s\u27achĂšve sur une sĂ©rie de recommandations d\u27ordre gĂ©nĂ©ral quant aux types de problĂ©matiques et d\u27Ă©tudes que la BnF pourrait dĂ©velopper dans les prochaines annĂ©es

    VidĂ©o-ethnographie des usages de Gallica : une exploration au plus prĂšs de l’activitĂ©

    Cette Ă©tude s’ancre dans un projet associant plusieurs modalitĂ©s d’enquĂȘte (entretiens, questionnaire en ligne, vidĂ©o-ethnographie) pour mieux apprĂ©hender les publics en ligne. Cette approche vidĂ©o-ethnographique permet de documenter l’usage de Gallica d\u27une façon tout Ă  fait inĂ©dite, dans la mesure oĂč les personnes sont invitĂ©es Ă  reconstituer leurs raisonnements, Ă  expliciter Ă  chaque instant quels Ă©taient leurs buts

    « Je pars d’un sujet, je rebondis sur un autre » Pratiques et usages des publics de Gallica

    Le projet « Mettre en ligne le patrimoine : transformation des usages, Ă©volution des savoirs ? » portĂ© par la BnF, le labex Obvil et TĂ©lĂ©com ParisTech, vise Ă  une meilleure connaissance des publics et des usages des collections patrimoniales numĂ©risĂ©es. Il s’inscrit dans le cadre du partenariat de recherche entre la BnF et TĂ©lĂ©com ParisTech, le Bibli-Lab, et dans le prolongement d’une rĂ©flexion sur la maniĂšre d’étudier usages et utilisateurs dans le monde numĂ©rique (Beaudouin et Denis, 2014). Cette recherche est centrĂ©e sur les usages de Gallica, la bibliothĂšque numĂ©rique de la BnF. Elle est Ă©galement soucieuse de resituer le plus large spectre possible des usages de Gallica dans leur contexte, en intĂ©grant une consultation ouverte Ă  d’autres sources documentaires disponibles en ligne ou hors ligne, et en essayant de cerner la place qu’occupe la consultation dans le cours de l’activitĂ© de l’individ

    Les pages personnelles comme terrain d’expĂ©rimentation

    Les pages personnelles sont des espaces de publication Web offerts par les fournisseurs d’accĂšs ou par des portails Ă  leurs clients ou visiteurs. L’adjectif « personnel » sous-entend que l’instance d’énonciation est un individu et que le contenu lui-mĂȘme renvoie Ă  la personne. Pour autant, peut-on considĂ©rer que les pages personnelles constituent un genre spĂ©cifique ? Nous avons montrĂ©, lors de travaux prĂ©cĂ©dents, que les sites personnels se distinguaient des sites marchands par l’emploi des pronoms personnels et par la structure des liens hypertextuels. Par-delĂ  ces deux catĂ©gories de traits, y a-t-il d’autres Ă©lĂ©ments qui assurent l’autonomie du genre, outre le nom qui les dĂ©signe ? Pour le savoir, nous avons constituĂ© un corpus de 100 000 pages personnelles visitĂ©es par une cohorte d’un millier d’internautes extraites d’un panel entre janvier et juin 2000. Nous montrons que les pages personnelles partagent une fonction de terrain d’expĂ©rimentation (elles ont une fonction de brouillon) et constituent un lieu d’apprentissage de l’écriture hypertextuelle qui est amenĂ© Ă  Ă©voluer

    Suppression by thimerosal of ex-vivo CD4+ T cell response to influenza vaccine and induction of apoptosis in primary memory T cells.

    International audienceThimerosal is a preservative used widely in vaccine formulations to prevent bacterial and fungal contamination in multidose vials of vaccine. Thimerosal was included in the multidose non-adjuvanted pandemic 2009 H1N1 vaccine Panenza. In the context of the analysis of the ex-vivo T cell responses directed against influenza vaccine, we discovered the in vitro toxicity Panenza, due to its content in thimerosal. Because thimerosal may skew the immune response to vaccines, we investigated in detail the ex-vivo effects of thimerosal on the fate and functions of T cells in response to TCR ligation. We report that ex-vivo exposure of quiescent or TCR-activated primary human T cells to thimerosal induced a dose-dependent apoptotic cell death associated with depolarization of mitochondrial membrane, generation of reactive oxygen species, cytochrome c release from the mitochondria and caspase-3 activation. Moreover, exposure to non-toxic concentrations of thimerosal induced cell cycle arrest in G0/G1 phase of TCR-activated T cells, and inhibition of the release of proinflammatory cytokines such as IFN gamma, IL-1 beta, TNF alpha, IL-2, as well as the chemokine MCP1. No shift towards Th2 or Th17 cells was detected. Overall these results underline the proapoptotic effect of thimerosal on primary human lymphocytes at concentrations 100 times less to those contained in the multidose vaccine, and they reveal the inhibitory effect of this preservative on T-cell proliferation and functions at nanomolar concentrations

    Analysis of Gallica and Data BnF logs and Modelling of Behaviour Patterns: Presentation of the Main Results

    Gallica (http://gallica.bnf.fr) is one of the major digital libraries available for free via the Internet. It provides access to million of documents of any type and receive around 1.5 million visits per month. In the context of a research partnership between the BnF and TĂ©lĂ©com ParisTech, an analysis of Gallica servers’ connection logs was carried out, applying machine-learning methods to them. The aim was not to collect information on users or their profiles but rather to use logs, which act as records of usage, as a basis for identifying typical clickstreams. For 15 months, a data clusterisation algorithm was developed, enabling grouping of Gallica sessions with similarities in sequencing and duration of actions . Logs analysed covered a range of durations, from a week to a month, with systematic checking of the stability of models obtained. Such learning methods take advantage of the very factor that undermines traditional methods for gathering information on usage: the extremely high numbers of connections. Despite the power of the algorithms involved, machine learning also requires numerous decisions to be taken, necessitating availability of other sources of knowledge on usages and users. For this reason, the preferred methodological choice was to have statistical models dialogue with results obtained from other approaches (ethnographic observations, interviews, etc.). The interest of the work carried out on the Gallica logs persuaded the BnF and TĂ©lĂ©com ParisTech to add a further stage to the research devoted to Data BnF logs as well as clickstreams between Gallica, Data BnF and BnF General Catalogue


    This work is a translation of a research published in 2002, which the investigation was developed by sociologist ValĂ©rie Beaudouin, from École des Hautes Études en Sciences Sociales (EHESS). The paper shows, from statistics data, some reflections about the users and the digital world, at the reading and writing scope, that, despite of being from two decades ago, have relevance and actuality to the researches in this area. Thereby, it was considered the writing’ and reading’s operation from social, age and genre of the users’ profile, and the engaged dynamics at the digital environment.Este trabalho Ă© uma tradução de uma pesquisa publicada em 2002, cuja investigação foi desenvolvida pela sociĂłloga ValĂ©rie Beaudouin, da École des Hautes Études en Sciences Sociales (EHESS). O artigo apresenta, a partir de dados estatĂ­sticos, algumas reflexĂ”es sobre usuĂĄrios e mundo digital, no campo da leitura e da escrita, que, apesar de passadas mais de duas dĂ©cadas, contĂȘm relevĂąncia e atualidade para as pesquisas nessa ĂĄrea. Nesse sentido, considerou-se o funcionamento da escrita e da leitura a partir do perfil social, etĂĄrio e de gĂȘnero dos usuĂĄrios, bem como as dinĂąmicas engajadas nos ambientes digitais

    Abstracts from the Food Allergy and Anaphylaxis Meeting 2016

