7 research outputs found
Optimiser une collecte par gĂ©nĂ©ration alĂ©atoire de numĂ©ros de tĂ©lĂ©phone mobile pour une enquĂȘte en population restreinte : lâexemple de lâenquĂȘte sur la vie affective des jeunes adultes
La rĂ©alisation dâenquĂȘte par tĂ©lĂ©phone auprĂšs de jeunes adultes pose plusieurs difficultĂ©s mĂ©thodologiques, Ă commencer par lâabsence de base de sondage contenant suffisamment dâinformations permettant de joindre ces individus directement. Pour pallier ces problĂšmes, lâenquĂȘte sur la vie affective des jeunes adultes, portĂ©e par lâIned, sera rĂ©alisĂ©e par gĂ©nĂ©ration alĂ©atoire de numĂ©ros de tĂ©lĂ©phone (RDD). Seulement, recourir Ă une telle mĂ©thode dâĂ©chantillonnage engendre des coĂ»ts consĂ©quents : tout dâabord car une partie importante des numĂ©ros gĂ©nĂ©rĂ©s seront inexistants ou non attribuĂ©s, mais aussi car une part non nĂ©gligeable des individus contactĂ©s seront hors champ de lâenquĂȘte.
Ce travail se propose de faire Ă©tat de lâensemble des techniques classiquement utilisĂ©es pour optimiser une collecte en gĂ©nĂ©ration alĂ©atoire de numĂ©ros de tĂ©lĂ©phone tout en proposant de nouvelles pistes Ă partir de donnĂ©es collectĂ©es durant le test et la rĂ©pĂ©tition gĂ©nĂ©rale de lâenquĂȘte
Apprendre des paradonnées pour améliorer les protocoles de collecte : l'exemple d'Epicov
La collecte de la vague 1 de lâenquĂȘte EpiCov sâest dĂ©roulĂ©e entre le 2 mai et le 1er juin 2020. Elle a reposĂ©, en mĂ©tropole, sur un Ă©chantillon de 350 000 personnes issu de FidĂ©li. Deux modes de collecte ont Ă©tĂ© employĂ©s : internet, complĂ©tĂ© par le tĂ©lĂ©phone pour un cinquiĂšme des lots alĂ©atoires composant lâĂ©chantillon. Environ 130 000 personnes ont rĂ©pondu en mĂ©tropole dont 30 000 par tĂ©lĂ©phone. La collecte a Ă©tĂ© lâoccasion de recueillir des paradonnĂ©es sur les deux modes de collecte : nombre de connexions au site internet de collecte, matĂ©riel utilisĂ©, jour et heure de remplissage du questionnaire, type de numĂ©ros de tĂ©lĂ©phone disponibles, historique des appels, protocole de relance, etc.
Cet article rend compte de lâexploitation des paradonnĂ©es de EpiCov avec un double objectif : i) documenter les potentialitĂ©s de FidĂ©li en tant que base de sondage pour une collecte multimode ; ii) aboutir Ă des prĂ©conisations pour les protocoles de collecte dâenquĂȘtes futures. Pour rĂ©pondre Ă lâobjectif dâĂ©valuation de FidĂ©li comme base de sondage, une analyse de la disponibilitĂ© et de la validitĂ© des coordonnĂ©es de contact prĂ©sentes dans le fichier est menĂ©e et dĂ©clinĂ©e en fonction des caractĂ©ristiques sociales disponibles dans FidĂ©li (sexe, Ăąge, dĂ©cile de niveau de vie, quartier prioritaire de la politique de la ville, etc.).
Lâapport de lâenrichissement annuaire est Ă©galement Ă©tudiĂ©, globalement et en fonction des profils socio-dĂ©mographiques. Par la suite, lâarticle sâintĂ©resse Ă la rentabilitĂ© des diffĂ©rents lots du protocole de collecte. Il sâattache Ă mettre en lien les taux de rĂ©ponse selon les protocoles (monomode versus multimode), les caractĂ©ristiques sociales des enquĂȘtĂ©s, les modes de collecte et la richesse des coordonnĂ©es de contact Ă disposition (adresse mail ou non, numĂ©ro de tĂ©lĂ©phone ou non, numĂ©ro de mobile ou non, etc.). GrĂące Ă la multiplicitĂ© des coordonnĂ©es disponibles, le protocole de relance a Ă©tĂ© particuliĂšrement Ă©toffĂ© dans lâenquĂȘte EpiCov (mails, SMS, messages vocaux, etc.). LâefficacitĂ© des diffĂ©rents moyens de relance est analysĂ©e et questionnĂ©e.
Le nombre de connexions et, pour les lots concernĂ©s, dâappels nĂ©cessaires au remplissage du questionnaire ainsi que le mode de rĂ©ponse finalement utilisĂ© sont Ă©galement analysĂ©s et dĂ©clinĂ©s en fonction des protocoles et des profils sociodĂ©mographiques. Une analyse des abandons est Ă©galement prĂ©vue, notamment en lien avec le type de matĂ©riel utilisĂ© pour le remplissage du questionnaire en ligne. En dernier lieu, un focus est fait sur les lots multimodes, divisĂ©s en deux groupes. Pour certains lots, la collecte sâest dĂ©roulĂ©e selon un multimode concurrentiel oĂč les collectes internet et tĂ©lĂ©phone ont Ă©tĂ© ouvertes dĂšs le dĂ©but. Pour un autre lot, elle sâest dĂ©roulĂ©e selon un multimode sĂ©quentiel, la collecte tĂ©lĂ©phone ayant Ă©tĂ© ouverte dans un second temps, aprĂšs la collecte internet. Une comparaison est menĂ©e pour en tirer des conclusions sur la maniĂšre dâexploiter au mieux la complĂ©mentaritĂ© des modes de collecte. La taille importante de lâĂ©chantillon EpiCov permet de nuancer les rĂ©sultats selon diffĂ©rents types de sous-populations dâĂ©tude
De la thĂ©orie Ă la pratique : quelques enseignements de la mise en oeuvre de la mĂ©thode « Network Sampling with Memory » pour enquĂȘter auprĂšs des immigrĂ©s chinois en Ile-de-France
La mĂ©thode dâĂ©chantillonnage « Network sampling with memory » (NSM) constitue une nouvelle variante de sondage par chaĂźnage (boule de neige, Respondent Driven Sampling (RDS), etc.). Ces mĂ©thodes consistent Ă enquĂȘter au sein de rĂ©seaux en sĂ©lectionnant au dĂ©part quelques individus appelĂ©s « graines ». Seuls ces individus sont dĂ©signĂ©s par le sondeur. Par la suite, ce sont les enquĂȘtĂ©s eux-mĂȘmes qui recrutent/dĂ©signent leurs pairs qui seront sollicitĂ©s Ă leur tour pour participer Ă lâenquĂȘte. Les mĂ©thodes par chaĂźnage permettent en thĂ©orie dâatteindre des pans de la population non directement accessibles Ă des enquĂȘteur·rice·s, mais souffrent dâun biais de sĂ©lection trĂšs fort. Dans le but de pallier ce dĂ©faut, une Ă©quipe de lâuniversitĂ© de Caroline du Nord a dĂ©veloppĂ© la mĂ©thode NSM qui prĂ©sente des avantages thĂ©oriques notamment sur la prĂ©cision des estimations, au prix dâune complexitĂ© plus importante. La particularitĂ© de NSM est de recrĂ©er, au fur et Ă mesure du terrain, une base de sondage de la population cible composĂ©e des personnes citĂ©es par les rĂ©pondants et de tirer alĂ©atoirement les futur·e·s enquĂȘté·e·s dans cette base. Contrairement Ă la mĂ©thode RDS, elle ne cherche pas Ă enquĂȘter tous les contacts citĂ©s mais vise Ă intĂ©grer une dimension alĂ©atoire dans une mĂ©thode de sondage empirique. Lâalgorithme comprend une premiĂšre phase exploratoire dite « Search », Ă la recherche de nouveaux pans du rĂ©seau, puis une seconde phase de tirages alĂ©atoires au sein du rĂ©seau dĂ©voilĂ©. Selon ses concepteurs, la mĂ©thode NSM devrait permettre dâobtenir des estimations dâune prĂ©cision Ă©quivalente Ă celle dâun sondage alĂ©atoire simple.
AprĂšs deux expĂ©riences Ă lâĂ©tranger (en Tanzanie et en Caroline du Nord), la mĂ©thode a Ă©tĂ© utilisĂ©e pour la premiĂšre fois en France entre septembre 2020 et juin 2021 dans le cadre dâune enquĂȘte menĂ©e auprĂšs des immigrĂ©s chinois en Ile-de-France (ChIPRe). Ă lâissue du terrain, 500 questionnaires et quelque 1700 citations ont Ă©tĂ© collectĂ©s. Cette enquĂȘte sâest avĂ©rĂ©e extrĂȘmement dĂ©licate Ă mettre en Ćuvre. Sa dimension alĂ©atoire, et notamment la nĂ©cessitĂ© de rĂ©aliser des tirages hebdomadaires, a engendrĂ© de nombreuses difficultĂ©s sur le terrain. La charge de travail individuelle des enquĂȘteur·rice·s sâest rĂ©vĂ©lĂ©e difficile Ă anticiper, puisquâune forme de filiation citant/citĂ©s (conserver le·la mĂȘme enquĂȘteur·rice pour un·e enquĂȘté·e et les personnes citĂ©es dans son « roster » puis Ă©chantillonnĂ©es) a Ă©tĂ© privilĂ©giĂ©e afin de faciliter les nĂ©gociations des enquĂȘteur·rice·s sur le terrain. De plus, un paradoxe inhĂ©rent Ă la logique de lâalgorithme de tirage dans sa phase « exploratoire » conduisait les enquĂȘteur·rice·s qui collectaient le plus de citations (les plus grands « rosters ») Ă se voir attribuer parfois moins dâĂ©chantillonnĂ©s que dâautres enquĂȘteur·rice·s moins performants. En effet, les petits rosters (contenant un petit nombre de citations) Ă©taient plus exposĂ©s Ă lâĂ©chantillonnage car interprĂ©tĂ©s par lâalgorithme comme une opportunitĂ© dâaller vers des pans inexplorĂ©s du rĂ©seau, Ă lâinverse des plus grands rosters, plus souvent dĂ©laissĂ©s par lâalgorithme car associĂ©s Ă la dĂ©couverte de personnes citĂ©es plusieurs fois (doublons), synonymes dâun niveau dâexploration avancĂ© du rĂ©seau. Ainsi les « bon·ne·s » enquĂȘteur·rice·s ne voyaient pas toujours leurs efforts rĂ©compensĂ©s par le tirage des rosters quâil·elle·s avaient collectĂ©s. Cette impossibilitĂ© dâanticiper les tirages sâest aussi concrĂ©tisĂ©e dans le travail de communication auprĂšs des enquĂȘtĂ©s, car les enquĂȘteur·rice·s Ă©taient incapables de prĂ©dire dans leurs argumentaires si les personnes citĂ©es par leurs enquĂȘté·e·s seraient finalement tirĂ©es au sort ou non, ni Ă quelle Ă©chĂ©ance.
Ă ces difficultĂ©s se sont ajoutĂ©es celles de la pandĂ©mie. La crise sanitaire et la suspension de la collecte en face-Ă -face induite par le second confinement ont eu des impacts consĂ©quents sur la collecte. Initialement pensĂ©e pour ĂȘtre conduite en face-Ă -face, nous avons Ă©tĂ© contraints de mener au moins une partie de lâenquĂȘte par tĂ©lĂ©phone. Les mĂ©thodes dâĂ©chantillonnage par chainage reposant sur un lien de confiance entre enquĂȘteur·rice et enquĂȘté·e et contribuant Ă une rĂ©elle implication des enquĂȘté·e·s dans le processus de recrutement, la prise de contact et la passation des questionnaires Ă distance (par tĂ©lĂ©phone ou en visio) a rendu la tĂąche plus ardue. Le distanciel a Ă©galement rendu plus complexe et moins efficace la gestion des incitations financiĂšres (remise de chĂšques cadeaux)
O-079 Cross-border reproductive care from France: an original digital survey to measure this phenomenon [Abstract]
LâenquĂȘte test Ătude des relations familiales et intergĂ©nĂ©rationnelles (Erfi) 2.0 : enseignements dâune collecte multimode tĂ©lĂ©phone/Internet avec et sans incitations financiĂšres
Le Generations and Gender Programme (GGP) est une infrastructure de recherche transnationale qui vise Ă comprendre les dynamiques familiales et les parcours de vie des individus en rĂ©alisant des enquĂȘtes longitudinales. Dans le passĂ©, les questionnaires ont Ă©tĂ© posĂ©s principalement en face-Ă -face, notamment en France pour les trois vagues de lâĂtude des relations familiales et intergĂ©nĂ©rationnelles (Erfi) menĂ©es en 2005, 2008 et 2011 conjointement par lâIned et lâInsee.
Le nouveau cycle international dâenquĂȘtes GGP-II, en cours dans une vingtaine de pays, prĂ©voit une collecte au moins partiellement sur Internet. Pour amĂ©liorer le taux de rĂ©ponse, habituellement peu Ă©levĂ© avec ce mode de collecte, plusieurs pays se sont posĂ© la question de recourir Ă des incitations financiĂšres, en plus dâun mode de collecte complĂ©mentaire (face-Ă -face ou tĂ©lĂ©phone). Le volet français du programme, Erfi 2, est conçu par lâIned, peu familier de telles pratiques. LâIned a menĂ© de novembre 2021 Ă fĂ©vrier 2022 un test, dĂ©nommĂ© Erfi 2.0, afin dâĂ©valuer neuf scĂ©narios diffĂ©rents reposant sur une dĂ©clinaison de protocoles de collecte multimode combinant Internet (CAWI) et tĂ©lĂ©phone (CATI) mais aussi de recours aux incitations financiĂšres (inconditionnelles de 5⏠avant lâentretien, conditionnelles de 10âŹ/15⏠aprĂšs, ou les deux combinĂ©es). Le test a portĂ© sur 3199 personnes tirĂ©es dans la base de Sondage FidĂ©li (Fichier dĂ©mographique dâorigine fiscale sur les logements et les personnes).
Les incitations financiĂšres augmentent le taux de rĂ©ponse en CAWI-CATI mais pas en CATI-CAWI. Le taux de rĂ©ponse varie de 14 % en CAWI seul Ă 34 % en CATI-CAWI sans incitations financiĂšres ou avec incitations combinĂ©es, et 35 % en CAWI-CATI avec incitations combinĂ©es. Comme attendu, le taux dâabandon est plus Ă©levĂ© en CAWI quâen CATI, oĂč il est presque nul. Les questionnaires CAWI prĂ©sentent aussi plus de non-rĂ©ponses partielles et plus de rĂ©ponses systĂ©matiques (straightlining), mais aussi des rĂ©ponses plus diversifiĂ©es, ce qui pourrait indiquer un moindre biais de dĂ©sirabilitĂ© sociale. De maniĂšre contre-intuitive, le protocole CATI-CAWI ne sâavĂšre pas plus coĂ»teux que le protocole CAWI-CATI avec incitations financiĂšres combinĂ©es. En effet, mĂȘme si des Ă©conomies sont rĂ©alisĂ©es grĂące au plus grand nombre de questionnaires remplis en CAWI, le faible taux de rĂ©ponse oblige Ă distribuer massivement des incitations inconditionnelles (Ă©chantillon sollicitĂ© de plus grande taille). Ces rĂ©sultats doivent ĂȘtre interprĂ©tĂ©s avec prĂ©caution du fait de plusieurs problĂšmes rencontrĂ©s par le prestataire de collecte dans lâenvoi des relances et lâaccĂšs au questionnaire CAWI
The French Generations and Gender Pilot Survey: Internet versus Telephone, or Both?
The Generations and Gender Programme (GGP) questionnaire has a long and complex structure. Its adaptation to the web poses challenges in terms of low response rates, self-selection or inaccurate responses. The French GGP2020 test compares CAWI (computer-assisted web-interviewing) and CATI (computer-assisted telephone interviewing) modes, the latter having often been implemented at INED. The test includes nine scenarios, making it possible to measure the impact of financial incentives (pre- and post-interview) on the response rate and the continuation of the questionnaire or the interview. One of the scenarios offers respondents CAWI mode alone. The other eight scenarios combine CAWI or CATI, presence or absence of unconditional and conditional incentives, the latter offered when the questionnaire is completed. We also test the efficiency of offering a new response mode (switching from CAWI to CATI, and from CATI to CAWI). After the test, we will decide our data collection mode, likely a mix of CAWI and CATI in order to control for mode effects.
We use a Demographic file on housing and people based on tax data (called FidĂ©li) as a sampling frame. Beyond GGP, it will be interesting to highlight lessons that can be drawn for other French surveys, for example concerning the possibilities of using FidĂ©liâs e-mail addresses for a âpush-to-webâ survey on a representative sample, and the impact of financial incentives in France. For GGP, this test will also focus on the harmonized questionnaire of the second data collection cycle, which has been translated into French by INED
Dystrophin's central domain forms a complex filament that becomes disorganized by in-frame deletions
International audienceDystrophin, encoded by the gene, is critical for maintaining plasma membrane integrity during muscle contraction events. Mutations in the gene disrupting the reading frame prevent dystrophin production and result in severe Duchenne muscular dystrophy (DMD); in-frame internal deletions allow production of partly functional internally deleted dystrophin and result in less severe Becker muscular dystrophy (BMD). Many known BMD deletions occur in dystrophin's central domain, generally considered to be a monotonous rod-shaped domain based on the knowledge of spectrin family proteins. However, the effects caused by these deletions, ranging from asymptomatic to severe BMD, argue against the central domain serving only as a featureless scaffold. We undertook structural studies combining small-angle X-ray scattering and molecular modeling in an effort to uncover the structure of the central domain, as dystrophin has been refractory to characterization. We show that this domain appears to be a tortuous and complex filament that is profoundly disorganized by the most severe BMD deletion (loss of exons 45-47). Despite the preservation of large parts of the binding site for neuronal nitric oxide synthase (nNOS) in this deletion, computational approaches failed to recreate the association of dystrophin with nNOS. This observation is in agreement with a strong decrease of nNOS immunolocalization in muscle biopsies, a parameter related to the severity of BMD phenotypes. The structural description of the whole dystrophin central domain we present here is a first necessary step to improve the design of microdystrophin constructs toward the goal of a successful gene therapy for DMD