393 research outputs found

    An Interactive Health Data Science Platform for Exploratory Analysis of Health Outcomes – a Case Study with Colon Cancer

    Get PDF
    Disease prediction is an important aspect of early disease detection and preventive care with wide range of applications in healthcare domain. Previous studies used image processing techniques, statistical and machine learning models to predict diseases. Prediction accuracies vary with data type and the target. Often the data is processed through models under different data conditions to identify what works best for a scenario. This results in tweaking the code, running multiple iterations making these methods usable only for people with technical skills. An interactive platform is developed that hides the technicalities and allows the users to change options like target disease for prognosis, feature selection method, sample size, ML algorithm. With this, multiple approaches can be tried and compared to find a combination of the options for an efficient outcome. Colon cancer is used to perform a case study to test this platform. 2 selection algorithms and 3 ML models are used. Although both selection methods identified identical features as significant for colon cancer prediction, the order of the features based on the scores is different. Hence, the machine learning algorithms performed similarly with both the selection methods. Random Forest, Logistic Regression, and Decision Tree had accuracies 87%, 86%, and 83% respectively

    Engineering evaluations and studies. Volume 3: Exhibit C

    Get PDF
    High rate multiplexes asymmetry and jitter, data-dependent amplitude variations, and transition density are discussed

    Passive optical network (PON) monitoring using optical coding technology

    Get PDF
    Les réseaux optiques passifs (PON) semblent être la technologie gagnante et ultime du futur pour les "fibres jusqu'au domicile" ayant une haute capacité. L'écoute de contrôle de ce genre de système est nécessaire pour s'assurer un niveau de qualité de service prédéterminé pour chaque client. En outre, l'écoute de contrôle réduit considérablement les dépenses en capital et de fonctionnement (CAPEX et OPEX), tant pour le fournisseur du réseau que les clients. Alors que la capacité des PON est croissante, les gestionnaires de réseau ne disposent pas encore d'une technologie efficace et appropriée pour l'écoute de contrôle des réseaux de capacité aussi élevée. Une variété de solutions a été proposée. Toutes ces dernières solutions ne sont pas pratiques à cause de leur faible capacité (nombre de clients), d'une faible évolutivité, d'une grande complexité et des défis technologiques. Plus important encore, la technologie souhaitable pour l'écoute de contrôle devrait être rentable car le marché des PON est très sensible aux coûts. Dans cette thèse, nous considérons l'application de la technologie du codage optique passif (OC) comme une solution prometteuse pour l'écoute de contrôle centralisée d'un réseau optique ramifié tels que les réseaux PON. Dans la première étape, nous développons une expression pour le signal détecté par l'écoute de contrôle et étudions ses statistiques. Nous trouvons une nouvelle expression explicite pour le rapport signal utile/signal brouillé (SIR) comme outil de mesure métrique de performance. Nous considérons cinq distributions PON géographiques différentes et étudions leurs effets sur l'SIR pour l'écoute de contrôle d'OC. Dans la prochaine étape, nous généralisons notre modèle mathématique et ses expressions pour le contrôle des signaux détectés par un détecteur quadratique et des paramètres réalistes. Nous évaluons ensuite les performances théoriques de la technologie basée sur l'écoute de contrôle selon le rapport signal/bruit (SNR), le rapport signal/bruit plus coefficient d'interférence (SNIR), et la probabilité de fausse alarme. Nous élaborons l'effet de la puissance d'impulsion transmise, la taille du réseau et la cohérence de la source lumineuse sur le rendement des codes unidimensionnels (ID) et bidimensionnels (2D) de l'écoute de contrôle d'OC. Une conception optimale est également abordée. Enfin, nous appliquons les tests de Neyman-Pearson pour le récepteur de notre système d'écoute de contrôle et enquêtons sur la façon dont le codage et la taille du réseau affectent les dépenses de fonctionnement (OPEX) de notre système d'écoute de contrôle. Malgré le fait que les codes ID et 2D fournissent des performances acceptables, elles exigent des encodeurs avec un nombre élevé de composants optiques : ils sont encombrants, causent des pertes, et ils sont coûteux. Par conséquent, nous proposons un nouveau schéma de codage simple et plus approprié pour notre application de l'écoute de contrôle que nous appelons le codage périodique. Par simulation, nous évaluons l'efficacité de l'écoute de contrôle en terme de SNR pour un PON employant cette technologie. Ce système de codage est utilisé dans notre vérification expérimentale de l'écoute de contrôle d'OC. Nous étudions expérimentalement et par simulation, l'écoute de contrôle d'un PON utilisant la technologie de codage périodique. Nous discutons des problèmes de conception pour le codage périodique et les critères de détection optimale. Nous développons également un algorithme séquentiel pour le maximum de vraisemblance avec une complexité réduite. Nous menons des expériences pour valider notre algorithme de détection à l'aide de quatre encodeurs périodiques que nous avons conçus et fabriqués. Nous menons également des simulations de Monte-Carlo pour des distributions géographiques de PON réalistes, avec des clients situés au hasard. Nous étudions l'effet de la zone de couverture et la taille du réseau (nombre d'abonnés) sur l'efficacité de calcul de notre algorithme. Nous offrons une borne sur la probabilité pour un réseau donné d'entraîner l'algorithme vers un temps exorbitant de surveillance du réseau, c'est à dire le délai d'attente de probabilité. Enfin, nous soulignons l'importance du moyennage pour remédier aux restrictions budgétaires en puissance/perte dans notre système de surveillance afin de supporter de plus grandes tailles de réseaux et plus grandes portées de fibres. Ensuite, nous mettrons à niveau notre dispositif expérimental pour démontrer un m PON avec 16 clients. Nous utilisons un laser à modulation d'exploitation directement à 1 GHz pour générer les impulsions sonde. Les données mesurées par le dispositif expérimental est exploité par l'algorithme de MLSE à détecter et à localiser les clients. Trois déploiements PON différents sont réalisés. Nous démontrons une surveillance plus rigoureuse pour les réseaux ayant une répartition géographique à plusieurs niveaux. Nous étudions aussi le budget de la perte de notre dispositif de soutien plus élevés de capacités du réseau. Enfin, nous étudions le budget total admissible de la perte d'exploitation du système de surveillance dans la bande de fréquences à 1650 nm en fonction des spécifications de l'émetteur/récepteur. En particulier, la limite totale de la perte de budget est représentée en fonction du gain de l'amplicateure de transimpédance (TIA) et le résolution de la conversion analogique-numérique (ADC). Par ailleurs, nous enquêtons sur le compromis entre la distance portée et la capacité (taille de fractionnement au niveau du noeud distant) dans notre système de suivi

    Modification of claims-based measures improves identification of comorbidities in non-elderly women undergoing mastectomy for breast cancer: A retrospective cohort study

    Get PDF
    BACKGROUND: Accurate identification of underlying health conditions is important to fully adjust for confounders in studies using insurer claims data. Our objective was to evaluate the ability of four modifications to a standard claims-based measure to estimate the prevalence of select comorbid conditions compared with national prevalence estimates. METHODS: In a cohort of 11,973 privately insured women aged 18–64 years with mastectomy from 1/04–12/11 in the HealthCore Integrated Research Database, we identified diabetes, hypertension, deficiency anemia, smoking, and obesity from inpatient and outpatient claims for the year prior to surgery using four different algorithms. The standard comorbidity measure was compared to revised algorithms which included outpatient medications for diabetes, hypertension and smoking; an expanded timeframe encompassing the mastectomy admission; and an adjusted time interval and number of required outpatient claims. A χ2 test of proportions was used to compare prevalence estimates for 5 conditions in the mastectomy population to national health survey datasets (Behavioral Risk Factor Surveillance System and the National Health and Nutrition Examination Survey). Medical record review was conducted for a sample of women to validate the identification of smoking and obesity. RESULTS: Compared to the standard claims algorithm, use of the modified algorithms increased prevalence from 4.79 to 6.79 % for diabetes, 14.75 to 24.87 % for hypertension, 4.23 to 6.65 % for deficiency anemia, 1.78 to 12.87 % for smoking, and 1.14 to 6.31 % for obesity. The revised estimates were more similar, but not statistically equivalent, to nationally reported prevalence estimates. Medical record review revealed low sensitivity (17.86 %) to capture obesity in the claims, moderate negative predictive value (NPV, 71.78 %) and high specificity (99.15 %) and positive predictive value (PPV, 90.91 %); the claims algorithm for current smoking had relatively low sensitivity (62.50 %) and PPV (50.00 %), but high specificity (92.19 %) and NPV (95.16 %). CONCLUSIONS: Modifications to a standard comorbidity measure resulted in prevalence estimates that were closer to expected estimates for non-elderly women than the standard measure. Adjustment of the standard claims algorithm to identify underlying comorbid conditions should be considered depending on the specific conditions and the patient population studied. ELECTRONIC SUPPLEMENTARY MATERIAL: The online version of this article (doi:10.1186/s12913-016-1636-7) contains supplementary material, which is available to authorized users

    Stage of cancer diagnoses among migrants from the former Soviet Union in comparison to the German population – are diagnoses among migrants delayed?

    Get PDF
    Background: In this study, we compared stage at diagnosis, standardized incidence ratio (SIR) and standardized mortality ratio (SMR) of most frequent cancer diagnoses between re-settlers (Aussiedler) from the former Soviet Union and the general population in the Saarland in Germany to assess possible delays in diagnosis of cancer among this migrant group. Methods: Lung cancer, colorectal cancer, breast cancer, prostate cancer, malignant melanoma of the skin and stomach cancer diagnoses among a cohort of 18,619 re-settlers living in the Saarland between 1990 and 2009 were identified by the federal state’s cancer registry. Vital status was available for the respective time-period and used to calculate SIR and SMR in comparison to the autochthonous population. Tumor stages were condensed into local and advanced stages. Odds ratios (OR) for an advanced tumor stage were modeled in dependence of re-settler-status and relevant covariates by logistic regression. Missing values were addressed in a sensitivity analysis. The influence of duration of stay in Germany on advanced stage diagnosis was analyzed among re-settlers. Results: SIR and SMR of lung and breast cancer were lower among female re-settlers, while SIR and SMR of colorectal and prostate cancer were lower among male re-settlers. SIR and SMR of stomach cancer were elevated among both sexes. Female re-settlers showed an elevated OR for being diagnosed with advanced stage breast cancer. Both male and female re-settlers showed an elevated OR when observing all six sites combined (OR among males 1.47, p = 0.04; OR among females 1.37, p = 0.05). The result of elevated ORs was supported in the sensitivity analysis. Finally, male re-settlers showed a weak association between duration of stay in Germany and reduced risk for advanced stage diagnosis. Conclusion: Re-settlers were more likely to be diagnosed at an advanced tumor stage. These findings are in line with previous research having shown unfavorable health care utilization of re-settlers. Overall, low mortality rates despite an increased risk of advanced stage at diagnosis argue for a sufficient follow-up care, comparable to the autochthonous population

    Epidemiological trends of sepsis in the twenty-first century (2000-2013): an analysis of incidence, mortality, and associated costs in Spain

    Get PDF
    BACKGROUND: Sepsis has represented a substantial health care and economic burden worldwide during the previous several decades. Our aim was to analyze the epidemiological trends of hospital admissions, deaths, hospital resource expenditures, and associated costs related to sepsis during the twenty-first century in Spain. METHODS: We performed a retrospective study of all sepsis-related hospitalizations in Spanish public hospitals from 2000 to 2013. Data were obtained from records in the Minimum Basic Data Set. The outcome variables were sepsis, death, length of hospital stay (LOHS), and sepsis-associated costs. The study period was divided into three calendar periods (2000-2004, 2005-2009, and 2010-2013). RESULTS: Overall, 2,646,445 patients with sepsis were included, 485,685 of whom had died (18.4%). The incidence of sepsis (events per 1000 population) increased from 3.30 (2000-2004) to 4.28 (2005-2009) to 4.45 (2010-2013) (p < 0.001). The mortality rates from sepsis (deaths per 10,000 population) increased from 6.34 (2000-2004) to 7.88 (2005-2009) to 7.89 (2010-2013) (p < 0.001). The case fatality rate (CFR) or proportion of patients with sepsis who died decreased from 19.1% (2000-2004) to 18.4% (2005-2009) to 17.9% (2010-2013) (p < 0.001). The LOHS (days) decreased from 15.9 (2000-2004) to 15.7 (2005-2009) to 14.5 (2010-2013) (p < 0.001). Total and per patient hospital costs increased from 2000 to 2011, and then decreased by the impact of the economic crisis. CONCLUSIONS: Sepsis has caused an increasing burden in terms of hospital admission, deaths, and costs in the Spanish public health system during the twenty-first century, but the incidence and mortality seemed to stabilize in 2010-2013. Moreover, there was a significant decrease in LOHS in 2010-2013 and a decline in hospital costs after 2011.This research has been supported by Instituto de Salud Carlos III (grant numbers PI14CIII/00011 to SR, PI12/00019 to AAM, and PI15/01451 to ET), and “Gerencia de Salud, Consejería de Sanidad, Junta de Castilla y Leon” [grant number 773/A/13 to ET]. MAJS is supported by a contract of “Instituto de Salud Carlos III” (grant number CD13/00013).S

    Improving patient record search: A meta-data based approach

    Get PDF
    The International Classification of Diseases (ICD) is a type of meta-data found in many Electronic Patient Records. Research to explore the utility of these codes in medical Information Retrieval (IR) applications is new, and many areas of investigation remain, including the question of how reliable the assignment of the codes has been. This paper proposes two uses of the ICD codes in two different contexts of search: Pseudo-Relevance Judgments (PRJ) and Pseudo-Relevance Feedback (PRF). We find that our approach to evaluate the TREC challenge runs using simulated relevance judgments has a positive correlation with the TREC official results, and our proposed technique for performing PRF based on the ICD codes significantly outperforms a traditional PRF approach. The results are found to be consistent over the two years of queries from the TREC medical test collection
    corecore