20 research outputs found

    Development of gene expression panels to determine prostate cancer

    No full text
    The aim of this investigation is to prove a modified algorithm for statistical approaches to develop gene expression panels for the detection of prostate tumors. According to Classification and Regression tree models and RE differences between adenocarcinoma (T) and adenoma (A) groups, we have chosen 31 transcripts for MDR analysis. Among them, there were 15 transcripts of (epithelial-mesenchymal transition (EMT) and prostate-cancer associated (PrCa-associated) genes and 16 transcripts of cancer-associated fibroblasts (CAF), tumor-associated macrophages (TAM), immune-associated genes (IAG)), which have shown some datasets with high statistical parameters. The highest diagnostic levels are manifested by expression panels developed from all 5 gene groups: PCA3, HOTAIR, ESR1, IL1R1 (Se = 0.97, Sp = 0.85, Ac = 0.93, OR = 204); CDH2, KRT18, PCA3, HOTAIR, ESR1, IL1R1 (Se = 1.0, Sp = 0.8, Ac = 0.93, OR > 500). We propose an improved algorithm for the gene expression data analysis to develop diagnostic panels with good and excellent diagnostic levels for the prostate tumor stratification in a group of patients from the Ukrainian population. Our data require a more detailed analysis and a larger cohort of patients with prostate tumor.Досліджено адаптацію модифікованого алгоритму статистичного підходу для розробки експресійних панелей для детекції раку передміхурової залози. За даними моделей класифікації та регресії й статистично значущими відмінностями відносної експресії між групами аденокарцином та аденом, серед досліджуваних генів відібрано 31 транскрипт для MDR аналізу. Серед них 15 транскриптів з груп генів епітеліальномезенхімального переходу та генів, асоційованих з раком передміхурової залози, і 16 транскриптів з груп генів пухлиноасоційованих фібробластів, пухлиноасоційованих макрофагів та імуноасоційованих генів. З цих груп отримано ряд панелей з високими статистичними показниками. Найвищі показники діагностичних рівнів мали експресійні панелі, які розроблені з усіх п’яти груп генів: PCA3, HOTAIR, ESR1, IL1R1 (Se = 0,97, Sp = 0,85, Ac = 0,93, OR = 204); CDH2, KRT18, PCA3, HOTAIR, ESR1, IL1R1 (Se = 1,0, Sp = 0,8, Ac = 0,93, OR > 500). Запропоновано модифікований алгоритм для аналізу даних експресії генів, який може бути використаний для розробки діагностичних панелей з добрим та високим діагностичними рівнями для стратифікації раку передміхурової залози на групі пацієнтів з української популяції. Одержані дані потребують подальшого аналізу на більшій вибірці пацієнтів з раком передміхурової залози.Исследована адаптация модифицированного алгоритма статистического подхода для разработки экспрессионных панелей для детекции рака простаты. Согласно данным моделей классификации и регрессии, а также статистически значимым отличиям относительной экспрессии между группами аденокарцином и аденом, среди исследуемых генов отобрано 31 транскрипт для MDR анализа. Среди них 15 транскриптов из групп генов эпителиально-мезенхимального перехода и генов, ассоциированных с раком простаты, и 16 транскриптов из групп генов опухолеассоциированных фибробластов, опухолеассоциированных макрофагов и иммуноассоциированных генов. Из этих групп было получено ряд панелей с высокими статистическими показателями. Самые высокие показатели диагностических уровней имели экспрессионные панели, полученные со всех пяти групп генов: PCA3, HOTAIR, ESR1, IL1R1 (Se = 0,97, Sp = 0,85, Ac = 0,93, OR = 204); CDH2, KRT18, PCA3, HOTAIR, ESR1, IL1R1 (Se = 1,0, Sp = 0,8, Ac = 0,93, OR > 500). Предложен модифицированный алгоритм для анализа данных экспрессии генов, который может быть использован для разработки диагностических панелей с хорошим и высоким диагностическими уровнями для стратификации рака простаты на группе пациентов из украинской популяции. Полученные данные требуют более детального анализа на большей выборке пациентов с раком простаты

    Cluster effect for SNP–SNP interaction pairs for predicting complex traits

    Get PDF
    Single nucleotide polymorphism (SNP) interactions are the key to improving polygenic risk scores. Previous studies reported several significant SNP–SNP interaction pairs that shared a common SNP to form a cluster, but some identified pairs might be false positives. This study aims to identify factors associated with the cluster effect of false positivity and develop strategies to enhance the accuracy of SNP–SNP interactions. The results showed the cluster effect is a major cause of false-positive findings of SNP–SNP interactions. This cluster effect is due to high correlations between a causal pair and null pairs in a cluster. The clusters with a hub SNP with a significant main effect and a large minor allele frequency (MAF) tended to have a higher false-positive rate. In addition, peripheral null SNPs in a cluster with a small MAF tended to enhance false positivity. We also demonstrated that using the modified significance criterion based on the 3 p-value rules and the bootstrap approach (3pRule + bootstrap) can reduce false positivity and maintain high true positivity. In addition, our results also showed that a pair without a significant main effect tends to have weak or no interaction. This study identified the cluster effect and suggested using the 3pRule + bootstrap approach to enhance SNP–SNP interaction detection accuracy

    التحقيق النظري للنماذج في خوارزمية تخفيض الأبعاد متعددة العوامل المعممة للأنماط الظاهرية الترتيبية

    Get PDF
    تشير الدراسات السريرية إلى العلاقة الوثيقة بين بعض الأمراض ووجود تداخلات محددة بين العوامل الجينية وكما هو الحال في كثير من الدراسات، فإن كشف التداخلات الجينية ذات التأثير الكبير على ظهور الأمراض الوراثية يحتاج إلى تحليلات احصائية مستفيضة. وبسبب الحجم الهائل للبيانات الجينية في الجنس البشري، فكان لا بد من تطوير طرق إحصائية مكيفة للتعامل مع البيانات الابعاد العالية. تعد خوارزمية تخفيض الأبعاد متعددة العوامل Multifactor Dimensionality Reduction (MDR) أحد الخوارزميات اللامعلمية الرائدة في هذا المجال. حيث تعمل الخوارزمية على تخفيض أبعاد البيانات الجينية للحصول على أهم تداخل ذات تأثير مباشر على زيادة احتمالية ظهور الأمراض الوراثية. وتعتمد الخوارزمية في تكوينها على مجموعة من الإجراءات اللامعلمية لتشخيص التداخل الجيني الأعلى تأثيراً على متغيرات الاستجابة الثنائية حصراً. وكأي طريقة إحصائية، فإن هذه الخوارزمية لا تخلو من نقاط الضعف والمحددات التطبيقية، لذا كان لا بد من تطوير الخوارزمية لتجاوز المعوقات. أحد نقاط الضعف في هذه الخوارزمية هي عدم إمكانية الخوارزمية من التعامل مع البيانات التي تحتوي على متغير استجابة من النوع الترتيبي. طور بعض الباحثين تعميماً لخوارزمية تخفيض الأبعاد متعددة العوامل لتمكينها من العامل مع البيانات الترتيبي. مع ذلك فإن الخوارزمية المعممة أكثر تعقيداً من الخوارزمية الأصلية. لذلك اقترحنا تطوير الخوارزمية المعممة تطويراً بسيطاً وذلك بتوظيف الانحدار اللوجستي الترتيبي في تصنيف الافراد في العينة، مع الإبقاء على جميع خطوات الخوارزمية الأصلية دون تغيير. ومن ناحية أخرى، فإن خوارزمية MDR تعتمد اسلوباً لا معلمياً للتحقق من معنوية التداخلات المرشحة في الخوارزمية. وينبني هذا الاجراء اللامعلمي على فكرة الاختبارات التباديلية، وهو يستهلك وقتاً زمنياً طويلاً جداً مقارنة بالإجراءات المعلمية المعتمدة على الأساليب النظرية. اقترح بعض الباحثين استخدام توزيع القيمة المتطرفة المعمم للتحقق من المعنوية الإحصائية للتداخلات المرشحة، لكن لم يرد استخدام هذا الأسلوب الا مع المتغيرات المعتمدة المستمرة والثنائية. تم في هذا البحث توظيف الاسلوب النظري المعتمد على توزيع القيمة المتطرفة المعمم بدلا من الاختبارات التباديلية المعتمدة في الخوارزمية وذلك عندما يكون متغير الاستجابة من النوع الترتيبي

    Discriminative identification of transcriptional responses of promoters and enhancers after stimulus

    Get PDF
    Promoters and enhancers regulate the initiation of gene expression and maintenance of expression levels in spatial and temporal manner. Recent findings stemming from the Cap Analysis of Gene Expression (CAGE) demonstrate that promoters and enhancers, based on their expression profiles after stimulus, belong to different transcription response subclasses. One of the most promising biological features that might explain the difference in transcriptional response between subclasses is the local chromatin environment. We introduce a novel computational framework, PEDAL, for distinguishing effectively transcriptional profiles of promoters and enhancers using solely histone modification marks, chromatin accessibility and binding sites of transcription factors and co-activators. A case study on data from MCF-7 cell-line reveals that PEDAL can identify successfully the transcription response subclasses of promoters and enhancers from two different stimulations. Moreover, we report subsets of input markers that discriminate with minimized classification error MCF-7 promoter and enhancer transcription response subclasses. Our work provides a general computational approach for identifying effectively cell-specific and stimulation-specific promoter and enhancer transcriptional profiles, and thus, contributes to improve our understanding of transcriptional activation in human

    Спортивная антропология: состояние и перспективы развития

    Get PDF
    Статья посвящена анализу современного состояния спортивной антропологии с учетом ее наиболее перспективных направлений в отношении спортивного отбора с особым упором на антропогенетику. Приводится анализ состояния антропогенетики, критический анализ значимости общего генетического баладля оценки генетической предрасположенности в спорте. Также проведен критический анализ проблемных вопросов генетики спорта и предложены возможные пути их решения

    Использование метода Multifactor Dimensionality Reduction (MDR) и его модификаций для анализа ген-генных и генно-средовых взаимодействий при генетико-эпидемиологических исследованиях (обзор)

    Get PDF
    Систематический анализ данных, имеющихся в современной литературе, о возможностях метода Multifactor Dimensionality Reduction (MDR) и его различных модификаций (GMDR, MB-MDR) при изучении ген- генных и генно-средовых взаимодействи

    Spatial rank-based multifactor dimensionality reduction to detect gene–gene interactions for multivariate phenotypes

    Get PDF
    Background Identifying interaction effects between genes is one of the main tasks of genome-wide association studies aiming to shed light on the biological mechanisms underlying complex diseases. Multifactor dimensionality reduction (MDR) is a popular approach for detecting gene–gene interactions that has been extended in various forms to handle binary and continuous phenotypes. However, only few multivariate MDR methods are available for multiple related phenotypes. Current approaches use Hotellings T2 statistic to evaluate interaction models, but it is well known that Hotellings T2 statistic is highly sensitive to heavily skewed distributions and outliers. Results We propose a robust approach based on nonparametric statistics such as spatial signs and ranks. The new multivariate rank-based MDR (MR-MDR) is mainly suitable for analyzing multiple continuous phenotypes and is less sensitive to skewed distributions and outliers. MR-MDR utilizes fuzzy k-means clustering and classifies multi-locus genotypes into two groups. Then, MR-MDR calculates a spatial rank-sum statistic as an evaluation measure and selects the best interaction model with the largest statistic. Our novel idea lies in adopting nonparametric statistics as an evaluation measure for robust inference. We adopt tenfold cross-validation to avoid overfitting. Intensive simulation studies were conducted to compare the performance of MR-MDR with current methods. Application of MR-MDR to a real dataset from a Korean genome-wide association study demonstrated that it successfully identified genetic interactions associated with four phenotypes related to kidney function. The R code for conducting MR-MDR is available at https://github.com/statpark/MR-MDR Conclusions Intensive simulation studies comparing MR-MDR with several current methods showed that the performance of MR-MDR was outstanding for skewed distributions. Additionally, for symmetric distributions, MR-MDR showed comparable power. Therefore, we conclude that MR-MDR is a useful multivariate non-parametric approach that can be used regardless of the phenotype distribution, the correlations between phenotypes, and sample size.This work was supported by the National Research Foundation of Korea (NRF) grant funded by the Korea government(MSIT) (2013M3A9C4078158, NRF-2021R1A2C1007788)
    corecore