132 research outputs found


    Get PDF

    Semi-supervised peak calling with SPAN and JBR genome browser

    Get PDF
    UNLABELLED: The widespread application of ChIP-seq led to a growing need for consistent analysis of multiple epigenetics profiles, for instance, in human studies where multiple replicates are a common element of design. Such multisamples experimental designs introduced analytical and computational challenges. For example, when peak calling is done independently for each sample, small differences in signal strength/quality lead to a very different number of peaks for individual samples, making group-level analysis difficult. On the other side, when samples are pooled together for joint analysis, individual-level statistical differences are averaged out. Recently we have demonstrated that a semi-supervised peak calling approach (SPAN) allows for robust analysis of multiple epigenetic profiles while preserving individual sample statistics. Here, we present this approach\u27s implementation, centered around the JBR genome browser, a stand-alone tool that allows for accessible and streamlined annotation, analysis, and visualization. Specifically, JBR supports graphical interactive manual region selection and annotation, thereby addressing supervised learning\u27s key procedural challenge. Furthermore, JBR includes the capability for peak optimization, i.e., calibration of sample-specific peak calling parameters by leveraging manual annotation. This procedure can be applied to a broad range of ChIP-seq datasets of different quality and chromatin accessibility ATAC-seq, including single-cell experiments. JBR was designed for efficient data processing, resulting in fast viewing and analysis of multiple replicates, up to thousands of tracks. Accelerated execution and integrated semi-supervised peak calling make JBR and SPAN next-generation visualization and analysis tools for multisample epigenetic data. AVAILABILITY: SPAN and JBR run on Linux, Mac OS, and Windows, and is freely available at https://research.jetbrains.org/groups/biolabs/tools/span-peak-analyzer and https://research.jetbrains.org/groups/biolabs/tools/jbr-genome-browser. SUPPLEMENTARY INFORMATION: Supplementary data are available at Bioinformatics online

    О мерах сходства расположения компонентов в массивах естественно упорядоченных данных

    Get PDF
    В настоящее время не используются адекватные математические средства для анализа расположения компонентов в массивах естественно упорядоченных данных различной природы, в том числе – слов или букв в текстах, нотных знаков в записях музыкальных произведений, символов в знаковых последовательностях, данных мониторинга, чисел, отображающих упорядоченные результаты измерений, компонентов в генетических текстах. Поэтому затруднены или невозможны измерение и сравнение порядка следования сообщений, выделенных в длинных информационных цепях. Основные подходы при сравнении символьных последовательностей используют вероятностные модели и статистический инструментарий, попарное и множественное выравнивание, позволяющее определить степень сходства цепей с помощью мер редакционного расстояния. В некотором роде экзотическим являются использование псевдоспектрального и фрактального представления символьных последовательностей. Следует особо отметить «проклятие априорного неосознаваемого знания» об очевидной упорядоченности цепи, которое широко распространено в математической лингвистике, биоинформатике (математической биологии) и других аналогичных областях науки. Отмеченные подходы почти не уделяют внимания исследованию и обнаружению закономерностей конкретного расположения всех знаков, слов, компонентов массивов данных, составляющих отдельную целостную последовательность. Объектом исследования в наших работах является специальным образом организованный числовой кортеж – расположение компонентов (строй) в символьных или числовых последовательностях. При этом в качестве основы для количественного отображения строя цепи используются интервалы между ближайшими одинаковыми её компонентами. Перемножение всех интервалов или суммирование их логарифмов позволяет получить числа, которые однозначно отображают расположение компонентов в конкретной последовательности. Эти числа, в свою очередь, позволяют получить целый набор нормированных характеристик строя, среди которых средний геометрический интервал и его логарифм. Такие характеристики на удивление точно отражают расположение компонентов в знаковых последовательностях. В данной работе представлен подход для количественного сравнения построений массивов естественно упорядоченных данных (информационных цепей) произвольной природы. Предложены меры сходства-расхождения и процедура сравнения строя цепей, основанные на выделении списка совпадающих и сходных по характеристикам строя подпоследовательностей (компонентов). При этом для быстрого выделения списка совпадающих компонентов используются ранговые распределения. В работе представлен инструментарий для сравнения построений информационных цепей и продемонстрированы некоторые его возможности при исследовании строя нуклеотидных последовательностей

    Epidemiological Situation on Tick-Borne Spotted Fever Group Rickettsioses in the Russian Federation in 2012–2021, Prognosis for 2022–2026

    Get PDF
    The aim of the review was to characterize the epidemiological situation on rickettsiosis of the tick-borne spotted fever (TSF) group in the constituent entities of the Russian Federation in 2012–2021 and provide a long-term forecast for 2022–2026. In 2020–2021, indicators of registered incidence of tick-borne rickettsiosis in Russia on the whole decreased relative to the average long-term pre-pandemic level in 2012–2019 by 2 fold for all forms of the TSF group on average (Siberian tick-borne typhus – STT, Astrakhan spotted fever and Mediterranean fever). A comparative analysis of the territories revealed a correlation between the incidence of STT and the number of medical facility visits due to “tick bites” (r=0.67, p=0.015), which, against the background of an increase in the frequency of contacts of the population with vectors in 2020–2021 in most regions and a decrease in the incidence in the same regions indicates the credible nature of the changes. The ranking of territories according to average long-term incidence rates made it possible to classify the Republic of Altai and the Altai Territory as regions of extremely high epidemic hazard as regards STT; high hazard – the Republic of Tuva; above average – the Republic of Khakassia, Khabarovsk Territory and the Jewish Autonomous Region. The established downward trend in the incidence of tick-borne rickettsiosis among the population will be sustained in most entities of the Russian Federation within the next 5 years, excluding the Republic of Altai, the Altai Territory, the Republic of Crimea and the city of Sevastopol, where current incidence or an increase should be expected. The results of the analysis indicate the need to put more emphasis on natural-focal infections at the time of COVID-19 pandemic

    Review of Epidemiological Situation on Rickettsioses in the Russian Federation in 2022 as Compared with 2013–2021, Forecast for 2023

    Get PDF
    The aim of the review was to characterize the epidemiological situation on tick-borne rickettsioses (TR) in the Russian Federation in 2022 in comparison with the pandemic years of 2020–2021 and the pre-pandemic period of 2013–2019, to give the forecast for 2023. During 2013–2022, a pattern was observed in the incidence of rickettsiosis of the tick-borne spotted fever group (with the exception of Astrakhan spotted fever – ASF), that is also characteristic of most other natural focal infections (NFIs): a sharp decrease in registered incidence rates in 2020–2021 with the subsequent increase in 2022 almost up to pre-pandemic levels or even exceedance in some regions. The absence of a defining influence of the frequency of contacts of the population with vectors on the decrease in the incidence in the period of 2020–2021 and the rise in the value in 2022 confirms the registration-related nature of the changes. Given due attention to the problem of effective detection and reporting of NFIs, we expect the incidence of tick-borne rickettsioses to remain within the confidence intervals of long-term average values in most endemic regions in 2023. Relaxed vigilance to the problem of NFIs may lead to a decline in the reported incidence of Siberian tick-borne typhus in the Krasnoyarsk and Zabaikalsky Territories, Republics of Tuva and Khakassia, Novosibirsk and Amur Regions; reduction in the incidence of ASF in Astrakhan Region. The main issue in detecting and registration of the tick-borne rickettsiosis incidence, objective assessment and forecasting of the epidemic situation as regards this group of infections is conditioned by the lack of domestic certified diagnostic test kits for laboratory verification of rickettsioses. Close cooperation between epidemiologists and clinicians is required to establish and register cases of TR based on clinical and epidemiological data