Search CORE

9 research outputs found

Порівняння якості та швидкості кластеризації алгоритмом Ллойда залежно від методу ініціалізації

Author: Honcharuk O. M.
Matsuga O. M.
Publication venue: 'Oles Honchar Dnipropetrovsk National University'
Publication date: 01/08/2017
Field of study

Computational experiments to compare clustering quality and speed by Lloyd’s algorithm depending on initialization method were carried out. Five methods for initial cluster centers choosing were used for comparison. Experimental results revealed that modified k-means++ method should be used as initialization method for small data sets. Проведены вычислительные эксперименты для сравнения качества и скорости кластеризации алгоритмом Ллойда в зависимости от метода инициализации. В процессе сравнения рассмотрены пять методов, позволяющие выбрать начальные центры кластеров для алгоритма Ллойда. Результаты экспериментов показали преимущества модифицированного метода k-means++ для инициализации в случае небольших наборов данных.Проведено обчислювальні експерименти для порівняння якості та швидкості кластеризації алгоритмом Ллойда залежно від методу ініціалізації. У процесі порівняння розглянуто п’ять методів, що дозволяють обрати початкові центри кластерів для алгоритму Ллойда. Результати експериментів засвідчили перевагу модифікованого методу k-means++ як методу ініціалізації у випадку невеликих наборів даних

Actual problems of automation and information technology (E-Journal) / Актуальні проблеми автоматизації та інформаційних технологій

ПРОГРАМНЕ ЗАБЕЗПЕЧЕННЯ ВІДНОВЛЕННЯ РОЗПОДІЛІВ ЗА МАЛИМИ ВИБІРКАМИ

Author: Basova H. O.
Matsuga O. M.
Publication venue: 'Oles Honchar Dnipropetrovsk National University'
Publication date: 01/11/2012
Field of study

The program «SmallSample» for distributions restoration using small samples is developed.The distributions nonparametric restoration methods for small samples are compared.Разработано программное обеспечение «SmallSample» восстановления распределений по малым выборкам. Проведено сравнение работы непараметрических методов восстановления распределений по малым выборкам.Розроблено програмне забезпечення «SmallSample» відновлення розподілів за малими вибірками. Проведено порівняння роботи непараметричних методів відновлення розподілів за малими вибірками

Actual problems of automation and information technology (E-Journal) / Актуальні проблеми автоматизації та інформаційних технологій

ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ КОРОТКОСТРОКОВОГО ПРОГНОЗУВАННЯ ПЕРВИННОЇ ІНВАЛІДНОСТІ В УКРАЇНІ

Author: Drozdova I. V.
Matsuga O. M.
Publication venue: 'Oles Honchar Dnipropetrovsk National University'
Publication date: 01/11/2013
Field of study

The information technology of primary disability forecasting in Ukraine is developed. It is based on combined using of short-term forecasting adapt methods.Разработана информационная технология прогнозирования первичной инвалидности в Украине на основе комплексного применения адаптивных методов краткосрочного прогнозирования.Розроблено інформаційну технологію прогнозування первинної інвалідності в Україні на базі комплексного застосування адаптивних методів короткострокового прогнозування

Actual problems of automation and information technology (E-Journal) / Актуальні проблеми автоматизації та інформаційних технологій

ОБЧИСЛЮВАЛЬНА СХЕМА ІДЕНТИФІКАЦІЇ РОЗПОДІЛІВ З КЛАСУ НОРМАЛЬНОГО

Author: Matsuga O. M.
Shubina H. S.
Publication venue: 'Oles Honchar Dnipropetrovsk National University'
Publication date: 01/11/2011
Field of study

A computing scheme for identification and restoration of distribution from normal distribution class is offered. It is notable for identification of a spline-normal distribution by automatic search of spline nodes on a probability paper.Предложена вычислительная схема идентификации распределений из класса нормального, которая отличается от существующих возможностью идентификации сплайн-распределения путем автоматизированного поиска узлов сплайна на вероятностной бумаге.Запропоновано обчислювальну схему ідентифікації розподілів з класу нормального, яка відрізняється від існуючих можливістю ідентифікації сплайн-розподілу шляхом автоматизованого пошуку вузлів сплайна на ймовірнісному папері

Actual problems of automation and information technology (E-Journal) / Актуальні проблеми автоматизації та інформаційних технологій

Кластеризація даних з пропусками методом k-середніх

Author: Matsuga O. M.
Sheremet V. S.
Publication venue: 'Oles Honchar Dnipropetrovsk National University'
Publication date: 20/12/2019
Field of study

Приведен обзор существующих подходов к кластеризации данных с пропусками. Проведены вычислительные эксперименты для их сравнения в случае применения метода k-средних. Для сравнения выбраны методы заполнения пропусков средним, медианой и на основе метода главных компонент, а также методы кластеризации данных с пропусками KSC и k-POD. Полученные результаты показали преимущества метода KSC и заполнения пропусков на основе метода главных компонент.The clustering task is a very important data mining task arising in many applications. However, well known and widely used clustering methods cannot work with datasets that have missing values. The paper provides an overview of the existing approaches to data with missing values clustering and a comparative analysis of chosen approaches when applying the k-means clustering method. Commonly used approaches are: 1) deletion entities or features with missing values with further complete data clustering, 2) imputation (filling in the missing values) with further complete data clustering, 3) using clustering methods that work with missing data. The following methods within these approaches were chosen for comparison: mean substitution, median substitution, imputation based on principal component analysis and two k-means extensions – KSC and k-POD. In order to conduct the comparative analysis the software «ClustDMV» was developed on the C# using the .NET Core framework. The software is a desktop application with a graphical interface.The following computational experiments were carried out using the created software. One hundred two-dimensional datasets were simulated in each experiment. All the datasets in one experiment were modeled with the same clusters parameters. Each dataset consists of 800 entities from four clusters. Then a certain percentage of omissions were randomly entered into the data. After that, either the missing values were filled in and k-means method was used with the complete data, or the KSC and k-POD methods were applied to the data with missing values. In order to evaluate the clustering quality Rand index was used. Indexes obtained on all 100 datasets were averaged.The paper presents the results of three typical experiments. According to the results the KSC method and imputation based on principal component analysis showed the best performance.Наведено огляд існуючих підходів до кластеризації даних з пропусками. Проведено обчислювальні експерименти для їх порівняння у разі застосування методу k-середніх. Для порівняння обрано методи заповнення пропусків середнім, медіаною і на основі методу головних компонент, а також методи кластеризації даних з пропусками KSC і k-POD. Одержані результати показали перевагу методу кластеризації KSC та заповнення пропусків на основі методу головних компонент

Actual problems of automation and information technology (E-Journal) / Актуальні проблеми автоматизації та інформаційних технологій

ОБЧИСЛЮВАЛЬНІ СХЕМИ ІДЕНТИФІКАЦІЇ СПЛАЙН-РОЗПОДІЛІВ ЗА ЙМОВІРНІСНИМ ПАПЕРОМ

Author: Matsuga O. M.
Shubina H. S.
Publication venue: 'Oles Honchar Dnipropetrovsk National University'
Publication date: 01/11/2012
Field of study

The computing schemes of spline-distributions automated identification using probability paper are improved. They are tested on modeling data from normal, logarithmic normal, exponential and Weibull spline-distributions.Усовершенствованы предложенные вычислительные схемы автоматизированной идентификации сплайн-распределений по вероятностной бумаге. Проведено их тестирование на данных имитационного моделирования из нормального, логарифмически нормального, экспоненциального и Вейбулла сплайн-распределений.Удосконалено запропоновані обчислювальні схеми автоматизованої ідентифікації сплайн-розподілів за ймовірнісним папером. Здійснено їх тестування на даних імітаційного моделювання з нормального, логарифмічно нормального, експоненціального та Вейбулла сплайн-розподілів

Actual problems of automation and information technology (E-Journal) / Актуальні проблеми автоматизації та інформаційних технологій

Побудова моделі прогнозування результату лікування на прикладі однієї медичної задачі

Author: Dudukina S. O.
Grygoruk S. P.
Matsuga O. M.
Publication venue: 'Oles Honchar Dnipropetrovsk National University'
Publication date: 20/12/2020
Field of study

The paper considers the technology of building a treatment outcome prediction model in the form of binary logistic regression. The technology implies three stages. The first stage involves data preprocessing which includes anomaly detecting, missing values handling, one-hot encoding of categorical features, analyzing the correlations between features in order to exclude highly correlated features and classes balancing. The second stage involves a feature selection. The feature selection procedure based on the recursive feature elimination method was suggested for this stage. The third stage implies learning of binary logistic regression on a dataset with the selected features. Newton’s method was applied in order to learn the model in the research. To evaluate the model performance such metrics as accuracy, sensitivity and specificity were measured using 7-fold cross-validation technique. Two models for predicting the outcome of revascularization of the first basin while revascularization of the both basins is required in patients with combined atherosclerotic lesions of the cerebral and coronary arteries were built during practical testing of the technology. The first model predicts whether the outcome of revascularization will be favorable (1, 2, 3, 5) or not (4, 6) with 97% accuracy. If it predicts a favorable outcome, then the second model distinguishes the outcome 1, 5 from 2, 3 with 62% accuracy. The suggested feature selection procedure allowed significant reduction in the features number as well as building models without overfitting, whose performance was comparable to that of the model on the full set of features. The features number was reduced to 8 for the first model and 4 for the second model (initially there were 78 features). The scikit-learn python library and the Jupyter Notebook application were used to build the models.Рассмотрена технология построения модели прогнозирования результата лечения в виде бинарной логистической регрессии. В рамках технологии предложена процедура отбора информативных признаков на основе метода рекурсивного исключения признаков. В процессе практической апробации технологии построены две модели, позволяющие прогнозировать результат реваскуляризации первого бассейна при необходимости реваскуляризации обоих у больных с сочетанными атеросклеротическими поражениями церебральных и коронарных артерий при последовательной тактике лечения.Розглянуто технологію побудови моделі прогнозування результату лікування у вигляді бінарної логістичної регресії. В рамках технології запропоновано процедуру відбору інформативних ознак на основі методу рекурсивного вилучення ознак. У ході практичної апробації технології побудовано дві моделі, що дозволяють прогнозувати результат реваскуляризації першого басейну при необхідності реваскуляризації обох у хворих з поєднаними атеросклеротичними ураженнями церебральних та коронарних артерій при послідовній тактиці хірургічного лікування

Actual problems of automation and information technology (E-Journal) / Актуальні проблеми автоматизації та інформаційних технологій

Технологія порівняння результатів двох добових моніторувань артеріального тиску пацієнта

Author: Akimova A. K.
Drozdova I. V.
Matsuga O. M.
Publication venue: 'Oles Honchar Dnipropetrovsk National University'
Publication date: 01/12/2016
Field of study

Computer-oriented technology for results comparison of two daily blood pressure monitorings was developed. Software in which it was implemented was created. Testing results on real data corroborated technology efficiency.Разработана вычислительная технология сравнения результатов двух суточных мониторирований артериального давления. Создано программное обеспечение, в котором она реализована. Проведена практическая апробация технологии на реальных данных, которая подтвердила её эффективность.Розроблено обчислювальну технологію порівняння результатів двох добових моніторувань артеріального тиску. Створено програмне забезпечення, в якому її реалізовано. Виконано практичну апробацію технології на реальних даних, яка засвідчила її ефективність

Actual problems of automation and information technology (E-Journal) / Актуальні проблеми автоматизації та інформаційних технологій

Обчислювальна технологія порівняння результатів добового моніторування артеріального тиску в пацієнтів з артеріальною гіпертензією

Author: Akimova A. K.
Drozdova I. V.
Matsuga O. M.
Publication venue: 'Zaporozhye State Medical University'
Publication date: 30/05/2018
Field of study

The evaluation of treatment effectiveness and further patient with arterial hypertension (AH) monitoring require the target level of arterial pressure achievement and its control by means of daily monitoring of blood pressure (DMBP).Purpose of the work involves development, software implementation and practical approval of computational technology in order to compare the results of patient’s two daily monitoring of blood pressure (DМBP).Material and methods. The open controlled study included 10 patients with AH at the third stage in long term after a cerebral stroke. Patients were treated according to the regulatory basis. DBPM was conducted using device АВРМ-01 (Meditech, Hungary) twice (before the treatment and after 1 year).Results comparison of the first and repeated DMBP was carried out by means of proposed computational technology and its own software ArtHyper in which the technology was implemented. The technology is based on the comparison of DMBP indices distribution functions using the two-sample Kolmogorov test and the Wilcoxon test.Results. The proposed technology work was demonstrated in terms of two patients. The target level of arterial pressure was achieved only for the first patient. The majority of DMAT indices distribution for this patient did not change in a year, in other words, the blood pressure and heart rate remained stable due to the treatment. The level of PBP slightly decreased, but in this case it was a positive factor. The second patient didn’t follow the complete course of treatment and didn’t achieve the target level of blood pressure. His levels of diastolic blood pressure and heart rate increased.Conclusions. The computational technology of two patient’s DMBP results comparison was developed. Its practical testing was carried out on real data and demonstrated the effectiveness of technology to detect changes in the second results monitoring and the possibility of its application for the evaluation of rehabilitation and treatment efficiency in patients with arterial hypertension. Оценка эффективности лечения и контроль за состоянием больного артериальной гипертензией (АГ) требуют достижения целевого уровня артериального давления (АД) и его проверки с помощью суточного мониторирования артериального давления (СМАД).Цель работы – разработка и программная реализация вычислительной технологии для сравнения результатов двух СМАД пациента, а также практическая апробация технологии на реальных данных.Материалы и методы. Открытое контролируемое исследование охватывало 10 больных артериальной гипертензией ІІІ стадии в отдаленный срок после перенесенного мозгового инсульта. Лечение больных осуществляли согласно нормативной базе. СМАД проводили на аппарате АВРМ-01 (Meditech, Венгрия) дважды (до начала лечения и через 1 год).Результаты первого и повторного СМАД сравнивали с помощью предложенной вычислительной технологии и собственного программного обеспечения ArtHyper, в котором ее реализовали. Технология базируется на сравнении функций распределения показателей СМАД с помощью двухвыборочного критерия Колмогорова и критерия Вилкоксона.Результаты. Работу предложенной технологии продемонстрировали на примере двух пациентов, у одного из которых удалось достичь целевого уровня АД. У первого пациента распределение большинства показателей СМАД через год не изменилось, то есть благодаря лечению уровень АД и частота сердечных сокращений больного остались на стабильном уровне, несколько изменился уровень ПАД, но это было позитивным фактором. У второго пациента, который не придерживался назначенного лечения и не достиг целевого уровня АД, выросли уровень диастолического АД и частота сердечных сокращений.Выводы. Разработана вычислительная технология сравнения двух СМАД пациента. Проведена ее практическая апробация на реальных данных, которая подтвердила эффективность технологии для установления изменений в результатах повторного мониторирования и возможность ее применения для оценки результативности реабилитации и лечения больных артериальной гипертензией. Оцінювання ефективності лікування та контроль за станом пацієнта з артеріальною гіпертензією (АГ) потребують досягнення цільового рівня артеріального тиску (АТ) і його підтвердження за допомогою добового моніторування артеріального тиску (ДМАТ).Мета роботи – розробка та програмна реалізація обчислювальної технології для порівняння результатів двох ДМАТ пацієнта, а також практична апробація технології на реальних даних.Матеріали та методи. Відкрите контрольоване дослідження охоплювало 10 хворих на АГ ІІІ ст. у віддалений термін після перенесеного мозкового інсульту. Лікування хворих здійснювали згідно з нормативною базою. ДМАТ виконали на апараті ABPM-1 (Meditech, Угорщина) двічі (до початку лікування і через 1 рік).Результати першого та повторного ДМАТ порівняли за допомогою запропонованої обчислювальної технології та власного програмного забезпечення ArtHyper, в якому її реалізували. Технологія базується на порівнянні функцій розподілів показників ДМАТ за допомогою двовибіркового критерію Колмогорова та критерію Вілкоксона. Результати. Роботу технології продемонстрували на прикладі двох пацієнтів, в одного з них вдалося досягти цільового рівня АТ. У першого пацієнта розподіл більшості показників ДМАТ через рік не змінився, тобто завдяки лікуванню рівень АТ і частота серцевих скорочень хворого залишилися на стабільному рівні, дещо зменшився рівень ПАТ, але це позитивний фактор. У другого пацієнта, який не дотримувався призначеного лікування й не досяг цільового рівня АТ, підвищились рівень діастолічного АТ і частота серцевих скорочень.Висновки. Розробили обчислювальну технологію порівняння результатів двох ДМАТ пацієнта. Виконали її практичну апробацію на реальних даних, що засвідчила ефективність технології для виявлення змін у результатах повторного моніторування та можливість її застосування для оцінювання результативності реабілітації та лікування хворих на артеріальну гіпертензію.

Наукова періодика України