81,735 research outputs found

    Analysis of a Gibbs sampler method for model based clustering of gene expression data

    Full text link
    Over the last decade, a large variety of clustering algorithms have been developed to detect coregulatory relationships among genes from microarray gene expression data. Model based clustering approaches have emerged as statistically well grounded methods, but the properties of these algorithms when applied to large-scale data sets are not always well understood. An in-depth analysis can reveal important insights about the performance of the algorithm, the expected quality of the output clusters, and the possibilities for extracting more relevant information out of a particular data set. We have extended an existing algorithm for model based clustering of genes to simultaneously cluster genes and conditions, and used three large compendia of gene expression data for S. cerevisiae to analyze its properties. The algorithm uses a Bayesian approach and a Gibbs sampling procedure to iteratively update the cluster assignment of each gene and condition. For large-scale data sets, the posterior distribution is strongly peaked on a limited number of equiprobable clusterings. A GO annotation analysis shows that these local maxima are all biologically equally significant, and that simultaneously clustering genes and conditions performs better than only clustering genes and assuming independent conditions. A collection of distinct equivalent clusterings can be summarized as a weighted graph on the set of genes, from which we extract fuzzy, overlapping clusters using a graph spectral method. The cores of these fuzzy clusters contain tight sets of strongly coexpressed genes, while the overlaps exhibit relations between genes showing only partial coexpression.Comment: 8 pages, 7 figure

    An adaptive neuro fuzzy inference system to model the uniaxial compressive strength of cemented hydraulic backfill

    Get PDF
    Purpose. The purpose of this paper is to develop the models for predicting the uniaxial compressive strength (UCS) of cemented hydraulic backfill (CHB), a widely used technique for filling underground voids created by mining operations as it provides the high strength required for safe and economical working environment and allows the use of waste rock from mining operations as well as tailings from mineral processing plants as ingredients. Methods. In this study, different modelling techniques such as conventional linear, nonlinear multiple regression and one of the evolving soft computing methods, adaptive neuro fuzzy inference system (ANFIS), were used for the prediction of UCS, the main criterion used to design backfill recipe. Findings. Statistical performance indices used to evaluate the efficiency of the developed models indicated that the ANFIS model can effectively be implemented for designing CHB with desired UCS. As proved by the performance indicators ANFIS model gives more compatible results with the expert opinion and current literature than conventional modelling techniques. Originality. In order to construct the models a very large database, containing more than 1600 UCS test results, was used. In addition to widely used conventional regression based modelling techniques, one of the evolving soft computing methods, ANFIS was employed. Numerical examples showing the implementation of constructed models were provided. Practical implementation. As proved by the statistical performance indicators, the developed models can be used for a reliable prediction of the UCS of CHB. However, more accurate results can be achieved by expanding the database and by constructing improved models using the algorithm presented in this paper.Мета. Побудова моделей для прогнозування межі міцності при одноосьовому стисканні цементної гідравлічної закладки для заповнення вироблених просторів шахт. Методика. Для досягнення поставленої мети були використані різні методи моделювання: лінійна та нелінійна множинна регресія, а також порівняно недавно став популярним метод програмування – адаптивне нейронечітке логічне виведення (ANFIS). За їх допомогою було спрогнозовано зміну міцності на одноосьове стискання, що є ключовим показником для визначення складу закладної суміші. Для побудови моделей використана значна база даних, яка включає результати більш ніж 1600 випробувань на одноосьове стискання. Лабораторними дослідженнями також визначалися властивості закладних матеріалів і суміші. Результати. Модель ANFIS дала найкращу продуктивність з урахуванням статистичних показників ефективності, таких як середня абсолютна процентна похибка і змінний обліковий запис. Статистичні показники продуктивності, які використовуються для оцінки ефективності розроблених моделей, свідчать, що моделювання за допомогою ANFIS дозволяє отримати результати, які більше відповідають експертній оцінці та даним з сучасної літератури, ніж інформація, отримана за допомогою традиційного моделювання. Встановлено, що на відміну від регресивного моделювання, ANFIS не вимагає заздалегідь визначених математичних рівнянь для взаємозв’язку між вхідними та вихідними змінними і використовує наданий набір даних для ефективного визначення структури моделі. Наукова новизна. Вперше для прогнозування міцності при одноосьовому стисканні були використані не лише традиційні способи моделювання, засновані на регресії, а й інноваційний метод програмування – адаптивне нейронечітке логічне виведення ANFIS. У статті наведені чисельні приклади впровадження нових побудованих моделей. Практична значимість. Статистичні індикатори продуктивності показали, що розроблені моделі можуть бути використані для надійного прогнозування міцності при одноосьовому стисканні й оптимальної рецептури закладної суміші. Однак, щоб отримати більш точні результати, необхідно мати більш широку базу даних і створити більш досконалі моделі на основі алгоритму, запропонованому в даній статті.Цель. Построение моделей для прогнозирования предела прочности при одноосном сжатии цементной гидравлической закладки для заполнения выработанных пространств шахт. Методика. Для достижения поставленной цели были использованы различные методы моделирования: линейная и нелинейная множественная регрессия, а также сравнительно недавно ставший популярным метод программирования – адаптивный нейронечеткий логический вывод (ANFIS). С их помощью было спрогнозировано изменение прочности на одноосное сжатие, что является ключевым показателем для определения состава закладочной смеси. Для построения моделей использована обширная база данных, которая включает результаты более чем 1600 испытаний на одноосное сжатие. Лабораторными исследованиями также определялись свойства закладочных материалов и смеси. Результаты. Модель ANFIS дала наилучшую производительность с учетом статистических показателей эффективности, таких как средняя абсолютная процентная погрешность и переменная учетная запись. Статистические показатели производительности, используемые для оценки эффективности разработанных моделей, свидетельствуют, что моделирование с помощью ANFIS позволяет получить результаты, которые более соответствуют экспертной оценке и данным из современной литературы, чем информация, полученная при помощи традиционного моделирования. Установлено, что в отличие от регрессионного моделирования, ANFIS не требует заранее определенных математических уравнений для взаимосвязи между входными и выходными переменными и использует предоставленный набор данных для эффективного определения структуры модели. Научная новизна. Впервые для прогнозирования прочности при одноосном сжатии были использованы не только традиционные способы моделирования, основанные на регрессии, но и инновационный метод программирования – адаптивный нейронечеткий логический вывод ANFIS. В статье приведены численные примеры внедрения новых построенных моделей. Практическая значимость. Статистические индикаторы производительности показали, что разработанные модели могут быть использованы для надежного прогнозирования прочности при одноосном сжатии и оптимальной рецептуры закладочной смеси. Однако, чтобы получить более точные результаты, необходимо иметь более широкую базу данных и создать более совершенные модели на основе алгоритма, предложенного в данной статье.The authors thank the staff and the managers of Jinfeng underground gold mine for their helps and cooperation during field and laboratory studies. The company is also acknowledged for the permission to use and publish the data

    Knowledge discovery for friction stir welding via data driven approaches: Part 2 – multiobjective modelling using fuzzy rule based systems

    Get PDF
    In this final part of this extensive study, a new systematic data-driven fuzzy modelling approach has been developed, taking into account both the modelling accuracy and its interpretability (transparency) as attributes. For the first time, a data-driven modelling framework has been proposed designed and implemented in order to model the intricate FSW behaviours relating to AA5083 aluminium alloy, consisting of the grain size, mechanical properties, as well as internal process properties. As a result, ‘Pareto-optimal’ predictive models have been successfully elicited which, through validations on real data for the aluminium alloy AA5083, have been shown to be accurate, transparent and generic despite the conservative number of data points used for model training and testing. Compared with analytically based methods, the proposed data-driven modelling approach provides a more effective way to construct prediction models for FSW when there is an apparent lack of fundamental process knowledge

    Fuzzy Interval-Valued Multi Criteria Based Decision Making for Ranking Features in Multi-Modal 3D Face Recognition

    Get PDF
    Soodamani Ramalingam, 'Fuzzy interval-valued multi criteria based decision making for ranking features in multi-modal 3D face recognition', Fuzzy Sets and Systems, In Press version available online 13 June 2017. This is an Open Access paper, made available under the Creative Commons license CC BY 4.0 https://creativecommons.org/licenses/by/4.0/This paper describes an application of multi-criteria decision making (MCDM) for multi-modal fusion of features in a 3D face recognition system. A decision making process is outlined that is based on the performance of multi-modal features in a face recognition task involving a set of 3D face databases. In particular, the fuzzy interval valued MCDM technique called TOPSIS is applied for ranking and deciding on the best choice of multi-modal features at the decision stage. It provides a formal mechanism of benchmarking their performances against a set of criteria. The technique demonstrates its ability in scaling up the multi-modal features.Peer reviewedProo
    corecore