2,687 research outputs found
Classification of microarray gene expression cancer data by using artificial intelligence methods
Günümüzde bilgisayar teknolojilerinin gelişmesi ile birçok alanda yapılan çalışmaları etkilemiştir. Moleküler biyoloji ve bilgisayar teknolojilerinde meydana gelen gelişmeler biyoinformatik adlı bilimi ortaya çıkarmıştır. Biyoinformatik alanında meydana gelen hızlı gelişmeler, bu alanda çözülmeyi bekleyen birçok probleme çözüm olma yolunda büyük katkılar sağlamıştır. DNA mikroarray gen ekspresyonlarının sınıflandırılması da bu problemlerden birisidir. DNA mikroarray çalışmaları, biyoinformatik alanında kullanılan bir teknolojidir. DNA mikroarray veri analizi, kanser gibi genlerle alakalı hastalıkların teşhisinde çok etkin bir rol oynamaktadır. Hastalık türüne bağlı gen ifadeleri belirlenerek, herhangi bir bireyin hastalıklı gene sahip olup olmadığı büyük bir başarı oranı ile tespit edilebilir. Bireyin sağlıklı olup olmadığının tespiti için, mikroarray gen ekspresyonları üzerinde yüksek performanslı sınıflandırma tekniklerinin kullanılması büyük öneme sahiptir.
DNA mikroarray’lerini sınıflandırmak için birçok yöntem bulunmaktadır. Destek Vektör Makinaları, Naive Bayes, k-En yakın Komşu, Karar Ağaçları gibi birçok istatistiksel yöntemler yaygın olarak kullanlmaktadır. Fakat bu yöntemler tek başına kullanıldığında, mikroarray verilerini sınıflandırmada her zaman yüksek başarı oranları vermemektedir. Bu yüzden mikroarray verilerini sınıflandırmada yüksek başarı oranları elde etmek için yapay zekâ tabanlı yöntemlerin de kullanılması yapılan çalışmalarda görülmektedir.
Bu çalışmada, bu istatistiksel yöntemlere ek olarak yapay zekâ tabanlı ANFIS gibi bir yöntemi kullanarak daha yüksek başarı oranları elde etmek amaçlanmıştır. İstatistiksel sınıflandırma yöntemleri olarak K-En Yakın Komşuluk, Naive Bayes ve Destek Vektör Makineleri kullanılmıştır. Burada Göğüs ve Merkezi Sinir Sistemi kanseri olmak üzere iki farklı kanser veri seti üzerinde çalışmalar yapılmıştır.
Sonuçlardan elde edilen bilgilere göre, genel olarak yapay zekâ tabanlı ANFIS tekniğinin, istatistiksel yöntemlere göre daha başarılı olduğu tespit edilmiştir
Visualization of Big Spatial Data using Coresets for Kernel Density Estimates
The size of large, geo-located datasets has reached scales where
visualization of all data points is inefficient. Random sampling is a method to
reduce the size of a dataset, yet it can introduce unwanted errors. We describe
a method for subsampling of spatial data suitable for creating kernel density
estimates from very large data and demonstrate that it results in less error
than random sampling. We also introduce a method to ensure that thresholding of
low values based on sampled data does not omit any regions above the desired
threshold when working with sampled data. We demonstrate the effectiveness of
our approach using both, artificial and real-world large geospatial datasets
Automating Data Science: Prospects and Challenges
Given the complexity of typical data science projects and the associated
demand for human expertise, automation has the potential to transform the data
science process.
Key insights:
* Automation in data science aims to facilitate and transform the work of
data scientists, not to replace them.
* Important parts of data science are already being automated, especially in
the modeling stages, where techniques such as automated machine learning
(AutoML) are gaining traction.
* Other aspects are harder to automate, not only because of technological
challenges, but because open-ended and context-dependent tasks require human
interaction.Comment: 19 pages, 3 figures. v1 accepted for publication (April 2021) in
Communications of the AC
- …