8 research outputs found

    Clustering-based approaches to SAGE data mining

    Get PDF
    Serial analysis of gene expression (SAGE) is one of the most powerful tools for global gene expression profiling. It has led to several biological discoveries and biomedical applications, such as the prediction of new gene functions and the identification of biomarkers in human cancer research. Clustering techniques have become fundamental approaches in these applications. This paper reviews relevant clustering techniques specifically designed for this type of data. It places an emphasis on current limitations and opportunities in this area for supporting biologically-meaningful data mining and visualisation

    Visual Methods for Examining Support Vector Machine Results, with Applications to Gene Expression Data Analysis

    Get PDF
    Support vector machines (SVM) offer a theoretically well-founded approach to automated learning of pattern classifiers. They have been proven to give highly accurate results in complex classification problems, for example, gene expression analysis. The SVM algorithm is also quite intuitive with a few inputs to vary in the fitting process and several outputs that are interesting to study. For many data mining tasks (e.g., cancer prediction) finding classifiers with good predictive accuracy is important, but understanding the classifier is equally important. By studying the classifier outputs we may be able to produce a simpler classifier, learn which variables are the important discriminators between classes, and find the samples that are problematic to the classification. Visual methods for exploratory data analysis can help us to study the outputs and complement automated classification algorithms in data mining. We present the use of tour-based methods to plot aspects of the SVM classifier. This approach provides insights about the cluster structure in the data, the nature of boundaries between clusters, and problematic outliers. Furthermore, tours can be used to assess the variable importance. We show how visual methods can be used as a complement to cross-validation methods in order to find good SVM input parameters for a particular data set

    Η εργαστηριακή προσέγγιση και αξιολόγηση του μεταγραφώματος στην πρόγνωση και στην εξατομικευμένη ιατρική του καρκίνου του μαστού

    Get PDF
    Τα τελευταία χρόνια, με τη ραγδαία εξέλιξη της βιοτεχνολογίας, έχουν αναπτυχθεί μέθοδοι ανίχνευσης και αντιμετώπισης των ασθενειών που πλήττουν τον παγκόσμιο πληθυσμό. Με τελικό στόχο τη βελτίωση ποιότητας ζωής του εκάστοτε ατόμου αλλά και την αποφυγή μείωσης του προσδόκιμου ζωής από μία από τις θανατηφόρες ασθένειες στις μέρες μας, τον καρκίνο, η επιστήμη έχει αναπτύξει τεχνικές που συνδυάζουν τη θεραπευτική αντιμετώπιση με τις πληροφορίες που προσφέρει η αποκωδικοποίηση του κάθε οργανισμού από τη μοριακή βιολογία. Αυτή είναι η έννοια της εξατομικευμένης ιατρικής, εργαλείο απαραίτητο για τα ιδανικότερα αποτελέσματα αντιμετώπισης. Ο καρκίνος του μαστού αποτελεί μία από τις πλέον θανατηφόρες ασθένειες που πλήττουν κατά κύριο λόγο το γυναικείο πληθυσμό του Δυτικού κόσμου. Σαν ασθένεια, έχει μελετηθεί σε βάθος για την βέλτιστη κατανόησή του. Παρ’ όλα αυτά παραμένει ασθένεια με πολλές μεταβλητές καθώς είναι πολυπαραγοντικό νόσημα γεγονός που καθιστά δύσκολη την πρόβλεψη καθώς και την αποτελεσματική θεραπεία. Από το 1953, που ανακαλύφθηκε πως το DNA αποτελεί το μέσον μεταβίβασης της γενετικής πληροφορίας, έχουν πραγματοποιηθεί πολυάριθμες μελέτες για την αποκωδικοποίηση του. Την τελευταία δεκαετία, έχει έρθει στο προσκήνιο η μελέτη του μεταγραφώματος. Το μεταγράφωμα αποτελεί το υλικό που καθορίζει την ορθή ή μη ενεργοποίηση των γονιδίων που ρυθμίζουν τη λειτουργία ενός οργανισμού. Συσσώρευση σφαλμάτων σε πολλαπλά σημεία κατά την διαδικασία μεταγραφής μπορούν να οδηγήσουν την ανάπτυξη ενός όγκου. Το είδος του καρκίνου, ο βαθμός κακοήθειας αλλά και ο τρόπος αντιμετώπισης μπορούν να καθοριστούν με την κατανόηση της γονιδιακής έκφρασης κάθε οργανισμού. Η παρούσα εργασία αποτελεί βιβλιογραφική ανασκόπηση με θέμα την ανάλυση του μεταγραφώματος σε ασθενείς με καρκίνο του μαστού. Θα αναλυθούν τεχνικές όπως ανάλυση μικροσυστοιχιών, η αλληλούχιση επόμενης γενιάς καθώς επίσης και ο στοχευμένος εντοπισμός γονιδίων που εμπλέκονται στο παθοφυσιολογικό μηχανισμό. Θα γίνει επίσης λεπτομερής αναφορά στα μοντέλα ταξινόμησης καθώς και τα πρωτόκολλα ανίχνευσης γονιδιακών υπογραφών για τον καθορισμό της θεραπείας σε κάθε ασθενή. Σκοπός: Ο σκοπός της παρούσας διπλωματικής εργασίας είναι η ανασκόπηση των έως τώρα εργαστηριακών τεχνικών και πρωτοκόλλων ανίχνευσης γονιδιακών υπογραφών για τη μελέτη της έκφρασης των γονιδίων που εμπλέκονται στην εμφάνιση της νόσου.In recent years, with the rapid development of technology, methods have been developed to detect and treat diseases that affect the world's population. With the ultimate goal being the improvement of quality of life for each individual in addition to avoiding reduced life expectancy from one of the deadliest diseases today, cancer, science has developed techniques that are able to combine medical treatment with the necessary information that is available through the expression of each organism by molecular biology. This is the concept of personalized medicine, a tool necessary for the best treatment results. Breast cancer is one of the deadliest diseases affecting mainly the female population of the Western world. As a disease, it has been studied in depth for its optimal understanding. Nevertheless, it remains a disease with many variables as it is a multifactorial disease which makes it difficult to predict its beginning as well as the correct treatment for patients. Since 1953, when DNA was discovered to be the molecule able to transfer genetic information, numerous studies have been conducted to decode it. The last decade has given rise to the study of a concept that before now was not at the forefront of research, the study of the transcriptome. The transcriptome is the material able to determine the activation or inactivation of those genes that regulate an organisms functionality. Accumulation of errors at multiple points during the transcription process can result in the growth of a tumour. The type of cancer, degree of malignancy and the necessary treatment can be determined by understanding the gene expression of each organism. This dissertation is a literature review on the analysis of the transcriptome as well as the evaluation of its analysis techniques and their corresponding results in relation to breast cancer. Techniques such as microarray analysis, next-generation sequencing as well as targeted localization of genes responsible for Breast Cancer. In addition, breast cancer classification models will be considered as well as gene signature detection protocols performed to determine treatment for each patient. Purpose: The purpose of this dissertation is to review the laboratory techniques to date that analyze the expression of genes due to the disease