2 research outputs found

    Clustering with Open Source Tools

    Get PDF
    U većini istraivanja obrada podataka predstavlja jedan od kljuČnih koraka. U većem broju slučajeva struktura tih podataka nije unaprijed poznata, te je potrebno tijekom analize grupirati podatke u klastere te iz takve strukture donijeti zaključke istraživanja. Danas se koristit vrlo veliki broj metoda za navedeni način obrade podataka i različitih alata pomoću kojih se te obrade izvršavaju. Razvijen je i veći broj alata koji su slobodni za korištenje (engl. open source) čija kvaliteta u sve više slučajeva prerasta kvalitetu komercijalnih rješenja. U radu će biti dan pregled jedne od najčešće korištenih metoda obrade podataka hijerarhijskim grupiranjem. Zatim će biti predstavljeni slobodni alati koji se mogu koristiti za primjenu te metode (npr. CLUTO, R,...). Neki od alata su samostalne aplikacije, dok su ostali alati biblioteke klasa koje se mogu jednostavno primijeniti iz nekog programskog jezika pomoću programskih sučelja.Data processing represents one of the key steps during most research projects. In most cases structure of data to process is not known in advance, so it is necessary during the data analysis to group the research data into data clusters, from which research conclusions can be derived. Today large numbers of methods, as well as diverse set of software tools are used for data clustering. Many of such software tools are open source software, which in quality in many cases surpass the quality of many commercial software solutions. This paper will provide an overview of one of the most used methods for hierarchical data clustering, as well as overview of open source software tools for using the afore mentioned method (e.g. CLUTO, R). Some of the software tools are implemented as standalone applications, while others are implemented as libraries which can be easily invoked from within some other programming language development environment

    Clustering with Open Source Tools

    Get PDF
    U većini istraivanja obrada podataka predstavlja jedan od kljuČnih koraka. U većem broju slučajeva struktura tih podataka nije unaprijed poznata, te je potrebno tijekom analize grupirati podatke u klastere te iz takve strukture donijeti zaključke istraživanja. Danas se koristit vrlo veliki broj metoda za navedeni način obrade podataka i različitih alata pomoću kojih se te obrade izvršavaju. Razvijen je i veći broj alata koji su slobodni za korištenje (engl. open source) čija kvaliteta u sve više slučajeva prerasta kvalitetu komercijalnih rješenja. U radu će biti dan pregled jedne od najčešće korištenih metoda obrade podataka hijerarhijskim grupiranjem. Zatim će biti predstavljeni slobodni alati koji se mogu koristiti za primjenu te metode (npr. CLUTO, R,...). Neki od alata su samostalne aplikacije, dok su ostali alati biblioteke klasa koje se mogu jednostavno primijeniti iz nekog programskog jezika pomoću programskih sučelja.Data processing represents one of the key steps during most research projects. In most cases structure of data to process is not known in advance, so it is necessary during the data analysis to group the research data into data clusters, from which research conclusions can be derived. Today large numbers of methods, as well as diverse set of software tools are used for data clustering. Many of such software tools are open source software, which in quality in many cases surpass the quality of many commercial software solutions. This paper will provide an overview of one of the most used methods for hierarchical data clustering, as well as overview of open source software tools for using the afore mentioned method (e.g. CLUTO, R). Some of the software tools are implemented as standalone applications, while others are implemented as libraries which can be easily invoked from within some other programming language development environment
    corecore