7 research outputs found

    Multi-relational data mining

    Get PDF
    An important aspect of data mining algorithms and systems is that they should scale well to large databases. A consequence of this is that most data mining tools are based on machine learning algorithms that work on data in attribute-value format. Experience has proven that such 'single-table' mining algorithms indeed scale well. The downside of this format is, however, that more complex patterns are simply not expressible in this format and, thus, cannot be discovered. One way to enlarge the expressiveness is to generalize, as in ILP, from one-table mining to multiple table mining, i.e., to support mining on full relational databases. The key step in such a generalization is to ensure that the search space does not explode and that efficiency and, thus, scalability are maintained. In this paper we present a framework and an architecture that provide such a generalization. In this framework the semantic information in the database schema, e.g., foreign keys, are exploited to prune the search space and, in the architecture, database primitives are defined to ensure efficiency. Moreover, the framework induces a canonical generalization of algorithms, i.e., if the generalized algorithms are run on a single table database, they give the same results as their single-table counterparts. The framework is illustrated by the Warmr algorithm, which is a multi-relational generalization of the Apriori algorithm

    Reverse Engineering Databases for Knowledge Discovery

    Get PDF
    Abstract Many data mining tools cannot be used directly to analyze the complex sets of relations which are found in large database systems. In our experience, data miners rely on a well-defined data model, or the knowledge of a data expert, to isolate and extract candidate data sets prior to mining the data. For many databases, typically large legacy systems, a reliable data model is often unavailable and access to the data expert can be limited. In this paper we use reverse engineering techniques to infer a model of the database. Reverse engineering a database can be seen as knowledge discovery in its own right and the resulting data model may be made available to data mining tools as background knowledge. In addition, minable data sets can be produced from the inferred data model and analyzed using conventional data mining tools. Our approach reduces the data miner's reliance on a well-defmed data model and the data expert

    Data mining and database systems: integrating conceptual clustering with a relational database management system.

    Get PDF
    Many clustering algorithms have been developed and improved over the years to cater for large scale data clustering. However, much of this work has been in developing numeric based algorithms that use efficient summarisations to scale to large data sets. There is a growing need for scalable categorical clustering algorithms as, although numeric based algorithms can be adapted to categorical data, they do not always produce good results. This thesis presents a categorical conceptual clustering algorithm that can scale to large data sets using appropriate data summarisations. Data mining is distinguished from machine learning by the use of larger data sets that are often stored in database management systems (DBMSs). Many clustering algorithms require data to be extracted from the DBMS and reformatted for input to the algorithm. This thesis presents an approach that integrates conceptual clustering with a DBMS. The presented approach makes the algorithm main memory independent and supports on-line data mining

    Data mining and database systems : integrating conceptual clustering with a relational database management system

    Get PDF
    Many clustering algorithms have been developed and improved over the years to cater for large scale data clustering. However, much of this work has been in developing numeric based algorithms that use efficient summarisations to scale to large data sets. There is a growing need for scalable categorical clustering algorithms as, although numeric based algorithms can be adapted to categorical data, they do not always produce good results. This thesis presents a categorical conceptual clustering algorithm that can scale to large data sets using appropriate data summarisations. Data mining is distinguished from machine learning by the use of larger data sets that are often stored in database management systems (DBMSs). Many clustering algorithms require data to be extracted from the DBMS and reformatted for input to the algorithm. This thesis presents an approach that integrates conceptual clustering with a DBMS. The presented approach makes the algorithm main memory independent and supports on-line data mining.EThOS - Electronic Theses Online ServiceGBUnited Kingdo

    Национална безбедност Републике Србије у регионалном безбедносном поткомплексу Западни Балкан

    Get PDF
    The regional security complex theory, at least according to founders of this theoretical approach, can be used at four different levels, and where one of these levels is linked to national security. The subject of this thesis is related to the examination of RSCT cognitiveexplanatory potential in the national security analysis. The main idea that the regional security complex or subcomplex is a relatively good framework for the analysis of the national security of the specific state was questioned in the particular case study which covered the national security of the Republic of Serbia in the Western Balkans subcomplex. Аrguments regarding the adequacy of selected case study is also offered in dissertation. In these paper the RSCT conceptual network was complemented with some of the key concepts in security studies: the concept of national interest, power and strength of the state, and which was also explained why. In the study of was u The documentary material and adapted Nuechterlein matrix were used for analysis of national interest, the CIA world factbook matrix for power of Western Balkans states, and FSI matrix for strength of the states. These findings were used to analyze the security interdependence, respectively regional security dynamics establish by states/unites of WBRSSC. In order to enable comparison of findings and conclusions with original authors, in these research RSCT was used in a way that Buzen and Waever are using this theoretical framework in their papers. As typical for Buzen and Wæver, the probable scenarios of possible transformation of WBRSSC, as well as the presumed effects of external actors were determined in this theses as well. Considering case study the cognitive-explanatory potential of the RSCT in the national security analisys was identified by establishing advantages and disadvantages, and there was also offered recommendations for improvement of this theoretical framework, but also its application in the national security analisysТеорију регионалног безбедносног комплекса је бар према утемељивачима овог теоријског приступа могуће користити на четири различита нивоа, а где се један од нивоа примене доводи у везу са националном безбедношћу. Тема ове дисертације је везана за испитивање сазнајно-експланаторног потенцијала ТРБК у проучавању националне безбедност. Основна идеја, да регионални безбедносни комплекс, односно поткомплекс представља релативно добар оквир за анализу националне безбедности конкретне државе, проверавана је у студији случаја којом је обухваћена национална безбедност Републике Србије у регионалном безбедносном поткомплексу Западни Балкан. У дисертацији је такође понуђена аргументација у вези са адекватношћу одабране студије случаја. Појмовна мрежа ТРБК је за потребе овог истраживања допуњена неким од кључних појмова у студијама безбедности: појмом националног интереса, моћи и снаге државе, а што је такође објашњено и аргументовано у раду. У проучавању националног интереса коришћена је анализа документационе грађе и адаптирана Нектерлајнова матрица, за анализу моћи коришћена је CIA world factbook матрица, док је у анализи снаге западнобалканских држава коришћена FSI матрица. Добијени налази су коришћени у анализи безбедносне међузависности, односно регионалне безбедносне динамике које успостављају државе/јединице РБПКЗБ. ТРБК је коришћена на начин на који Бузен и Вејвер користе овај теоријски оквир у својим радовима, а како би била омогућена компарација налаза и закључака са налазима ових аутора. Својствено Бузену и Вејверу и у овој дисертацији су утврђени вероватни сценарији могућих трансформација Западнобалканског поткомплекса, као и претпостављени утицаји спољних актера. На основу проучене студије случаја утврђен је сазнајно-експланаторни потенцијал ТРБК у проучавању националне безбедности тако што су истакнуте предности и недостаци, али и тако што су понуђене препоруке за унапређење овог теоријског оквира, али и његове примене у проучавању националне безбедност

    The Republic of Serbia national security in the Western Balkans regional security complex

    Get PDF
    Теорију регионалног безбедносног комплекса је бар према утемељивачима овог теоријског приступа могуће користити на четири различита нивоа, а где се један од нивоа примене доводи у везу са националном безбедношћу. Тема ове дисертације је везана за испитивање сазнајно-експланаторног потенцијала ТРБК у проучавању националне безбедност. Основна идеја, да регионални безбедносни комплекс, односно поткомплекс представља релативно добар оквир за анализу националне безбедности конкретне државе, проверавана је у студији случаја којом је обухваћена национална безбедност Републике Србије у регионалном безбедносном поткомплексу Западни Балкан. У дисертацији је такође понуђена аргументација у вези са адекватношћу одабране студије случаја. Појмовна мрежа ТРБК је за потребе овог истраживања допуњена неким од кључних појмова у студијама безбедности: појмом националног интереса, моћи и снаге државе, а што је такође објашњено и аргументовано у раду. У проучавању националног интереса коришћена је анализа документационе грађе и адаптирана Нектерлајнова матрица, за анализу моћи коришћена је CIA world factbook матрица, док је у анализи снаге западнобалканских држава коришћена FSI матрица. Добијени налази су коришћени у анализи безбедносне међузависности, односно регионалне безбедносне динамике које успостављају државе/јединице РБПКЗБ. ТРБК је коришћена на начин на који Бузен и Вејвер користе овај теоријски оквир у својим радовима, а како би била омогућена компарација налаза и закључака са налазима ових аутора. Својствено Бузену и Вејверу и у овој дисертацији су утврђени вероватни сценарији могућих трансформација Западнобалканског поткомплекса, као и претпостављени утицаји спољних актера. На основу проучене студије случаја утврђен је сазнајно-експланаторни потенцијал ТРБК у проучавању националне безбедности тако што су истакнуте предности и недостаци, али и тако што су понуђене препоруке за унапређење овог теоријског оквира, али и његове примене у проучавању националне безбедностиThe regional security complex theory, at least according to founders of this theoretical approach, can be used at four different levels, and where one of these levels is linked to national security. The subject of this thesis is related to the examination of RSCT cognitiveexplanatory potential in the national security analysis. The main idea that the regional security complex or subcomplex is a relatively good framework for the analysis of the national security of the specific state was questioned in the particular case study which covered the national security of the Republic of Serbia in the Western Balkans subcomplex. Аrguments regarding the adequacy of selected case study is also offered in dissertation. In these paper the RSCT conceptual network was complemented with some of the key concepts in security studies: the concept of national interest, power and strength of the state, and which was also explained why. In the study of was u The documentary material and adapted Nuechterlein matrix were used for analysis of national interest, the CIA world factbook matrix for power of Western Balkans states, and FSI matrix for strength of the states. These findings were used to analyze the security interdependence, respectively regional security dynamics establish by states/unites of WBRSSC. In order to enable comparison of findings and conclusions with original authors, in these research RSCT was used in a way that Buzen and Waever are using this theoretical framework in their papers. As typical for Buzen and Wæver, the probable scenarios of possible transformation of WBRSSC, as well as the presumed effects of external actors were determined in this theses as well. Considering case study the cognitive-explanatory potential of the RSCT in the national security analisys was identified by establishing advantages and disadvantages, and there was also offered recommendations for improvement of this theoretical framework, but also its application in the national security analisy