5 research outputs found

    DISCOVERING KNOWLEDGE STRUCTURE IN THE WEB

    Get PDF
    Association Rule Mining is a widely used method for finding interesting relationships from large data sets. The challenge here is how to swiftly and accurately discover association rules from large data sets. To achieve this, this paper will (1) build a data warehouse system that simulates the secondary storage and represents a database by bit patterns, and (2) implement a new geometric algorithm to find association rules, called Maximal Simplex Algorithm. The data warehouse consists of very long bit columns. Each column is an item or an attribute value pair and a row represents a transaction or a tuple in a database. A bit value 1 in a row represents the transaction contain this item or the tuple contains this value. In this Maximal Simplex Algorithm, we interpret the set of bit columns as a set of independent vertices in a high dimension Euclidean space. The main idea is for each vertex, we find its star neighborhood, namely to find all simplexes that contains this vertex. An n-dimensional simplex is called n-simplex. An n-simplex represents the association rule of length n+1. Based on the experimental results, Maximal Simplex method improves the performance of association rule mining. And also it is possible to achieve parallel computing by using the data warehouse system

    рдорд╣рд┐рд╖рд╛рд╕реБрд░: рдорд┐рдердХ рд╡ рдкрд░рдВрдкрд░рд╛рдПрдВ

    Get PDF
    рдЗрдХреНрдХрд╕рд╡реАрдВ рд╕рджреА рдХреЗ рджреВрд╕рд░реЗ рджрд╢рдХ рдореЗрдВ рднрд╛рд░рдд рдореЗрдВ рдорд╣рд┐рд╖рд╛рд╕реБрд░ рдЖрдВрджреЛрд▓рди рджреНрд╡рд┐рдЬ рд╕рдВрд╕реНрдХреГрддрд┐ рдХреЗ рд▓рд┐рдП рдЪреБрдиреМрддреА рдмрдирдХрд░ рдЙрднрд░рд╛ред рдЗрд╕рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдЖрджрд┐рд╡рд╛рд╕рд┐рдпреЛрдВ, рдкрд┐рдЫрдбрд╝реЛрдВ рдФрд░ рджрд▓рд┐рддреЛрдВ рдХреЗ рдПрдХ рдмрдбрд╝реЗ рд╣рд┐рд╕реНрд╕реЗ рдиреЗ рдЕрдкрдиреА рд╕рд╛рдВрд╕реНрдХреГрддрд┐рдХ рджрд╛рд╡реЗрджрд╛рд░реА рдкреЗрд╢ рдХреАред рд▓реЗрдХрд┐рди рдпрд╣ рдЖрдВрджреЛрд▓рди рдХреНрдпрд╛ рд╣реИ, рдЗрд╕рдХреА рдЬрдбрд╝реЗрдВ рд╕рдорд╛рдЬ рдореЗрдВ рдХрд╣рд╛рдВ рддрдХ рдлреИрд▓реА рд╣реИрдВ, рдмрд╣реБрдЬрдиреЛрдВ рдХреА рд╕рд╛рдВрд╕реНрдХреГрддрд┐рдХ рдкрд░рдВрдкрд░рд╛ рдореЗрдВ рдЗрд╕рдХрд╛ рдХреНрдпрд╛ рд╕реНрдерд╛рди рд╣реИ, рдореМрдЬреВрджрд╛ рд▓реЛрдХ-рдЬреАрд╡рди рдореЗрдВ рдорд╣рд┐рд╖рд╛рд╕реБрд░ рдХреА рдЙрдкрд╕реНрдерд┐рддрд┐ рдХрд┐рди-рдХрд┐рди рд░реВрдкреЛрдВ рдореЗрдВ рд╣реИ, рдЗрд╕рдХреЗ рдкреБрд░рд╛рддрд╛рддреНрд╡рд┐рдХ рд╕рд╛рдХреНрд╖реНрдп рдХреНрдпрд╛ рд╣реИрдВ? рдЧреАрддреЛрдВ-рдХрд╡рд┐рддрд╛рдУрдВ рд╡ рдирд╛рдЯрдХреЛрдВ рдореЗрдВ рдорд╣рд┐рд╖рд╛рд╕реБрд░ рдХрд┐рд╕ рд░реВрдк рдореЗрдВ рдпрд╛рдж рдХрд┐рдП рдЬрд╛ рд░рд╣реЗ рд╣реИрдВ рдФрд░ рдЕрдХрд╛рджрдорд┐рдХ-рдмреМрджреНрдзрд┐рдХ рд╡рд░реНрдЧ рдХреЛ рдЗрд╕ рдЖрдВрджреЛрд▓рди рдиреЗ рдХрд┐рд╕ рд░реВрдк рдореЗрдВ рдкреНрд░рднрд╛рд╡рд┐рдд рдХрд┐рдпрд╛ рд╣реИ, рдЙрдирдХреА рдкреНрд░рддрд┐рдХреНрд░рд┐рдпрд╛рдПрдВ рдХреНрдпрд╛ рд╣реИрдВ? рдЖрджрд┐ рдкреНрд░рд╢реНрдиреЛрдВ рдкрд░ рд╡рд┐рдорд░реНрд╢ рд╣рдореЗрдВ рдПрдХ рдРрд╕реА рдмреМрджреНрдзрд┐рдХ рдпрд╛рддреНрд░рд╛ рдХреА рдУрд░ рд▓реЗ рдЬрд╛рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рд╣реИрдВ, рдЬрд┐рд╕рд╕реЗ рд╣рдордореЗрдВ рдЕрдзрд┐рдХрд╛рдВрд╢ рдЕрднреА рддрдХ рдЕрдкрд░рд┐рдЪрд┐рдд рд░рд╣реЗ рд╣реИрдВред рдХреНрдпрд╛ рдорд╣рд┐рд╖рд╛рд╕реБрд░ рджрдХреНрд╖рд┐рдг рдПрд╢рд┐рдпрд╛ рдХреЗ рдЕрдирд╛рд░реНрдпреЛрдВ рдХреЗ рдкреВрд░реНрд╡рдЬ рдереЗ, рдЬреЛ рдмрд╛рдж рдореЗрдВ рдПрдХ рдорд┐рдердХреАрдп рдЪрд░рд┐рддреНрд░ рдмрди рдХрд░ рдмрд╣реБрдЬрди рд╕рдВрд╕реНрдХреГрддрд┐ рдХреЗ рдкреНрд░рддреАрдХ рдкреБрд░реБрд╖ рдмрди рдЧрдП? рдХреНрдпрд╛ рдпрд╣ рдмрд╣реБрдд рдмрд╛рдж рдХреА рдкрд░рд┐рдШрдЯрдирд╛ рд╣реИ, рдЬрдм рдорд╛рдХрдгреНрдбреЗрдп рдкреБрд░рд╛рдг, рджреБрд░реНрдЧрд╛рд╕рдкреНрддрд╢рддреА рдЬреИрд╕реЗ рдЧреНрд░рдВрде рд░рдЪ рдХрд░, рдПрдХ рдХрдкреЛрд▓-рдХрд▓реНрдкрд┐рдд рджреЗрд╡реА рдХреЗ рд╣рд╛рдереЛрдВ рдорд╣рд┐рд╖рд╛рд╕реБрд░ рдХреА рд╣рддреНрдпрд╛ рдХреА рдХрд╣рд╛рдиреА рдЧрдврд╝реА рдЧрдИ? рдЗрд╕ рдЖрдВрджреЛрд▓рди рдХреА рд╕реИрджреНрдзрд╛рдВрддрд┐рдХреА рдХреНрдпрд╛ рд╣реИ? рдкреНрд░рдореЛрдж рд░рдВрдЬрди рджреНрд╡рд╛рд░рд╛ рд╕рдВрдкрд╛рджрд┐рдд рдХрд┐рддрд╛рдм тАЬрдорд╣рд┐рд╖рд╛рд╕реБрд░: рдорд┐рдердХ рд╡ рдкрд░рдВрдкрд░рд╛рдПрдВтАЭ рдореЗрдВ рд▓реЗрдЦрдХреЛрдВ рдиреЗ рдЙрдкрд░реЛрдХреНрдд рдкреНрд░рд╢реНрдиреЛрдВ рдкрд░ рд╡рд┐рдЪрд╛рд░ рдХрд┐рдпрд╛ рд╣реИ рддрдерд╛ рд╡рд┐рд▓реБрдкреНрддрд┐ рдХреЗ рдХрдЧрд╛рд░ рдкрд░ рдЦрдбрд╝реЗ рдЕрд╕реБрд░ рд╕рдореБрджрд╛рдп рдХрд╛ рд╡рд┐рд╕реНрддреГрдд рдиреГрд╡рдВрд╢рд╢рд╛рд╕реНрддреНрд░реАрдп рдЕрдзреНрдпрдпрди рднреА рдкреНрд░рд╕реНрддреБрдд рдХрд┐рдпрд╛ рд╣реИред рдЗрд╕ рдкреБрд╕реНрддрдХ рдореЗрдВ рд╕рдордХрд╛рд▓реАрди рднрд╛рд░рддреАрдп рд╕рд╛рд╣рд┐рддреНрдп рдореЗрдВ рдорд╣рд┐рд╖рд╛рд╕реБрд░ рдкрд░ рд▓рд┐рдЦреА рдЧрдИ рдХрд╡рд┐рддрд╛рдУрдВ рд╡ рдЧреАрддреЛрдВ рдХрд╛ рдкреНрд░рддрд┐рдирд┐рдзрд┐ рд╕рдВрдХрд▓рди рднреА рд╣реИ рддрдерд╛ рдорд╣рд┐рд╖рд╛рд╕реБрд░ рдХреА рдмрд╣реБрдЬрди рдХрдерд╛ рдкрд░ рдЖрдзрд╛рд░рд┐рдд рдПрдХ рдирд╛рдЯрдХ рднреА рдкреНрд░рдХрд╛рд╢рд┐рдд рд╣реИред рд╕рдорд╛рдЬ-рд╡рд┐рдЬреНрдЮрд╛рди рд╡ рд╕рд╛рдВрд╕реНрдХреГрддрд┐рдХ рд╡рд┐рдорд░реНрд╢ рдХреЗ рдЕрдзреНрдпреЗрддрд╛рдУрдВ, рд╕рд╛рдорд╛рдЬрд┐рдХ-рд░рд╛рдЬрдиреАрддрд┐рдХ рдХрд╛рд░реНрдпрдХрд░реНрддрд╛рдУрдВ, рд╕рд╛рд╣рд┐рддреНрдп рдкреНрд░реЗрдорд┐рдпреЛрдВ рдХреЗ рд▓рд┐рдП рдпрд╣ рдПрдХ рдЖрд╡рд╢реНрдпрдХ рдкреБрд╕реНрддрдХ рд╣реИ

    Distinct genetic architectures for syndromic and nonsyndromic congenital heart defects identified by exome sequencing.

    Get PDF
    Congenital heart defects (CHDs) have a neonatal incidence of 0.8-1% (refs. 1,2). Despite abundant examples of monogenic CHD in humans and mice, CHD has a low absolute sibling recurrence risk (тИ╝2.7%), suggesting a considerable role for de novo mutations (DNMs) and/or incomplete penetrance. De novo protein-truncating variants (PTVs) have been shown to be enriched among the 10% of 'syndromic' patients with extra-cardiac manifestations. We exome sequenced 1,891 probands, including both syndromic CHD (S-CHD, n = 610) and nonsyndromic CHD (NS-CHD, n = 1,281). In S-CHD, we confirmed a significant enrichment of de novo PTVs but not inherited PTVs in known CHD-associated genes, consistent with recent findings. Conversely, in NS-CHD we observed significant enrichment of PTVs inherited from unaffected parents in CHD-associated genes. We identified three genome-wide significant S-CHD disorders caused by DNMs in CHD4, CDK13 and PRKD1. Our study finds evidence for distinct genetic architectures underlying the low sibling recurrence risk in S-CHD and NS-CHD

    Distinct genetic architectures for syndromic and nonsyndromic congenital heart defects identified by exome sequencing

    Full text link
    corecore