    Some results about normal forms for functional dependency in the relational datamodel

    AbstractIn this paper we present some characterizations of relation schemes in second normal form (2NF), third normal form (3NF) and Boyce-Codd normal form (BCNF). It is known [6]that the set of minimal keys of a relation scheme is a Sperner system (an antichain) and for an arbitrary Sperner system there exists a relation scheme the set of minimal keys of which is exactly the given Sperner system. We investigate families of 2NF, 3NF and BCNF relation schemes where the sets of minimal keys are given Sperner systems. We give characterizations of these families. The minimal Armstrong relation has been investigated in the literature [3, 7, 11, 15, 18]. This paper gives new bounds on the size of minimal Armstrong relations for relation schemes. We show that given a relation scheme s such that the set of minimal keys is the Sperner system K, the number of antikeys (maximal nonkeys) of K is polynomial in the number of attributes iff so is the size of minimal Armstrong relation of s. We give a new characterization of relations and relation schemes that are uniquely determined by their minimal keys. From this characterization we give a polynomial-time algorithm deciding whether an arbitrary relation is uniquely determined by its set of all minimal keys. We present a new polynomial-time algorithm testing BCNF property of a given relation scheme


    Cơ sở dữ liệu và khai phá dữ liệu là những hướng phát triển rất quan trọng trong lĩnh vực công nghệ thông tin (CNTT). Về thực chất dữ liệu đóng vai trò nền tảng nhất trong quá trình xử lí thông tin trên hệ thống máy tính. Lí thuyết cơ sở dữ liệu và việc ứng dụng lí thuyết này vào thực tiễn đã được phát triển và đạt được nhiều thành tựu ngay từ những năm 80 thế kỉ trước. Về bản chất lí thuyết cơ sở dữ liệu cung cấp cho chúng ta những tri thức quan trọng nhất liên quan đến vấn đề  tổ chức,  thiết kế và xây dựng  các hệ  thống quản  trị  cơ  sở dữ  liệu. Trên nền  tảng những kết quả đạt được trong lí  thuyết này, các hãng máy tính của thế giới như IBM, Microsoft, Oracle, Apple … đã xây dựng những hệ thống quản trị cơ sở dữ liệu thương mại bán khắp nơi trên thị trường toàn cầu như SQL, Oracle, IBM DB2. Về một khía cạnh nào đó, hiện nay, trong mọi hoạt động nhân  lọai đã  tích  lũy một khối  lượng khổng  lồ dữ  liệu. Tuy vậy,  tri  thức  thì  lại quá  nhỏ  bé.  Chính  vì  thế,  hiện  nay,  hướng  nghiên  cứu  về  phát  hiện  tri  thức  từ  dữ  liệu (Knowledge Discovery from Data) là một hướng phát triển rát mạnh mẽ. Một khâu đặc biệt then chốt  trong quá  trình phát hiện  tri  thức  từ dữ  liệu này  là khai phá dữ  liệu  (Data Mining) để  thu nhận tri thức. Do đó, hướng nghiên cứu về các phương pháp khai phá dữ liệu là một hướng rất cơ bản trong lĩnh vực CNTT. Trong bài báo này, chúng tôi trình bày một số kết quả nền tảng về vấn đề tính toán, thực chất là vấn đề thuật toán, trong lĩnh vực cơ sở dữ liệu và khai phá dữ liệu