Tiểu luận kết thúc môn học: Cơ sở dữ liệu nâng cao

Ngày nay, những ứng dụng là ngày càng phức tạp, chúng yêu cầu hỗ trợ những hệ thống phần mềm thông minh, trong đó có hệ thống quản trị cơ sở dữ liệu. Chắc chắn trong tương lai, để phản ánh thực tế một cách trung thực, những hệ thống quản trị cơ sở dữ liệu sẽ phải quản lý những dữ liệu không hoàn thiện. Một vài công trình đã được đưa ra trong phạm vi của những giá trị rỗng, nhưng không thể thiết kế một đại số quan hệ mở rộng hoàn thiện trong ngữ cảnh này, nghĩa là thiết kế một mô hình mà kết quả bất kỳ phép toán nào vẫn là một quan hệ của mô hình. Chẳng hạn nếu ta có một kết nối trong trường hợp một thuộc tính kết nối mang giá trị không chính xác, khi đó một bộ của quan hệ thứ nhất có thể được kết nối với nhiều bộ của quan hệ thứ hai và kết quả trong các bộ khác nhau là không độc lập.

Bài viết này xem xét một khả năng mở rộng mô hình quan hệ dữ liệu trong đó những giá trị mơ hồ được cho phép và được biểu diễn như là những đại diện (candidate) phân biệt. Mục tiêu của bài viết là để chỉ ra rằng có thể nghĩ ra một hệ thống biểu diễn hợp lệ đối với một tập hữu hạn các phép toán bao gồm phép chọn, phép chiếu, phép nối trên những thuộc tính mang giá trị chính xác và fk-join là một loại kết nối đặc biệt thường xuất hiện trong thực tiễn. Bài viết này đề cập hai phần cơ bản: Mô hình nằm dưới hệ thống biểu diễn và khả năng sử dụng một loại phép toán kết nối nào đó trong sự hiển diện của những giá trị mơ hồ.

Nội dung bài viết được chia làm 3 phần. Phần 1: giới thiệu hai loại yếu tố chính có ảnh hưởng trên mô hình. Một mặt chúng liên quan đến sự lựa chọn cơ chế có thể để biểu diễn những giá trị mơ hồ và sự thể hiện của một cơ sở dữ liệu có thể dưới dạng của những cơ sở dữ liệu thông thường chỉ chứa những thông tin chính xác và mặt khác sự thật rằng đôi khi cần thiết để đưa vào sự đánh giá sự phụ thuộc giữa những giá trị đại diện lấy từ những thuộc tính khác nhau. Phần 2: giới thiệu những khía cạnh chính của mô hình dữ liệu nằm dưới hệ thống biểu diễn. Ý tưởng chính là công nhận khả năng phân phối trên những bộ giá trị mà tương đương với một cấu trúc bao hàm quan hệ lồng nhau. Phần 3: trình bày hoạt động của hai phép toán với mô hình: phép chọn và fk-join.

14 trang | Chia sẻ: luyenbuizn | Lượt xem: 1009 | Lượt tải: 1

Nội dung tài liệu Tiểu luận kết thúc môn học: Cơ sở dữ liệu nâng cao, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

A. Giới thiệu Ngày nay, những ứng dụng là ngày càng phức tạp, chúng yêu cầu hỗ trợ những hệ thống phần mềm thông minh, trong đó có hệ thống quản trị cơ sở dữ liệu. Chắc chắn trong tương lai, để phản ánh thực tế một cách trung thực, những hệ thống quản trị cơ sở dữ liệu sẽ phải quản lý những dữ liệu không hoàn thiện. Một vài công trình đã được đưa ra trong phạm vi của những giá trị rỗng, nhưng không thể thiết kế một đại số quan hệ mở rộng hoàn thiện trong ngữ cảnh này, nghĩa là thiết kế một mô hình mà kết quả bất kỳ phép toán nào vẫn là một quan hệ của mô hình. Chẳng hạn nếu ta có một kết nối trong trường hợp một thuộc tính kết nối mang giá trị không chính xác, khi đó một bộ của quan hệ thứ nhất có thể được kết nối với nhiều bộ của quan hệ thứ hai và kết quả trong các bộ khác nhau là không độc lập. Bài viết này xem xét một khả năng mở rộng mô hình quan hệ dữ liệu trong đó những giá trị mơ hồ được cho phép và được biểu diễn như là những đại diện (candidate) phân biệt. Mục tiêu của bài viết là để chỉ ra rằng có thể nghĩ ra một hệ thống biểu diễn hợp lệ đối với một tập hữu hạn các phép toán bao gồm phép chọn, phép chiếu, phép nối trên những thuộc tính mang giá trị chính xác và fk-join là một loại kết nối đặc biệt thường xuất hiện trong thực tiễn. Bài viết này đề cập hai phần cơ bản: Mô hình nằm dưới hệ thống biểu diễn và khả năng sử dụng một loại phép toán kết nối nào đó trong sự hiển diện của những giá trị mơ hồ. Nội dung bài viết được chia làm 3 phần. Phần 1: giới thiệu hai loại yếu tố chính có ảnh hưởng trên mô hình. Một mặt chúng liên quan đến sự lựa chọn cơ chế có thể để biểu diễn những giá trị mơ hồ và sự thể hiện của một cơ sở dữ liệu có thể dưới dạng của những cơ sở dữ liệu thông thường chỉ chứa những thông tin chính xác và mặt khác sự thật rằng đôi khi cần thiết để đưa vào sự đánh giá sự phụ thuộc giữa những giá trị đại diện lấy từ những thuộc tính khác nhau. Phần 2: giới thiệu những khía cạnh chính của mô hình dữ liệu nằm dưới hệ thống biểu diễn. ý tưởng chính là công nhận khả năng phân phối trên những bộ giá trị mà tương đương với một cấu trúc bao hàm quan hệ lồng nhau. Phần 3: trình bày hoạt động của hai phép toán với mô hình: phép chọn và fk-join. B. Nội dung I/ Những yếu tố cơ bản của mô hình Phần này chỉ ra hai yếu tố chính ảnh hưởng đến mô hình. Yếu tố thứ nhất liên quan đến biểu diễn của những giá trị không chính xác bằng khả năng phân phối và sự giải thích của những cơ sở dữ liệu như vậy dưới dạng của cơ sở dữ liệu chính quy. Yếu tố thứ hai đó là một số phép toán có thể yêu cầu biểu diễn mà giá trị đại diện không độc lập đối với những thuộc tính khác nhau. 1.1/ Những giá trị không chính xác, khả năng phân phối và worlds Lý thuyết khả năng cung cấp một mô hình thứ tự cho sự không chắc chắn trong đó sự mơ hồ được biểu diễn bởi một quan hệ đã mã hóa bằng một thứ tự chung trên những tình huống có thể. Cơ chế này quan hệ gần gũi với lý thuyết tập mờ (fuzzy) vì ý tưởng là gán giá trị nhận bởi một biến nhờ một tập fuzzy gọi là một khả năng phân phối. Chính xác hơn, một khả năng phân phối là một ánh xạ p từ một miền X đã cho đến một khoảng đơn vị [0,1] và p(a) biểu diễn mức độ có thể của biến. Sự tiêu chuẩn hóa điều kiện cho rằng ít nhất một giá trị của miền (a0) là hoàn toàn có thể, nghĩa là p(a0)=1. Thiết lập này phù hợp để đưa vào tính toán sự biểu diễn không chắc chắn bởi những toán hạng thuộc ngôn ngữ, chẳng hạn như là cao, lớn, vừa và vân vân. Khi miền là rời rạc, một khả năng phân phối được viết {p1/a1+p2/a2+...+pn/an} Trong đó ai là một giá trị đại diện và pi tương ứng độ đo khả năng của nó. Một độ đo khả năng P thuộc một trong các trường hợp sau: P (ặ)=0 P(X)=1 P(AẩB)=max(P(A),P(B)). Vì tính chất không cộng được của mô hình, giá trị của P() không thể được suy ra từ P(A) và độ đo thứ hai N đã được đưa ra, N(A)=1-P(). Cách tiếp cận này đưa ra một khung thống nhất để biểu diễn giá trị chắc chắn, cũng như những giá trị mơ hồ, bao gồm cả “giá trị rỗng”. Tương tự với mô hình xác suất, nó có thể được xem như một sự chọn lọc những giá trị phân biệt và cũng được gọi là or-sets. Chính xác hơn, một or-set có thể được mô hình như là một khả năng phân phối trong đó bất kỳ đại diện nào cũng là hoàn toàn có thể. Một thuận lợi của mô hình xác suất là khả năng của nó để giải quyết đồng thời với giá trị mơ hồ và những truy vấn mờ với cùng những ưu tiên ngữ nghĩa. Một cơ sở dữ liệu D chứa những giá trị chưa biết trước có thể được hiểu như là một tập cơ sở dữ liệu thông thường D1,D2,...,Dp (ký hiệu là rep(D)), mà khả năng của các Di là khác nhau. Bất kỳ Di nào thu được bằng việc chọn một đại diện trong mỗi phân phối khả năng xuất hiện ở trong D và một trong những cơ sở dữ liệu chính quy Dk được cho để tương ứng với trạng thái hiện thời của world. Mức độ ấn định cho một world (Di) là giá trị cực tiểu của những mức độ khả năng đối với mỗi đại diện đã chọn. Chẳng hạn, quan hệ emp dưới đây trên thuộc tính #id, years và job emp: #id years job 1 {1/5+0.8/4+0.3/3} Cashier 2 {1/8+0.5/9} {1/salesman+0.6/cashier} 3 {1/4+0.8/5} salesman 4 2 salesman Có thể được kết hợp với khoảng chừng 24 (3*2*2*2) worlds có thể. Những sự lựa chọn: 5 đối với thuộc tính years trong bộ thứ nhất; 8 đối với thuộc tính years và cashier đối với thuộc tính job trong bộ thứ 2; 5 đối với thuộc tính years trong bộ thứ 3. Điều này dẫn đến một world là 0.6 có thể. Từ đó ta nhằm vào thiết kế một hệ thống biểu diễn mạnh, nó phải có khả năng “tìm thấy nguồn gốc” tất cả world có thể bao gồm những cái mà trong đó một số bộ vắng mặt. Để đạt được mục đích này, bất kỳ bộ t của một quan hệ có thể phải được cung cấp một mức độ N cần thiết cho biết khoảng mà chắc chắn rằng t thuộc vào quan hệ đã đề cập. N bằng 1 khi chưa có phần tử nào bị hủy bỏ. Khi N khác 1, giá trị của nó cung cấp để tính toán mức độ khả năng (1-N) gắn với sự lựa chọn của một world nơi bộ vắng mặt. Ta minh họa điều này bằng ví dụ của quan hệ trước với sự lựa chọn job=’salesman’. Rõ ràng, bộ thứ nhất là không đủ tiêu chuẩn, trái lại hai bộ cuối cùng là đủ tiêu chuẩn. Để có một sự biểu diễn đáng tin cậy trong nghĩa của một hệ thống biểu diễn mạnh, cần phải giữ lại bộ thứ hai vì nó vẫn thỏa mãn điều kiện mặc dù không chắc chắn. Trường hợp này, ta có quan hệ kết quả như sau: salesmen #id years job N 2 {1/8+0.5/9} Salesmen 0.4 3 {1/4+0.8/5} Salesmen 1 4 2 Salesmen 1 Qua đó ta thấy có thể bộ đầu tiên bị thiếu vắng trong world nào đó. Chẳng hạn word: #id years job 3 5 Salesmen 4 2 Salesmen là có thể ở mức độ: min(0.6, 0.8, 1)=0.6 và nó phù hợp với sự lựa chọn của giá trị ‘cashier’ ở trong quan hệ ban đầu emp. 1.2/ Sự phụ thuộc của những giá trị đại diện Mô hình có thể chính quy đều được dựa trên những thuộc tính có thể nhận những giá trị là khả năng phân phối. Rõ ràng, với một mô hình trạng thái như vậy, những giá trị đại diện xuất hiện trong những thuộc tính khác biệt của một bộ đã cho là độc lập. Chẳng hạn, trong bộ: không có sự ràng buộc kết nối những lựa chọn của một số của thuộc tính years và một job. Trường hợp này hiếm khi xảy ra. Trong thực tế, đôi khi cần biểu diễn mà bên trong một bộ đã cho có một số giá trị đại diện xuất hiện từ những thuộc tính khác nhau bị ràng buộc với nhau. Để minh họa, ta định nghĩa một quan hệ emp trên những thuộc tính name, years, job, l-city and b-city, hai thuộc tính l-city và b-city mô tả thành phố đang sống và thành phố nơi sinh của một nhân công. Sau đó xét phép toán lựa chọn trên quan hệ này với điều kiện l-cityb-city. Sự biểu diễn của tất cả worlds có thể làm cho nó cần thiết để hiện lên những cặp đại diện mà thỏa mãn điều kiện. Chẳng hạn, với bộ: , ba cặp có thể chấp nhận được của thành phố là: 0.7/(Paris,Marseille), 1/( Paris,Nice) và 0.4/(Nice,Marseille). Rõ ràng với một tình huống như vậy không thể được biểu diễn một tập hợp các giá trị đại diện độc lập trên l-city và b-city. Điều đó là cần thiết để mở rộng mô hình sao cho đạt được yêu cầu này. II/ Tổng quan của mô hình có thể mở rộng. Như đã được nêu ra, có một sự cần thiết khi biểu diễn mà bên trong một bộ đã cho có một vài giá trị đại diện xuất hiện từ những thuộc tính khác nhau và bị ràng buộc với nhau. ý tưởng là phải cải tiến mô hình do đó một số giá trị thuộc tính có thể phân phối trên nhiều miền hơn trên một miền nguyên tử (ở đây ta hạn chế vào những thuộc tính có miền rời rạc). Nói cách khác, một số đại diện là những bộ được phình ra và mô hình được dựa trên khái niệm quan hệ lồng nhau. Mô hình được đưa ra ở đây nhằm hạn chế số lượng mức lồng nhau để được một dạng đơn. Trong phần còn lại, hệ thống ký hiệu R(A1,..., Am, X1(Ap,...,Aq), ..., Xn(Ak,...,Al)) thay thế cho một lược đồ trong đó A1 đến Am là thuộc tính cơ sở mà giá trị là hoặc là chính xác hoặc là khả năng phân phối và Xi(Ah,...,Aj) biểu diễn một thuộc tính “có cấu trúc” mà giá trị của nó là khả năng phân phối trên các bộ được xây dựng trên các thuộc tính từ Ah đến Aj . Thật vậy, một thuộc tính cơ sở có thể được xem như một trường hợp đặc biệt của thuộc tính cấu trúc trong đó số lượng của quan hệ lồng nhau là 1. Rõ ràng những quan hệ như vậy có sự thể hiện dưới dạng world khi nó là trường hợp của quan hệ có khả năng thông thường. Thật vậy, khi một cái chuyển vào một world đã cho, lược đồ trở thành không lồng nhau, vì một giá trị đại diện cấu trúc có thể được chia thành những giá trị nguyên tử. Đối với mối quan hệ giữa quan hệ khả năng thông thường và quan hệ đã mở rộng, ta thấy rằng, từ một quan hệ khả năng thông thường có thể xây dựng một quan hệ mở rộng tương đương bao hàm một số lượng quan hệ lồng nhau. Chẳng hạn, lược đồ R(A,B,C,D) có thể được biểu diễn là R1(A,X(B,C),D), nhưng cũng có thể là R2(X(A,B,C),D) hoặc thậm chí R3(X(A,B,C,D)). Tuy nhiên, đảo lại nói chung là không khả thi vì những lý do đã đề cập ở trong phần 1. Điều thú vị là sự tương đương của tất cả những biểu diễn này dưới dạng world và tính chất này sẽ được vận dụng ở phần tiếp theo trong đó nó được dùng như là cơ sở để định nghĩa phép chọn và kết nối. Như vậy, rõ ràng R(A,B,C,D) là thích hợp nhất vì những quan hệ lồng nhau tương đương bao hàm tích Đề-các yêu cầu không gian nhiều hơn. Từ một quan điểm cụ thể, ta nhấn mạnh những quan hệ ban đầu giữ nguyên quan hệ khả năng thông thường và mô hình mở rộng đó được dùng trong suốt quá trình tính toán để biểu diễn đúng kết quả của thao tác trung gian bao gồm cả kết quả cuối cùng. Theo mô hình này, giả sử có lược đồ quan hệ R(ss#,date,X(car-t,brand)) mô tả kiểu (car-t) và nhãn (brand) của những xe ô tô được mua tại một ngày (date) nào đó bởi một người (ss#) để biểu diễn một vài kết quả trung gian. Một mở rộng có thể của một quan hệ r(R) là: r ss# date X Car-t Brand P N 1 d1 camry Toyota 1 1 2 d3 camry taurus avensis Toyota Ford Toyota 1 0.7 0.4 1 Tên và nhãn của những xe ô tô được biểu diễn như những cặp đại diện có ràng buộc với nhau. ở đây, trong bộ thứ nhất chỉ có một đại diện và trong bộ thứ hai có 3 phần tử trong quan hệ lồng nhau trên lược đồ X(car-t, brand). Biểu diễn tương đương được thể hiện như sau: r ss# date X Car-t Brand N 1 d1 {1/} 1 2 d3 {1/+0.7/+0.4/ 1 Nếu giá trị đại diện thứ hai được chọn ở trong bộ thứ hai, ta lấy quan hệ , là một phần của world mà khả năng nhiều nhất là 0.7. III/ Những phép toán của mô hình Phần này, tập trung vào hai phép toán mà hoạt động trong ngữ cảnh của hệ thống biểu diễn, nghĩa là những phép toán thỏa mãn nguyên tắc: rep(Q(D))= Q(rep(D)). Nói cách khác, kết quả của truy vấn Q đã xử lý trên cơ sở dữ liệu ‘compact’ D là giống như truy vấn Q trên tập hợp của cơ sở dữ liệu chính quy xuất phát từ D. 3.1/ Phép chọn (Selection) Đối với phép chọn, có hai vấn đề cần giải quyết. Thứ nhất, giữ lại trong quan hệ kết quả những giá trị phần tử thỏa mãn tiêu chuẩn lựa chọn. Điều này được giải quyết khá dễ dàng, vì chỉ cần sửa đổi giá trị được xem là không chính xác và giữ lại phần tử mà thỏa mãn điều kiện, sau đó sửa đổi mức độ cần thiết (N) đã gán cho bộ, tùy thuộc vào mức độ của phần tử đã bị loại bỏ. Thứ hai, đưa vào tiêu chuẩn đánh giá mà thiết lập một sự phụ thuộc giữa những thuộc tính. ở đây, có hai trường hợp trong đó một phép toán lựa chọn có thể dẫn đến một quan hệ kết quả mà lược đồ của nó bao hàm một quan hệ lồng nhau. Trường hợp thứ nhất liên quan đến tiêu chuẩn lựa chọn nguyên tử làm từ hai thuộc tính, nghĩa là có dạng “Ai q Ak” trong đó q là một toán tử so sánh, ở đây lược đồ quan hệ kết quả bao hàm quan hệ lồng nhau X(Ai,Ak) để biểu diễn sự phụ thuộc giữa những giá trị các phần tử một mặt từ Ai mặt khác từ Ak. Trong trường hợp này, giả sử rằng quan hệ đầu vào r là lược đồ không lồng nhau R(A1,...,An), ta có: SEL(r, Ai q Ak)={N’/}| $t=N/ and (tẻr) and (ai,p q ak,l) and aj={lj,l/aj,l + ... + lj,nj/aj,nj} and N’=min(N,1-supp,l | not()min(li,plk.l))} Trường hợp thứ hai là khi điều kiện được ghép từ những điều kiện sơ cấp rời rạc có dạng: ci(Ai) or ... or ck(Ak) trong đó cj là một điều kiện nguyên tử có dạng “Aj q value” với q là một toán tử so sánh. Khi đó, kết quả của phép lựa chọn là một quan hệ mà lược đồ của nó bao hàm cả quan hệ lồng nhau X(Ai,...,Ak). Ta minh họa điều này với lược đồ quan hệ PUR(ss#,date,car-t,l-city,p-city) miêu tả kiểu (car-t) của xe cars đã mua tại một ngày nào đó trong một thành phố (p-city) bởi một người (ss#) sống ở trong thành phố (l-city). Truy vấn tìm kiếm đối với những người đó mà đã mua xe ở ngoài thành phố họ sống hoặc người đã mua một chiếc Avensis hoặc một chiếc Taurus, là một phép chọn ((car-t ẻ {avensis,taurus}) or (p-cityl-city)). Với p(PUR) p ss# date car-t l-city p-city 1 d1 taurus {1/antibes+0.3/nice} nice 1 d2 jeep paris {1/paris+0.5/nice} 2 {1/d3 +1/d4} {0.5/vensis+ 1/camry} {0.4/madrid+ 1/granada} madrid Ta thu được kết quả: ss# date X car-t l-city p-city N 1 d1 {1/+0.3/} 1 1 d2 {0.5/} 0 2 {1/d3 +1/d4} {1/+0.4+0.5/} 0.6 Giá trị của N trong bộ cuối cùng là (0.6) biểu diễn phần tử có thể nhất mà không thỏa mãn điều kiện có mức độ 0.4 (tương ứng với sự lựa chọn trong p). Trên thực tế, kết quả của phép lựa chọn có thể được xem như một sự hạn chế của những phần tử sinh ra từ tích Đề-các của những phần tử ban đầu trên những thuộc tính liên quan sang những phần tử kia mà thỏa mãn điều kiện. Vậy thì, tính chất mong muốn đối với world đã đạt được. 3.2/ Foreign key join (kết nối khóa ngoài) Toán tử này được dùng trong những truy vấn trên một quan hệ chính quy s trên lược đồ S(X,Y) mô tả một hàm chính xác giữa những tập hợp các thuộc tính X và Y và một quan hệ có thể r mà lược đồ của nó là R(X,Z) trong đó X và Z có thể nhận giá trị không chắc chắn. Theo [3], một trường hợp như vậy được liên kết với khái niệm của một phụ thuộc hàm. Thật vậy, quan hệ r và s xuất phát từ sự phân tách của một quan hệ ban đầu (lấy lại X,Y và Z) nhằm giới hạn của sự dư thừa. Phép nối đặc biệt này được gọi là foreign key join (fk-join), là một equi-join mà nhằm tìm của một giá trị thuộc tính kết nối thông qua hàm. Mỗi bộ của kết quả có thể được xem như là một hoàn thành của một bộ của r nhờ thông tin của hàm kết nối X và Y-những giá trị cụ thể ở trong s. Điều đáng nói là những giá trị đang xuất hiện trong phân phối đối với X trong một bộ kết quả phù hợp với những phần tử đó mà có một ảnh ở trong s. Bằng việc xây dựng, phép toán này mô tả một kết nối giữa hai giá trị X và Y (đối và ảnh) và cần phải duy trì nó trong kết quả để thoả mãn điều kiện cần thiết của một hệ thống biểu diễn mạnh. Theo mô hình đã giới thiệu trong phần 2, kỹ thuật quan hệ lồng nhau được dùng để đạt được mục đích này. Nếu ta bắt đầu với quan hệ có thể r và quan hệ chính quy (function) s mà lược đồ tương ứng của nó là R(A1,...,Am,B1,...Bq) và S(A1,...,Am,C), fk-join được định nghĩa là: fk-join(r,s,{ A1,...,Am}) = {N’/ + ...}, c, b1,..., bq> | $ t=N/ and $ u= and (t ẻ r) and (u ẻ s) and ai={} and "j ẻ[1,m], ẻ scv(ai) and N’=min(N,1-min())} trong đó scv(ai) là tập hợp các giá trị phần tử xuất hiện trong ai. Nói cách khác, một tìm kiếm ảnh ở trong s của mỗi giá trị phần tử trên những thuộc tính A1,...,Am của một bộ t của quan hệ r. Nếu ta sử dụng lược đồ R(A,B,C) và S(A,B,D) và những mở rộng: r A B C {1/a1+1/a2+0.7/a3} {1/b1+0.3/b2} c1 {1/a1+0.3/a4} b2 c2 s A B D a1 b1 d1 a1 b2 d2 a2 b1 d3 a3 b2 d2 Kết quả của phép fk-join(r,s,{A,B}) là: X A B D C N {1/+0.3/+1/+0.3/} c1 0.3 {1/} c2 0.7 Như vậy bất cứ quan hệ có thể r (không lồng nhau) có một sự biểu diễn tương đương bao hàm một quan hệ lồng nhau. Khi đó, những yếu tố nguyên tử được giữ lại trong quan hệ kết quả chỉ là những cái có sự phù hợp. Cũng tương tự như phép chọn, nếu một thuộc tính thuộc về những cái mà được bao hàm trong điều kiện kết nối là một phần của quan hệ lồng nhau trong r, toàn bộ lược đồ của quan hệ lồng nhau này được sát nhập trong quan hệ kết quả. C. Kết luận Bài viết này đã đưa ra mở rộng của mô hình quan hệ khả năng của dữ liệu được tìm ra trước đây bởi Prade và Testemale. Đặc điểm chính của nó nằm trong sự đưa vào mức đơn quan hệ lồng nhau bên trong các lược đồ, cái mà dẫn đến những giá trị thuộc tính phân phối khả năng trên tích Đề-các của miền nguyên tử. Một mô hình như vậy đưa ra một số thuận lợi quan trọng đối với quan hệ ban đầu. Đặc biệt, nó thiết lập một hệ thống biểu diễn chặt chẽ cho phép toán lựa chọn (với một phạm vi rộng của tiêu chuẩn), fk-join (bao gồm cả trường hợp thuộc tính phức tạp), phép chiếu và kết nối tự nhiên. Bài viết này còn phải được tiếp tục nghiên cứu theo các hướng như: i/ phân phối khả năng trên một miền liên tục và ii/ sự phức tạp của truy vấn được gửi đến cơ sở dữ liệu trong một ngữ cảnh của một mô hình mới. Rõ ràng cách dùng những quan hệ lồng nhau gây ra nhiều thao tác mà tốn kém nhiều hơn những thực hiện đó ở trên quan hệ khả năng chính quy và sẽ là hữu ích để nhận biết những truy vấn đối với cái mà kỹ thuật lồng nhau có thể bị bỏ qua mà không ảnh hưởng sự chính xác của câu trả lời cuối cùng. Hơn nữa, điều quan tâm là bổ sung một hệ thống quản lý thông tin không chính xác và đưa ra nhiều khả năng thao tác trong bài viết này. Lời kết: Để hoàn thành được đề tài này, ngoài sự nỗ lực và cố gắng của bản thân, tác giả đã nhận được sự giúp đỡ qúy báu của Quý Thầy, GS.TS. Lê Mạnh Thạnh. Là một học viên chuyên ngành Tin học và dù rất tâm đắc với đề tài đang nghiên cứu nhưng với thời gian có hạn và khối lượng kiến thức của bản thân còn ít ỏi nên chắc chắn tiểu luận không tránh khỏi những hạn chế trong việc tiếp cận, nghiên cứu và trình bày. Tác giả xin kính trọng cảm ơn sự giúp đỡ quý báu của Quý Thầy và mong được đón nhận từ Quý Thầy sự góp ý để giúp tác giả có được hiểu biết đúng hơn đối với vấn đề đang nghiên cứu đồng thời mong được sự lượng thứ cho những sơ suất trong tiểu luận này. tài liệu tham khảo [1] Lê Tiến Vương-Nhập môn cơ sở dữ liệu quan hệ-NXBKHKT-1996 [2] Nguyễn Kim Anh-Nguyên lý của các hệ cơ sở dữ liệu-NXBĐHQGHN-2004 [3] Jeffrey D. Ullman-Nguyên lý các hệ cơ sở dữ liệu và cơ sở tri thức-Trần Đức Quang và Hồ Thuần dịch-NXBTK-1998 [4] Patrick Bosc, Olivier Pivert-Towards a representation system for possibilistic relation Phụ lục Nội dung bài báo mà tiểu luận tham khảo Mục lục Nội dung Trang Giới thiệu ...................................................................................................................................................................... 1 Nội dung ...................................................................................................................................................................... 2 1. Những yếu tố cơ bản của mô hình ............................................................................................ 2 1.1 Những giá trị không chính xác, khả năng phân phối và world ..... 3 1.2 Sự phụ thuộc của những giá trị đại diện.................................................................... 4 2. Tổng quan của mô hình có thể mở rộng ............................................................................ 5 3. Những toán tử của mô hình ............................................................................................................. 7 3.1 Phép chọn (Selection) ................................................................................................................. 7 3.2 Phép kết nối khóa ngoài (Foreign key join) ..................................................... 8 Kết luận ........................................................................................................................................................................ 11 Tài liệu tham khảo ........................................................................................................................................... 12 Phụ lục: Nội dung bài báo mà tiểu luận tham khảo..................................................... 13

Các file đính kèm theo tài liệu này:

tieu luan co sodu lieuban sua moi1.doc