Công nghệmultimedia liên quan tới việc mô tảsựkết hợp các dạng thức thông tin 
khác nhau (văn bản, dữliệu, hình ảnh, âm thanh, video) dưới dạng tín hiệu số. Có thể
nêu ra đây một số ứng dụng multimedia như: 
• E-learning. 
• Hội thảo Video (Video Conferencing). 
• Thưviện điện tử(Elibrary). 
• Hiện tại ảo (Vitual Reality). 
Các công nghệtruyền dùng đểthao tác, truyền phát, điều khiển các dữliệu multimedia 
đã và đang được nghiên cứu một cách rất sôi động. 
Các hệthống multimedia cần có một hệthống phân phối nhằm mục đích thu thập các 
đối tượng multimedia và đưa chúng đến người dùng, một trong sốcác phương tiện đầu 
tiên được dùng dến là đĩa từvà đĩa quang. Ngày nay, Internet cũng nhưcác giao thức 
khác nhưTCP/IP, NetBIOS, các mạng Lan đang trởthành các phương tiện đểtruyền 
bá dữliệu multimedia . Khảnăng mô tảphong phú cũng nhưkhảnăng đồhọa của các 
web browser cùng với các tính năng đang được tiếp tục tăng cường nhưhoạt họa, âm 
thanh và Video khiến các web browser đang trởthành một phương tiện mới đểmang 
lại các dữliệu multimedia cho người dùng[5] 
Các công nghệchủyêu liên quan đến multimedia bao gồm: 
• Kỹthuật nén. 
• Video Servers. 
• Các kỹthuật vềmạng (internet, tokenring, ethernet, ATM vv). 
• Các công nghệtruyền dữliệu. 
• Các công nghệvềcáp truyền dẫn. 
• Công nghệxác thực. 
• Các công nghệvềCSDL. 
8
Một CSDL là tập hợp của các dữliệu có liên quan đến nhau. Một hệquản trịCSDL 
(DBMS) là hệthống phần mềm trợgiúp cho các quá trình khai báo, xây dựng và thao 
tác với CSDL phục vụcho các ứng dụng khác nhau. CSDL multimedia bao gồm thêm 
các kiểu dữliệu khác như: 
• Văn bản. 
• Hình ảnh. 
• Âm thanh. 
• Video. 
• Hoạt hình. 
Các kiểu dữliệu khác này đòi hỏi phải có các phương thức đặc biệt nhằm mục đích tối 
ưu hóa cho việc lưu trữ, truy cập, chỉsốhoá và khai thác. Một MDBMS phải cung cấp 
một môi trường thích hợp đểquản lý và sửdụng CSDL multimedia. 
Một MDBMS cần phải đảm bảo các tính năng cơbản của một DBMS, ngoài ra nó còn 
phải có các tính năng khác như: 
• Tích hợp các phương tiện khác (Media Intergration). 
• Khảnăng sắp xếp và mô tảthông tin. 
• Khảnăng khai thác dữliệu. 
• Khảnăng lưu trữlớn. 
• Giao diện multimedia. 
• Hỗtrợtruy vấn tương tác multimedia. 
Thông thường các đối tượng riêng lẻcủa một hình ảnh hoặc một video frame sẽcó một 
vài mối liên hệbộphận với các đối tượng khác. Các mối liên hệnày đưa đến một số
các ràng buộc trong quá trình tìm kiếm các đối tượng trong CSDL multimedia. Căn cứ
trên cơsởnày việc triển khai các ứng dụng multimedia trên nền các hệquản trịCSDL 
hướng đối tượng sẽthuận lợi hơn so với các RDMBS hiện thời[1]. 
              
                                            
                                
            
 
            
                 88 trang
88 trang | 
Chia sẻ: oanh_nt | Lượt xem: 1059 | Lượt tải: 0 
              
            Bạn đang xem trước 20 trang nội dung tài liệu Luận văn Cơ sở dữ liệu đa phương tiện yêu cầu và các vấn đề, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ĐẠI HỌC QUỐC GIA HÀ NỘI 
 TRƯỜNG ĐẠI HỌC CÔNG NGHỆ 
Trần Hoài Nam 
CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN 
YÊU CẦU VÀ CÁC VẤN ĐỀ 
LUẬN VĂN THẠC SĨ 
Hà Nội – 2004
 2
ĐẠI HỌC QUỐC GIA HÀ NỘI 
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ 
 Trần Hoài Nam 
CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN 
YÊU CẦU VÀ CÁC VẤN ĐỀ 
 Chuyên ngành : Công nghệ thông tin 
 Mã số : 1.01.10 
LUẬN VĂN THẠC SĨ 
 Người hướng dẫn khoa học: PGS.TS. Vũ Đức Thi 
Hà Nội – 2004 
 3
Mục lục 
BẢNG THUẬT NGỮ VÀ CÁC CHỮ VIẾT TẮT .........................................................4 
LỜI CẢM ƠN ..................................................................................................................5 
MỞ ĐẦU..........................................................................................................................7 
CHƯƠNG 1 ...................................................................................................................10 
GIỚI THIỆU CHUNG VỀ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN............................10 
1.1 Các kiểu truyền thông và multimedia .............................................................11 
1.1.1. Cơ sở dữ liệu và các DBMS ....................................................................12 
1.1.2. Truy tìm thông tin tài liệu văn bản ..........................................................12 
1.1.3. Truy xuất và chỉ số hoá multimedia.........................................................13 
1.1.4. Trích rút đặc trưng, biểu diễn nội dung và chỉ số hoá .............................13 
1.2 Sự cần thiết đối với MIRS...............................................................................13 
1.2.1. Sự phát triển về dữ liệu multimedia và các đặc trưng của nó..................14 
1.2.2. Các DBMS và vai trò của chúng trong việc xử lý dữ liệu multimedia....15 
1.2.3. Hệ thống IR và vai trò của nó trong việc truy xuất multimedia ..............18 
1.2.4. Cách tiếp cận tích hợp việc truy xuất và chỉ số hoá thông tin multimedia
 19 
1.3 Tổng quan về MIRS ........................................................................................19 
1.4 Các ứng dụng nói chung và khả năng mong đợi của MIRS...........................20 
CHƯƠNG 2 ...................................................................................................................24 
CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (Multimedia Database) ................................24 
2.1 Kiến trúc cho việc tổ chức nội dung................................................................25 
2.4.1 Nguyên lý tự trị ........................................................................................25 
2.4.2 Nguyên lý đồng nhất ................................................................................26 
2.4.3 Nguyên lý lai ghép ...................................................................................27 
2.2 Tổ chức dữ liệu multimedia dựa trên nguyên lý đồng nhất. ..........................30 
2.3 Cấu trúc tóm tắt media ....................................................................................32 
2.4.1 Dữ liệu ảnh như là một tóm tắt media. ....................................................33 
2.4.2 Dữ liệu video như là một tóm tắt media. .................................................34 
2.4.3 Định nghĩa về một CSDL Multimedia đơn giản ......................................36 
2.4.4 Định nghĩa về một CSDL Multimedia có cấu trúc ..................................37 
2.4 Ngôn ngữ truy vấn khai thác dư liệu multimedia............................................39 
2.4.1 Truy vấn SMDSs (mô tả đồng nhất) ........................................................40 
2.4.2 Truy vấn dữ liệu multimedia mô tả dưới kiến trúc lai tạo. ......................43 
2.4.3 Chỉ số hoá SMDS với chỉ số đảo. ............................................................46 
CHƯƠNG 3 ...................................................................................................................52 
HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯONG TIỆN – YÊU CẦU VÀ CÁC VẤN 
ĐỀ...................................................................................................................................52 
3.1 Mục đích của MDBMS ...................................................................................52 
 4
3.2 Các yêu cầu của một MDBMS........................................................................55 
3.2.1 Khả năng quản trị lưu trữ lớn...................................................................57 
3.2.2 Hỗ trợ truy vấn và khai thácdữ liệu. ........................................................58 
3.2.3 Tích hợp các phương tiện, tổng hợp và thể hiện......................................59 
3.2.4 Giao diện và tương tác. ............................................................................59 
3.2.5 Hiệu suất. .................................................................................................60 
3.3 Các vấn đề của MDBMS.................................................................................60 
3.3.1 Mô hình hoá dữ liệu MULTIMEDIA ......................................................60 
3.3.2 Lưu trữ đối tượng MULTIMEDIA..........................................................62 
3.3.3 Tích hợp multimedia, thể hiện và chất lượng của dịch vụ (QoS)............63 
3.3.4 Chỉ số hoá multimedia .............................................................................64 
3.3.5 Hỗ trợ truy vấn multimedia, khai thác và duyệt qua................................65 
3.3.6 Quản trị CSDL multimedia phân tán .......................................................66 
3.3.7 Sự hỗ trợ của hệ thống .............................................................................67 
CHƯƠNG 4 ...................................................................................................................69 
XÂY DỰNG HỆ THỐNG MUA BÁN HÀNG QUA MẠNG......................................69 
4.2.1. Giới thiệu .....................................................................................................69 
4.2.2. Ứng dụng CSDL đa phương tiện vào hệ thống bán hàng qua mạng...........70 
4.2.1. Xây dựng kho dữ liệu hình ảnh 2D và 3D...............................................71 
4.2.2. Xây dựng cơ chế truy vấn đối với kho dữ liệu hình ảnh .........................71 
4.2.3. Hệ thống bán hàng qua mạng ......................................................................73 
4.3.1. Mô hình hệ thống .....................................................................................73 
4.3.2. Các chức năng cơ bản của hệ thống.........................................................75 
4.3.3. Các công cụ phát triển hệ thống...............................................................76 
4.3.4. Quy trình thực hiện giao dịch của hệ thống.............................................77 
4.3.5. Cài đặt hệ thống .......................................................................................78 
4.4. Giải pháp tích hợp các hệ thống khác .............................................................80 
4.4.1. Hệ thống quản lý và cấp phát chứng chỉ số (CA)....................................80 
4.4.2. Hệ thống thanh toán trực tuyến (VASC Payment) ..................................81 
4.5. Một số giao diện chính của hệ thống...............................................................83 
KẾT LUẬN....................................................................................................................86 
TÀI LIỆU THAM KHẢO..............................................................................................87 
BẢNG THUẬT NGỮ VÀ CÁC CHỮ VIẾT TẮT 
 5
STT Ký hiệu viết tắt Giải thích 
1 Web browser Trình duyệt Web 
2 CSDL Cơ sở dữ liệu 
3 DBMS Hệ quản trị cơ sở dữ liệu 
4 MDBMS Hệ quản trị cơ sở dữ liệu đa phương tiện 
5 Video frame Khung hình video 
6 RDBMS Hệ quản trị cơ sở dữ liệu quan hệ 
7 Multimedia Đa phương tiện 
8 MIRS Hệ thống truy vấn thông tin đa phương tiện 
9 Metadata Siêu dữ liệu 
10 Media Phương tiện 
11 SMDS Hệ thống cơ sở dữ liệu đa phương tiện có cấu trúc 
12 Information Retrival(IR) Truy xuất thông tin 
13 Multimedia Information 
Retrieval System (MIRS) 
Hệ thống truy xuất thông tin đa phương tiện 
LỜI CẢM ƠN 
 6
Tôi xin bầy tỏ lòng kính trọng và biết ơn sâu sắc tới PGS.TS Vũ Đức Thi, người thầy, 
người đồng nghiệp đã trực tiếp hướng dẫn, cho tôi những định hướng và những ý kiến 
rất quý báu về cơ sở dữ liệu đa phương tiện. Tôi cũng xin chân thành cám ơn các đồng 
nghiệp của tôi tại phòng Các hệ thống quản trị dữ liệu – Viện Công nghệ thông tin đã 
giúp đỡ tôi rất nhiều trong quá trình công tác để tôi có thể hoàn thành bản luận văn này 
một cách tốt đẹp 
Xin chân thành cám ơn các bạn bè của tôi, trong nước cũng như ngoài nước đã giúp đỡ 
tôi rất nhiều trong quá trình tìm tòi và sưu tầm tài liệu. 
Cuối cùng xin châm thành cám ơn các thành viên trong gia đình đã động viên và tạo 
mọi điều kiện thuận lợi để tôi có được kết quả như ngày hôm nay. 
 Hà nội ngày 20/06/2004 
 Học viên 
 Trần Hoài Nam 
 7
MỞ ĐẦU 
Công nghệ multimedia liên quan tới việc mô tả sự kết hợp các dạng thức thông tin 
khác nhau (văn bản, dữ liệu, hình ảnh, âm thanh, video) dưới dạng tín hiệu số. Có thể 
nêu ra đây một số ứng dụng multimedia như : 
• E-learning. 
• Hội thảo Video (Video Conferencing). 
• Thư viện điện tử (Elibrary). 
• Hiện tại ảo (Vitual Reality). 
Các công nghệ truyền dùng để thao tác, truyền phát, điều khiển các dữ liệu multimedia 
đã và đang được nghiên cứu một cách rất sôi động. 
Các hệ thống multimedia cần có một hệ thống phân phối nhằm mục đích thu thập các 
đối tượng multimedia và đưa chúng đến người dùng, một trong số các phương tiện đầu 
tiên được dùng dến là đĩa từ và đĩa quang. Ngày nay, Internet cũng như các giao thức 
khác như TCP/IP, NetBIOS, các mạng Lan đang trở thành các phương tiện để truyền 
bá dữ liệu multimedia . Khả năng mô tả phong phú cũng như khả năng đồ họa của các 
web browser cùng với các tính năng đang được tiếp tục tăng cường như hoạt họa, âm 
thanh và Video khiến các web browser đang trở thành một phương tiện mới để mang 
lại các dữ liệu multimedia cho người dùng[5] 
Các công nghệ chủ yêu liên quan đến multimedia bao gồm: 
• Kỹ thuật nén. 
• Video Servers. 
• Các kỹ thuật về mạng (internet, tokenring, ethernet, ATM …vv). 
• Các công nghệ truyền dữ liệu. 
• Các công nghệ về cáp truyền dẫn. 
• Công nghệ xác thực. 
• Các công nghệ về CSDL. 
 8
Một CSDL là tập hợp của các dữ liệu có liên quan đến nhau. Một hệ quản trị CSDL 
(DBMS) là hệ thống phần mềm trợ giúp cho các quá trình khai báo, xây dựng và thao 
tác với CSDL phục vụ cho các ứng dụng khác nhau. CSDL multimedia bao gồm thêm 
các kiểu dữ liệu khác như: 
• Văn bản. 
• Hình ảnh. 
• Âm thanh. 
• Video. 
• Hoạt hình. 
Các kiểu dữ liệu khác này đòi hỏi phải có các phương thức đặc biệt nhằm mục đích tối 
ưu hóa cho việc lưu trữ, truy cập, chỉ số hoá và khai thác. Một MDBMS phải cung cấp 
một môi trường thích hợp để quản lý và sử dụng CSDL multimedia. 
Một MDBMS cần phải đảm bảo các tính năng cơ bản của một DBMS, ngoài ra nó còn 
phải có các tính năng khác như: 
• Tích hợp các phương tiện khác (Media Intergration). 
• Khả năng sắp xếp và mô tả thông tin. 
• Khả năng khai thác dữ liệu.. 
• Khả năng lưu trữ lớn. 
• Giao diện multimedia. 
• Hỗ trợ truy vấn tương tác multimedia. 
Thông thường các đối tượng riêng lẻ của một hình ảnh hoặc một video frame sẽ có một 
vài mối liên hệ bộ phận với các đối tượng khác. Các mối liên hệ này đưa đến một số 
các ràng buộc trong quá trình tìm kiếm các đối tượng trong CSDL multimedia. Căn cứ 
trên cơ sở này việc triển khai các ứng dụng multimedia trên nền các hệ quản trị CSDL 
hướng đối tượng sẽ thuận lợi hơn so với các RDMBS hiện thời[1]. 
 9
Mục tiêu chính của bản luận văn này nhằm nghiên cứu và tìm hiểu một số vấn đền cơ 
bản của một MDBMS: 
• Tổng quan về cơ sử dữ liệu đa phương tiện 
• Các yêu cầu của một MDBMS cũng như kiến trúc, thiết kế và truy vấn đối với 
một MDBMS. 
Luận văn này được bố cục thành 5 phần chính: 
• Chương I: Giới thiệu chung về CSDL multimedia. 
• Chương II: Cơ sở dữ liệu multimedia. 
• Chương III: Hệ quản trị cơ sở dữ liệu multimedia – Yêu cầu và các vấn đề 
• Chương IV: Xây dựng hệ thống bán hàng qua mạng. 
• Kết luận 
 10
CHƯƠNG 1 
GIỚI THIỆU CHUNG VỀ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN 
Dữ liệu multimedia được chia thành hai lớp là các dữ liệu liên tục và các dữ liệu không 
liên tục. Các dữ liệu liên tục bao gồm các dữ liệu âm thanh, video thay đổi theo thời 
gian. Các dữ liệu không liên tục là các dữ liệu không phục thuộc vào thời gian, các loại 
dữ liệu đặc trưng cho dạng này là các dữ liệu văn bản (có hoặc không có định dạng), 
hình ảnh tĩnh và các đối tượng đồ họa. Các kiểu dữ liệu thông thường của một CSDL 
multimedia bao gồm: 
• Dữ liệu văn bản (có hoặc không có định dạng). 
• Đồ họa: là các bản vẽ, minh họa được mã hóa như các tệp postscript. 
• Hình ảnh: là các hình ảnh được mã hóa sử dụng các dạng thức chuẩn như là 
JPEG hoặc MPEG. 
• Các hoạt hình. 
• Âm thanh. 
• Video. 
Các đặc tính chung của dữ liệu multimedia bao gồm: 
• Thiếu cấu trúc: Các dữ liệu multimedia có khuynh hướng phi cấu trúc vì vậy 
các tác nghiệp quản trị dữ liệu chuẩn như chỉ số hoá, tìm kiếm nội dung, truy 
vấn dữ liệu thường là không áp dụng được. 
• Tính tạm thời: Một vài kiểu dữ liệu multimedia như là Video, âm thanh và hoạt 
hình đều phụ thuộc vào yếu tố thời gian liên quan mật thiết đến việc lưu trữ, 
thao tác và mô tả chúng. 
• Có dung lượng lớn: các dữ liệu video và âm thanh thường đòi hỏi các thiết bị 
lưu trữ lớn. 
 11
• Các ứng dụng hỗ trợ: các dữ liệu phi chuần có thể đòi hỏi các quy trình xử lý 
phức tạp như việc sử dụng các thuật toán nén dữ liệu đối với các ứng dụng 
CSDL multimedia. 
1.1 Các kiểu truyền thông và multimedia 
Truyền thông đề cập đến các kiểu thông tin hoặc các kiểu biểu diễn thông tin, ví dụ 
như dữ liệu vần chữ cái, hình ảnh, âm thanh, truyền hình. Có nhiều cách phân lớp 
truyền thông. Những cách phân loại chung được dựa trên những dạng vật lý và những 
mối quan hệ truyền thông với thời gian. Ta phân lớp truyền thông dựa trên việc có hay 
không có chiều thời gian. Ngầm định này hướng tới hai lớp truyền thông tĩnh và động 
(hoặc tính liên tục về thời gian). 
Truyền thông tĩnh không bao hàm yếu tố thời gian, các nội dung và nghĩa của chúng 
không phụ thuộc vào thời gian được biểu diễn. Truyền thông tĩnh bao gồm các dữ liệu 
vần chữ cái, các đồ thị và các ảnh tĩnh. 
Truyền thông động bao hàm yếu tố thời gian, các nghĩa và tính chính xác của chúng 
phụ thuộc vào loại được biểu diễn. Truyền thông động gồm các hoạt hình, âm thanh và 
video. Các truyền thông này có bản chất khoảng thống nhất hoặc tốc độ riêng của 
chúng. Chẳng hạn, để truyền cảm giác chuyển động nhịp nhàng video phải thực hiện 
25 hình mỗi giây (hoặc 30 hình phụ thuộc vào hệ thống video đang sử dụng). Tương 
tự, khi chúng ta phát lại một lời nhắn hoặc đoạn nhạc đã được ghi âm, chỉ có một loại 
thể hiện là thích hợp. Việc phát lại ở chế độ nhanh hơn hoặc chậm hơn sẽ làm méo 
nghĩa hoặc chất lượng âm thanh. Vì những truyền thông này phải được phát liên tục ở 
tốc độ cố định mà chúng thường được gọi là truyền thông liên tục. Chúng cũng còn 
được gọi truyền thông đẳng thời vì mối quan hệ cố định giữa mỗi đơn vị truyền thông 
và thời gian. 
Truyền thông đề cập đến một bộ sưu tập các kiểu truyền thông đã sử dụng cùng nhau. 
Điều đó có nghĩa là ít nhất có kiểu truyền thông dữ liệu là không theo ký tự chữ (nghĩa 
 12
là ít nhất có một kiểu truyền thông là ảnh, âm thanh hoặc truyền hình). Ở đây, 
“multimedia” được sử dụng như một tính từ vì vậy chúng ta sẽ nói một cách đặc trưng 
là thông tin multimedia, dữ liệu multimedia, hệ thống multimedia, liên lạc multimedia, 
ứng dụng multimedia,... Dữ liệu multimedia chính là sự biểu diễn về các loại truyền 
thông multimedia mà máy tính có thể đọc được. Thông tin multimedia là thông tin đã 
truyền bằng các kiểu truyền thông multimedia. Đôi khi, thông tin multimedia và dữ 
liệu multimedia được sử dụng có thể thay cho nhau. 
Đôi khi chúng ta sử dụng thuật ngữ multimedia hay truyền thông và đối tượng nhằm 
chỉ một thực thể tự trị nào đó trong một MIRS mà có thể được truy vấn, truy xuất và 
được trình diễn. Thuật ngữ “đối tượng” có thể là chưa xác định thích hợp theo nghĩa 
hướng đối tượng (0bject Oriented). Ngữ cảnh sẽ làm nó rõ ràng hơn dù cho nó được sử 
dụng trong một ý nghĩa chung hoặc trong cách tiếp cận hướng đối tượng[10]. 
1.1.1. Cơ sở dữ liệu và các DBMS 
Trong thư viện, CSDL và các DBMS đôi khi được sử dụng thay thế nhau. ở đây CSDL 
hiểu như một bộ sưu tập hoặc một kho dữ liệu hoặc nhiều mục truyền thông. Chúng ta 
sử dụng các DBMS như một hệ thống thực thể để quản lý CSDL. 
1.1.2. Truy tìm thông tin tài liệu văn bản 
Hệ thống truy tìm thông tin tự động hoá (IR) được phát triển để giúp quản lý một khối 
lượng với các tài liệu khoa học đã được tạo lập từ những năm 1940. Chức năng chính 
của một hệ thống IR là lưu trữ và quản lý một số rất lớn các tài liệu văn bản theo cách 
sao cho các tài liệu thích hợp với việc sử dụng các truy vấn để truy tìm nhanh. Chú ý 
rằng việc truy tìm thông tin tự động của các từ cấu tạo bằng chữ đầu của những từ khác 
là nhằm vào việc truy tìm các tài liệu văn bản, mặc dù thuật ngữ đầy đủ là truy tìm 
thông tin có thể hiểu là truy tìm một loại thông tin nào đó. 
 13
1.1.3. Truy xuất và chỉ số hoá multimedia 
Các DBMS truy xuất các khoản mục dựa trên số liệu có cấu trúc khi sử dụng kết nối 
chính xác. IR cũng được gọi là truy xuất dựa trên văn bản. Việc truy xuất dựa vào nội 
dung đề cập đến việc truy xuất dựa trên những nét đặc trưng truyền thống hiện nay như 
là màu sắc, hình thù thay cho lời giải thích văn bản về khoản mục truyền thông đó. 
Việc truy xuất dựa trên nội dung là chuẩn dựa trên sự đồng dạng thay vì một kết nối 
chính xác giữa một truy vấn và một tập các khoản mục dữ liệu. 
MIRS đề cập đến một hệ thống cơ sở cung cấp việc truy xuất thông tin multimedia khi 
sử dụng một tổ hợp DBMS, IR và các kỹ thuật truy xuất dựa trên nội dung. Trong một 
MIRS, một vài vấn đề như phiên bản và điều khiển an toàn có thể không thực hiện 
được đầy đủ. Một MIRS đủ bản lĩnh ra đời được gọi là MDBMS. 
1.1.4. Trích rút đặc trưng, biểu diễn nội dung và chỉ số hoá 
Trong các MIRS, một trong những vấn đề quan trọng nhất là trích rút đặc trưng hoặc 
biểu diễn nô ̣i dung (cái gì là những nét đặc trưng hoặc nội dung chính trong một khoản 
mục multimedia). Trích rút đặc trưng có thể là quá trình tự động hay bán tự động. 
Trong một vài tài liệu truy xuất dựa vào nội dung, trích rút đặc trưng cũng được gọi là 
chỉ số hoá. Sau đây, chúng ta theo quy ước chung. Khi mà thuật ngữ “chỉ số” được sử 
dụng như một danh từ, điều đó có nghĩa là đề cập tới cấu trúc dữ liệu hoặc việc tổ chức 
những đặc trưng đã được trích rút để nghiên cứu có hiệu quả và truy xuất. 
1.2 Sự cần thiết đối với MIRS 
Sự cần thiết đối với MIRS có thể được giải thích bằng ba yếu tố sau: 
Trước hết, dữ liệu multimedia đang được dùng ngày càng nhiều và đang được chú ý. 
Để sử dụng thông tin đó (chứa trong dữ liệu đó), đòi hỏi có một hệ thống truy xuất và 
chỉ số hoá hiệu quả và có hiệu lực. Thứ hai, dữ liệu multimedia có những đặc tính và 
những yêu cầu đặc biệt mà lại khác nhau đáng kể từ số liệu bảng chữ cái. Bởi vậy, 
 14
DBMS truyền thống không thích hợp cho việc xử lý dữ liệu multimedia. Thứ ba, mặc 
dù các kỹ thuật IR có thể giúp chúng ta trong việc truy xuất multimedia nhưng chỉ một 
mình chúng thì chưa đủ để xử lý dữ liệu multimedia một cách có hiệu quả[10]. 
1.2.1. Sự phát triển về dữ liệu multimedia và các đặc trưng của nó 
Hiện nay chúng ta đang tập trung khai phá thông tin multimedia. Ví dụ, một số lượng 
lớn hình ảnh và video đang được tạo lập và lưu trữ trên internet. Nhiều hoạ sỹ và bức 
tranh trong nhiều kiểu in ra là đang được chuyển sang dạng kỹ thuật số cho dễ xử lý, 
phân phối và bảo tồn. Các bức tranh từ các bản tin trên vô tuyến và trên báo cũng được 
chuyển sang dạng kỹ thuật số để dễ bảo trì và bảo tồn. Một số lớn các hình ảnh y tế 
đang được tập trung hàng ngày và các vệ tinh đang được sản xuất nhiều hơn. Khuynh 
hướng này có ý định tiếp tục nâng cấp việc lưu trữ và các công nghệ kỹ thuật số. Việc 
lập ra một chỗ chứa đối với lượng lớn thông tin multimedia ngày càng tăng như vậy 
còn được ít sử dụng. Điều này sẽ không thể sử dụng đầy đủ thông tin multimedia này 
trừ khi nó được tổ chức để truy xuất nhanh theo yêu cầu. 
Không chỉ là đang tăng về số lượng dữ liệu đang được lưu trữ, mà còn cả các kiểu dữ 
liệu và các đặc trưng của chúng là khác nhau từ dữ liệu ký tự chữ. 
Có những đặc trưng chính của dữ liệu multimedia như sau: 
• Dữ liệu multimedia, nhất là âm thanh và video, là dữ liệu có số lượng lớn. Ví 
dụ, một video 10’ trung bình chiếm 1,5 GB chưa nén. 
• Âm thanh và video có chiều thời gian và chúng khi biểu diễn sẽ chiếm tỷ lệ cố 
định để hoạt động có hiệu quả như đã yêu cầu 
• Âm thanh số, ảnh và video được trình diễn theo một loạt giá trị đơn cá thể và 
thiếu cấu trúc ngữ nghĩa rõ ràng cho máy tính để tự động hoá nhận biết nội dung 
• Nhiều ứng dụng multimedia đòi hỏi việc biểu diễn đồng thời các kiểu truyền 
thông đa năng theo cách kết hợp không gian và thời gian 
 15
• Ý nghĩa của dữ liệu multimedia đôi khi rất mờ và có tính chủ quan. Ví dụ, mỗi 
người có cách giải thích cùng 1 bức tranh theo cách khác nhau hoàn toàn riêng 
• Dữ liệu multimedia là giàu về thông tin, nhiều tham số được đòi hỏi mới trình 
diễn đủ nội dung của nó. 
1.2.2. Các DBMS và vai trò của chúng trong việc xử lý dữ liệu 
multimedia 
Các DBMS ngày nay được xây dựng khá tốt và được sử dụng rộng rãi đối với dữ liệu 
có cấu trúc. Các DBMS trội nhất là các hệ quản trị dữ liệu quan hệ (RDBMS). Trong 
RDBMS, thông tin dược tổ chức thành bảng hoặc các quan hệ. Các dòng của bảng 
tương ứng với các khoản mục thông tin hoặc các record, trong khi đó các cột tương 
ứng với các thuộc tính. Ngôn ngữ truy vấn có cấu trúc (SQL) được sử dụng để tạo ra 
các bảng như thế và để chèn và truy xuất thông tin từ các bảng đó[11]. 
Chúng ta dùng một ví dụ đơn giản dể minh hoạ cách sử dụng SQL để tạo lập một bảng 
và chèn, truy xuất thông tin từ đó. Giả sử chúng ta muốn lập một bảng chứa các bản 
ghi về sinh viên bao gồm số hiệu sinh viên, tên và địa chỉ. Ta có lệnh sau: 
Create table STUDENT( 
stu# integer, 
name char(20), 
address char(100)); 
Khi chúng ta muốn chèn các bản ghi về sinh viên vào bảng, chúng ta sử dụng lệnh chèn 
SQL như sau: 
Insert into STUDENT values(10,"Lew, Tom","2 Main St., 
Churchill, australia"); 
Lệnh trên sẽ chèn một dòng vào bảng STuDeNT 
 16
Thông tin trong bảng được truy xuất khi sử dụng câu lệnh SELECT của SQL. Ví dụ, 
nếu muốn truy xuất tên của sinh viên với sinh viên số 32, ta sử dụng lệnh truy vấn sau: 
Select Name 
From STUDENT 
Where Stu#=32 
Các thuộc tính trong RDBMS đã cố định kiểu và độ rộng. Trong ví dụ trên, thuộc tính 
Stu# là kiểu integer với độ dài cố định là 32 bit. Như vậy, RDBMS là thích hợp để xử 
lý dữ liệu số và dòng ký tự ngắn. 
Để hỗ trợ cho các trường có giá trị lớn trong RDBMS, một khái niệm được gọi là đối 
tượng rộng hoặc nhị phân (BLOB) sẽ được giới thiệu. Một BLOB là một xâu bit lớn 
các độ dài biến. Ví dụ, nếu ta muốn lưu bức tranh của sinh viên trong bản ghi ở bảng 
STUDENT trên, chúng ta có thể tạo ra một bảng khi sử dụng lệnh sau: 
Create table STUDENT( 
Stu# integer, 
Name char(20), 
address char(100), 
Picture BLOB); 
Các BLOB bình thường chỉ là xâu bit và hoạt động bằng việc so sánh chứ không mang 
chúng ra ngoài. Đó là vì RDBMS không biết nội dung hoặc ngữ nghĩa của một BLOB. 
Tất cả BLOB hiểu như một khối dữ liệu. 
Một dạng khác của các DBMS là hệ thống quản trị CSDL hướng đối tượng 
(OODBMS). Các OODBMS kết nối các khả năng của cơ sơ dữ liệu (như lưu trữ và 
tìm kiếm) và các đặc trưng hướng đối tượng (tóm lược, sự thừa kế, tính đồng nhất đối 
tượng). Một phương pháp tiếp cận chung là kết nối các đặc điểm hướng đối tượng với 
cơ sở dữ liệu quan hệ. Hệ thống đã được kết nối thì được gọi là một hệ thống cơ sở dữ 
 17
liệu đối tượng quan hệ. Trong một hệ thống như vậy, các đối tượng được xác định một 
cách thích hợp trong hướng đối tượng. Trong đó mỗi đối tượng chứa các đặc tính hoặc 
thuộc tính và các phương pháp hoặc các hàm được sử dụng để chế tác ra các đặc tính 
khác. Ví dụ, chúng ta có thể định nghĩa một loại ảnh sau: 
 Create type IMAGE( 
 Private 
 Size integer, 
 Resolution integer, 
 Content float[ ], 
 publlic 
 ... 
); 
 Sau đó khai báo các tranh bởi kiểu IMAGE có thể được sử dụng trong một bảng 
như sau: 
 Create table STUDENT( 
 Stu# integer, 
 Name char(20), 
 Address char(100) 
 Picture IMAGE); 
Điểm khác biệt chính giữa BLOB và các đối tượng là đối tượng thì được định rõ một 
cá
            Các file đính kèm theo tài liệu này:
 Co-So-Du-Lieu-Da-Phuong-TienYeu-Cau-Va-Cac-Van-De.pdf Co-So-Du-Lieu-Da-Phuong-TienYeu-Cau-Va-Cac-Van-De.pdf