1. Khái niệm
Cơ sở dữ liệu (database)
« Là một bộ sưu tập các dữ liệu tác
nghiệp được lưu trữ lại và được các hệ
ứng dụng của một xí nghiệp cụ thể nào
đó sử dụng »
Ví dụ: cơ sở dữ liệu sách của thư viện
Đại học Bách Khoa Hà Nội, cơ sở dữ
liệu hàng hóa của siêu thị
              
            GIẢNG VIÊN: TS.LÊ THỊ LAN
 Thông tin
• TS. Lê Thị Lan
• Viện nghiên cứu quốc tế MICA, Đại học 
 Bách Khoa Hà Nội
• Email: 
[email protected]
• Web: 
 Thi-Lan/Database
 Nội dung môn học
• Chương 1: Đại cương về các hệ cơ sở dữ liệu
• Chương 2: Các mô hình dữ liệu
• Chương 3: Ngôn ngữ định nghĩa và thao tác dữ liệu 
 (SQL)
• Chương 4: Phụ thuộc hàm và chuẩn hóa CSDL 
 quan hệ 
• Chương 5: Tích hợp cơ sở dữ liệu trong các ứng 
 dụng
 – Php + Mysql
 – C# + SQL server
 – ..
 Kế hoạch học tập
• Lý thuyết
• Bài tập trên lớp, bài tập tuần (cá nhân, 
 nhóm sinh viên) đánh giá giữa kỳ
• Bài tập lớn  tham gia vào điểm đánh giá 
 cuối kỳ
• Thi học kỳ
 Đánh giá giữa kỳ
• Thực hiện theo nhóm. Mỗi nhóm (3 sinh 
 viên theo danh sách) làm 1 bài tập.
• Cần:
 – Hoàn thành bài tập được giao trong thời 
 gian 1 tuần (nhận thứ năm hàng tuần và 
 trình bày vào thứ năm tuần tiếp theo)
 – Phân chia công việc rõ ràng
 – Chuẩn bị slides và trình bày về bài tập 
 cho các bạn trong lớp
 – Đánh giá điểm cho các thành viên dựa 
 vào công việc của từng thành viên
 Tài liệu tham khảo
• Nguyễn Kim Anh, Nguyên lý của các hệ cơ 
 sở dữ liệu, NXB Đại học quốc gia Hà Nội. 
• SQL Unleashed, Second Edition
 by Sakhr Youness Sams, Macmillan 
 Computer Publishing 
• Database Management Systems, Second 
 Edition, Raghu Ramakrishnan and Johannes 
 Gehrke
• Google
 CHƯƠNG 1
ĐẠI CƯƠNG VỀ HỆ 
 CƠ SỞ DỮ LIỆU
 Giới thiệu
 Dư thừa, không nhất quán, dị thường trong 
truy nhập đồng thời, 
Giới thiệu (tiếp)
 1. Khái niệm 
Cơ sở dữ liệu (database)
 « Là một bộ sưu tập các dữ liệu tác
 nghiệp được lưu trữ lại và được các hệ
 ứng dụng của một xí nghiệp cụ thể nào
 đó sử dụng »
Ví dụ: cơ sở dữ liệu sách của thư viện
 Đại học Bách Khoa Hà Nội, cơ sở dữ
 liệu hàng hóa của siêu thị
 1. Khái niệm 
Hệ quản trị cơ sở dữ liệu (database
 management system)
"Là một hệ thống phần mềm cho phép tạo
 lập cơ sở dữ liệu và điều khiển mọi truy
 nhập đối với CSDL đó."
Ví dụ: M. Access, SQL server
 1. Khái niệm 
4 thành phần của một hệ cơ sở dữ liệu 
 (database system)
– Cơ sở dữ liệu hợp nhất
– Người sử dụng
– Phần mềm quản trị cơ sở dữ liệu
– Phần cứng
 2. Hệ quản trị cơ sở dữ liệu
• Hệ quản trị cơ sở dữ liệu có khả năng:
 – Khả năng quản lý dữ liệu tồn tại lâu dài
 – Khả năng truy nhập các khối lượng dữ 
 liệu lớn một cách hiệu quả
 2. Hệ quản trị cơ sở dữ liệu
• Các đặc điểm của hệ quản trị cơ sở dữ 
 liệu:
 – Hỗ trợ ít nhất một mô hình dữ liệu
 – Đảm bảo tính độc lập dữ liệu
 – Hỗ trợ ngôn ngữ cấp cao
 – Quản lý giao dịch 
 – Điều khiển truy nhập
 – Phục hồi dữ liệu
 2. Hệ quản trị cơ sở dữ liệu
• Khái niệm:
 – Sơ đồ cơ sở dữ liệu
 – Thể hiện của sơ đồ cơ sở dữ liệu
 2. Hệ quản trị cơ sở dữ liệu
 Các thay đổi 
Các thay đổi Các thay đổi 
 dữ liệu
 sơ đồ truy vấn
 Bộ xử lý câu 
 hỏi
 Bộ quản lý 
 giao dịch
 Bộ quản lý 
 lưu trữ
 Dữ liệu 
 siêu dữ liệu
 2. Hệ quản trị cơ sở dữ liệu
• Các mức trừu tượng
 – Mức vật lý
 – Mức logic
 – Mức khung nhìn
• Các mức độc lập dữ liệu
 – Mức vật lý
 – Mức logic (khó đạt được)
Các mức trừu tượng
 2. Hệ quản trị cơ sở dữ liệu
• Các ngôn ngữ cơ sở dữ liệu
 – Ngôn ngữ định nghĩa dữ liệu (Data 
 Definition Language-DDL)
 – Ngôn ngữ thao tác dữ liệu (Data 
 Manipulation Language - DML)
 »Tìm kiếm thông tin
 »Thêm thông tin mới
 »Xóa thông tin
 »Thay đổi thông tin
 2. Hệ quản trị cơ sở dữ liệu
• Người dùng
 – Người quản trị cơ sở dữ liệu
 » Định nghĩa sơ đồ, xác định cấu trúc lưu trữ, ủy quyền, xác 
 định ràng buộc toàn vẹn
 – Người sử dụng cơ sở dữ liệu
 »Lập trình ứng dụng
 »Nhà phân tích dữ liệu
 »Người sử dụng cuối
Ví dụ
 3. Phân loại các hệ cơ sở dữ liệu
• Hệ cơ sở dữ liệu tập trung
 – Hệ cơ sở dữ liệu cá nhân
 – Hệ cơ sở dữ liệu trung tâm
 – Hệ cơ sở dữ liệu khách chủ
• Hệ cơ sở dữ liệu phân tán
 – Hệ cơ sở dữ liệu phân tán thuần nhất
 – Hệ cơ sở dữ liệu phân tán không thuần 
 nhất
 Cơ sở dữ liệu tập trung 
– Cơ sở dữ liệu trung tâm
Cơ sở dữ liệu phân tán
 3. Hệ cơ sở dữ liệu phân tán
– Hệ cơ sở dữ liệu phân tán thuần nhất
 »Hệ điều hành như nhau
 »Mô hình dữ liệu như nhau
 »Hệ quản trị cơ sở dữ liệu chung
 »Dữ liệu được định nghĩa và có khuôn 
 dạng chung
– Hệ cơ sở dữ liệu phân tán không thuần 
 nhất
 So sánh các hệ quản trị CSDL quan hệ
Tên Công ty Bản đầu tiên Bản quyền
ADABAS 1970 Software AG Proprietary
Microsoft Access 1992 Microsoft Proprietary
Microsoft SQL 1989 Microsoft Proprietary
Server
MySQL 1995 Sun Microsystems GPL or Proprietary
PostgreSQL 1989 PostgreSQL Global BSD
 Development Group
SQLite 2000 D. Richard Hipp Public domain
Oracle 1979 Oracle Corporation Proprietary
 So sánh các hệ quản trị CSDL quan hệ
Tên Kích thước
ADABAS N/A
Microsoft Access 2 GB
Microsoft SQL Server 524,258 TB (32,767 files * 16 
 TB max file size)
MySQL Unlimited
PostgreSQL Unlimited
SQLite 32 TB (230 pages * 32 KB max 
 page size)
Oracle Unlimited (4 GB * block size 
 per tablespace)