Xử lý ảnh - Chương III: Thu nhận ảnh

Máy quay (Cameras) cộng với bộ chuyển đổi tương tự số.

- Máy quét (Scaners) chuyên dụng.

- Các bộ cảm biến ảnh (Sensors).

 Hệ thống thu nhận ảnh thực hiện 2 quá trình:

 + Cảm biến: Biến đổi năng lượng quang học thành năng lượng điện.

 + Tổng hợp năng lượng điện thành ảnh điện.

 

ppt37 trang | Chia sẻ: Mr Hưng | Lượt xem: 748 | Lượt tải: 0download
Bạn đang xem trước 20 trang nội dung tài liệu Xử lý ảnh - Chương III: Thu nhận ảnh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA3.1 Các thiết bị thu nhận ảnhCHƯƠNG III. THU NHẬN ẢNH3.2 Số hoá ảnh3.3 Một số phương pháp biểu diễn biên ảnh3.1 Các thiết bị thu nhận ảnhCHƯƠNG III. THU NHẬN ẢNH- Máy quay (Cameras) cộng với bộ chuyển đổi tương tự số.- Máy quét (Scaners) chuyên dụng.- Các bộ cảm biến ảnh (Sensors). Hệ thống thu nhận ảnh thực hiện 2 quá trình: + Cảm biến: Biến đổi năng lượng quang học thành năng lượng điện. + Tổng hợp năng lượng điện thành ảnh điện. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA Ảnh thu được từ các thiết bị thu nhận ảnh có thể là ảnh tương tự hoặc ảnh số. Trong trường hợp ảnh tương tự, chúng ta phải tiến hành quá trình số hóa ảnh để có thể xử lý được bằng máy tính. Phương pháp chung để số hóa ảnh là lấy mẫu theo hàng và mã hóa từng hàng. 3.2 Số hoá ảnh Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDAHình 3.1: Mô tả quét ảnh theo hàng, lấy mẫu theo hàng và mã hóa từng hàng Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA Nguyên tắc số hóa ảnh có thể được mô tả theo sơ đồ sau: Ảnh vào là ảnh tương tự. Tiến trình lấy mẫu thực hiện các công việc sau: Quét ảnh theo hàng, và lấy mẫu theo hàng. Đầu ra là rời rạc về mặt không gian, nhưng liên tục về mặt biên độ. Tiến trình lượng hóa: Lượng tử hóa về mặt biên độ (độ sáng) cho dòng ảnh vừa được rời rạc hóa. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDALấy mẫu - Yêu cầu tín hiệu có dải phổ hữu hạn - Ảnh thỏa mãn điều kiện trên, và được lẫy mẫu đều trên một lưới hình chữ nhật, với bước nhảy (chu kỳ lấy mẫu) ∆x, ∆y có thể khôi phục lại không sai sót. Nếu như ta chọn ∆x, ∆y sao cho: Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA Lượng hóa Lượng hóa ảnh nhằm ánh xạ từ một biến liên tục u (biểu diễn giá trị độ sáng) sang một biến rời rạc u* với các giá trị thuộc tập hữu hạn {r1 , r2 ,..., rL}. Cơ sở lý thuyết của lượng hóa là chia dải độ sáng biến thiên từ Lmin đến Lmax thành một số mức (rời rạc và nguyên). Thường Lmin=0, Lmax là số nguyên dạng (Thường chọn B=8, mỗi điểm ảnh sẽ được mã hóa 8 bít). Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA Cho {tk , k = 1,2,..., L +1} là tập các bước dịch chuyển tku. Với khoảng chia như trên (t1, t2, tk) nếu u(ti, ti+1) thì gán cho u giá trị ri. Hay nói cách khác u đã được lượng hoá bởi mức i (giá trị ri). Lượng hóa đều: Lượng hóa đều là một kỹ thuật đơn giản, dễ thực hiện nhất. Giả sử biên độ đầu ra của hệ thống thu nhận ảnh nhận giá trị từ 0 đến X. Mẫu lượng hóa đều trên 256 mức. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA3.3 Một số phương pháp biểu diễn biên ảnh Sau giai đoạn số hóa, ảnh có thể được lưu trữ lại hoặc đem xử lý. Tuy nhiên, nếu ta lưu trữ ảnh thô (theo kiểu bản đồ ảnh), thì dung lượng lớn, không thuận tiện cho việc truyền thông. Vì vậy, thường người ta không biểu diễn toàn bộ ảnh thô, mà tập trung lưu trữ các mô tả đặc trưng của ảnh: Biên ảnh, các vùng ảnh. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA3.3.1 Mã loạt dài- Dùng biểu diễn cho vùng ảnh hay ảnh nhị phân Biểu diễn một vùng ảnh R nhờ một ma trận nhị phân - Với cách biểu diễn trên, một vùng ảnh nhị phân được xem như gồm các chuỗi 0 hay 1 đan xen (gọi là 1 mạch).- Mỗi mạch gồm: Địa chỉ bắ t đầu và chiều dài của mạch theo dạng (, chiều dài). Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDAHình 3.2 Ảnh nhị phân và các biểu diễn mã loạt dài tương ứng Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA3.3.2 Mã xích Mã xích thường được dùng để biểu diễn biên của ảnh. Thay vì lưu trữ toàn bộ ảnh, người ta lưu trữ dãy các điểm ảnh như A, BM. Theo phương pháp này, 8 hướng của vectơ nối 2 điểm biên liên tục được mã hóa. Khi đó ảnh được biểu diễn qua điểm ảnh bắt đầu A cùng với chuỗi các từ mã. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA3.3.3 Mã tứ phân Theo phương pháp mã tứ phân, một vùng ảnh coi như bao kín một hình chữ nhật. Vùng này được chia làm 4 vùng con (Quadrant). Nếu một vùng con gồm toàn điểm đen (1) hay toàn điểm trắng (0) thì không cần chia tiếp. Trong trường hợp ngược lại, vùng con gồm cả điểm đen và trắng gọi là vùng không đồng nhất, ta tiếp tục chia thành 4 vùng con tiếp và kiểm tra tính đồng nhất của các vùng con đó. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA Quá trình chia dừng lại khi mỗi vùng con chỉ chứa thuần nhất điểm đen hoặc điểm trắng. Cây biểu diễn ảnh gồm một chuỗi các ký hiệu b (black), w (white) và g (grey) kèm theo ký hiệu mã hóa 4 vùng con Biểu diễn theo phương pháp này ưu việt hơn so với các phương pháp trên, nhất là so với mã loạt dài. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA3.4 Các định dạng ảnh cơ bản Là ảnh được mô tả bởi một ma trận các giá trị số xác định màu và bảng màu của các điểm ảnh tương ứng khi hiển thị. * Ưu điểm của ảnh Bitmap là tốc độ vẽ và tốc độ xử lý nhanh. * Nhược điểm của nó là kích thước rất lớn. 3.4.1 Một số định dạng ảnh hiện nay a. Ảnh BMP (Bitmap) Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDAb. Ảnh JPEG (Joint Photographic Experts Group) Đây là một định dạng ảnh được hỗ trợ bởi nhiều trình duyệt web. Ảnh JPEG được phát triển để nén dung lượng và lưu trữ ảnh chụp, và được sử dụng tốt nhất cho đồ họa có nhiều màu sắc, ví dụ như là ảnh chụp được scan. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA Ảnh GIF được phát triển dành cho những ảnh có tính chất thay đổi. Nó được sử dụng tốt nhất cho đồ họa có ít màu, ví dụ như là ảnh hoạt hình hoặc là những bức vẽ với nhiều đường thẳng. c. Ảnh GIF (Graphics Interchange Format) Có hai sự khác nhau cơ bản giữa ảnh GIF và ảnh JPEG: + Ảnh GIF nén lại theo cách giữ nguyên toàn bộ dữ liệu ảnh trong khi ảnh JPEG nén lại nhưng làm mất một số dữ liệu trong ảnh. + Ảnh GIF bị giới hạn bởi số màu nhiều nhất là 256 trong khi ảnh JPEG không giới hạn số màu mà chúng sử dụng. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDAd. Ảnh WMF (Windows Metafiles) Là một tập hợp các lệnh GDI dùng để mô tả ảnh và nội dung ảnh. Có hai ưu điểm khi sử dụng ảnh WMF: Kích thước file WMF nhỏ và ít phụ thuộc vào thiết bị hiển thị hơn so với ảnh Bitmap. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA3.4.2 Khái niệm chung Ảnh thu được sau quá trình số hóa thường được lưu lại cho các quá trình xử lý tiếp theo hay truyền đi. Tuy các định dạng này khác nhau, song chúng đều tuân theo một cấu trúc chung nhất. Nhìn chung, một tệp ảnh bất kỳ thường bao gồm 3 phần: Mào đầu tệp (Header) Dữ liệu nén (Data Compres Bảng màu (Palette Color) Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDAa) Mào đầu tệp Mào đầu tệp là phần chứa các thông tin về kiểu ảnh, kích thước, độ phân giải, số bit dùng cho 1 pixel, cách mã hóa, vị trí bảng màub) Dữ liệu nén Số liệu ảnh được mã hóa bởi kiểu mã hóa chỉ ra trong phần Header.c) Bảng màu Bảng màu không nhất thiết phải có, ví dụ khi ảnh là đen trắng. Nếu có, bảng màu cho biết số màu dùng trong ảnh và bảng màu được sử dụng để hiện thị màu của ảnh. Một số các định dạng khác, cấu hình, đặc trưng của từng địng dạng và các tham số. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA Tiến hành đọc tệp ảnh và chuyển vào bộ nhớ của máy tính dưới dạng ma trận số liệu ảnh. Trước tiên, ta cần đọc phần mào đầu (Header) để lấy các thông tin chung và thông tin điều khiển. Việc đọc này sẽ dừng ngay khi ta không gặp đựợc chữ ký (Chữ ký ở đây thường được hiểu là một mã chỉ ra định dạng ảnh và đời (version) của nó) mong muốn. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA3.4.3 Quy trình đọc một tệp ảnh Tiến hành đọc tệp ảnh và chuyển vào bộ nhớ của máy tính dưới dạng ma trận số liệu ảnh. Trước tiên, ta cần đọc phần mào đầu (Header) để lấy các thông tin chung và thông tin điều khiển. Việc đọc này sẽ dừng ngay khi ta không gặp đựợc chữ ký (Chữ ký ở đây thường được hiểu là một mã chỉ ra định dạng ảnh và đời (version) của nó) mong muốn. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA Dựa vào thông tin điều khiển, ta xác định đựợc vị trí bảng màu và đọc nó vào bộ nhớ. Cuối cùng, ta đọc phần dữ liệu nén. Căn cứ vào phương pháp nén chỉ ra trong phần Header ta giải mã được ảnh. Cuối cùng là khâu hiện ảnh. Dựa vào số liệu ảnh đã giải nén, vị trí và kích thước ảnh, cùng sự trợ giúp của bảng màu ảnh được hiện lên trên màn hình. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA3.5 Các kỹ thuật tái hiện ảnh3.5.1 Kỹ thuật chụp ảnh3.5.2 Kỹ thuật in ảnh Từ đặc điểm cảm nhận của mắt người, sự thay đổi cường độ chấm đen trong các phần tử ảnh trắng tạo nên mô phỏng của một ảnh liên tục. Mắt người cảm nhận từ một ảnh mà màu biến đổi từ đen qua xám rồi đến trắng. Tuy nhiên, các máy in ghép nối với máy tính không có khả năng sắp xếp các chấm đen có kích thước khác nhau của ảnh. Do đó, người ta dùng một số kỹ thuật biến đổi như: Phân ngưỡng, chọn mẫu, dithering. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDAa) Phân ngưỡng Kỹ thuật này đặt ngưỡng để hiển thị các tông màu liên tục. Các điểm trong ảnh được so sánh với ngưỡng định trước. Giá trị của ngưỡng sẽ quyết định điểm có được hiển thị hay không. Do vậy ảnh kết quả sẽ mất đi một số chi tiết. Có nhiều kỹ thuật chọn ngưỡng áp dụng cho các đối tượng khác nhau Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA Trong đó u(m, n) là mức xám tại tọa độ (m, n)Nhìn chung kĩ thuật này khó chấp nhận vì ảnh mất khá nhiều chi tiết. Hiện thị 2 màu: Chỉ dùng ảnh đen trắng có 256 mức xám. Bản chất của phương pháp này là chọn ngưỡng dựa trên lược đồ mức xám của ảnh. Để đơn giản có thể lấy ngưỡng với giá trị là 127. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA Hiện thị 4 màu: Hiện 4 màu để khắc phục nhược điểm của kỹ thuật hiển thị 2 màu. Một ví dụ của Bảng mã 4 mầu được cho ở Bảng 3.1Bảng 3.1 Bảng mã 4 mầu Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDAb) Kỹ thuật chọn theo mẫu Kỹ thuật này sử dụng một nhóm các phần tử trên thiết bị ra (máy in chẳng hạn) để biểu diễn một pixel trên ảnh nguồn. Các phần tử của nhóm quyết định độ sáng tối của cả nhóm. Nhóm thường được chọn có dạng ma trận vuông. Nhóm n x n phần tử sẽ tạo nên n2+1 mức sáng. Ma trận mẫu thường được chọn là ma trận Rylander. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDABảng 3.2. Ma trận Rylander cấp 4 Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDAc) Kỹ thuật Dithering Dithering là việc biến đổi một ảnh đa cấp xám sang ảnh nhị phân. Kỹ thuật Dithering đựợc áp dụng để tạo ra ảnh đa cấp xám khi độ phân giải nguồn và đích là như nhau. Kỹ thuật này sử dụng một ma trận mẫu gọi là ma trận Dither. Ma trận này gần giống như ma trận Rylander. Để tạo ảnh, mỗi phần tử của ảnh gốc sẽ được so sánh với phần tử tương ứng của ma trận Dither. Nếu lớn hơn, phần tử ở đầu ra sẽ sáng và ngược lại. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA3.6 Khái niệm ảnh đen trắng và ảnh mầu Ảnh có thể biểu diễn dưới dạng tín hiệu tương tự hoặc tín hiệu số. Trong biểu diễn số của các ảnh đa mức xám, một ảnh được biểu diễn dưới dạng một ma trận hai chiều. Mỗi phần tử của ma trận biểu diễn cho mức xám hay cường độ của ảnh tại vị trí đó. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDAHình 3.4: Biểu diễn mức xám của ảnh số Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA3.6.1 Ảnh đen trắng Ảnh đen trắng chỉ bao gồm 2 màu: Màu đen và màu trắng. Người ta phân mức đen trắng đó thành L mức Nếu sử dụng số bit B=8 bít để mã hóa mức đen trắng (hay mức xám) thì L được xác định: Ảnh nhị phân khá đơn giản, các phần tử ảnh có thể coi như các phần tử logic. Ứng dụng chính của nó được dùng theo tính logic để phân biệt đối tượng ảnh với nền hay để phân biệt điểm biên với điểm khác. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA3.6.2 Ảnh màu Ảnh màu theo lý thuyết của Thomas là ảnh tổ hợp từ 3 màu cơ bản: Đỏ (R), lục (G), lơ (B) và thường thu nhận trên các dải băng tần khác nhau. Với ảnh màu, cách biểu diễn cũng tương tự như với ảnh đen trắng, chỉ khác là các số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm: Đỏ (red), lục (green) và lam (blue). Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA Để biểu diễn cho một điểm ảnh màu cần 24 bit. 24 bit này được chia thành ba khoảng 8 bit. Mỗi màu cũng phân thành L cấp màu khác nhau (thường L=256). Mỗi khoảng này biểu diễn cho cường độ sáng của một trong các màu chính. Để lưu trữ ảnh màu người ta có thể lưu trữ từng màu riêng biệt, mỗi màu lưu trữ như một ảnh đa cấp xám. Do đó, không gian nhớ dành cho một ảnh màu lớn gấp 3 lần một ảnh đa cấp xám cùng kích cỡ. Chương III 3.1 TBTNA 3.2 SHA 3.3 PPBDA

Các file đính kèm theo tài liệu này:

  • pptch3_7459.ppt