Các phương pháp ấn dữ liệu trên âm thanh

Đặc điểm tín hiệu âm thanh

• Mô hình hệ thính giác

• Các phương pháp ADL trên

âm thanh 3

pdf68 trang | Chia sẻ: Mr hưng | Lượt xem: 1280 | Lượt tải: 0download
Bạn đang xem trước 20 trang nội dung tài liệu Các phương pháp ấn dữ liệu trên âm thanh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
2• Đặc điểm tín hiệu âm thanh1 • Mô hình hệ thính giác2 • Các phương pháp ADL trên âm thanh3 • Thảo luận, bài tập, và seminar4 • Các thành phần cơ bản của tai người và nguồn phát âm thanh 3 4Nguồn Dao động 51 chiều Các dạng sóng 6 7• Tai có những cảm thụ khác nhau (âm bổng, âm trầm). • Giọng nữ bổng và giọng nam trầm. • Độ cao của âm thanh mỗi người khác nhau Độ cao (Pitch) Độ cao được xác định bằng số dao động của tín hiệu trong 1 giây (tần số - Hz). 8Bước sóng Độ lớn Một dao động Độ cao(Pitch) Cường độ Quyết định 9Pitch caoPitch thấp Độ cao(Pitch) Tần số thấp Tần số cao 10 Bước sóng ngắn, tần số cao Bước sóng dài, tần số thấp Độ cao(Pitch) Pitch caoPitch thấp Độ lớn (Loudness) 11 Bước sóng Độ lớn Một giao động Cường độ Quyết định Độ lớn (Loudness) 12 C ư ờ n g đ ộ 13 Độ lớn (Loudness) • Được đo bằng đơn vị decibel (dB) • Âm thanh nhỏ nhất mà tai có thể cảm nhận được là 0dB. • Ngưỡng đau là 120 dB. Độ lớn (Loudness) 14 Cường độ Dao động trong không khí càng lớn thì âm tạo ra càng to. Mức áp suất không khí khi một vật dao động. Áp suất không khí này được xem như cường độ. Độ lớn Tùy thuộc vào cảm nhận của mỗi người Mức độ “thính” của tai người Tần số cao nghe lớn tần số thấp 15 - Âm thanh A có cường độ lớn hơn âm thanh B (năng lượng cao hơn). - Âm thanh B có tần số cao hơn âm thanh A (trong cùng khoảng thời gian, âm thanh B cho nhiều sóng ). Độ cao(Pitch) Âm thanh A Âm thanh B Độ lớn (Loudness) 16 Họa âm thứ nhất đến thứ năm của của 1 tiếng đàn Âm sắc(Timbre) • Âm sắc quyết định chất lượng hay màu sắc của âm. • Âm sắc được quyết định bởi các họa âm và mối quan hệ giữa các độ lớn của các họa âm. 17 Âm sắc(Timbre) Tần số Âm cơ bản Họa âm 18 Sóng vuông chỉ chứa các họa âm lẻ Âm sắc(Timbre) Âm cơ bản Âm tổng hợp 19 Sóng tổng hợp của các họa âm Âm sắc(Timbre) 20 Âm sắc(Timbre) 21 20 Hz-20kHz Nhạy cảm: 1kHz-5kHz Tạp âm Âm thanh Tạp âm 22 • Đặc điểm tín hiệu âm thanh1 • Mô hình hệ thính giác2 • Các phương pháp ADL trên âm thanh3 • Thảo luận, bài tập, và seminar4 23 Tai người Các biến đổi về mặt thời gian của áp âm Đặc tính về cả thời gian và phổ tần số 24 25 26 27 Critical band Được Harvey Fletcher giới thiệu vào 1940 Đơn vị: Bark - tương ứng độ rộng của 1 critical band Trong khoảng tần số mà HVS có thể cảm nhận (20 Hz- 20kHz) được chia thành các critical band với số lượng khác nhau (24, 25, 32, 55, hoặc 109) tùy thuộc vào tần số ngưỡng 28 Critical band 29 Ngụy trang tần số 30 Ngưỡng nghe 31 0 2 4 6 8 10 12 14 16 18 20 22 24 critical band [Barks] 60 40 20 0M ứ c k íc h th íc h [d B ] Hàm nghe Tần số (kHz) M ứ c k íc h th íc h [d B ] 32 0 2 4 6 8 10 12 14 16 18 20 22 24 critical band [Barks] 60 40 20 0M ứ c k íc h th íc h [d B ] Khoảng lặng Ngưỡng nghe Âm thanh 33 0 2 4 6 8 10 12 14 16 18 20 22 24 critical band [Barks] 60 40 20 0M ứ c k íc h th íc h [d B ] Tín hiệu watermark Tín hiệu âm thanh chứa 34 Ngụy trang thời gian 35 masker maskee • Tín hiệu âm thanh chứa • Tín hiệu • Tín hiệu watermark • Nhiễu 36 Ngụy trang tín hiệu âm thanh Ngụy trang tần số Ngụy trang thời gian 37 Mức độ ngụy trang 38 Vô hình (Chất lượng) Dung lượng chứa Bền vững 39 HỆ THÍNH GIÁC Sức chứa Vô hình Dung lượng 40 M ô h ìn h g iả lậ p h ệ th ín h g iá c 41 • Đặc điểm tín hiệu âm thanh1 • Mô hình hệ thính giác2 • Các phương pháp ADL trên âm thanh3 • Thảo luận, bài tập, và seminar4 42 Mã hóa bit ít quan trọng nhất Phương pháp dùng tiếng vang Mã hóa pha Phương pháp Patch work 43 Sample Rate Bit depth 1x-bit 2x-bit 4x-bit 44 Sample (Mẫu) Tập tin âm thanh 3 4 5 6 5 4 3 2 2 3 1 1 3 4 5 5 101 (watermark) 110 1 0 1 111 000 100001 101 7 0 5 Chọn mẫu ngẫu nhiên 45 Miền thời gian Thuật toán đơn giản nhất Khả năng nhúng cao, chi phí thấp 46 Quá trình nhúng Chọn ngẫu nhiên hai tập A = {ai} và B = {bi}Bước 1 • Tính độ lỗi Tính giá trị mới cho A và BBước 2 Thay thế các giá trị ai và bi bằng các giá trị mớiBước 3       22 1 1 1 N N i ii i a a b b S N N              * * / 2 / 2 i i i i a a sign a b CS b b sign a b CS         47 Quá trình trích Tính giá trị thống kêBước 1 So sánh T2 với ngưỡng τBước 2 • Nếu T2 > τ có nhúng watermark • Ngược lại không có   2 2 2 a b T S   48 1 1 , j j j k k k j k                      • Phân đoạn tín hiệu chứa với chiều dài N Bước 1 • Mỗi đoạn được biến đổi bằng DFTBước 2 • Tính sự khác biệt của một ma trận pha với các ma trận pha xung quanh Bước 3 Ma trận phase φj [ωk] Ma trận cường độ |Aj[ωk]| 0 ≤ k ≤ N/2 – 1, 0 ≤ j ≤ N - 1 49               1 0 1 2 m k k                       1 1 ,j j jk k k j k • Tín hiệu thủy vân được nhúng vào phổ pha đầu tiên Bước 4 • Tạo ma trận pha mớiBước 5 • Kết hợp ma trận pha mới và ma trận cường độ (cũ) Bước 6 • Biến đổi DFT ngượcBước 7 50 • Phân đoạn tín hiệu chứa với chiều dài N Bước 1 • Biến đổi DFT cho đoạn tín hiệu đầu tiên Bước 2 • Xét ma trận phaBước 3        0 2 k       0 2 k Bit 0 Bit 1 51 52 Cơ chế tiếng vang Tham số: độ lớn khởi tạo, độ trễ, decay rate. deltaĐộ trễ Mẫu TH gốc Mẫu echo‘1’ Mẫu echo‘0’ Độ lớn ban đầu Decay rate Decay rate Bit „1‟ Bit „0‟ 53 Định nghĩa các kernel ‘1’ và kernel ‘0’ Quá trình nhúng 01 Mẫu echo cho bit ‘1’ w1= α1 c(t+1) w0=α0 c(t+0) Mẫu TH gốc Mẫu TH gốc D ec ay ra te α 0 D ec ay ra te α 1 Mẫu echo cho bit ‘0’ 54 Tín hiệu gốc Tín hiệu gốc Tín hiệu echo 00 kernel ‘0’ Quá trình nhúng ( ) ( )* ( )wc t c t h t a b c d e f g 1 0 1 1 0 0 1 55 Encode ‘1’ a b c d e f g 1 Encode ‘0’ a b c d e f g 0 Quá trình nhúng 56 a b c d e f g 1 0 1 1 0 0 1 Định nghĩa các bộ trộn tín hiệu Bộ trộn‘1’ Bộ trộn‘0’ Quá trình nhúng 1 0 0 ( ) (1 ) ( ) M j j j m t b rect t     1 1 0 ( ) ( ) M j j j m t b rect t           1 1 if ( ) 0 otherwise j j j t t t rect t bj = w [j mod l(w)] Với w là watermark, l(w) là chiều dài watermark. 1 0 1 0 1011001 (watermark) 57 Quá trình nhúng 1 0 1 1 0 0 1 58 c(t) w1=c(t+1) w0=c(t+0) w0* m0 w1* m1 cw= c0+w1*m1+w0*m0 Quá trình nhúng Tín hiệu gốc Kernel ‘1’ (w1) Kernel ‘0’ (w0) Bộ trộn ‘0’ (m0) Tín hiệu đánh dấu Bộ trộn ‘1’ (m1) 59 init(Block blocks[]) { for (int i=0; i < blocks.length; i++) { if (blocks[i].echoValue() == 0) blocks[i] = offset0(blocks[i]); else blocks[i] = offset1(blocks[i]); } } Block offset0(Block block) { return (block + (block - OFFSET_0)); } Block offset1(Block block) { return (block + (block - OFFSET_1)); } Quá trình nhúng 60 Xác định 1 và 0 từ tín hiệu đã nhúng Quá trình trích Bước 1 • Tìm phổ tín hiệu (cepstrum) Bước 2 • Tự tương quan tín hiệu x (Rxx) trong miền phổ Bước 3 • Xác định thông tin đã nhúng thông qua các peak của tín hiệu tự tương quan Rxx 61 Quá trình trích F(x)   2ln F xx CxF-1 F(cx)   2 xF cCx RxxF -1 62 Hàm tự tương quanQuá trình trích 63 Ví dụ Quá trình nhúng 3 5 2 1 4 Đoạn âm thanh gốc Echo cho bit ‘0’ Echo cho bit ‘1’ 0 0 3 5 2 0 0 0 3 5 Giả sử độ trể tương ứng với bit 1 là 2 Giả sử độ trể tương ứng với bit 0 là 3 Các tham số 1 = 2 0 = 3 α0 = α1 = 0.5 64 Ví dụ nhúng bit 1 3 5 2 1 4 Echo cho bit ‘1’ 0 0 3 5 2 Các tham số 1 = 2 0 = 3 α0 = α1 = 0.5 3 = 3 5 3.5 3.5 5 Kết quả sau khi nhúng Đoạn âm thanh gốc + * 65 Ví dụ nhúng bit 0 3 5 2 1 4 Echo cho bit ‘0’ 0 0 0 3 2 Các tham số 1 = 2 0 = 3 α0 = α1 = 0.5 2 = 3 5 2 2.5 6.5 Kết quả sau khi nhúng Đoạn âm thanh gốc + * 66 Ví dụ quá trình nhúng 3 5 2 1 4 Các tham số 1 = 2 0 = 3 α0 = α1 = 0.5Đoạn âm thanh gốc 3 5 3.5 3.5 5 3 5 2 2.5 6.5 Kết quả khi: Nhúng bit 1 Nhúng bit 0 67 Ví dụ quá trình rút trích 3 5 2 2.5 6.5 Các tham số 1 = 2 0 = 3 α0 = α1 = 0.5Đoạn âm thanh đã nhúng 1 0.1417 0.0483 0.0548 0.2553 Kết quả FFT  ln IFFT  autocorr Echo 1 Echo 0 Bit 0 68

Các file đính kèm theo tài liệu này:

  • pdfcac_phuong_phap_an_du_lieu_tren_am_thanh_2375.pdf
Tài liệu liên quan