Đề tài Xử lý tiếng nói

ỞViệt Nam, việc nghiên cứu trong lĩnh vực ỞViệt Nam, việc nghiên cứu trong lĩnh vực

xửlý tiếng nói mới được phát triển trong xửlý tiếng nói mới được phát triển trong

thời gian gần đây thời gian gần đây

„Tổng hợp tiếng nói tiếng Việt chủyếu dựa Tổng hợp tiếng nói tiếng Việt chủyếu dựa

àh há hé ốiáđ ị â àh há hé ốiáđ ị â vào phươngpháp ghép nốicác đơn vị âm vào phươngpháp ghép nốicác đơn vị âm

Âm tiếttiếng Việt Âm tiếttiếng Việt Âm tiết tiếng Việt Âm tiết tiếng Việt

„Âm tiết là đơn vịngữâm nhỏnhất khi nói. Âm tiết là đơn vịngữâm nhỏnhất khi nói.

Cho dù phát âm thật chậm, thật rõ ràng thì Cho dù phát âm thật chậm, thật rõ ràng thì

nhữngâm thanh tiếngnói phát ra không nhữngâm thanh tiếngnói phát ra không

thểchia nhỏra được nữa. thểchia nhỏra được nữa.

Âiế óíh à đ bởi Âiế óíh à đ bởi „Âm tiết cótínhtoàn vẹn được tạo ra bởi Âm tiết cótínhtoàn vẹn được tạo ra bởi

một đợt căng của bộmáy phát âm một đợt căng của bộmáy phát âm

Cá đợt ă ốitiế htthà h ột Cá đợt ă ốitiế htthà h ột „Các đợtcăngnối tiếp nhau tạo thànhmột Các đợtcăngnối tiếp nhau tạo thànhmột

chuỗi âm tiết

pdf15 trang | Chia sẻ: oanh_nt | Lượt xem: 1142 | Lượt tải: 0download
Nội dung tài liệu Đề tài Xử lý tiếng nói, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Bài 6: Tổng hợp tiếng nói tiếng Việt „ Ở Việt Nam, việc nghiên cứu trong lĩnh vực xử lý tiếng nói mới được phát triển trong thời gian gần đây „ Tổng hợp tiếng nói tiếng Việt chủ yếu dựa à h há hé ối á đ ị âv o p ương p p g p n c c ơn v m Âm tiết tiếng Việt „ Âm tiết là đơn vị ngữ âm nhỏ nhất khi nói. Cho dù phát âm thật chậm, thật rõ ràng thì những âm thanh tiếng nói phát ra không thể chia nhỏ ra được nữa.  iế ó í h à đ bởi„ m t t c t n to n vẹn ược tạo ra một đợt căng của bộ máy phát âm Cá đợt ă ối tiế h t thà h ột„ c c ng n p n au ạo n m chuỗi âm tiết Đặc điểm âm tiết tiếng Việt „ Tính độc lập – Âm tiết tiếng Việt được thể hiện rõ ràng, riêng biệt với nhau. Trong tiếng Việt không có hiện tượng nối âm „ Có khả năng mang ý nghĩa – Hầu hết các âm tiết tiếng Việt đều mang ý nghĩa „ Âm tiết tiếng Việt có cấu trúc chặt chẽ. Mỗi âm tiết tiếng Việt ở dạng đầy đủ có 5 thành phần như sau: Thanh điệu Âm đầu Vần Âm đệm Âm chính Âm cuối „ Âm đầu: – Thường là phụ âm, có chức năng tạo ra âm sắc  ểcho âm tiết lúc mở đầu. m đầu có th khuyết trong một số trường hợp. „ Âm đệm: – Có chức năng làm thay đổi âm sắc của âm tiết lúc khởi đầu và làm phân biệt âm tiết này với âm tiết khác. Âm đệm có thể khuyết trong một số trường hợp. „ Âm chính: – Luôn luôn có mặt trong mọi âm tiết, có chức năng ắ Âquy định âm s c chủ yếu của âm tiết. m chính luôn luôn là nguyên âm „ Âm cuối: – Có thể là phụ âm hoặc bán nguyên âm, có chức năng là cơ sở phân chia loại hình âm tiết, để nhận ra sự xuất hiện của thanh điệu „ Thanh điệu: – luôn có mặt trong âm tiết, có chức năng phân biệt âm tiết về cao độ Các giải pháp tổng hợp tiếng nói tiếng Việt „ Ghép tiếng nói từ những từ riêng lẻ „ Ghép tiếng nói từ những đơn âm cơ bản „ Ghép tiếng nói theo hai phần: phụ âm đầu và phần vần „ Ghép tiếng nói từ các âm vị kép (diphone) Tổng hợp tiếng việt bằng cách ghép nối các âm vị kép (diphone) „ Tiếng việt là ngôn ngữ đơn âm tiết, bất kỳ từ nào cũng có thể được tạo thành từ hai âm vị kép (diphone) ghép lại „ Ví dụ: ể– từ tôi có th phân tích thành hai diphone “tô” và “ôi” Các bước thực hiện tổng hợp tiếng nói tiếng Việt 1. Thu âm và tạo cơ sở dữ liệu diphone 2. Phân tích văn bản, xác định các diphone cần sử dụng để tổng hợp 3. Ghép nối các diphone để tạo thành tiếng nói tương ứng 4. Làm trơn và biến đổi thanh điệu tiếng nói sau khi ghép nối Các diphone trong tiếng việt „ Mỗi từ trong tiếng việt có thể được tạo thành từ hai diphone „ Từ = diphone bắt đầu + diphone kết thúc – Ví dụ: bạn = ba + an + thanh điệu „ Diphone bắt đầu: một phụ âm đứng trước và tiếp theo là nguyên âm – Ví dụ: ba, kha „ Diphone kết thúc: một nhóm các nguyên â đứ t ướ à tiế th là h âm ng r c v p eo p ụ m – Ví dụ: an, ương „ Theo thống kê, tổng số diphone cần có để tạo nên các từ trong tiếng việt là 389 diphone trong đó có 61 diphone kết thúc có dấu X bả h l á di h iế iệ„ em ng p ụ ục c c p one t ng v t Xây dựng cơ sở dữ liệu diphone tiếng việt „ Thu âm các mẫu tiếng nói „ Tách các diphone từ mẫu tiếng nói „ Lưu trữ dạng sóng âm thanh của diphone vào cơ sở dữ liệu Tổng hợp tiếng nói bằng cách ghép hai phần: phụ âm đầu và phần vần „ Theo thống kê, trong tiếng Việt có 28 phụ âm làm âm đầu và 650 vần „ Xem bảng phụ lục các phụ âm đầu và vần trong tiếng Việt Xây dựng cơ sở dữ liệu phụ âm đầu và phần vần „ Thu âm các mẫu tiếng nói „ Tách các phụ âm đầu và phần vần từ mẫu tiếng nói „ Lưu trữ dạng sóng âm thanh của phụ âm đầu và phần vần vào cơ sở dữ liệu Các bước thực hiện tổng hợp tiếng nói tiếng Việt 1. Thu âm và tạo cơ sở dữ liệu phụ âm đầu và phần vần 2. Phân tích văn bản, xác định phụ âm đầu và vần tạo nên từ 3. Ghép nối phụ âm đầu và phần vần tương ứng trong CSDL để tạo thành tiếng nói tươ ứng ng 4. Làm trơn và biến đổi thanh điệu tiếng nói sau khi ghép nối

Các file đính kèm theo tài liệu này:

  • pdfxu_ly_tieng_noi_speech_synthesis_for_vietnamese_0033.pdf