Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://dspace.ctu.edu.vn/jspui/handle/123456789/85058
Nhan đề: | ỨNG DỤNG HỌC SÂU TRONG TÁI TẠO GIỌNG NÓI |
Nhan đề khác: | APPLY DEEP LEARNING IN VIETNAMESE VOICE CLONING SYSTEM |
Tác giả: | Trần, Nguyễn Dương Chi Trần, Trương Sơn Bảo |
Từ khoá: | KHOA HỌC MÁY TÍNH |
Năm xuất bản: | 2022 |
Nhà xuất bản: | Trường Đại Học Cần Thơ |
Tóm tắt: | Trong phạm vi nghiên cứu của đề tài này, chúng ta sẽ ứng dụng kỹ thuật học sâu để giải quyết bài toán tái tạo giọng nói tiếng Việt bằng cách dựa vào các mạng nơ ron nhân tạo để tổng hợp văn bản thành giọng nói của những người nói khác nhau bao gồm cả giọng của những người không có trong quá trình huấn luyện. Hệ thống gồm có ba thành phần tương ứng với ba mô hình khác nhau được huấn luyện độc lập với nhau: Một là mô hình xác thực giọng nói được huấn luyện về tác vụ xác minh người nói bằng cách sử dụng một bộ dữ liệu độc lập với hai mô hình còn lại nhằm mục đích tạo ra một vectơ để ánh xạ được hầu hết các đặc trưng âm thanh từ không gian sóng âm của người nói sang không gian của vectơ đó với số chiều cố định. Hai là mô hình tổng hợp văn bản thành giọng nói dựa trên kiến trúc của Tacotron với mục đích tạo ra Mel-Spectrograms từ các đặc trưng văn bản và âm thanh của giọng nói. Ba là mô hình mã hóa giọng nói được huấn luyện với mục đích mã hóa phổ âm thanh Mel-Spectrograms được tổng hợp thành đoạn sóng âm mà tai người có thể nghe được. Kết quả chúng ta đạt được là một hệ thống có khả năng tổng hợp được giọng nói tiếng Việt từ những người nói ngẫu nhiên. |
Mô tả: | 102 Tr |
Định danh: | https://dspace.ctu.edu.vn/jspui/handle/123456789/85058 |
Bộ sưu tập: | Trường Công nghệ Thông tin & Truyền thông |
Các tập tin trong tài liệu này:
Tập tin | Mô tả | Kích thước | Định dạng | |
---|---|---|---|---|
_file_ Giới hạn truy cập | 6.66 MB | Adobe PDF | ||
Your IP: 18.219.23.150 |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.