ỨNG DỤNG HỌC SÂU TRONG TÁI TẠO GIỌNG NÓI

Trần, Trương Sơn Bảo

Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: https://dspace.ctu.edu.vn/jspui/handle/123456789/85058

Nhan đề:	ỨNG DỤNG HỌC SÂU TRONG TÁI TẠO GIỌNG NÓI
Nhan đề khác:	APPLY DEEP LEARNING IN VIETNAMESE VOICE CLONING SYSTEM
Tác giả:	Trần, Nguyễn Dương Chi Trần, Trương Sơn Bảo
Từ khoá:	KHOA HỌC MÁY TÍNH
Năm xuất bản:	2022
Nhà xuất bản:	Trường Đại Học Cần Thơ
Tóm tắt:	Trong phạm vi nghiên cứu của đề tài này, chúng ta sẽ ứng dụng kỹ thuật học sâu để giải quyết bài toán tái tạo giọng nói tiếng Việt bằng cách dựa vào các mạng nơ ron nhân tạo để tổng hợp văn bản thành giọng nói của những người nói khác nhau bao gồm cả giọng của những người không có trong quá trình huấn luyện. Hệ thống gồm có ba thành phần tương ứng với ba mô hình khác nhau được huấn luyện độc lập với nhau: Một là mô hình xác thực giọng nói được huấn luyện về tác vụ xác minh người nói bằng cách sử dụng một bộ dữ liệu độc lập với hai mô hình còn lại nhằm mục đích tạo ra một vectơ để ánh xạ được hầu hết các đặc trưng âm thanh từ không gian sóng âm của người nói sang không gian của vectơ đó với số chiều cố định. Hai là mô hình tổng hợp văn bản thành giọng nói dựa trên kiến trúc của Tacotron với mục đích tạo ra Mel-Spectrograms từ các đặc trưng văn bản và âm thanh của giọng nói. Ba là mô hình mã hóa giọng nói được huấn luyện với mục đích mã hóa phổ âm thanh Mel-Spectrograms được tổng hợp thành đoạn sóng âm mà tai người có thể nghe được. Kết quả chúng ta đạt được là một hệ thống có khả năng tổng hợp được giọng nói tiếng Việt từ những người nói ngẫu nhiên.
Mô tả:	102 Tr
Định danh:	https://dspace.ctu.edu.vn/jspui/handle/123456789/85058
Bộ sưu tập:	Trường Công nghệ Thông tin & Truyền thông

Các tập tin trong tài liệu này:

Tập tin	Mô tả	Kích thước	Định dạng
_file_ Giới hạn truy cập		6.66 MB	Adobe PDF
Your IP: 216.73.216.197

Hiển thị đầy đủ biểu ghi tài liệu Xem thống kê

Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.

Thư viện số DSPACE

Thư viện số cho phép quản lý các nguồn tài liệu số như: Văn bản, hình ảnh, âm thanh, phim ảnh...