Please use this identifier to cite or link to this item:
https://dspace.ctu.edu.vn/jspui/handle/123456789/85058
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Trần, Nguyễn Dương Chi | - |
dc.contributor.author | Trần, Trương Sơn Bảo | - |
dc.date.accessioned | 2023-01-31T09:40:43Z | - |
dc.date.available | 2023-01-31T09:40:43Z | - |
dc.date.issued | 2022 | - |
dc.identifier.other | B1709525 | - |
dc.identifier.uri | https://dspace.ctu.edu.vn/jspui/handle/123456789/85058 | - |
dc.description | 102 Tr | vi_VN |
dc.description.abstract | Trong phạm vi nghiên cứu của đề tài này, chúng ta sẽ ứng dụng kỹ thuật học sâu để giải quyết bài toán tái tạo giọng nói tiếng Việt bằng cách dựa vào các mạng nơ ron nhân tạo để tổng hợp văn bản thành giọng nói của những người nói khác nhau bao gồm cả giọng của những người không có trong quá trình huấn luyện. Hệ thống gồm có ba thành phần tương ứng với ba mô hình khác nhau được huấn luyện độc lập với nhau: Một là mô hình xác thực giọng nói được huấn luyện về tác vụ xác minh người nói bằng cách sử dụng một bộ dữ liệu độc lập với hai mô hình còn lại nhằm mục đích tạo ra một vectơ để ánh xạ được hầu hết các đặc trưng âm thanh từ không gian sóng âm của người nói sang không gian của vectơ đó với số chiều cố định. Hai là mô hình tổng hợp văn bản thành giọng nói dựa trên kiến trúc của Tacotron với mục đích tạo ra Mel-Spectrograms từ các đặc trưng văn bản và âm thanh của giọng nói. Ba là mô hình mã hóa giọng nói được huấn luyện với mục đích mã hóa phổ âm thanh Mel-Spectrograms được tổng hợp thành đoạn sóng âm mà tai người có thể nghe được. Kết quả chúng ta đạt được là một hệ thống có khả năng tổng hợp được giọng nói tiếng Việt từ những người nói ngẫu nhiên. | vi_VN |
dc.language.iso | vi | vi_VN |
dc.publisher | Trường Đại Học Cần Thơ | vi_VN |
dc.subject | KHOA HỌC MÁY TÍNH | vi_VN |
dc.title | ỨNG DỤNG HỌC SÂU TRONG TÁI TẠO GIỌNG NÓI | vi_VN |
dc.title.alternative | APPLY DEEP LEARNING IN VIETNAMESE VOICE CLONING SYSTEM | vi_VN |
dc.type | Thesis | vi_VN |
Appears in Collections: | Trường Công nghệ Thông tin & Truyền thông |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
_file_ Restricted Access | 6.66 MB | Adobe PDF | ||
Your IP: 18.220.255.227 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.