Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/85058
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorTrần, Nguyễn Dương Chi-
dc.contributor.authorTrần, Trương Sơn Bảo-
dc.date.accessioned2023-01-31T09:40:43Z-
dc.date.available2023-01-31T09:40:43Z-
dc.date.issued2022-
dc.identifier.otherB1709525-
dc.identifier.urihttps://dspace.ctu.edu.vn/jspui/handle/123456789/85058-
dc.description102 Trvi_VN
dc.description.abstractTrong phạm vi nghiên cứu của đề tài này, chúng ta sẽ ứng dụng kỹ thuật học sâu để giải quyết bài toán tái tạo giọng nói tiếng Việt bằng cách dựa vào các mạng nơ ron nhân tạo để tổng hợp văn bản thành giọng nói của những người nói khác nhau bao gồm cả giọng của những người không có trong quá trình huấn luyện. Hệ thống gồm có ba thành phần tương ứng với ba mô hình khác nhau được huấn luyện độc lập với nhau: Một là mô hình xác thực giọng nói được huấn luyện về tác vụ xác minh người nói bằng cách sử dụng một bộ dữ liệu độc lập với hai mô hình còn lại nhằm mục đích tạo ra một vectơ để ánh xạ được hầu hết các đặc trưng âm thanh từ không gian sóng âm của người nói sang không gian của vectơ đó với số chiều cố định. Hai là mô hình tổng hợp văn bản thành giọng nói dựa trên kiến trúc của Tacotron với mục đích tạo ra Mel-Spectrograms từ các đặc trưng văn bản và âm thanh của giọng nói. Ba là mô hình mã hóa giọng nói được huấn luyện với mục đích mã hóa phổ âm thanh Mel-Spectrograms được tổng hợp thành đoạn sóng âm mà tai người có thể nghe được. Kết quả chúng ta đạt được là một hệ thống có khả năng tổng hợp được giọng nói tiếng Việt từ những người nói ngẫu nhiên.vi_VN
dc.language.isovivi_VN
dc.publisherTrường Đại Học Cần Thơvi_VN
dc.subjectKHOA HỌC MÁY TÍNHvi_VN
dc.titleỨNG DỤNG HỌC SÂU TRONG TÁI TẠO GIỌNG NÓIvi_VN
dc.title.alternativeAPPLY DEEP LEARNING IN VIETNAMESE VOICE CLONING SYSTEMvi_VN
dc.typeThesisvi_VN
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
6.66 MBAdobe PDF
Your IP: 18.220.255.227


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.