Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/44553
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorTrần, Công Án-
dc.contributor.authorNguyễn, Thị Mỹ Yến-
dc.date.accessioned2021-02-04T09:32:20Z-
dc.date.available2021-02-04T09:32:20Z-
dc.date.issued2021-
dc.identifier.otherB1607047-
dc.identifier.urihttps://dspace.ctu.edu.vn/jspui/handle/123456789/44553-
dc.description61 Trvi_VN
dc.description.abstractTrong thực tế, việc tạo phụ đề cho video là cách hiệu quả và trực quan nhất để thuyết minh, diễn giải cho các kênh truyền hình dân tộc. Từ đó, việc đồng bộ hóa tự động giữa phụ đề và video trở thành một cách cần thiết và hiệu quả mà các kênh truyền hình dân tộc muốn áp dụng lên những bản tin của nhà đài. Các bản tin tiếng dân tộc được gán phụ đề với ngôn ngữ Tiếng Việt, giúp truyền tải và cung cấp nội dung cũng như những thông tin cần thiết đến rộng rãi khán giả xem truyền hình. Trong đó, việc sử dụng Nhận dạng tiếng nói người trên phân hệ Tiếng Việt để tạo phụ đề tự động cho video là một việc quan trọng và cần thiết. Từ mô hình Nhận dạng tiếng nói người trên phân hệ Tiếng Việt giúp đánh dấu và xác định chính xác về thời gian xuất hiện phụ đề trong video. Luận văn này được áp dụng hai mô hình máy học là CNN (Convolutional Neural Network) và RNN (Recurrent Neural Network) vào việc nhận diện tiếng nói người dựa trên các trích xuất đặc trưng giọng nói MFCC (Mel Frequency Cepstral Coefficients). Kết quả đạt được của luận văn là xác định được xác suất giọng nói của con người xuất hiện vào khoảng thời gian nào trong video.vi_VN
dc.language.isovivi_VN
dc.publisherTrường Đại Học Cần Thơvi_VN
dc.subjectCÔNG NGHỆ THÔNG TINvi_VN
dc.titleNHẬN DẠNG TIẾNG NÓI NGƯỜI PHÂN HỆ TIẾNG VIỆTvi_VN
dc.typeThesisvi_VN
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
2.86 MBAdobe PDF
Your IP: 3.141.198.146


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.