Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/44553
Title: NHẬN DẠNG TIẾNG NÓI NGƯỜI PHÂN HỆ TIẾNG VIỆT
Authors: Trần, Công Án
Nguyễn, Thị Mỹ Yến
Keywords: CÔNG NGHỆ THÔNG TIN
Issue Date: 2021
Publisher: Trường Đại Học Cần Thơ
Abstract: Trong thực tế, việc tạo phụ đề cho video là cách hiệu quả và trực quan nhất để thuyết minh, diễn giải cho các kênh truyền hình dân tộc. Từ đó, việc đồng bộ hóa tự động giữa phụ đề và video trở thành một cách cần thiết và hiệu quả mà các kênh truyền hình dân tộc muốn áp dụng lên những bản tin của nhà đài. Các bản tin tiếng dân tộc được gán phụ đề với ngôn ngữ Tiếng Việt, giúp truyền tải và cung cấp nội dung cũng như những thông tin cần thiết đến rộng rãi khán giả xem truyền hình. Trong đó, việc sử dụng Nhận dạng tiếng nói người trên phân hệ Tiếng Việt để tạo phụ đề tự động cho video là một việc quan trọng và cần thiết. Từ mô hình Nhận dạng tiếng nói người trên phân hệ Tiếng Việt giúp đánh dấu và xác định chính xác về thời gian xuất hiện phụ đề trong video. Luận văn này được áp dụng hai mô hình máy học là CNN (Convolutional Neural Network) và RNN (Recurrent Neural Network) vào việc nhận diện tiếng nói người dựa trên các trích xuất đặc trưng giọng nói MFCC (Mel Frequency Cepstral Coefficients). Kết quả đạt được của luận văn là xác định được xác suất giọng nói của con người xuất hiện vào khoảng thời gian nào trong video.
Description: 61 Tr
URI: https://dspace.ctu.edu.vn/jspui/handle/123456789/44553
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
2.86 MBAdobe PDF
Your IP: 3.144.248.165


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.