Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/44554
Title: NHẬN DẠNG TIẾNG NÓI NGƯỜI PHÂN HỆ TIẾNG KHMER
Authors: Trần, Công Án
Sơn, Phước Lộc
Keywords: CÔNG NGHỆ THÔNG TIN
Issue Date: 2021
Publisher: Trường Đại Học Cần Thơ
Abstract: Đồng bộ hóa phụ đề trong các bản tin thời sự hay các chương trình tiếng dân tộc là cần thiết bởi vì tính truyền thông cách biệt về ngôn ngữ cho người xem và là vấn đề của những đài truyền hình. Nhận dạng tiếng nói người trong audio được trích từ các video bản tin là bước quan trọng trong việc đồng bộ hóa phụ đề để xác định thời gian xuất hiện phụ đề, cũng như phát hiện tiếng nói người trong các bản tin. Đề tài Nhận dạng tiếng nói người phân hệ tiếng Khmer được thực hiện nhằm mục đích xây dựng mô hình phát hiện tiếng nói tiếng Khmer trong các bản tin dân tộc tiếng Khmer thông qua huấn luyện máy học. Nhận dạng tiếng nói người phân hệ tiếng Khmer sẽ khai thác các đặc trưng của âm thanh Mel-frequency cepstral coefficients (MFCC) thông qua huấn luyện máy học trên hai mô hình RNN (Recurrent Neural Network) và CNN (Convolutional Neural Network). Kết quả của mô hình sau huấn luyện sẽ dự đoán được thời gian xuất hiện của phụ đề (SubRip text). Từ khóa: đồng bộ hóa phụ đề, nhận dạng tiếng nói người, đặc trưng của âm thanh Mel-frequency cepstral coefficients (MFCCs), RNN, CNN, tệp tin srt.
Description: 64 Tr
URI: https://dspace.ctu.edu.vn/jspui/handle/123456789/44554
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
2.73 MBAdobe PDF
Your IP: 3.145.93.221


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.