Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/19467
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorLâm, Nhựt Khang-
dc.contributor.authorDương, Văn Tú-
dc.date.accessioned2019-12-24T08:18:53Z-
dc.date.available2019-12-24T08:18:53Z-
dc.date.issued2019-
dc.identifier.otherB1507337-
dc.identifier.urihttp://dspace.ctu.edu.vn/jspui/handle/123456789/19467-
dc.description51 trvi_VN
dc.description.abstractMạng nơ-ron tích chập CNN là một mạng nơ-ron phổ biến và được sử dụng rộng rãi trong các mô hình xử lý ảnh và nhận diện giọng nói tự động. Luận văn này áp dụng mạng CNNs vào việc nhận diện âm thanh dựa vào các trích xuất đặc trưng Mel Frequency Spectral Coefficients. Chúng tôi sử dụng mô hình GLU-CNNs với chỉ số đánh giá CTC để huấn luyện mô hình ngữ âm. Quá trình decode sử dụng mô hình ngôn ngữ KenLM và tìm kiếm Beam để chuyển âm thanh đầu vào thành văn bản. Tập dữ liệu bao gồm 22.700 tập tin file âm thanh dạng WAV được thu thập từ VIVOS và sachonline.com để huấn luyện mô hình âm học và 1.000 tập tin âm thanh dạng wav dùng để đánh giá, dựa vào bộ từ điển tập hợp các ký tự tiếng Việt và 2,2 GB dữ liệu thô dạng text được thu thập từ báo mạng Vnexpress.net, thông qua mô hình ngôn ngữ và tìm kiếm Beam để giải mã âm thanh đầu vào. Kết quả đạt được của luận văn dựa vào chỉ số WER là 3,32% cho mô hình GLU-CNNs ở tập đánh giá.vi_VN
dc.language.isovivi_VN
dc.publisherTrường Đại Học Cần Thơvi_VN
dc.subjectCÔNG NGHỆ THÔNG TINvi_VN
dc.titleXÂY DỰNG MÔ HÌNH NHẬN DIỆN GIỌNG NÓI TIẾNG VIỆTvi_VN
dc.typeThesisvi_VN
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
1.73 MBAdobe PDF
Your IP: 3.141.32.252


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.