XÂY DỰNG MÔ HÌNH NHẬN DIỆN GIỌNG NÓI TIẾNG VIỆT

Dương, Văn Tú

Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: https://dspace.ctu.edu.vn/jspui/handle/123456789/19467

Toàn bộ biểu ghi siêu dữ liệu

Trường DC	Giá trị	Ngôn ngữ
dc.contributor.advisor	Lâm, Nhựt Khang	-
dc.contributor.author	Dương, Văn Tú	-
dc.date.accessioned	2019-12-24T08:18:53Z	-
dc.date.available	2019-12-24T08:18:53Z	-
dc.date.issued	2019	-
dc.identifier.other	B1507337	-
dc.identifier.uri	http://dspace.ctu.edu.vn/jspui/handle/123456789/19467	-
dc.description	51 tr	vi_VN
dc.description.abstract	Mạng nơ-ron tích chập CNN là một mạng nơ-ron phổ biến và được sử dụng rộng rãi trong các mô hình xử lý ảnh và nhận diện giọng nói tự động. Luận văn này áp dụng mạng CNNs vào việc nhận diện âm thanh dựa vào các trích xuất đặc trưng Mel Frequency Spectral Coefficients. Chúng tôi sử dụng mô hình GLU-CNNs với chỉ số đánh giá CTC để huấn luyện mô hình ngữ âm. Quá trình decode sử dụng mô hình ngôn ngữ KenLM và tìm kiếm Beam để chuyển âm thanh đầu vào thành văn bản. Tập dữ liệu bao gồm 22.700 tập tin file âm thanh dạng WAV được thu thập từ VIVOS và sachonline.com để huấn luyện mô hình âm học và 1.000 tập tin âm thanh dạng wav dùng để đánh giá, dựa vào bộ từ điển tập hợp các ký tự tiếng Việt và 2,2 GB dữ liệu thô dạng text được thu thập từ báo mạng Vnexpress.net, thông qua mô hình ngôn ngữ và tìm kiếm Beam để giải mã âm thanh đầu vào. Kết quả đạt được của luận văn dựa vào chỉ số WER là 3,32% cho mô hình GLU-CNNs ở tập đánh giá.	vi_VN
dc.language.iso	vi	vi_VN
dc.publisher	Trường Đại Học Cần Thơ	vi_VN
dc.subject	CÔNG NGHỆ THÔNG TIN	vi_VN
dc.title	XÂY DỰNG MÔ HÌNH NHẬN DIỆN GIỌNG NÓI TIẾNG VIỆT	vi_VN
dc.type	Thesis	vi_VN
Bộ sưu tập:	Trường Công nghệ Thông tin & Truyền thông

Các tập tin trong tài liệu này:

Tập tin	Mô tả	Kích thước	Định dạng
_file_ Giới hạn truy cập		1.73 MB	Adobe PDF
Your IP: 3.138.105.89

Hiển thị đơn giản biểu ghi tài liệu Xem thống kê

Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.

Thư viện số DSPACE

Thư viện số cho phép quản lý các nguồn tài liệu số như: Văn bản, hình ảnh, âm thanh, phim ảnh...