ỨNG DỤNG MÔ HÌNH TRANSFORMER VÀO SỬA LỖI CHÍNH TẢ TIẾNG VIỆT

Dương, Trung Hiền

Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: https://dspace.ctu.edu.vn/jspui/handle/123456789/85071

Nhan đề:	ỨNG DỤNG MÔ HÌNH TRANSFORMER VÀO SỬA LỖI CHÍNH TẢ TIẾNG VIỆT
Nhan đề khác:	APPLYING THE TRANSFORMER MODEL TO CORRECT VIETNAMESE SPELLING ERRORS
Tác giả:	Lưu, Tiến Đạo Dương, Trung Hiền
Từ khoá:	KHOA HỌC MÁY TÍNH
Năm xuất bản:	2022
Nhà xuất bản:	Trường Đại Học Cần Thơ
Tóm tắt:	Các mô hình nhận dạng chữ viết hay chuyển đổi giọng nói thành văn bản có tỉ lệ sai sót nhất định khi nhận dạng thành văn bản gây sai sót chính tả. Và để khắc phục hạn chế trên đề tài "Ứng dụng mô hình Transformer vào sửa lỗi chính tả tiếng Việt" ra đời. Áp dụng bài toán dịch máy (Model Translation) khi bài toán này có nét tương đồng với bài toán sửa lỗi chính tả. Cụ thể bài toán dịch máy có dữ liệu đầu vào là ngôn ngữ gốc và dữ liệu đích là ngôn ngữ cần dịch thì đối với bài toán sửa lỗi chính tả dữ liệu đầu vào là dữ liệu sai chính tả và dữ liệu đích là dữ liệu đúng chính tả. Dữ liệu sẽ được thu thập từ nguồn là một trang báo mạng. Dữ liệu thu thập được sẽ được tiền xử lý và sinh ra thêm tập dữ liệu đầu vào là dữ liệu sai chính tả. Đề tài sử dụng kiến trúc cơ bản của mô hình Transformer với 2 khối encoder và decoder được hỗ trợ bởi thư viện Tensorflow. Mô hình cho ra độ chính xác cao lên đến 92,8%. Ngoài ra, xây dựng thêm API giúp người dùng dễ dàng truy cập vào máy chủ để sử dụng mô hình đã được huấn luyện hoàn chỉnh.
Mô tả:	39 Tr
Định danh:	https://dspace.ctu.edu.vn/jspui/handle/123456789/85071
Bộ sưu tập:	Trường Công nghệ Thông tin & Truyền thông

Các tập tin trong tài liệu này:

Tập tin	Mô tả	Kích thước	Định dạng
_file_ Giới hạn truy cập		1.16 MB	Adobe PDF
Your IP: 3.15.218.254

Hiển thị đầy đủ biểu ghi tài liệu Xem thống kê

Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.

Thư viện số DSPACE

Thư viện số cho phép quản lý các nguồn tài liệu số như: Văn bản, hình ảnh, âm thanh, phim ảnh...