Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/85071
Title: ỨNG DỤNG MÔ HÌNH TRANSFORMER VÀO SỬA LỖI CHÍNH TẢ TIẾNG VIỆT
Other Titles: APPLYING THE TRANSFORMER MODEL TO CORRECT VIETNAMESE SPELLING ERRORS
Authors: Lưu, Tiến Đạo
Dương, Trung Hiền
Keywords: KHOA HỌC MÁY TÍNH
Issue Date: 2022
Publisher: Trường Đại Học Cần Thơ
Abstract: Các mô hình nhận dạng chữ viết hay chuyển đổi giọng nói thành văn bản có tỉ lệ sai sót nhất định khi nhận dạng thành văn bản gây sai sót chính tả. Và để khắc phục hạn chế trên đề tài "Ứng dụng mô hình Transformer vào sửa lỗi chính tả tiếng Việt" ra đời. Áp dụng bài toán dịch máy (Model Translation) khi bài toán này có nét tương đồng với bài toán sửa lỗi chính tả. Cụ thể bài toán dịch máy có dữ liệu đầu vào là ngôn ngữ gốc và dữ liệu đích là ngôn ngữ cần dịch thì đối với bài toán sửa lỗi chính tả dữ liệu đầu vào là dữ liệu sai chính tả và dữ liệu đích là dữ liệu đúng chính tả. Dữ liệu sẽ được thu thập từ nguồn là một trang báo mạng. Dữ liệu thu thập được sẽ được tiền xử lý và sinh ra thêm tập dữ liệu đầu vào là dữ liệu sai chính tả. Đề tài sử dụng kiến trúc cơ bản của mô hình Transformer với 2 khối encoder và decoder được hỗ trợ bởi thư viện Tensorflow. Mô hình cho ra độ chính xác cao lên đến 92,8%. Ngoài ra, xây dựng thêm API giúp người dùng dễ dàng truy cập vào máy chủ để sử dụng mô hình đã được huấn luyện hoàn chỉnh.
Description: 39 Tr
URI: https://dspace.ctu.edu.vn/jspui/handle/123456789/85071
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
1.16 MBAdobe PDF
Your IP: 3.239.13.1


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.