Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: https://dspace.ctu.edu.vn/jspui/handle/123456789/101064
Nhan đề: HỆ THỐNG SỬA LỖI TIẾNG ANH
Nhan đề khác: ENGLISH LANGUAGE CORRECTION SYSTEM
Tác giả: Lê, Huỳnh Quốc Bảo
Trần, Thị Thùy Dương
Từ khoá: CÔNG NGHỆ THÔNG TIN
Năm xuất bản: 2024
Nhà xuất bản: Trường Đại Học Cần Thơ
Tóm tắt: Trong thời đại cách mạng công nghiệp 4.0 hiện nay, lĩnh vực trí tuệ nhân tạo nói chung và xử lý ngôn ngữ tự nhiên nói riêng có vai trò đặc biệt quan trọng và tác động to lớn đến đời sống kinh tế, xã hội. Những nghiên cứu về lĩnh vực này đã được ứng dụng triển khai trong thực tế và từng bước cải thiện đời sống chúng ta ngày càng tốt hơn. Tính năng phát hiện và sửa lỗi chính tả có mặt trong hầu hết các ứng dụng liên quan đến văn bản, từ máy tính cho đến các thiết bị di động. Khi nhập một từ không chính xác, hệ thống sẽ phát hiện lỗi, có thể đó là lỗi chính tả hoặc từ không phù hợp ngữ cảnh. Sau đó, hệ thống tự động sửa bằng một từ khác hoặc đề xuất một danh sách các từ có thể thay thế. Dựa trên các nghiên cứu về học sâu, đề tài đã ứng dụng và kết hợp các phương pháp này để cho ra mô hình giúp bắt một số lỗi chính tả mức đơn giản cho tiếng Anh. Đây là hướng nghiên cứu khá mới hiện nay và có những thuận lợi, khó khăn riêng so với phương pháp truyền thống. Những thuận lợi có thể kể tới như việc rút trích đặc trưng không còn làm một cách thủ công mà đã tích hợp hoàn toàn bằng mô hình học máy giúp giảm đi sự phức tạp và tăng độ hiệu quả. Đặc biệt với các nghiên cứu gần đây về mô hình sequence-to-sequence, kỹ thuật Attention, kiến trúc Transformer và mô hình BERT cho chất lượng vượt trội so với những phương pháp trước kia. Hơn nữa các phương pháp học sâu phù hợp với các phần cứng tính toán song song như GPU giúp tăng tốc trong quá trình xử lý. Bên cạnh đó, vẫn tồn tại những khó khăn, thách thức lớn nhất là vấn đề dữ liệu. Các phương pháp học sâu đòi hỏi một lượng dữ liệu khá lớn để có thể làm việc tốt. Dù có những hạn chế về mặt dữ liệu, bước đầu đề tài đã cho kết quả tương đối khả quan.
Mô tả: 30 Tr
Định danh: https://dspace.ctu.edu.vn/jspui/handle/123456789/101064
Bộ sưu tập: Trường Công nghệ Thông tin & Truyền thông

Các tập tin trong tài liệu này:
Tập tin Mô tả Kích thước Định dạng  
_file_
  Giới hạn truy cập
868.53 kBAdobe PDF
Your IP: 18.221.162.164


Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.