Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/101064
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorLê, Huỳnh Quốc Bảo-
dc.contributor.authorTrần, Thị Thùy Dương-
dc.date.accessioned2024-05-30T08:30:23Z-
dc.date.available2024-05-30T08:30:23Z-
dc.date.issued2024-
dc.identifier.otherB2014559-
dc.identifier.urihttps://dspace.ctu.edu.vn/jspui/handle/123456789/101064-
dc.description30 Trvi_VN
dc.description.abstractTrong thời đại cách mạng công nghiệp 4.0 hiện nay, lĩnh vực trí tuệ nhân tạo nói chung và xử lý ngôn ngữ tự nhiên nói riêng có vai trò đặc biệt quan trọng và tác động to lớn đến đời sống kinh tế, xã hội. Những nghiên cứu về lĩnh vực này đã được ứng dụng triển khai trong thực tế và từng bước cải thiện đời sống chúng ta ngày càng tốt hơn. Tính năng phát hiện và sửa lỗi chính tả có mặt trong hầu hết các ứng dụng liên quan đến văn bản, từ máy tính cho đến các thiết bị di động. Khi nhập một từ không chính xác, hệ thống sẽ phát hiện lỗi, có thể đó là lỗi chính tả hoặc từ không phù hợp ngữ cảnh. Sau đó, hệ thống tự động sửa bằng một từ khác hoặc đề xuất một danh sách các từ có thể thay thế. Dựa trên các nghiên cứu về học sâu, đề tài đã ứng dụng và kết hợp các phương pháp này để cho ra mô hình giúp bắt một số lỗi chính tả mức đơn giản cho tiếng Anh. Đây là hướng nghiên cứu khá mới hiện nay và có những thuận lợi, khó khăn riêng so với phương pháp truyền thống. Những thuận lợi có thể kể tới như việc rút trích đặc trưng không còn làm một cách thủ công mà đã tích hợp hoàn toàn bằng mô hình học máy giúp giảm đi sự phức tạp và tăng độ hiệu quả. Đặc biệt với các nghiên cứu gần đây về mô hình sequence-to-sequence, kỹ thuật Attention, kiến trúc Transformer và mô hình BERT cho chất lượng vượt trội so với những phương pháp trước kia. Hơn nữa các phương pháp học sâu phù hợp với các phần cứng tính toán song song như GPU giúp tăng tốc trong quá trình xử lý. Bên cạnh đó, vẫn tồn tại những khó khăn, thách thức lớn nhất là vấn đề dữ liệu. Các phương pháp học sâu đòi hỏi một lượng dữ liệu khá lớn để có thể làm việc tốt. Dù có những hạn chế về mặt dữ liệu, bước đầu đề tài đã cho kết quả tương đối khả quan.vi_VN
dc.language.isovivi_VN
dc.publisherTrường Đại Học Cần Thơvi_VN
dc.subjectCÔNG NGHỆ THÔNG TINvi_VN
dc.titleHỆ THỐNG SỬA LỖI TIẾNG ANHvi_VN
dc.title.alternativeENGLISH LANGUAGE CORRECTION SYSTEMvi_VN
dc.typeThesisvi_VN
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
868.53 kBAdobe PDF
Your IP: 3.137.223.169


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.