Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/74846
Title: PHÁT HIỆN ĐỘ TƯƠNG ĐỒNG VĂN BẢN TIẾNG VIỆT ĐƯỢC DỊCH TỪ TIẾNG ANH
Other Titles: SIMILARITY DETECTION OF VIETNAMESE DOCUMENTS TRANSLATED FROM ENGLISH
Authors: Nguyễn, Thanh Hải
Lê, Duy Anh
Keywords: CÔNG NGHỆ THÔNG TIN
Issue Date: 2021
Publisher: Trường Đại Học Cần Thơ
Abstract: Hiện nay có nhiều nghiên cứu về đo độ tương đồng giữa các văn bản ở một ngôn ngữ cụ thể như tiếng Việt - tiếng Việt, tiếng Anh – tiếng Anh. Tuy nhiên, gần đây xuất hiện thêm một vấn đề là có nhiều bài có nguồn từ tiếng Anh được dịch lại thành qua tiếng Việt và chỉnh sửa câu từ lại biến nó thành bài của mình. Hiểu được các nhu cầu cần thiết của việc này, đề tài đã ứng dụng theo cách tiếp cận mới là dịch văn bản tiếng Anh sang tiếng Việt từ đó đi tìm kiếm, so sánh bài đã được dịch với các bài được sao chép, chỉnh sửa từ các bản dịch. Trong đề tài chủ yếu tập trung thành các giai đoạn như: Dịch văn bản tiếng Anh sang tiếng Việt, tiền xử lý các văn bản, xác định độ tương đồng giữa các văn bản. Việc xác định độ tương đồng giữa các văn bản được đề cập đến trong đề tài này là: Độ tương đồng Cosine dựa trên Term Frequency * Inverse Document Frequency và độ tương đồng thứ tự từ trong văn bản. Kết hợp cả 2 độ đo này lại để cho ra kết quả độ tương đồng có kết quả chính xác và thuyết phục hơn.
Description: 58 Tr
URI: https://dspace.ctu.edu.vn/jspui/handle/123456789/74846
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
2.34 MBAdobe PDF
Your IP: 3.133.108.103


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.