Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/74846
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorNguyễn, Thanh Hải-
dc.contributor.authorLê, Duy Anh-
dc.date.accessioned2022-03-07T06:58:16Z-
dc.date.available2022-03-07T06:58:16Z-
dc.date.issued2021-
dc.identifier.otherS1800005-
dc.identifier.urihttps://dspace.ctu.edu.vn/jspui/handle/123456789/74846-
dc.description58 Trvi_VN
dc.description.abstractHiện nay có nhiều nghiên cứu về đo độ tương đồng giữa các văn bản ở một ngôn ngữ cụ thể như tiếng Việt - tiếng Việt, tiếng Anh – tiếng Anh. Tuy nhiên, gần đây xuất hiện thêm một vấn đề là có nhiều bài có nguồn từ tiếng Anh được dịch lại thành qua tiếng Việt và chỉnh sửa câu từ lại biến nó thành bài của mình. Hiểu được các nhu cầu cần thiết của việc này, đề tài đã ứng dụng theo cách tiếp cận mới là dịch văn bản tiếng Anh sang tiếng Việt từ đó đi tìm kiếm, so sánh bài đã được dịch với các bài được sao chép, chỉnh sửa từ các bản dịch. Trong đề tài chủ yếu tập trung thành các giai đoạn như: Dịch văn bản tiếng Anh sang tiếng Việt, tiền xử lý các văn bản, xác định độ tương đồng giữa các văn bản. Việc xác định độ tương đồng giữa các văn bản được đề cập đến trong đề tài này là: Độ tương đồng Cosine dựa trên Term Frequency * Inverse Document Frequency và độ tương đồng thứ tự từ trong văn bản. Kết hợp cả 2 độ đo này lại để cho ra kết quả độ tương đồng có kết quả chính xác và thuyết phục hơn.vi_VN
dc.language.isovivi_VN
dc.publisherTrường Đại Học Cần Thơvi_VN
dc.subjectCÔNG NGHỆ THÔNG TINvi_VN
dc.titlePHÁT HIỆN ĐỘ TƯƠNG ĐỒNG VĂN BẢN TIẾNG VIỆT ĐƯỢC DỊCH TỪ TIẾNG ANHvi_VN
dc.title.alternativeSIMILARITY DETECTION OF VIETNAMESE DOCUMENTS TRANSLATED FROM ENGLISHvi_VN
dc.typeThesisvi_VN
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
2.34 MBAdobe PDF
Your IP: 13.59.227.82


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.