Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://dspace.ctu.edu.vn/jspui/handle/123456789/78262
Nhan đề: | HỆ THỐNG KIỂM TRA ĐỘ TƯƠNG TỰ GIỮA VĂN BẢN TIẾNG ANH VÀ TIẾNG VIỆT TRÊN MỘT HỆ THỐNG NỘP BÀI TẠP CHÍ |
Tác giả: | Nguyễn, Thanh Hải Lê, Thu Chi |
Từ khoá: | HỆ THỐNG THÔNG TIN |
Năm xuất bản: | 2022 |
Nhà xuất bản: | Trường Đại Học Cần Thơ |
Tóm tắt: | Trong bối cảnh học thuật, đạo văn được coi là hành động thiếu trung thực và có tác động tiêu cực đến tới công trình nghiên cứu và môi trường học thuật. Các tạp chí khoa học có những chính sách liên quan đến đạo văn nhằm ngăn chặn các tác giả sao chép tài liệu học thuật đã được xuất bản. Việc kiểm tra độ tương tự của bản thảo được nộp với kho tài liệu đã xuất bản để phát hiện dấu hiệu đạo văn và ngăn chặn kịp thời trước khi đưa vào các giai đoạn tiếp theo trong quá trình xử lý bài viết ở các tạp chí là vô cùng cần thiết, nhằm nâng cao chất lượng bài báo, và tiết kiệm thời gian để xử lý những vấn đề phát sinh về sau. Trong luận văn này đã triển khai phương pháp Cosine kết hợp với Term Frequency - Inverse Document Frequency (TF-IDF) cùng với xác định tương đồng ngữ nghĩa với các cặp từ tương đồng, trái nghĩa để so sánh độ tương tự văn bản giữa các văn bản tiếng việt với nhau, và kết hợp với các công cụ dịch thuật để nhằm phát hiện các tài liệu được dịch từ tài liệu nào trong kho được lưu trữ sẵn. Đề tài đã đánh giá tính hiệu quả của phương pháp trên kho dữ liệu gồm 64 bài báo tiếng Việt và 19 bài tiếng Anh được trích xuất từ tạp chí khoa học trường Đại Học Cần Thơ và cho những kết quả khả quan. Đề tài đã triển khai việc so sánh độ tương tự giữa các văn bản và phát hiện bài dịch trên một hệ thống nền Web được lập trình với các công nghệ: Django Framework, Postgres, DBeaver, HTML, CSS, Javascript, kết hợp ngôn ngữ lập trình Python với các thư viện sklearn, docx2txt, pandas, underthesea,... Hướng phát triển đề tài mong đợi có thể giúp cho biên tập viên có thể kiểm tra được độ tương tự giữa các bản thảo đã nộp dựa trên kho tài liệu đang có để từ đó có thể tạo ra bộ lọc tốt trước khi đưa các bản thảo vào các quá trình xử lý tiếp theo. |
Mô tả: | 60 Tr |
Định danh: | https://dspace.ctu.edu.vn/jspui/handle/123456789/78262 |
Bộ sưu tập: | Trường Công nghệ Thông tin & Truyền thông |
Các tập tin trong tài liệu này:
Tập tin | Mô tả | Kích thước | Định dạng | |
---|---|---|---|---|
_file_ Giới hạn truy cập | 33.15 MB | Adobe PDF | ||
Your IP: 3.15.0.242 |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.