Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: https://dspace.ctu.edu.vn/jspui/handle/123456789/84942
Nhan đề: HỆ THỐNG PHÁT HIỆN VĂN BẢN TIẾNG VIỆT TƯƠNG TỰ DỰA TRÊN PHÂN LOẠI LĨNH VỰC TÀI LIỆU TỰ ĐỘNG VÀ CÁC PHƯƠNG PHÁP ĐỘ ĐO TƯƠNG ĐỒNG
Nhan đề khác: A SYSTEM FOR SEARCHING SIMILAR VIETNAMESE DOCUMENTS SEARCH USING TOPIC CLASSIFICATION AND SIMILARITY COMPUTATION APPROACHES
Tác giả: Nguyễn, Thanh Hải
Nguyễn, Hoàng Huy
Từ khoá: CÔNG NGHỆ THÔNG TIN
Năm xuất bản: 2022
Nhà xuất bản: Trường Đại Học Cần Thơ
Tóm tắt: Hiện nay, vấn đề đạo văn trong khoa học ngày càng xảy ra phổ biến do sự phát triển của Internet, lượng thông tin tăng lên mỗi ngày. Vì thế mọi người có quá nhiều nguồn thông tin để tham khảo và có khi vô tình hoặc cố ý sao chép nội dung đó về làm của mình. Với các văn bản tiếng Việt thì rất khó để phát hiện ra các câu tương đồng vì từ ngữ tiếng Việt rất phong phú và đa dạng, chỉ cần thay đổi các từ trong câu thành các từ khác đồng nghĩa hoặc trái nghĩa là có thể thành 1 câu khác hoàn toàn. Hiểu được nhu cầu cấp thiết này, đề tài đã ứng dụng các phép đo tương đồng kết hợp với việc so sánh ngữ nghĩa trong câu tiếng Việt để có thể cho ra độ chính xác tương đồng cao nhất. Đồng thời áp dụng các phương pháp phân loại chủ đề tự động để thuận tiện cho việc xác định chủ đề. Phương pháp tính tương đồng của bài luận này được tính trên độ đo Cosine kết hợp với TF-IDF và xét ngữ nghĩa từng cặp câu với nhau để đưa ra được độ tương đồng chính xác của bài. Ngoài ra, đối với phương pháp phân loại sẽ đánh giá dựa trên 3 giải thuật khác nhau và chọn ra giải thuật có độ chính xác cao nhất để tự động phân loại chủ đề giúp người dùng không cần phải đọc qua bài.
Mô tả: 95 Tr
Định danh: https://dspace.ctu.edu.vn/jspui/handle/123456789/84942
Bộ sưu tập: Trường Công nghệ Thông tin & Truyền thông

Các tập tin trong tài liệu này:
Tập tin Mô tả Kích thước Định dạng  
_file_
  Giới hạn truy cập
2.8 MBAdobe PDF
Your IP: 3.145.191.22


Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.