Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/74154
Title: ỨNG DỤNG PHOBERT ĐỂ KIỂM TRA ĐẠO VĂN TRONG VĂN BẢN TIẾNG VIỆT
Other Titles: VIETNAMESE PLAGIARISM DETECTION USING PHOBERT
Authors: Trần, Nguyễn Dương Chi
Trần, Vĩnh Thuận
Keywords: KHOA HỌC MÁY TÍNH
Issue Date: 2021
Publisher: Trường Đại Học Cần Thơ
Abstract: Trong thời đại bùng nổ về công nghệ thông tin, việc tiếp cận đến nhiều tri thức mang lại cho chúng ta nguồn tài liệu dồi dào để đáp ứng nhu cầu tự học, tự nghiên cứu. Bên cạnh thuận lợi kể trên, việc có nhiều nguồn tham khảo khiến cho nhiều người ỷ lại, gian lận trong các nghiên cứu bằng cách đạo văn, tức lấy cắp ý tưởng, bài làm của người khác mà không dẫn nguồn. Với nguồn tài liệu dồi dào như hiện nay, việc có một công cụ giúp phát hiện đạo văn là điều cần thiết. Ở đề tài này, PhoBERT, một mô hình biểu diễn ngôn ngữ đã được huấn luyện cho tiếng Việt, sẽ được sử dụng để giúp xây dựng một công cụ phát hiện đạo văn. Mô hình PhoBERT được dùng để biểu diễn tài liệu, sau đó mô hình máy học vector hỗ trợ SVM sẽ được sử dụng để phân loại các cặp đạo văn. Kết quả của việc ứng dụng những mô hình trên giúp phát hiện tốt các đoạn đạo văn trong tài nghi ngờ được tạo.
Description: 54 Tr
URI: https://dspace.ctu.edu.vn/jspui/handle/123456789/74154
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
2.31 MBAdobe PDF
Your IP: 3.128.33.243


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.