Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: https://dspace.ctu.edu.vn/jspui/handle/123456789/115929
Nhan đề: CÁC BIẾN THỂ CỦA TRANSFORMER ĐỂ PHÂN LOẠI TIN GIẢ
Nhan đề khác: TRANSFORMER VARIANTS IN FAKE NEWS CLASSIFICATION
Tác giả: Nguyễn, Thanh Hải
Sử, Kim Anh
Nguyễn, Hồng Tuấn Phát
Từ khoá: CÔNG NGHỆ THÔNG TIN
Năm xuất bản: 2025
Nhà xuất bản: Trường Đại Học Cần Thơ
Tóm tắt: Tin giả đang là một thách thức lớn trong thời đại kỷ nguyên số, nó gây ảnh hưởng trực tiếp đến nhận thức xã hội, làm hoang mang, mất niềm tin của mọi người. Vì vậy, việc phát triển một mô hình tự động có khả năng phân loại tin giả một cách chính xác và hiệu quả là rất cần thiết nhằm giảm thiểu tác động tiêu cực từ các thông tin sai lệch này. Nghiên cứu này tập trung vào việc ứng dụng và đánh giá hiệu quả của các mô hình biến thể của Transformer, cụ thể là BERT và RoBERTa, cho bài toán phân loại tin giả. Các mô hình này đã được tinh chỉnh siêu tham số một cách có hệ thống và đánh giá trên bốn bộ dữ liệu phổ biến: ISOT Fake News Dataset, Fake News Dataset, Fake or Real News Dataset và Fake News Detection Dataset. Đồng thời, khả năng tổng quát hóa của các mô hình cũng được khảo sát thông qua các thử nghiệm kiểm tra chéo bộ dữ liệu. Kết quả thực nghiệm cho thấy các mô hình biến thể của Transformer, đặc biệt là RoBERTa, đạt được hiệu suất phân loại rất cao khi được huấn luyện và kiểm thử trên cùng một bộ dữ liệu, với các chỉ số F1 – score và Accuracy vượt trội đạt đến 99,98% trên tập ISOT. Tuy nhiên, kết quả kiểm thử chéo bộ dữ liệu lại bộc lộ một thách thức đáng kể về khả năng tổng quát hóa: hiệu suất của mô hình giảm sút mạnh khi áp dụng trên các tập dữ liệu khác biệt so với tập huấn luyện, cho thấy sự quan trọng của mô hình đối với đặc trưng riêng của từng nguồn dữ liệu. Dựa trên sự cân bằng giữa hiệu suất và khả năng tổng quát hóa trung bình tốt hơn trong kiểm thử chéo, mô hình RoBERTa được huấn luyện trên tập Fake News Detection được đề xuất lựa chọn để phát triển ứng dụng thực tế. Nghiên cứu này không chỉ khẳng định tiềm năng to lớn của kiến trúc Transformer trong việc phát hiện tin giả dựa trên nội dung văn bản mà còn chỉ ra những hạn chế về tính tổng quát hóa cần được quan tâm trong các ứng dụng thực tế. Kết quả đạt được cung cấp cơ sở khoa học và thực nghiệm cho việc phát triển các công cụ kiểm chứng thông tin, hỗ trợ hoạt động báo chí số, góp phần xây dựng một không gian thông tin lành mạnh hơn.
Mô tả: 73 Tr
Định danh: https://dspace.ctu.edu.vn/jspui/handle/123456789/115929
Bộ sưu tập: Trường Công nghệ Thông tin & Truyền thông

Các tập tin trong tài liệu này:
Tập tin Mô tả Kích thước Định dạng  
_file_
  Giới hạn truy cập
3.97 MBAdobe PDF
Your IP: 216.73.216.91


Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.