Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/94224
Title: TÓM TẮT TÓM LƯỢC VĂN BẢN SỬ DỤNG MÔ HÌNH BART – EDU
Other Titles: ABSTRACTIVE TEXT SUMMARIZATION USING MODEL BART – EDU
Authors: Lâm, Nhựt Khang
Phú, Vủ Luân
Lâm, Đình Khôi
Lý, Thành Tiến
Keywords: CÔNG NGHỆ THÔNG TIN
Issue Date: 2023
Publisher: Trường Đại Học Cần Thơ
Abstract: Luận văn nghiên cứu huấn luyện mô hình tóm tắt văn bản trừu tượng với mô hình BART sử dụng kỹ thuật BRIO và phương pháp phân tách văn bản thành các đơn vị EDU cũng như tối ưu EDU bằng cách chọn lọc token. Thực hiện cách tiếp cận hai bước, trích xuất rồi tóm tắt, giúp chất lượng bản tóm tắt tốt hơn và ngắn gọn hơn. Toàn bộ quá trình thực nghiệm chúng tôi sử dụng tập dữ liệu CNN/Dailymail. Chúng tôi đã chứng minh được phương pháp phân tách văn bản thành các đơn vị EDU kết hợp với kỹ thuật BRIO đã giúp cải thiện hiệu suất của mô hình. Cụ thể, điểm số của ROUGE-1, ROUGE-2, ROUGE-L lần lượt là 46.56, 22.26, 43.33 đối với mô hình BIO-EDU và ROUGE-1 là 46.27, ROUGE-2 là 22.01, ROUGE-L là 43.03 đối với mô hình BRIO-EDU với EDU được chọn lọc.
Description: 65 Tr
URI: https://dspace.ctu.edu.vn/jspui/handle/123456789/94224
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
1.45 MBAdobe PDF
Your IP: 3.21.247.195


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.