Please use this identifier to cite or link to this item:
https://dspace.ctu.edu.vn/jspui/handle/123456789/94224
Title: | TÓM TẮT TÓM LƯỢC VĂN BẢN SỬ DỤNG MÔ HÌNH BART – EDU |
Other Titles: | ABSTRACTIVE TEXT SUMMARIZATION USING MODEL BART – EDU |
Authors: | Lâm, Nhựt Khang Phú, Vủ Luân Lâm, Đình Khôi Lý, Thành Tiến |
Keywords: | CÔNG NGHỆ THÔNG TIN |
Issue Date: | 2023 |
Publisher: | Trường Đại Học Cần Thơ |
Abstract: | Luận văn nghiên cứu huấn luyện mô hình tóm tắt văn bản trừu tượng với mô hình BART sử dụng kỹ thuật BRIO và phương pháp phân tách văn bản thành các đơn vị EDU cũng như tối ưu EDU bằng cách chọn lọc token. Thực hiện cách tiếp cận hai bước, trích xuất rồi tóm tắt, giúp chất lượng bản tóm tắt tốt hơn và ngắn gọn hơn. Toàn bộ quá trình thực nghiệm chúng tôi sử dụng tập dữ liệu CNN/Dailymail. Chúng tôi đã chứng minh được phương pháp phân tách văn bản thành các đơn vị EDU kết hợp với kỹ thuật BRIO đã giúp cải thiện hiệu suất của mô hình. Cụ thể, điểm số của ROUGE-1, ROUGE-2, ROUGE-L lần lượt là 46.56, 22.26, 43.33 đối với mô hình BIO-EDU và ROUGE-1 là 46.27, ROUGE-2 là 22.01, ROUGE-L là 43.03 đối với mô hình BRIO-EDU với EDU được chọn lọc. |
Description: | 65 Tr |
URI: | https://dspace.ctu.edu.vn/jspui/handle/123456789/94224 |
Appears in Collections: | Trường Công nghệ Thông tin & Truyền thông |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
_file_ Restricted Access | 1.45 MB | Adobe PDF | ||
Your IP: 3.135.201.101 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.