Please use this identifier to cite or link to this item:
https://dspace.ctu.edu.vn/jspui/handle/123456789/94224
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Lâm, Nhựt Khang | - |
dc.contributor.author | Phú, Vủ Luân | - |
dc.contributor.author | Lâm, Đình Khôi | - |
dc.contributor.author | Lý, Thành Tiến | - |
dc.date.accessioned | 2024-01-04T01:38:40Z | - |
dc.date.available | 2024-01-04T01:38:40Z | - |
dc.date.issued | 2023 | - |
dc.identifier.other | B1910407 | - |
dc.identifier.other | B1910086 | - |
dc.identifier.other | B1910310 | - |
dc.identifier.uri | https://dspace.ctu.edu.vn/jspui/handle/123456789/94224 | - |
dc.description | 65 Tr | vi_VN |
dc.description.abstract | Luận văn nghiên cứu huấn luyện mô hình tóm tắt văn bản trừu tượng với mô hình BART sử dụng kỹ thuật BRIO và phương pháp phân tách văn bản thành các đơn vị EDU cũng như tối ưu EDU bằng cách chọn lọc token. Thực hiện cách tiếp cận hai bước, trích xuất rồi tóm tắt, giúp chất lượng bản tóm tắt tốt hơn và ngắn gọn hơn. Toàn bộ quá trình thực nghiệm chúng tôi sử dụng tập dữ liệu CNN/Dailymail. Chúng tôi đã chứng minh được phương pháp phân tách văn bản thành các đơn vị EDU kết hợp với kỹ thuật BRIO đã giúp cải thiện hiệu suất của mô hình. Cụ thể, điểm số của ROUGE-1, ROUGE-2, ROUGE-L lần lượt là 46.56, 22.26, 43.33 đối với mô hình BIO-EDU và ROUGE-1 là 46.27, ROUGE-2 là 22.01, ROUGE-L là 43.03 đối với mô hình BRIO-EDU với EDU được chọn lọc. | vi_VN |
dc.language.iso | vi | vi_VN |
dc.publisher | Trường Đại Học Cần Thơ | vi_VN |
dc.subject | CÔNG NGHỆ THÔNG TIN | vi_VN |
dc.title | TÓM TẮT TÓM LƯỢC VĂN BẢN SỬ DỤNG MÔ HÌNH BART – EDU | vi_VN |
dc.title.alternative | ABSTRACTIVE TEXT SUMMARIZATION USING MODEL BART – EDU | vi_VN |
dc.type | Thesis | vi_VN |
Appears in Collections: | Trường Công nghệ Thông tin & Truyền thông |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
_file_ Restricted Access | 1.45 MB | Adobe PDF | ||
Your IP: 3.14.145.97 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.