Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://dspace.ctu.edu.vn/jspui/handle/123456789/43620
Nhan đề: | TÓM TẮT TÓM LƯỢC VĂN BẢN TIẾNG VIỆT SỬ DỤNG MÔ HÌNH BERT |
Tác giả: | Lâm, Nhựt Khang Nguyễn, Công Đoàn |
Từ khoá: | CÔNG NGHỆ THÔNG TIN |
Năm xuất bản: | 2021 |
Nhà xuất bản: | Trường Đại Học Cần Thơ |
Tóm tắt: | Tóm tắt văn bản là một đề tài đang phát triển trong lĩnh vực xử lý ngôn ngữ tự nhiên. Sản phầm của tóm tắt văn bản là một phiên bản rút gọn và cô đọng của văn bản đầu vào và làm nổi bật các ý chính của nó. Tóm tắt văn bản theo phương pháp thủ công thường mất rất nhiều thời gian và công sức. Do đó, nhiều nghiên cứu đã quan tâm đến việc tóm tắt văn bản tự động. Luận văn tốt nghiệp này nghiên cứu mô hình BERT cho việc tóm tắt văn bản tiếng Việt tự động. Mô hình kết hợp thế mạnh của hai phương pháp tóm tắt rút trích và tóm tắt tóm lược. Với các văn bản gốc, mô hình tóm tắt rút trích tạo ra các bản tóm tắt, sau đó được đưa vào mô hình tóm tắt tóm lược để tạo ra các bản tóm tắt. Độ chính xác của mô hình được đánh giá bằng phương pháp ROUGE trên một tập dữ liệu gồm hơn 55.000 bài báo được thu thập từ trang VNExpress, các kết quả ROUGE-1 thu được lần lượt: Recall là 62,99%, Precision là 34,49% và F-score là 43,61%; ROUGE-2 thu được lần lượt: Recall là 26,03%, Precision là 13,98% và F-score là 17,81%; ROUGE-L thu được lần lượt: Recall là 53,16%, Precision là 28,97% và F-score là 36,7%. Chúng tôi sẽ cải thiện chất lượng của tập dữ liệu đã thu thập được và điều chỉnh các thông số để nâng cao kết quả. |
Mô tả: | 69 Tr |
Định danh: | https://dspace.ctu.edu.vn/jspui/handle/123456789/43620 |
Bộ sưu tập: | Trường Công nghệ Thông tin & Truyền thông |
Các tập tin trong tài liệu này:
Tập tin | Mô tả | Kích thước | Định dạng | |
---|---|---|---|---|
_file_ Giới hạn truy cập | 2.79 MB | Adobe PDF | ||
Your IP: 3.145.34.13 |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.