Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://dspace.ctu.edu.vn/jspui/handle/123456789/45262
Nhan đề: | TÓM TẮT RÚT TRÍCH VĂN BẢN SỬ DỤNG MÔ HÌNH SEQUENCE-TO-SEQUENCE VỚI CƠ CHẾ ATTENTION VÀ MÔ HÌNH BERT |
Tác giả: | Lâm, Nhựt Khang Nguyễn, Văn Dinh |
Từ khoá: | CÔNG NGHỆ THÔNG TIN |
Năm xuất bản: | 2021 |
Nhà xuất bản: | Trường Đại Học Cần Thơ |
Tóm tắt: | Tóm tắt văn bản là một chủ đề đang rất được quan tâm trong lĩnh vực xử lý ngôn ngữ tự nhiên. Các tóm tắt văn bản là một phiên bản rút gọn hoặc cô đọng của văn bản gốc, nhưng vẫn giữ được ý chính của nó. Luận văn này nghiên cứu phương pháp tóm tắt trích xuất văn bản cho các bài báo sử dụng mô hình sequence-to-sequence với cơ chế attention, xây dựng nhúng từ bằng mô hình word2vec và BERT. Chúng tôi thử nghiệm trên bộ dữ liệu CNN / Daily Mail ở tiếng Anh và bộ dữ liệu bao gồm các bài báo được rút trích từ các trang báo mạng ở tiếng Việt. Độ chính xác của mô hình được đánh giá bằng chỉ số ROUGE. Chúng tôi sẽ nghiên cứu sự kết hợp của các mô hình khác nhau và điều chỉnh các thông số để nâng cao kết quả. |
Mô tả: | 50 Tr |
Định danh: | https://dspace.ctu.edu.vn/jspui/handle/123456789/45262 |
Bộ sưu tập: | Trường Công nghệ Thông tin & Truyền thông |
Các tập tin trong tài liệu này:
Tập tin | Mô tả | Kích thước | Định dạng | |
---|---|---|---|---|
_file_ Giới hạn truy cập | 3.27 MB | Adobe PDF | ||
Your IP: 3.12.76.241 |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.