Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://dspace.ctu.edu.vn/jspui/handle/123456789/8965
Nhan đề: | TÓM TẮT NỘI DUNG VĂN BẢN TIẾNG ANH |
Tác giả: | Trần, Nguyễn Dương Chi Nguyễn, Hồng Phát |
Từ khoá: | KHOA HỌC MÁY TÍNH |
Năm xuất bản: | 2019 |
Nhà xuất bản: | Trường Đại học Cần Thơ |
Tóm tắt: | Với sự bùng nổ dữ liệu đang diễn ra như hiện nay, các ứng dụng của Tóm tắt văn bản như “Chatbot” và “Headline Generator” đang thật sự trở nên rất quan trọng. Tuy nhiên, đa số các phương pháp tóm tắt trước đây đều được phát triển theo hướng “Extractive Text Summarization”, và đây chưa thật sự là hướng tiếp cân tốt nhất khi mà các văn bản được sinh ra vẫn còn thiếu sự sáng tạo trong cách viết. Dựa trên những nghiên cứu tiêu biểu gần đây của “Abstractive Text Summarization”, trong luận văn này em sẽ trình bày cách xây dựng một mô hình Học máy để tạo ra một ứng dụng tóm tắt văn bản đơn giản mà vẫn thể hiện được sự ưu việt vốn thiếu của “Extractive Text Summarization” trong cách viết tóm tắt. Về phần mô hình, đó là một sự kết hợp của mô hình sequence-to-sequence với cơ chế Attention được cài đặt theo Dot-Attention cho mục tiêu làm giảm số lượng trọng số cần huấn luyện. Sau khi huấn luyện trên một triệu điểm dữ liệu được lấy từ tập Gigaword, mô hình thu được đã có thể thực hiện việc tóm tắt trên các văn bản ngắn (1-2 câu) với độ chính xác F-1 đạt được là 25%. |
Mô tả: | 47 tr |
Định danh: | http://dspace.ctu.edu.vn/jspui/handle/123456789/8965 |
Bộ sưu tập: | Trường Công nghệ Thông tin & Truyền thông |
Các tập tin trong tài liệu này:
Tập tin | Mô tả | Kích thước | Định dạng | |
---|---|---|---|---|
_file_ Giới hạn truy cập | 2.05 MB | Adobe PDF | ||
Your IP: 3.146.178.241 |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.