Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/5503
Title: TÓM TẮT TÓM LƯỢC Ý VĂN BẢN SỬ DỤNG MÔ HÌNH SEQUENCE-TO-SEQUENCE WITH ATTENTION VÀ BEAM SEARCH
Authors: Lâm, Nhựt Khang
Huỳnh, Quốc Lực
Keywords: CÔNG NGHỆ THÔNG TIN
Issue Date: 2018
Publisher: Trường Đại học Cần Thơ
Abstract: Luận văn này tập trung nghiên cứu việc áp dụng mô hình Sequence – to – Sequence with Attention của học sâu vào bài toán tóm tắt tóm lược ý văn bản trên tập dữ liệu tiếng Việt. Trong đề tài này, mô hình Glove được dùng để rút trích những đặc điểm của tiếng Việt và tạo tập từ vựng tiếng Việt cho đầu vào của mô hình nhằm tạo kết quả đầu ra là chuỗi các từ. Cuối cùng kết quả được chọn lọc lại bằng thuật toán Beam Search và sinh ra câu tóm tắt. Độ chính xác của mô hình được đánh giá bằng phương pháp ROUGE trên tập dữ liệu 12000 bài báo được thu thập từ trang vnexpress, kết quả thu được lần lược: Recall là 17%, Precision là 34% và F-score là 22%. Tuy kết quả còn chưa tốt nhưng mô hình đã hoàn thành được mục tiêu được đưa ra. Chúng tôi sẽ cải thiện chất lượng tập dữ liệu và điều chỉnh tham số để nâng cao kết quả.
Description: 36 tr
URI: http://dspace.ctu.edu.vn/jspui/handle/123456789/5503
Appears in Collections:Khoa Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
1.06 MBAdobe PDF
Your IP: 54.236.35.159


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.