Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/8965
Title: TÓM TẮT NỘI DUNG VĂN BẢN TIẾNG ANH
Authors: Trần, Nguyễn Dương Chi
Nguyễn, Hồng Phát
Keywords: KHOA HỌC MÁY TÍNH
Issue Date: 2019
Publisher: Trường Đại học Cần Thơ
Abstract: Với sự bùng nổ dữ liệu đang diễn ra như hiện nay, các ứng dụng của Tóm tắt văn bản như “Chatbot” và “Headline Generator” đang thật sự trở nên rất quan trọng. Tuy nhiên, đa số các phương pháp tóm tắt trước đây đều được phát triển theo hướng “Extractive Text Summarization”, và đây chưa thật sự là hướng tiếp cân tốt nhất khi mà các văn bản được sinh ra vẫn còn thiếu sự sáng tạo trong cách viết. Dựa trên những nghiên cứu tiêu biểu gần đây của “Abstractive Text Summarization”, trong luận văn này em sẽ trình bày cách xây dựng một mô hình Học máy để tạo ra một ứng dụng tóm tắt văn bản đơn giản mà vẫn thể hiện được sự ưu việt vốn thiếu của “Extractive Text Summarization” trong cách viết tóm tắt. Về phần mô hình, đó là một sự kết hợp của mô hình sequence-to-sequence với cơ chế Attention được cài đặt theo Dot-Attention cho mục tiêu làm giảm số lượng trọng số cần huấn luyện. Sau khi huấn luyện trên một triệu điểm dữ liệu được lấy từ tập Gigaword, mô hình thu được đã có thể thực hiện việc tóm tắt trên các văn bản ngắn (1-2 câu) với độ chính xác F-1 đạt được là 25%.
Description: 47 tr
URI: http://dspace.ctu.edu.vn/jspui/handle/123456789/8965
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
2.05 MBAdobe PDF
Your IP: 18.222.184.162


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.