Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/14268
Title: TÓM TẮT TÓM LƯỢC VĂN BẢN SỬ DỤNG PHƯƠNG PHÁP HỌC TĂNG CƯỜNG
Authors: Lâm, Nhựt Khang
Phan, Thị Tuyết Kha
Keywords: CÔNG NGHỆ THÔNG TIN
Issue Date: 2019
Publisher: Trường Đại Học Cần Thơ
Abstract: Tóm tắt văn bản là quá trình chắt lọc lại những thông tin quan trọng nhất từ một tài liệu văn bản nhằm giúp người đọc nắm bắt được nhanh gọn, súc tích nội dung văn bản, tiết kiệm thời gian. Tóm tắt văn bản thủ công thường tốn rất nhiều thời gian, công sức đặc biệt là khi thao tác với các văn bản dài. Vì thế, một xu hướng mới mở ra nhằm đáp ứng nhu cầu đó là tóm tắt văn bản tự động, thực hiện nhanh chóng và vẫn đảm bảo được khả năng chính xác của nội dung tóm tắt so với văn bản gốc. Với những đặc tính riêng của tiếng Việt đặt ra những khó khăn và thách thức riêng mà tóm tắt văn bản tự nhiên chưa được nghiên cứu nhiều ở Việt Nam hiện nay so với trên thế giới. Chính vì vậy, em đề xuất mô hình tóm tắt văn bản tiếng Việt tự động với mong muốn tìm ra phương pháp hữu hiệu nhất sử dụng các phương pháp đã áp dụng thành công cho các ngôn ngữ khác trên thế giới đặc biệt là tiếng Anh vào việc xử lí văn bản tiếng Việt. Luận văn sẽ tập trung vào xây dựng quy trình rút trích văn bản với phương pháp xử lý chính là phương pháp tóm tắt trừu tượng kết hợp xử lý với phương pháp rút trích và học tăng cường. Bước đầu đánh giá kết quả của phương pháp dựa trên đánh giá Rouge và thủ công cho kết quả tương đối khả quan.
Description: 69 Tr
URI: http://dspace.ctu.edu.vn/jspui/handle/123456789/14268
Appears in Collections:Khoa Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
4.21 MBAdobe PDF
Your IP: 3.235.85.115


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.