Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/5735
Title: TÌM KIẾM NỘI DUNG BÀI BÁO PHÙ HỢP VỚI TỪ KHÓA BẰNG CHỈ MỤC NGHỊCH ĐẢO
Authors: Nguyễn, Tí Hon
Trần, Nguyễn Thanh Hùng
Keywords: CÔNG NGHỆ THÔNG TIN
Issue Date: 2018
Publisher: Trường Đại học Cần Thơ
Abstract: Mục tiêu của đề tài là tìm kiếm nội dung bài báo phù hợp với từ khóa bằng chỉ mục nghịch đảo. Đầu tiên, tiến hành phân tích tài liệu để lập chỉ mục, song song đó tiến hành tính trọng số của từng từ trong tài liệu để tính được độ tương đồng cosine của từng từ đối với tài liệu. Tiếp theo, từ câu truy vấn của người dùng tiến hành phân tích câu truy vấn của người dùng và tìm trong tập chỉ mục đã có, sau đó hợp nhất kết quả truy vấn bằng cách sắp xếp giảm dần độ tương đồng cosine và trả kết quả cho người truy vấn. Cài đặt và đánh giá kết quả được thực hiện tập dữ liệu về tin tức của báo VNExpress được sưu tập từ internet. Qua kết quả thực nghiệm độ chính xác K trên tập kiểm thử nhận được kết quả trả về hơn 90%, tuy nhiên vẫn có một số vấn đề tồn tại như việc dữ liệu ngày càng nhiều việc bổ xung dữ liệu cần phải được thêm vào liên tục. Qua đó cho thấy cần phải phát triển bot để thu thập dữ liệu liên tục nhằm phát huy tối đa việc tìm kiếm nội dung bằng từ khóa.
Description: 48 tr
URI: http://dspace.ctu.edu.vn/jspui/handle/123456789/5735
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
2.39 MBAdobe PDF
Your IP: 44.214.106.184


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.