Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/5735
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorNguyễn, Tí Hon-
dc.contributor.authorTrần, Nguyễn Thanh Hùng-
dc.date.accessioned2018-12-21T02:28:26Z-
dc.date.available2018-12-21T02:28:26Z-
dc.date.issued2018-
dc.identifier.otherB1412451-
dc.identifier.urihttp://dspace.ctu.edu.vn/jspui/handle/123456789/5735-
dc.description48 trvi_VN
dc.description.abstractMục tiêu của đề tài là tìm kiếm nội dung bài báo phù hợp với từ khóa bằng chỉ mục nghịch đảo. Đầu tiên, tiến hành phân tích tài liệu để lập chỉ mục, song song đó tiến hành tính trọng số của từng từ trong tài liệu để tính được độ tương đồng cosine của từng từ đối với tài liệu. Tiếp theo, từ câu truy vấn của người dùng tiến hành phân tích câu truy vấn của người dùng và tìm trong tập chỉ mục đã có, sau đó hợp nhất kết quả truy vấn bằng cách sắp xếp giảm dần độ tương đồng cosine và trả kết quả cho người truy vấn. Cài đặt và đánh giá kết quả được thực hiện tập dữ liệu về tin tức của báo VNExpress được sưu tập từ internet. Qua kết quả thực nghiệm độ chính xác K trên tập kiểm thử nhận được kết quả trả về hơn 90%, tuy nhiên vẫn có một số vấn đề tồn tại như việc dữ liệu ngày càng nhiều việc bổ xung dữ liệu cần phải được thêm vào liên tục. Qua đó cho thấy cần phải phát triển bot để thu thập dữ liệu liên tục nhằm phát huy tối đa việc tìm kiếm nội dung bằng từ khóa.vi_VN
dc.language.isovivi_VN
dc.publisherTrường Đại học Cần Thơvi_VN
dc.subjectCÔNG NGHỆ THÔNG TINvi_VN
dc.titleTÌM KIẾM NỘI DUNG BÀI BÁO PHÙ HỢP VỚI TỪ KHÓA BẰNG CHỈ MỤC NGHỊCH ĐẢOvi_VN
dc.typeThesisvi_VN
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
2.39 MBAdobe PDF
Your IP: 44.192.20.240


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.