Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/21100
Title: PHÂN LOẠI BÀI BÁO DỰA VÀO TÓM TẮT
Authors: Nguyễn, Tí Hon
Võ, Thị Ngọc Trân
Keywords: CÔNG NGHỆ THÔNG TIN
Issue Date: 2019
Publisher: Trường Đại Học Cần Thơ
Abstract: Phân loại bài báo là một vấn đề liên quan đến lĩnh vực khai mỏ dữ liệu. Bài toán phân loại là một trong những bài toán quan trọng của ngành khoa học máy tính, việc phân loại tốn rất nhiều thời gian và chi phí tính toán, phân loại bài báo và khai mỏ dữ liệu trên mạng xã hội đang là xu hướng phát triển hiên nay. Để giải quyết bài toán này thì có rất nhiều giải thuật máy học được sử dụng: giải thuật Bayes thơ ngây (Naïve Bayes), k láng giềng (KNN), Cây quyết định (Decision Tree), máy học vector hỗ trợ (SVM), K-Means clustering, Mini Batch K-Means, v.v. Mỗi giải thuật sẽ có các mặt thuận lợi và bất lợi. Đề tài “Phân loại bài báo dựa vào tóm tắt” này sẽ được xử lý bằng hai giải thuật. Đó là Mini Batch K-Means và máy học vector hỗ trợ (SVM). Nó sẽ phân loại bài báo trên tập dữ liệu báo “Dân Trí”. [5] Đề tài sử dụng giải thuật Mini Batch K-Means và giải thuật SVM, tiến hành huấn luyện và kiểm tra trên tập dữ liệu có hai thành phần: phần nội dung và phần tóm tắt để so sánh kết quả về mặt thời gian và độ chính xác của hai giải thuật trên hai thành phần đó, từ đó đưa ra được hướng giải quyết tốt nhất cho bài toán phân loại.
Description: 40 tr
URI: http://dspace.ctu.edu.vn/jspui/handle/123456789/21100
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
1.14 MBAdobe PDF
Your IP: 18.225.209.95


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.