Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://dspace.ctu.edu.vn/jspui/handle/123456789/21100
Nhan đề: | PHÂN LOẠI BÀI BÁO DỰA VÀO TÓM TẮT |
Tác giả: | Nguyễn, Tí Hon Võ, Thị Ngọc Trân |
Từ khoá: | CÔNG NGHỆ THÔNG TIN |
Năm xuất bản: | 2019 |
Nhà xuất bản: | Trường Đại Học Cần Thơ |
Tóm tắt: | Phân loại bài báo là một vấn đề liên quan đến lĩnh vực khai mỏ dữ liệu. Bài toán phân loại là một trong những bài toán quan trọng của ngành khoa học máy tính, việc phân loại tốn rất nhiều thời gian và chi phí tính toán, phân loại bài báo và khai mỏ dữ liệu trên mạng xã hội đang là xu hướng phát triển hiên nay. Để giải quyết bài toán này thì có rất nhiều giải thuật máy học được sử dụng: giải thuật Bayes thơ ngây (Naïve Bayes), k láng giềng (KNN), Cây quyết định (Decision Tree), máy học vector hỗ trợ (SVM), K-Means clustering, Mini Batch K-Means, v.v. Mỗi giải thuật sẽ có các mặt thuận lợi và bất lợi. Đề tài “Phân loại bài báo dựa vào tóm tắt” này sẽ được xử lý bằng hai giải thuật. Đó là Mini Batch K-Means và máy học vector hỗ trợ (SVM). Nó sẽ phân loại bài báo trên tập dữ liệu báo “Dân Trí”. [5] Đề tài sử dụng giải thuật Mini Batch K-Means và giải thuật SVM, tiến hành huấn luyện và kiểm tra trên tập dữ liệu có hai thành phần: phần nội dung và phần tóm tắt để so sánh kết quả về mặt thời gian và độ chính xác của hai giải thuật trên hai thành phần đó, từ đó đưa ra được hướng giải quyết tốt nhất cho bài toán phân loại. |
Mô tả: | 40 tr |
Định danh: | http://dspace.ctu.edu.vn/jspui/handle/123456789/21100 |
Bộ sưu tập: | Trường Công nghệ Thông tin & Truyền thông |
Các tập tin trong tài liệu này:
Tập tin | Mô tả | Kích thước | Định dạng | |
---|---|---|---|---|
_file_ Giới hạn truy cập | 1.14 MB | Adobe PDF | ||
Your IP: 3.141.27.70 |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.