Please use this identifier to cite or link to this item:
https://dspace.ctu.edu.vn/jspui/handle/123456789/93765
Title: | PHÂN LOẠI THƯ RÁC BẰNG PHƯƠNG PHÁP HỌC MÁY PHÂN HỆ 2: CÁC THUẬT TOÁN RANDOM FOREST, XGBOOST, KNN, GRU |
Other Titles: | MACHINE LEARNING-BASED SPAM EMAIL CLASSIFICATION WITH ALGORITHMS: RANDOM FOREST, XGBOOST, KNN AND GRU |
Authors: | Phan, Thượng Cang Ngô, Lê Thị Hoài Thu |
Keywords: | TRUYỀN THÔNG VÀ MẠNG MÁY TÍNH |
Issue Date: | 2023 |
Publisher: | Trường Đại Học Cần Thơ |
Abstract: | Ngày nay việc phân loại thư rác là một vấn đề quan trọng trong lĩnh vực bảo mật thông tin và liên lạc qua email. Phân loại thư rác là nhiệm vụ tự động xác định và phân loại các email không mong muốn, thường được gọi là thư rác từ các email trong hộp thư mail. Phương pháp máy học đóng một vai trò quan trọng trong việc phân loại thư rác. Các phương pháp này tận dụng các tính năng và đặc điểm khác nhau của email, chẳng hạn như nội dung, siêu dữ liệu, thông tin người gửi và thuộc tính cấu trúc, để xây dựng các mô hình có thể đưa ra dự đoán về việc email đó có phải là thư rác hay không. Để phát triển mô hình phân loại thư rác bằng phương pháp học máy, một tập dữ liệu đào tạo được sử dụng bao gồm các ví dụ được gắn nhãn về email spam và email ham. Sử dụng tập dữ liệu này để huấn luyện đào tạo các thuật toán học máy. Sau khi được đào tạo, các mô hình có thể được áp dụng để phân loại chúng có phải là thư rác hay không. Trong luận văn này, chúng tôi sử dụng các thuật toán máy học có giám sát để phân tích và dự đoán nhãn cho các email từ đó dễ dàng lọc được các thư rác. Nhìn chung, phân loại thư rác bằng phương pháp học máy là một lĩnh vực nghiên cứu và phát triển thiết yếu trong lĩnh vực bảo mật thông tin. Nó đóng một vai trò quan trọng trong việc chống thư rác, bảo vệ người dùng khỏi nội dung độc hại hoặc không mong muốn, đồng thời đảm bảo tính toàn vẹn và hiệu quả của giao tiếp qua email. |
Description: | 57 Tr |
URI: | https://dspace.ctu.edu.vn/jspui/handle/123456789/93765 |
Appears in Collections: | Trường Công nghệ Thông tin & Truyền thông |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
_file_ Restricted Access | 2.56 MB | Adobe PDF | ||
Your IP: 3.147.82.108 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.