Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/93765
Title: PHÂN LOẠI THƯ RÁC BẰNG PHƯƠNG PHÁP HỌC MÁY PHÂN HỆ 2: CÁC THUẬT TOÁN RANDOM FOREST, XGBOOST, KNN, GRU
Other Titles: MACHINE LEARNING-BASED SPAM EMAIL CLASSIFICATION WITH ALGORITHMS: RANDOM FOREST, XGBOOST, KNN AND GRU
Authors: Phan, Thượng Cang
Ngô, Lê Thị Hoài Thu
Keywords: TRUYỀN THÔNG VÀ MẠNG MÁY TÍNH
Issue Date: 2023
Publisher: Trường Đại Học Cần Thơ
Abstract: Ngày nay việc phân loại thư rác là một vấn đề quan trọng trong lĩnh vực bảo mật thông tin và liên lạc qua email. Phân loại thư rác là nhiệm vụ tự động xác định và phân loại các email không mong muốn, thường được gọi là thư rác từ các email trong hộp thư mail. Phương pháp máy học đóng một vai trò quan trọng trong việc phân loại thư rác. Các phương pháp này tận dụng các tính năng và đặc điểm khác nhau của email, chẳng hạn như nội dung, siêu dữ liệu, thông tin người gửi và thuộc tính cấu trúc, để xây dựng các mô hình có thể đưa ra dự đoán về việc email đó có phải là thư rác hay không. Để phát triển mô hình phân loại thư rác bằng phương pháp học máy, một tập dữ liệu đào tạo được sử dụng bao gồm các ví dụ được gắn nhãn về email spam và email ham. Sử dụng tập dữ liệu này để huấn luyện đào tạo các thuật toán học máy. Sau khi được đào tạo, các mô hình có thể được áp dụng để phân loại chúng có phải là thư rác hay không. Trong luận văn này, chúng tôi sử dụng các thuật toán máy học có giám sát để phân tích và dự đoán nhãn cho các email từ đó dễ dàng lọc được các thư rác. Nhìn chung, phân loại thư rác bằng phương pháp học máy là một lĩnh vực nghiên cứu và phát triển thiết yếu trong lĩnh vực bảo mật thông tin. Nó đóng một vai trò quan trọng trong việc chống thư rác, bảo vệ người dùng khỏi nội dung độc hại hoặc không mong muốn, đồng thời đảm bảo tính toàn vẹn và hiệu quả của giao tiếp qua email.
Description: 57 Tr
URI: https://dspace.ctu.edu.vn/jspui/handle/123456789/93765
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
2.56 MBAdobe PDF
Your IP: 3.147.82.108


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.