Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: https://dspace.ctu.edu.vn/jspui/handle/123456789/111671
Nhan đề: FILE TYPE CLASSIFICATION USING MACHINE LEARNING
Nhan đề khác: PHÂN LOẠI TẬP TIN SỬ DỤNG MÁY HỌC
Tác giả: Thái, Minh Tuấn
Lê, Trung Nhật
Từ khoá: CÔNG NGHỆ THÔNG TIN - CHẤT LƯỢNG CAO
Năm xuất bản: 2024
Nhà xuất bản: Trường Đại Học Cần Thơ
Tóm tắt: File classification is crucial in information security, system management, and digital forensics. Traditional methods like classification by file extensions, header extraction, or basic machine learning have limitations such as low accuracy and poor scalability. This thesis proposes a file classification approach using byte histograms combined with Decision Tree and Random Forest models, enhanced by supplemental features like entropy and file size. A dataset with 12 common file types was used, with 80% for training and 20% for testing. The Random Forest model with additional features achieved the highest accuracy of 92.5%, outperforming Decision Tree in Precision, Recall, and F1-Score, especially for types like pdf, exe, and json. The proposed method offers high accuracy, scalability, and practical applicability for file classification tasks.
Mô tả: 86 Tr
Định danh: https://dspace.ctu.edu.vn/jspui/handle/123456789/111671
Bộ sưu tập: Trường Công nghệ Thông tin & Truyền thông

Các tập tin trong tài liệu này:
Tập tin Mô tả Kích thước Định dạng  
_file_
  Giới hạn truy cập
2.35 MBAdobe PDF
Your IP: 3.17.167.39


Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.