Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/66829
Title: PHÂN LOẠI MÃ ĐỘC SỬ DỤNG GIẢI THUẬT WORD2VECTOR VÀ MLP
Authors: Thái, Minh Tuấn
Lê, Văn Sơn
Keywords: CÔNG NGHỆ THÔNG TIN
Issue Date: 2021
Publisher: Trường Đại Học Cần Thơ
Abstract: Hiện nay, mã độc ngày càng phát triển đa dạng và phong phú, có nhiều biến đổi, tốc độ tăng trưởng nhanh theo thời gian. Những phương pháp phân loại phần mềm độc hại truyền thống trong máy học chủ yếu dựa trên kỹ thuật rút trích đặc trưng của phần mềm độc hại còn vài vấn đề khó khăn. Để nâng cao độ chính xác thì phải rút trích nhiều đặc trưng hơn nữa từ các phần mềm độc hại. Điều đó làm cho việc phân loại mã độc trở nên phức tạp ngày càng cao. Để giải quyết những vấn đề trên, luận văn này đã đề xuất một phương pháp phân loại phần mềm độc hại bằng cách sử dụng giải thuật Word2Vec và MLP. Với mỗi mẫu phần mềm độc hại bao gồm một số lượng lớn các byte có giá trị từ 0x00 đến 0xFF. Do đó, mỗi mẫu phần mềm độc hại có thể được coi như một tài liệu được viết bởi các byte. Và chính vì điều này, tài liệu đó có thể được chia thành các câu dựa vào các byte đệm hoặc các byte vô nghĩa. Trong luận văn này, đầu tiên sử dụng giải thuật Word2Vec để tính toán các vector từ có kích thước là 256 cho mỗi byte trên mỗi mẫu phần mềm độc hại. Tiếp đến, kết hợp tập các vector vừa tạo thành một ma trận và ma trận này được sắp xếp theo thứ tự tăng dần từ 0x00 đến 0xFF. Kế tiếp, sử dụng giải thuật MLP để đào tạo mô hình phân loại trên tập dữ liệu đào tạo có sẵn. Cuối cùng, sử dụng mô hình được đào tạo đó để phân loại các mẫu thử nghiệm, kiểm tra và đánh giá mô hình. Kết quả thực nghiệm của mô hình phân loại MLP cho thấy phương pháp đề xuất trong luận văn này có độ chính xác tương đối cao 98.80%.
Description: 48 Tr
URI: https://dspace.ctu.edu.vn/jspui/handle/123456789/66829
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
1.28 MBAdobe PDF
Your IP: 18.191.178.145


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.