Please use this identifier to cite or link to this item:
https://dspace.ctu.edu.vn/jspui/handle/123456789/116199
Title: | LỰA CHỌN GENE FAMILY ĐỂ CHẨN ĐOÁN BỆNH VỚI RANDOM FOREST VÀ LOCAL INTERPRETABLE MODEL-AGNOSTIC EXPLANATIONS |
Other Titles: | GENE FAMILY SELECTION FOR DISEASE PREDICTION WITH RANDOM FOREST AND LOCAL INTERPRETABLE MODEL-AGNOSTIC EXPLANATIONS |
Authors: | Nguyễn, Thanh Hải Sử, Kim Anh Trương, Huỳnh Tú Như |
Keywords: | CÔNG NGHỆ THÔNG TIN |
Issue Date: | 2025 |
Publisher: | Trường Đại Học Cần Thơ |
Abstract: | Các mô hình học máy hoạt động trên dữ liệu Gene Family có thể yêu cầu tài nguyên tính toán đáng kể do số lượng đặc trưng rất lớn, dẫn đến thời gian huấn luyện kéo dài và đòi hỏi rất nhiều thời gian để tính toán. Việc chọn lọc đặc trưng không chỉ giúp giảm thiểu chi phí tính toán, đẩy nhanh quá trình xử lý mà còn hạn chế tối đa việc loại bỏ những đặc trưng quan trọng có ảnh hưởng đến kết quả dự đoán. Nghiên cứu này đã đánh giá ảnh hưởng của phương pháp LIME trong việc chọn lọc đặc trưng kết hợp với mô hình Random Forest (RF) và Gradient Boosting Classifier (GBC). Kết quả thực nghiệm cho thấy phương pháp chọn lọc đặc trưng dựa trên LIME đạt độ chính xác tốt hơn so với phương pháp chọn lọc truyền thống của RF. Đặc biệt, trong hầu hết các trường hợp LIME giúp cải thiện độ chính xác so với dữ liệu gốc và đặc biệt trên các tập dữ liệu CIR, COL và WT2D. Bên cạnh đó, khi so sánh với các phương pháp của nghiên cứu trước đây như Principal Component Analysis và Random Projection, việc kết hợp RF + LIME cho thấy hiệu suất phân loại tốt hơn. Những kết quả này cho thấy LIME là một phương pháp hiệu quả trong việc lựa chọn đặc trưng, giúp nâng cao độ chính xác của mô hình mà vẫn giữ lại các yếu tố quan trọng. |
Description: | 75 Tr |
URI: | https://dspace.ctu.edu.vn/jspui/handle/123456789/116199 |
Appears in Collections: | Trường Công nghệ Thông tin & Truyền thông |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
_file_ Restricted Access | 4.25 MB | Adobe PDF | ||
Your IP: 216.73.216.232 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.