Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://dspace.ctu.edu.vn/jspui/handle/123456789/45255
Nhan đề: | CẢI THIỆN HIỆU SUẤT PHÂN LOẠI TRÊN BỘ DỮ LIỆU KHÔNG CÂN BẰNG VỚI MẠNG GAN |
Tác giả: | Trần, Cao Đệ Nguyễn, Thị Huyễn Nhi |
Từ khoá: | CÔNG NGHỆ THÔNG TIN |
Năm xuất bản: | 2021 |
Nhà xuất bản: | Trường Đại Học Cần Thơ |
Tóm tắt: | Vấn đề mất cân bằng dữ liệu thường xảy ra khi trong tập dữ liệu có lớp chứa số mẫu nhiều hơn các lớp khác. Phân loại chính xác cho mẫu thuộc lớp có ít dữ liệu trong tập dữ liệu mất cân bằng là một điều khó khăn. Tỷ lệ mất cân bằng của tập dữ liệu càng cao thì việc phát hiện được mẫu của lớp nhỏ càng khó. Trong bài luận văn này, chúng tôi nghiên cứu sự ảnh hưởng xấu của sự mất cân bằng lớp đối với hiệu suất phân loại của kiến trúc phân loại hybrid CNN SVM, nhằm mục đích đưa ra các biện pháp để khắc phục vấn đề mất cân bằng lớp này.Để nghiên cứu vấn đề này, chúng tôi giả lập sự mất cân bằng lớp trong bộ dữ liệu FMNIST và quan sát thấy rằng Accuracy và F1 - Score đều giảm trung bình 7% khi được đem so sánh hiệu suất trong tập dữ liệu gốc. Để giải quyết vấn đề này, chúng tôi sử dụng data augumentation để cân bằng lại dữ liệu. Đầu tiên sử dụng cách data augmentation truyền thống áp dụng các phép biến đổi hình học và quang học trên các mẫu hiện có của lớp thiểu số như xoay hình ảnh, phóng to, làm mờ, làm trắng, cắt,… Sau đó, sử dụng kiến trúc mạng WassersteinGAN với Gradient Penalty (WGAN - GP) để tạo ra thêm dữ liệu mới. Kết quả phân loại tập dữ liệu cân bằng được tạo ra bằng cách sử dụng WGAN - GP cho thấy Accuracy và F1 - Score đều tăng khoảng 4% tốt hơn kết quả sử dụng phương pháp Image Transformations. Đây là một giải pháp đầy hứa hẹn cho các bộ dữ liệu phức tạp trong thực tế. |
Mô tả: | 56 Tr |
Định danh: | https://dspace.ctu.edu.vn/jspui/handle/123456789/45255 |
Bộ sưu tập: | Trường Công nghệ Thông tin & Truyền thông |
Các tập tin trong tài liệu này:
Tập tin | Mô tả | Kích thước | Định dạng | |
---|---|---|---|---|
_file_ Giới hạn truy cập | 4.09 MB | Adobe PDF | ||
Your IP: 3.149.29.209 |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.