Please use this identifier to cite or link to this item:
https://dspace.ctu.edu.vn/jspui/handle/123456789/45255
Title: | CẢI THIỆN HIỆU SUẤT PHÂN LOẠI TRÊN BỘ DỮ LIỆU KHÔNG CÂN BẰNG VỚI MẠNG GAN |
Authors: | Trần, Cao Đệ Nguyễn, Thị Huyễn Nhi |
Keywords: | CÔNG NGHỆ THÔNG TIN |
Issue Date: | 2021 |
Publisher: | Trường Đại Học Cần Thơ |
Abstract: | Vấn đề mất cân bằng dữ liệu thường xảy ra khi trong tập dữ liệu có lớp chứa số mẫu nhiều hơn các lớp khác. Phân loại chính xác cho mẫu thuộc lớp có ít dữ liệu trong tập dữ liệu mất cân bằng là một điều khó khăn. Tỷ lệ mất cân bằng của tập dữ liệu càng cao thì việc phát hiện được mẫu của lớp nhỏ càng khó. Trong bài luận văn này, chúng tôi nghiên cứu sự ảnh hưởng xấu của sự mất cân bằng lớp đối với hiệu suất phân loại của kiến trúc phân loại hybrid CNN SVM, nhằm mục đích đưa ra các biện pháp để khắc phục vấn đề mất cân bằng lớp này.Để nghiên cứu vấn đề này, chúng tôi giả lập sự mất cân bằng lớp trong bộ dữ liệu FMNIST và quan sát thấy rằng Accuracy và F1 - Score đều giảm trung bình 7% khi được đem so sánh hiệu suất trong tập dữ liệu gốc. Để giải quyết vấn đề này, chúng tôi sử dụng data augumentation để cân bằng lại dữ liệu. Đầu tiên sử dụng cách data augmentation truyền thống áp dụng các phép biến đổi hình học và quang học trên các mẫu hiện có của lớp thiểu số như xoay hình ảnh, phóng to, làm mờ, làm trắng, cắt,… Sau đó, sử dụng kiến trúc mạng WassersteinGAN với Gradient Penalty (WGAN - GP) để tạo ra thêm dữ liệu mới. Kết quả phân loại tập dữ liệu cân bằng được tạo ra bằng cách sử dụng WGAN - GP cho thấy Accuracy và F1 - Score đều tăng khoảng 4% tốt hơn kết quả sử dụng phương pháp Image Transformations. Đây là một giải pháp đầy hứa hẹn cho các bộ dữ liệu phức tạp trong thực tế. |
Description: | 56 Tr |
URI: | https://dspace.ctu.edu.vn/jspui/handle/123456789/45255 |
Appears in Collections: | Trường Công nghệ Thông tin & Truyền thông |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
_file_ Restricted Access | 4.09 MB | Adobe PDF | ||
Your IP: 3.140.195.142 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.