Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/45255
Title: CẢI THIỆN HIỆU SUẤT PHÂN LOẠI TRÊN BỘ DỮ LIỆU KHÔNG CÂN BẰNG VỚI MẠNG GAN
Authors: Trần, Cao Đệ
Nguyễn, Thị Huyễn Nhi
Keywords: CÔNG NGHỆ THÔNG TIN
Issue Date: 2021
Publisher: Trường Đại Học Cần Thơ
Abstract: Vấn đề mất cân bằng dữ liệu thường xảy ra khi trong tập dữ liệu có lớp chứa số mẫu nhiều hơn các lớp khác. Phân loại chính xác cho mẫu thuộc lớp có ít dữ liệu trong tập dữ liệu mất cân bằng là một điều khó khăn. Tỷ lệ mất cân bằng của tập dữ liệu càng cao thì việc phát hiện được mẫu của lớp nhỏ càng khó. Trong bài luận văn này, chúng tôi nghiên cứu sự ảnh hưởng xấu của sự mất cân bằng lớp đối với hiệu suất phân loại của kiến trúc phân loại hybrid CNN SVM, nhằm mục đích đưa ra các biện pháp để khắc phục vấn đề mất cân bằng lớp này.Để nghiên cứu vấn đề này, chúng tôi giả lập sự mất cân bằng lớp trong bộ dữ liệu FMNIST và quan sát thấy rằng Accuracy và F1 - Score đều giảm trung bình 7% khi được đem so sánh hiệu suất trong tập dữ liệu gốc. Để giải quyết vấn đề này, chúng tôi sử dụng data augumentation để cân bằng lại dữ liệu. Đầu tiên sử dụng cách data augmentation truyền thống áp dụng các phép biến đổi hình học và quang học trên các mẫu hiện có của lớp thiểu số như xoay hình ảnh, phóng to, làm mờ, làm trắng, cắt,… Sau đó, sử dụng kiến trúc mạng WassersteinGAN với Gradient Penalty (WGAN - GP) để tạo ra thêm dữ liệu mới. Kết quả phân loại tập dữ liệu cân bằng được tạo ra bằng cách sử dụng WGAN - GP cho thấy Accuracy và F1 - Score đều tăng khoảng 4% tốt hơn kết quả sử dụng phương pháp Image Transformations. Đây là một giải pháp đầy hứa hẹn cho các bộ dữ liệu phức tạp trong thực tế.
Description: 56 Tr
URI: https://dspace.ctu.edu.vn/jspui/handle/123456789/45255
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
4.09 MBAdobe PDF
Your IP: 3.140.195.142


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.