Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: https://dspace.ctu.edu.vn/jspui/handle/123456789/45255
Nhan đề: CẢI THIỆN HIỆU SUẤT PHÂN LOẠI TRÊN BỘ DỮ LIỆU KHÔNG CÂN BẰNG VỚI MẠNG GAN
Tác giả: Trần, Cao Đệ
Nguyễn, Thị Huyễn Nhi
Từ khoá: CÔNG NGHỆ THÔNG TIN
Năm xuất bản: 2021
Nhà xuất bản: Trường Đại Học Cần Thơ
Tóm tắt: Vấn đề mất cân bằng dữ liệu thường xảy ra khi trong tập dữ liệu có lớp chứa số mẫu nhiều hơn các lớp khác. Phân loại chính xác cho mẫu thuộc lớp có ít dữ liệu trong tập dữ liệu mất cân bằng là một điều khó khăn. Tỷ lệ mất cân bằng của tập dữ liệu càng cao thì việc phát hiện được mẫu của lớp nhỏ càng khó. Trong bài luận văn này, chúng tôi nghiên cứu sự ảnh hưởng xấu của sự mất cân bằng lớp đối với hiệu suất phân loại của kiến trúc phân loại hybrid CNN SVM, nhằm mục đích đưa ra các biện pháp để khắc phục vấn đề mất cân bằng lớp này.Để nghiên cứu vấn đề này, chúng tôi giả lập sự mất cân bằng lớp trong bộ dữ liệu FMNIST và quan sát thấy rằng Accuracy và F1 - Score đều giảm trung bình 7% khi được đem so sánh hiệu suất trong tập dữ liệu gốc. Để giải quyết vấn đề này, chúng tôi sử dụng data augumentation để cân bằng lại dữ liệu. Đầu tiên sử dụng cách data augmentation truyền thống áp dụng các phép biến đổi hình học và quang học trên các mẫu hiện có của lớp thiểu số như xoay hình ảnh, phóng to, làm mờ, làm trắng, cắt,… Sau đó, sử dụng kiến trúc mạng WassersteinGAN với Gradient Penalty (WGAN - GP) để tạo ra thêm dữ liệu mới. Kết quả phân loại tập dữ liệu cân bằng được tạo ra bằng cách sử dụng WGAN - GP cho thấy Accuracy và F1 - Score đều tăng khoảng 4% tốt hơn kết quả sử dụng phương pháp Image Transformations. Đây là một giải pháp đầy hứa hẹn cho các bộ dữ liệu phức tạp trong thực tế.
Mô tả: 56 Tr
Định danh: https://dspace.ctu.edu.vn/jspui/handle/123456789/45255
Bộ sưu tập: Trường Công nghệ Thông tin & Truyền thông

Các tập tin trong tài liệu này:
Tập tin Mô tả Kích thước Định dạng  
_file_
  Giới hạn truy cập
4.09 MBAdobe PDF
Your IP: 3.149.29.209


Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.