Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: https://dspace.ctu.edu.vn/jspui/handle/123456789/73589
Nhan đề: ỨNG DỤNG ĐỘ ĐO FRÉCHET VÀO LỰA CHỌN MẪU SINH RA TỪ MẠNG GAN ĐỂ CÂN BẰNG DỮ LIỆU
Tác giả: Trần, Cao Đệ
Lâm, Thị Ngọc Mỹ
Từ khoá: CÔNG NGHỆ THÔNG TIN
Năm xuất bản: 2021
Nhà xuất bản: Trường Đại Học Cần Thơ
Tóm tắt: Vấn đề mất cân bằng dữ liệu thường xảy ra khi trong tập dữ liệu có lớp chứa số mẫu nhiều hơn các lớp khác. Phân loại chính xác cho mẫu thuộc lớp có ít dữ liệu trong tập dữ liệu mất cân bằng là một điều khó khăn. Tỷ lệ mất cân bằng của tập dữ liệu càng cao thì việc phát hiện được mẫu của lớp thiểu số càng khó khăn. Có nhiều phương pháp giải quyết vấn đề mất cân bằng dữ liệu. Một trong những phương pháp đó là sử dụng mạng GAN (Generative adversarial networks) để sinh thêm ảnh bổ sung cho tập dữ liệu mất cân bằng. Bài luận văn này nghiên cứu về phương pháp sử dụng mạng GAN sinh ảnh bổ sung cho tập dữ liệu mất cân bằng. Ngoài ra, nghiên cứu hiệu quả của việc lựa chọn mẫu được sinh ra từ GAN bằng độ đo Fréchet. Để tiến hành nghiên cứu, việc giả lập sự mất cân bằng dữ liệu được thực hiện trên bộ dữ liệu Fashion MNIST (FMNIST). Sử dụng kiến trúc mạng WassersteinGAN với Gradient Penalty (WGAN - GP) để sinh ra thêm dữ liệu mới thuộc các lớp thiểu số. Sau đó, sử dụng độ đo FID trên tập ảnh được sinh ra để chọn tập dữ liệu tốt bổ sung cho tập mất cân bằng. Kết quả phân loại trên tập dữ liệu sau khi đã cân bằng lại, so với kết quả trên tập mất cân bằng, cho thấy độ chính xác (accuracy) tăng khoảng 3%. Kết quả này cho thấy có thể dùng độ đo FID trong lựa chọn mẫu để bổ sung cho lớp thiểu số trong tập dữ liệu mất cân bằng.
Mô tả: 60 Tr
Định danh: https://dspace.ctu.edu.vn/jspui/handle/123456789/73589
Bộ sưu tập: Trường Công nghệ Thông tin & Truyền thông

Các tập tin trong tài liệu này:
Tập tin Mô tả Kích thước Định dạng  
_file_
  Giới hạn truy cập
1.85 MBAdobe PDF
Your IP: 18.220.108.111


Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.