Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: https://dspace.ctu.edu.vn/jspui/handle/123456789/110615
Nhan đề: PHÂN LOẠI HÌNH ẢNH VỚI DỮ LIỆU ĐÃ ĐƯỢC TĂNG CƯỜNG BẰNG VGG-16
Nhan đề khác: IMAGE CLASSIFICATION FOR AUGMENTED DATA WITH THE VGG-16
Tác giả: Trần, Thanh Điện
Nguyễn, Tiến
Từ khoá: HỆ THỐNG THÔNG TIN
Năm xuất bản: 2024
Nhà xuất bản: Trường Đại Học Cần Thơ
Tóm tắt: Đề tài nghiên cứu về việc xây dựng mô hình phân loại hình ảnh sử dụng mạng nơron tích chập VGG-16. Mục tiêu chính là phát triển mô hình có khả năng phân loại các loại hình ảnh, bao gồm biểu đồ, đồ thị, ảnh thông thường, bảng và các loại hình ảnh khác nhau, nhằm cải thiện độ chính xác và khả năng tổng quát hóa của hệ thống. Để đạt được mục tiêu này, đề tài đã áp dụng kỹ thuật tăng cường ảnh, giúp mô hình học được từ nhiều biến thể khác nhau của hình ảnh gốc và giảm thiểu vấn đề overfitting. Phương pháp chính của nghiên cứu bao gồm việc sử dụng mô hình VGG-16 cho việc phân loại hình ảnh. Mô hình này được huấn luyện trên hai tập dữ liệu: một tập dữ liệu sử dụng tăng cường ảnh và một tập dữ liệu không sử dụng kỹ thuật này. Các kỹ thuật tăng cường ảnh như xoay, thay đổi độ sáng và lật ảnh đã được áp dụng để tạo ra các biến thể đa dạng cho hình ảnh huấn luyện. Mô hình VGG-16 được chọn vì khả năng xử lý hình ảnh phức tạp với độ chính xác cao. Kết quả nghiên cứu cho thấy việc áp dụng kỹ thuật tăng cường ảnh mang lại sự cải thiện rõ rệt về hiệu suất của mô hình, đặc biệt là khả năng tổng quát hóa trong việc nhận diện các hình ảnh chưa từng thấy trước đây. Mô hình sử dụng tăng cường ảnh có khả năng giảm thiểu overfitting, đồng thời đạt được độ chính xác cao hơn trong các bài toán phân loại. Tuy nhiên, vẫn còn tồn tại một số hạn chế về thời gian huấn luyện và khả năng xử lý các hình ảnh có biến dạng mạnh hoặc chưa được mô hình huấn luyện. Các đóng góp chính của đề tài là cải tiến hiệu suất mô hình phân loại hình ảnh thông qua việc sử dụng kỹ thuật tăng cường ảnh, cung cấp một giải pháp linh hoạt cho các bài toán phân loại hình ảnh với dữ liệu hạn chế, đồng thời mở ra hướng nghiên cứu về việc áp dụng các kiến trúc mạng tiên tiến hơn trong tương lai. Từ khóa: phân loại hình ảnh, VGG-16, tăng cường ảnh, mạng nơ-ron tích chập, học sâu.
Mô tả: 51 Tr
Định danh: https://dspace.ctu.edu.vn/jspui/handle/123456789/110615
Bộ sưu tập: Trường Công nghệ Thông tin & Truyền thông

Các tập tin trong tài liệu này:
Tập tin Mô tả Kích thước Định dạng  
_file_
  Giới hạn truy cập
1.46 MBAdobe PDF
Your IP: 18.227.114.67


Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.