Please use this identifier to cite or link to this item:
https://dspace.ctu.edu.vn/jspui/handle/123456789/110615
Title: | PHÂN LOẠI HÌNH ẢNH VỚI DỮ LIỆU ĐÃ ĐƯỢC TĂNG CƯỜNG BẰNG VGG-16 |
Other Titles: | IMAGE CLASSIFICATION FOR AUGMENTED DATA WITH THE VGG-16 |
Authors: | Trần, Thanh Điện Nguyễn, Tiến |
Keywords: | HỆ THỐNG THÔNG TIN |
Issue Date: | 2024 |
Publisher: | Trường Đại Học Cần Thơ |
Abstract: | Đề tài nghiên cứu về việc xây dựng mô hình phân loại hình ảnh sử dụng mạng nơron tích chập VGG-16. Mục tiêu chính là phát triển mô hình có khả năng phân loại các loại hình ảnh, bao gồm biểu đồ, đồ thị, ảnh thông thường, bảng và các loại hình ảnh khác nhau, nhằm cải thiện độ chính xác và khả năng tổng quát hóa của hệ thống. Để đạt được mục tiêu này, đề tài đã áp dụng kỹ thuật tăng cường ảnh, giúp mô hình học được từ nhiều biến thể khác nhau của hình ảnh gốc và giảm thiểu vấn đề overfitting. Phương pháp chính của nghiên cứu bao gồm việc sử dụng mô hình VGG-16 cho việc phân loại hình ảnh. Mô hình này được huấn luyện trên hai tập dữ liệu: một tập dữ liệu sử dụng tăng cường ảnh và một tập dữ liệu không sử dụng kỹ thuật này. Các kỹ thuật tăng cường ảnh như xoay, thay đổi độ sáng và lật ảnh đã được áp dụng để tạo ra các biến thể đa dạng cho hình ảnh huấn luyện. Mô hình VGG-16 được chọn vì khả năng xử lý hình ảnh phức tạp với độ chính xác cao. Kết quả nghiên cứu cho thấy việc áp dụng kỹ thuật tăng cường ảnh mang lại sự cải thiện rõ rệt về hiệu suất của mô hình, đặc biệt là khả năng tổng quát hóa trong việc nhận diện các hình ảnh chưa từng thấy trước đây. Mô hình sử dụng tăng cường ảnh có khả năng giảm thiểu overfitting, đồng thời đạt được độ chính xác cao hơn trong các bài toán phân loại. Tuy nhiên, vẫn còn tồn tại một số hạn chế về thời gian huấn luyện và khả năng xử lý các hình ảnh có biến dạng mạnh hoặc chưa được mô hình huấn luyện. Các đóng góp chính của đề tài là cải tiến hiệu suất mô hình phân loại hình ảnh thông qua việc sử dụng kỹ thuật tăng cường ảnh, cung cấp một giải pháp linh hoạt cho các bài toán phân loại hình ảnh với dữ liệu hạn chế, đồng thời mở ra hướng nghiên cứu về việc áp dụng các kiến trúc mạng tiên tiến hơn trong tương lai. Từ khóa: phân loại hình ảnh, VGG-16, tăng cường ảnh, mạng nơ-ron tích chập, học sâu. |
Description: | 51 Tr |
URI: | https://dspace.ctu.edu.vn/jspui/handle/123456789/110615 |
Appears in Collections: | Trường Công nghệ Thông tin & Truyền thông |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
_file_ Restricted Access | 1.46 MB | Adobe PDF | ||
Your IP: 18.116.100.166 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.