Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://dspace.ctu.edu.vn/jspui/handle/123456789/121535
Nhan đề: | ĐỀ XUẤT VÀ TINH CHỈNH CÁC MÔ HÌNH HỌC SÂU INCEPTIONV3, INCEPTIONV4 VÀ INCEPTIONRESNETV2 CHO BÀI TOÁN PHÂN LOẠI VÀ TRUY XUẤT ẢNH HỌC THUẬT TƯƠNG ĐỒNG |
Nhan đề khác: | PROPOSED AND FINE-TUNED DEEP LEARNING MODELS INCEPTIONV3, INCEPTIONV4, AND INCEPTIONRESNETV2 FOR SIMILAR ACADEMIC IMAGE CLASSIFICATION AND RETRIEVAL |
Tác giả: | Trần, Thanh Điện Trần, Thu Trang |
Từ khoá: | HỆ THỐNG THÔNG TIN |
Năm xuất bản: | 2025 |
Nhà xuất bản: | Trường Đại Học Cần Thơ |
Tóm tắt: | Luận văn này tập trung đề xuất và tinh chỉnh ba kiến trúc mạng nơ-ron tích chập hiện đại gồm InceptionV3, InceptionV4 và Inception-ResNetV2 nhằm đồng thời giải quyết hai nhiệm vụ: phân loại ảnh và truy xuất ảnh tương đồng (CBIR) trong lĩnh vực tài liệu học thuật. Tập dữ liệu nghiên cứu được xây dựng từ 4.303 hình ảnh thuộc 11 lớp, trích xuất từcác bài báo khoa học đăng trên Tạp chí Khoa học Trường Đại học Cần Thơ. Dữ liệu được tiền xử lý và áp dụng các kỹ thuật tăng cường để nâng cao hiệu quả huấn luyện. Các mô hình được khởi tạo từ trọng số ImageNet và được fine-tuning để thích nghi với dữliệuchuyên biệt. Quá trình tối ưu siêu tham số được tiến hành bằng Bayesian Optimization,hỗ trợ tìm kiếm cấu hình mô hình tối ưu một cách tự động và hiệu quả. Ngoài ra, trựcquan hóa đặc trưng được triển khai nhằm phân tích vùng tập trung, kiểm chứng khả năng học của mô hình và hỗ trợ diễn giải kết quả. Trong bài toán CBIR, các vector đặc trưng được trích xuất từ các tầng sâu của mạng nơ-ron tích chập. Sau đó, PCA được áp dụng để giảm chiều dữ liệu, giúp loại bỏ nhiễu và tối ưu hóa không gian đặc trưng. Cuối cùng, FAISS được sử dụng nhằm tăng tốc quá trình tìm kiếm và so sánh độ tương tự giữa các vector. Kết quả thực nghiệm cho thấy cả ba mô hình đều đạt hiệu suất tốt. Đặc biệt, InceptionV4 thể hiện độ chính xác cao trong phân loại, trong khi Inception-ResNetV2nổibật hơn ở nhiệm vụ truy xuất ảnh. Những kết quả này khẳng định tính ưu việt củacáckiến trúc CNN hiện đại trong việc giải quyết các bài toán thị giác máy tính đối với dữ liệu học thuật. Từ khóa: Phân loại hình ảnh, Truy xuất ảnh tương đồng, Mạng nơ-ron tích chập, InceptionV3, InceptionV4, Inception-ResNetV2. |
Mô tả: | 97 Tr |
Định danh: | https://dspace.ctu.edu.vn/jspui/handle/123456789/121535 |
Bộ sưu tập: | Trường Công nghệ Thông tin & Truyền thông |
Các tập tin trong tài liệu này:
Tập tin | Mô tả | Kích thước | Định dạng | |
---|---|---|---|---|
_file_ Giới hạn truy cập | 5.89 MB | Adobe PDF | ||
Your IP: 216.73.216.3 |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.