Please use this identifier to cite or link to this item:
https://dspace.ctu.edu.vn/jspui/handle/123456789/121249| Title: | XÂY DỰNG HỆ THỐNG PHÂN LOẠI VÀ TRUY XUẤT ẢNH TƯƠNG ĐỒNG TRONG NGUỒN HỌC LIỆU SỐ SỬ DỤNG CÁC MÔ HÌNH HỌC SÂU RESNET101, EFFICIENTNETB0 VÀ MOBILENETV2 |
| Other Titles: | BUILDING A SYSTEM FOR CLASSIFYING AND RETRIEVING SIMILAR IMAGES IN DIGITAL LEARNING RESOURCES USING DEEP LEARNING MODELS RESNET101, EFFICIENTNETB0 AND MOBILENETV2 |
| Authors: | Trần, Thanh Điện Nguyễn, Hoàng Anh |
| Keywords: | HỆ THỐNG THÔNG TIN |
| Issue Date: | 2025 |
| Publisher: | Trường Đại Học Cần Thơ |
| Abstract: | Đề tài tập trung nghiên cứu và ứng dụng các mô hình học sâu vào bài toán phân loại và truy xuất ảnh tương đồng trong nguồn học liệu số. Cụ thể, ba mô hình học sâu gồm ResNet101, EfficientNetB0 và MobileNetV2 đã được lựa chọn để so sánh hiệu quả trong việc nhận diện và tìm kiếm ảnh có nội dung tương tự. Các mô hình được sử dụng ở dạng đã huấn luyện trước (pre-trained), kết hợp với quá trình huấn luyện lại (fine-tuning) trên tập dữ liệu chuyên biệt gồm 4.303 hình ảnh thuộc 11 lớp, được trích xuất từ các bài báo khoa học trong Tạp chí Khoa học Trường Đại học Cần Thơ thông qua thư viện PyMuPDF. Để nâng cao hiệu quả huấn luyện, đề tài đã áp dụng các kỹ thuật tăng cường dữ liệu (data augmentation) nhằm làm phong phú dữ liệu đầu vào và tăng khả năng tổng quát của mô hình. Đồng thời, quá trình huấn luyện các mô hình cũng được tối ưu hóa thông qua Grid Search, giúp tìm ra tổ hợp siêu tham số phù hợp nhất với từng mô hình nhằm cải thiện hiệu suất phân loại và độ ổn định trong quá trình huấn luyện. Các ảnh sau khi được xử lý và gán nhãn được lưu trữ kèm theo thông tin mô tả, tạo thành cơ sở dữ liệu phục vụ cho cả hai tác vụ: phân loại ảnh và truy xuất ảnh tương đồng. Sau khi huấn luyện, các mô hình được sử dụng để trích xuất đặc trưng ảnh và tính toán độ tương đồng dựa trên độ đo cosine. Ngoài ra, công cụ Faiss cũng được tích hợp nhằm tăng tốc độ truy vấn ảnh, đặc biệt hữu ích khi làm việc với tập dữ liệu lớn. Kết quả thực nghiệm cho thấy mô hình ResNet101 đạt hiệu suất cao nhất về độ chính xác phân loại và độ tin cậy trong truy xuất ảnh tương đồng. Hai mô hình còn lại, EfficientNetB0 và MobileNetV2, tuy có hiệu suất thấp hơn nhưng lại có ưu điểm về tốc độ xử lý và khả năng triển khai trên các thiết bị có tài nguyên hạn chế. Hệ thống còn được phát triển kèm giao diện người dùng trực quan, cho phép kiểm thử và đánh giá hiệu quả truy xuất một cách thuận tiện và trực tiếp trên dữ liệu thực tế. Những kết quả đạt được từ đề tài cho thấy tiềm năng của việc ứng dụng học sâu vào việc khai thác, tổ chức và truy xuất học liệu số dựa trên thông tin hình ảnh. Đồng thời, đây cũng là tiền đề cho các hướng nghiên cứu mở rộng trong tương lai nhằm nâng cao chất lượng học tập, nghiên cứu và tìm kiếm tri thức trong kho tài liệu học thuật. Từ khóa: Bài báo khoa học, Học sâu, Phân loại hình ảnh, Trích xuất đặc trưng, Truy xuất hình ảnh, Faiss. |
| Description: | 90 Tr |
| URI: | https://dspace.ctu.edu.vn/jspui/handle/123456789/121249 |
| Appears in Collections: | Trường Công nghệ Thông tin & Truyền thông |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| _file_ Restricted Access | 6.88 MB | Adobe PDF | ||
| Your IP: 216.73.216.134 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.