Please use this identifier to cite or link to this item:
https://dspace.ctu.edu.vn/jspui/handle/123456789/86802
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Trương, Quốc Bảo | - |
dc.contributor.author | Lê, Văn Tuấn | - |
dc.contributor.author | Lâm, Mạnh Tường | - |
dc.date.accessioned | 2023-04-27T08:25:08Z | - |
dc.date.available | 2023-04-27T08:25:08Z | - |
dc.date.issued | 2022-05 | - |
dc.identifier.uri | https://dspace.ctu.edu.vn/jspui/handle/123456789/86802 | - |
dc.description | 71 trang | vi_VN |
dc.description.abstract | Ngày nay, logo không những xem là thương hiệu gắn liền với doanh nghiệp mà còn có nhiều ý nghĩa khác. Vì vậy, nhận dạng logo là bài toán rất được quan tâm. Luận văn này sẽ trình bài một phương pháp nhận dạng logo dựa trên kiến trúc mạng học sâu sử dụng mô hình YOLOv5 (You only look once version 5). Thay vì sử dụng mô hình tiếp cận kiểu RCNN hoặc biến thể Fast RCNN, chúng tôi đã cải tiến mạng học sâu YOLO để dò tìm vùng logo đồng thời xác định được vị trí của vật thể trong ảnh mẫu đầu vào. Cải tiến chính trong YOLO là tích hợp toàn bộ quá trình phát hiện và phân loại đối tượng trong một mạng duy nhất thay vì trích xuất các tính năng và khu vực riêng biệt. Qua kết quả được thực nghiệm, chúng tôi thấy rằng phương pháp này đạt được độ chính xác cao. Hơn nữa, phương pháp đề xuất được được đánh giá đơn giản, hiệu quả và có tốc độ thực hiện nhanh, phù hợp với các hệ thống nhận dạng logo yêu cầu tính thời gian thực. Kết quả thực nghiệm trên với 4000 hình ảnh huấn luyện, nhận dạng với 4 loại nhãn hiệu khác nhau, đạt tỷ lệ huấn luyện 80% và tỷ lệ nhận dạng 70%. Chương trình chạy trên hệ điều hành Window 11 với tốc độ nhận dạng đạt 0.852ms với 1 frame ảnh trên cấu hình phần cứng xử lý với CPU Intel Core I7 2.8GHz, 8.00GB (RAM). KT điều khiển và tự động hóa, Logo, Phát hiện đối tượng, nhận dạng đối tượng, mạng học sâu, YOLOv5, Fast RCNN | vi_VN |
dc.description.tableofcontents | Lời cảm tạ i Tóm tắt ii Abstract .iii Lời cam đoan .iv Danh mục hình .viii Danh mục từ viết tắt .xi Danh mục bảng xii Chương 1: Giới thiệu về YOLO 1 1.1 Lý do chọn đề tài 1 1.2 Mục đích nghiên cứu 2 1.3 Giới hạn đề tài 2 1.4 Phương pháp nghiên cứu 3 1.5 Ý nghĩa khoa học và thực tiễn đề tài 3 1.6 Bố cục của luận văn 3 Chương 2: Cơ sở lý thuyết 4 2.1 Tổng quan về YOLO 5 2.2 Lịch sử phát triển các phiên bản YOLO 5 2.3.1 YOLOv1 5 2.2.1.1 Ô lưới 5 2.2.1.2 Hàm mất mát 7 2.2.1.3 Localization loss 7 2.2.1.4 Confidence loss 8 2.2.1.5 Classification loss 8 2.2.1.6 Inference:Non-maximal suppression 8 2.2.1.7 Lợi ích của YOLO 9 2.2.1.8 Khuyết điểm của YOLO 9 2.3.2 YOLOv2 10 2.2.2.1 Anchor Boxes 10 2.2.2.2 K-mean clustering cho Anchor 12 2.2.2.3 Direct Location problem 12 2.2.2.4 Các tính năng hạt mịn 13 2.2.2.5 Multi-Scale Training 14 2.2.2.6 Darknet 15 2.2.2.7 Training YOLO 17 2.2.2.8 Classification 17 2.2.2.9 Phân loại phân cấp 18 2.3.3 YOLOv3 19 2.3.4 YOLOv4 22 2.3.5 YOLOv5 24 2.2.5.1 Cấu trúc 27 2.2.5.2 Cải tiến của YOLOv5 28 Chương 3: Thiết kế hệ thống 29 3.1 Môi trường và công cụ sử dụng 29 3.1.1 Môi trường 29 3.1.2 Công cụ 30 3.2 Sử dụng YOLO để giải bài toán nhận diện đối tượng Logo 30 3.2.1 Thuật toán của bài toán 30 3.3 Đào tạo YOLO để phát hiện Logo 30 3.3.1 Giới thiệu bài toán 30 3.3.2 Các bước cài đặt và phát triển 31 3.3.3 Gán nhãn dữ liệu 31 3.3.4 Chuẩn bị mã nguồn và file cấu hình YOLOv5 38 3.4 Train model YOLOv5 trên Colab 40 Chương 4: Kết quả thực hiện 46 4.1 Các bước chạy trên PyCharm 46 4.2 Kết quả nhận diện ảnh 50 4.2.1 Nhận diện hình ảnh chứa một Logo 50 4.2.2 Ý nghĩa của kết quả Detection 50 4.2.3 Nhận diện với nhiều Logo 53 4.2.4 Nhận xét với ảnh không rõ nét 55 4.2.5 Nhận xét nhận diện ảnh 61 4.3 Kết quả nhận diện video 61 4.3.1 Nhận diện qua video 61 4.3.2 Nhận diện video với độ phân giải thấp 63 4.3.3 Nhận xét nhận diện video 65 4.4 Cải tiến trên YOLOv5 66 4.5 Đánh giá kết quả kiểm thử 68 Chương 5: Kết luận và kiến nghị 69 5.1 Kết luận 69 5.2 Hướng phát triển 69 Tài liệu tham khảo 70 Phụ lục 71 | vi_VN |
dc.language.iso | vi | vi_VN |
dc.publisher | Trường Đại Học Cần Thơ | vi_VN |
dc.title | TRADEMARK LOGO RECOGNITION USING YOLOv5 | vi_VN |
dc.type | Thesis | vi_VN |
Appears in Collections: | Trường Bách khoa |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
_file_ Restricted Access | 5.03 MB | Adobe PDF | ||
Your IP: 3.145.161.199 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.