Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/13360
Title: XÂY DỰNG WEBSITE TÌM KIẾM ẢNH KẾT HỢP ĐẶC TRƯNG ẢNH VÀ VĂN BẢN
Authors: Lê, Thị Phương Dung
Quách, Ánh Hồng
Keywords: KHOA HỌC MÁY TÍNH
Issue Date: 2019
Publisher: Trường Đại Học Cần Thơ
Abstract: Đề tài “Xây dựng website tìm kiếm ảnh kết hợp đặc trưng ảnh và đặc trưng văn bản” thực hiện phân lớp dữ liệu ảnh trên tập dữ liệu. Rút trích đặc trưng ảnh đầu vào bằng giải thuật Histogram Oriented of Gradient (HoG), rút đặc trưng văn bản bằng mô hình Bag Of Word (BoW) và sử dụng mô hình KNN để tính khoảng cách, trả về danh sách kết quả ảnh tương tự. Đề tài chọn giải thuật HoG để trích đặc trưng ảnh vì giải thuật này đơn giản, dễ sử dụng. HoG sử dụng thông tin về sự phân bố của các cường độ gradient (intensity gradient) hoặc của hướng biên (edge directins) để mô tả các đối tượng cục bộ trong ảnh. Chọn mô hình BoW vì đây là thuật toán hỗ trợ xử lý ngôn ngữ tự nhiên khá tốt. Sử dụng giải thuật KNN cũng vì đây là giải thuật đơn giản, phù hợp với quy mô đề tài. Đề tài có 3 chức năng tìm kiếm: tìm kiếm bằng ảnh đầu vào, tìm kiếm bằng từ khóa và tìm kiếm kết hợp cả hai. Nguyên lý hoạt động của đề tài là trích lọc đặc trưng ảnh đầu vào bằng giải thuật HoG sau đó lưu mô hình vào file CSV rồi tiến hành đem phân loại dựa vào giải thuật KNN. Còn về đặc trưng văn bản, hệ thống sẽ trích lọc đặc trưng từ khóa đầu vào sau đó tách từ bằng VnTokenizer, loại bỏ những kí tự đặc biệt sau đó tiếp tục lưu vào file CSV rồi phân loại dựa vào giải thuật KNN. Kết quả trả về sẽ là danh sách các ảnh tương tự với nhau. Dùng phương pháp thống kê tự động để kiểm thử và đánh giá độ tin cậy của hệ thống về 3 phương pháp tìm kiếm. Từ đó rút ra kết luận và hướng phát triển.
Description: 35 Tr
URI: http://dspace.ctu.edu.vn/jspui/handle/123456789/13360
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
1.39 MBAdobe PDF
Your IP: 3.144.102.239


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.