Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/124217
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorPhạm, Nguyên Khang-
dc.contributor.authorNguyễn, Dương Kim Anh-
dc.date.accessioned2026-01-12T00:51:15Z-
dc.date.available2026-01-12T00:51:15Z-
dc.date.issued2025-
dc.identifier.otherB2113326-
dc.identifier.urihttps://dspace.ctu.edu.vn/jspui/handle/123456789/124217-
dc.description71 Trvi_VN
dc.description.abstractCác hệ thống tìm kiếm trên trang thương mại điện tử thời trang thường gặp khó khăn trong việc hiểu ý định phức tạp qua các truy vấn ngôn ngữ tự nhiên. Để giải quyết vấn đề này, luận văn “Thiết kế và triển khai hệ thống biểu diễn đặc trưng văn bản – hình ảnh dựa trên mô hình học sâu cho bài toán tìm kiếm sản phẩm thời trang từ truy vấn văn bản” xây dựng một hệ thống tìm kiếm ngữ nghĩa đa phương thức, có khả năng gợi ý sản phẩm từ mô tả của người dùng. Luận văn đề xuất mô hình CLIPFashion, một kiến trúc đối sánh hình ảnh-văn bản, kết hợp bộ mã hóa văn bản tiếng Việt PhoBERT và so sánh hiệu năng giữa hai bộ mã hóa hình ảnh là Vision Transformer (ViT-B/16) và ResNet-50. Mô hình được huấn luyện trên bộ dữ liệu Fashion Product Images Small (FPISD) gồm 31,112 sản phẩm, thực hiện ánh xạ các cặp hình ảnh-văn bản vào một không gian vector chung để tính toán độ tương đồng. Kết quả thực nghiệm cho thấy biến thể của CLIPFashion sử dụng ViT-B/16 kết hợp tinh chỉnh PhoBERT đạt hiệu năng tốt nhất, với chỉ số MRR là 0.66 và Recall@10 là 88.57% trên 6.223 mẫu thử. Hệ thống sau đó đã được tích hợp vào một website thương mại điện tử. Từ khóa: CLIPFashion, Học đa phương thức, PhoBERT, ResNet-50, Thương mại điện tử, Tìm kiếm ngữ nghĩa, Vision Transformer.vi_VN
dc.language.isovivi_VN
dc.publisherTrường Đại Học Cần Thơvi_VN
dc.subjectKHOA HỌC MÁY TÍNHvi_VN
dc.titleTHIẾT KẾ VÀ TRIỂN KHAI HỆ THỐNG BIỂU DIỄN ĐẶC TRƯNG VĂN BẢN – HÌNH ẢNH DỰA TRÊN MÔ HÌNH HỌC SÂU CHO BÀI TOÁN TÌM KIẾM SẢN PHẨM THỜI TRANG TỪ TRUY VẤN VĂN BẢNvi_VN
dc.title.alternativeDESIGN AND IMPLEMENTATION OF A DEEP LEARNING–BASED TEXT–IMAGE FEATURE REPRESENTATION SYSTEM FOR FASHION PRODUCT SEARCH FROM TEXT QUERIESvi_VN
dc.typeThesisvi_VN
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
2.65 MBAdobe PDF
Your IP: 216.73.216.105


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.