THIẾT KẾ VÀ TRIỂN KHAI HỆ THỐNG BIỂU DIỄN ĐẶC TRƯNG VĂN BẢN – HÌNH ẢNH DỰA TRÊN MÔ HÌNH HỌC SÂU CHO BÀI TOÁN TÌM KIẾM SẢN PHẨM THỜI TRANG TỪ TRUY VẤN VĂN BẢN

Nguyễn, Dương Kim Anh

Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/124217

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	Phạm, Nguyên Khang	-
dc.contributor.author	Nguyễn, Dương Kim Anh	-
dc.date.accessioned	2026-01-12T00:51:15Z	-
dc.date.available	2026-01-12T00:51:15Z	-
dc.date.issued	2025	-
dc.identifier.other	B2113326	-
dc.identifier.uri	https://dspace.ctu.edu.vn/jspui/handle/123456789/124217	-
dc.description	71 Tr	vi_VN
dc.description.abstract	Các hệ thống tìm kiếm trên trang thương mại điện tử thời trang thường gặp khó khăn trong việc hiểu ý định phức tạp qua các truy vấn ngôn ngữ tự nhiên. Để giải quyết vấn đề này, luận văn “Thiết kế và triển khai hệ thống biểu diễn đặc trưng văn bản – hình ảnh dựa trên mô hình học sâu cho bài toán tìm kiếm sản phẩm thời trang từ truy vấn văn bản” xây dựng một hệ thống tìm kiếm ngữ nghĩa đa phương thức, có khả năng gợi ý sản phẩm từ mô tả của người dùng. Luận văn đề xuất mô hình CLIPFashion, một kiến trúc đối sánh hình ảnh-văn bản, kết hợp bộ mã hóa văn bản tiếng Việt PhoBERT và so sánh hiệu năng giữa hai bộ mã hóa hình ảnh là Vision Transformer (ViT-B/16) và ResNet-50. Mô hình được huấn luyện trên bộ dữ liệu Fashion Product Images Small (FPISD) gồm 31,112 sản phẩm, thực hiện ánh xạ các cặp hình ảnh-văn bản vào một không gian vector chung để tính toán độ tương đồng. Kết quả thực nghiệm cho thấy biến thể của CLIPFashion sử dụng ViT-B/16 kết hợp tinh chỉnh PhoBERT đạt hiệu năng tốt nhất, với chỉ số MRR là 0.66 và Recall@10 là 88.57% trên 6.223 mẫu thử. Hệ thống sau đó đã được tích hợp vào một website thương mại điện tử. Từ khóa: CLIPFashion, Học đa phương thức, PhoBERT, ResNet-50, Thương mại điện tử, Tìm kiếm ngữ nghĩa, Vision Transformer.	vi_VN
dc.language.iso	vi	vi_VN
dc.publisher	Trường Đại Học Cần Thơ	vi_VN
dc.subject	KHOA HỌC MÁY TÍNH	vi_VN
dc.title	THIẾT KẾ VÀ TRIỂN KHAI HỆ THỐNG BIỂU DIỄN ĐẶC TRƯNG VĂN BẢN – HÌNH ẢNH DỰA TRÊN MÔ HÌNH HỌC SÂU CHO BÀI TOÁN TÌM KIẾM SẢN PHẨM THỜI TRANG TỪ TRUY VẤN VĂN BẢN	vi_VN
dc.title.alternative	DESIGN AND IMPLEMENTATION OF A DEEP LEARNING–BASED TEXT–IMAGE FEATURE REPRESENTATION SYSTEM FOR FASHION PRODUCT SEARCH FROM TEXT QUERIES	vi_VN
dc.type	Thesis	vi_VN
Appears in Collections:	Trường Công nghệ Thông tin & Truyền thông

Files in This Item:

File	Description	Size	Format
_file_ Restricted Access		2.65 MB	Adobe PDF
Your IP: 216.73.216.15

Show simple item record

LRC Digital repo

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets