Please use this identifier to cite or link to this item:
https://dspace.ctu.edu.vn/jspui/handle/123456789/124217Full metadata record
| DC Field | Value | Language |
|---|---|---|
| dc.contributor.advisor | Phạm, Nguyên Khang | - |
| dc.contributor.author | Nguyễn, Dương Kim Anh | - |
| dc.date.accessioned | 2026-01-12T00:51:15Z | - |
| dc.date.available | 2026-01-12T00:51:15Z | - |
| dc.date.issued | 2025 | - |
| dc.identifier.other | B2113326 | - |
| dc.identifier.uri | https://dspace.ctu.edu.vn/jspui/handle/123456789/124217 | - |
| dc.description | 71 Tr | vi_VN |
| dc.description.abstract | Các hệ thống tìm kiếm trên trang thương mại điện tử thời trang thường gặp khó khăn trong việc hiểu ý định phức tạp qua các truy vấn ngôn ngữ tự nhiên. Để giải quyết vấn đề này, luận văn “Thiết kế và triển khai hệ thống biểu diễn đặc trưng văn bản – hình ảnh dựa trên mô hình học sâu cho bài toán tìm kiếm sản phẩm thời trang từ truy vấn văn bản” xây dựng một hệ thống tìm kiếm ngữ nghĩa đa phương thức, có khả năng gợi ý sản phẩm từ mô tả của người dùng. Luận văn đề xuất mô hình CLIPFashion, một kiến trúc đối sánh hình ảnh-văn bản, kết hợp bộ mã hóa văn bản tiếng Việt PhoBERT và so sánh hiệu năng giữa hai bộ mã hóa hình ảnh là Vision Transformer (ViT-B/16) và ResNet-50. Mô hình được huấn luyện trên bộ dữ liệu Fashion Product Images Small (FPISD) gồm 31,112 sản phẩm, thực hiện ánh xạ các cặp hình ảnh-văn bản vào một không gian vector chung để tính toán độ tương đồng. Kết quả thực nghiệm cho thấy biến thể của CLIPFashion sử dụng ViT-B/16 kết hợp tinh chỉnh PhoBERT đạt hiệu năng tốt nhất, với chỉ số MRR là 0.66 và Recall@10 là 88.57% trên 6.223 mẫu thử. Hệ thống sau đó đã được tích hợp vào một website thương mại điện tử. Từ khóa: CLIPFashion, Học đa phương thức, PhoBERT, ResNet-50, Thương mại điện tử, Tìm kiếm ngữ nghĩa, Vision Transformer. | vi_VN |
| dc.language.iso | vi | vi_VN |
| dc.publisher | Trường Đại Học Cần Thơ | vi_VN |
| dc.subject | KHOA HỌC MÁY TÍNH | vi_VN |
| dc.title | THIẾT KẾ VÀ TRIỂN KHAI HỆ THỐNG BIỂU DIỄN ĐẶC TRƯNG VĂN BẢN – HÌNH ẢNH DỰA TRÊN MÔ HÌNH HỌC SÂU CHO BÀI TOÁN TÌM KIẾM SẢN PHẨM THỜI TRANG TỪ TRUY VẤN VĂN BẢN | vi_VN |
| dc.title.alternative | DESIGN AND IMPLEMENTATION OF A DEEP LEARNING–BASED TEXT–IMAGE FEATURE REPRESENTATION SYSTEM FOR FASHION PRODUCT SEARCH FROM TEXT QUERIES | vi_VN |
| dc.type | Thesis | vi_VN |
| Appears in Collections: | Trường Công nghệ Thông tin & Truyền thông | |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| _file_ Restricted Access | 2.65 MB | Adobe PDF | ||
| Your IP: 216.73.216.105 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.