Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/84794
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorLâm, Nhựt Khang-
dc.contributor.authorNguyễn, Thành Huy-
dc.date.accessioned2023-01-05T06:58:06Z-
dc.date.available2023-01-05T06:58:06Z-
dc.date.issued2022-
dc.identifier.otherB1809239-
dc.identifier.urihttps://dspace.ctu.edu.vn/jspui/handle/123456789/84794-
dc.description38 Trvi_VN
dc.description.abstractTự động xây dựng câu mô tả cho hình ảnh là một trong những bài toán quan trọng trong lĩnh vực hiểu hình ảnh liên quan đến thị giác máy tính và xử lý ngôn ngữ tự nhiên. Trong luận văn này, mô hình học sâu dựa được sử dụng để tạo câu mô tả cho hình ảnh bằng tiếng Việt. Kiến trúc hợp kết hợp đặc trưng hình ảnh được rút trích tư mô hình Vision Transformer với các câu mô tả đã được mã hóa bằng BiTransformer. Mô hình được huấn luyện trên tập dữ liệu Flickr8k. Kết quả đánh giá mô hình sử dụng tập dữ liệu Flickr8k là BLEU-1: 81.57, BLEU-2: 75.93, BLEU-3: 70.06, BLEU-4: 64.80.vi_VN
dc.language.isovivi_VN
dc.publisherTrường Đại Học Cần Thơvi_VN
dc.subjectCÔNG NGHỆ THÔNG TINvi_VN
dc.titleXÂY DỰNG CÂU MÔ TẢ CHO HÌNH ẢNH SỬ DỤNG MÔ HÌNH VISION TRANSFORMER VÀ BI-TRANSFORMERvi_VN
dc.title.alternativeIMAGE CAPTIONING USING VISION TRANSFORMER AND BI-TRANSFORMERvi_VN
dc.typeThesisvi_VN
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
1.65 MBAdobe PDF
Your IP: 18.226.181.57


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.