Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/94831
Title: SINH CÂU MÔ TẢ CHO HÌNH ẢNH DỰA TRÊN MÔ HÌNH SMALLCAP VỚI DEEP ATTENTION
Other Titles: IMAGE CAPTIONING BASED ON SMALLCAP WITH DEEP ATTENTION
Authors: Lâm, Nhựt Khang
Ngô, Đức Hiếu
Keywords: CÔNG NGHỆ THÔNG TIN
Issue Date: 2023
Publisher: Trường Đại Học Cần Thơ
Abstract: Sinh câu mô tả cho hình ảnh là một trong những bài toán quan trọng trong lĩnh vực hiểu hình ảnh liên quan đến thị giác máy tính và xử lý ngôn ngữ tự nhiên. Trong luận văn này, mô hình học sâu dựa được sử dụng để tạo câu mô tả cho hình ảnh tiếng Việt và tiếng Anh. Kiến trúc hợp kết hợp đặc trưng hình ảnh được rút trích từ mô hình CLIP, cùng với các câu mô tả được mã hoá và đặc trựng ảnh đưa vào deep attention kết hợp mô hình GPT kết để sinh câu mô tả cho hình ảnh. Mô hình được huấn luyện trên tập dữ liệu Flickr8k. Kết quả đánh giá mô hình sử dụng tập dữ liệu Flickr8k tiếng Việt BLEU-1: 72.39, BLEU-2: 59.79, BLEU-3: 49.2, BLEU-4: 39.51. Và trên tập dữ liệu Flickr8k tiếng Anh BLEU-1: 73.9 , BLEU-2: 56.69, BLEU-3: 41.54, BLEU-4: 30.57 .
Description: 38 Tr
URI: https://dspace.ctu.edu.vn/jspui/handle/123456789/94831
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
2.3 MBAdobe PDF
Your IP: 3.141.24.134


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.