XÂY DỰNG CÂU MÔ TẢ CHO HÌNH ẢNH SỬ DỤNG MÔ HÌNH VISION TRANSFORMER VÀ BI-TRANSFORMER

Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/84794

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	Lâm, Nhựt Khang	-
dc.contributor.author	Nguyễn, Thành Huy	-
dc.date.accessioned	2023-01-05T06:58:06Z	-
dc.date.available	2023-01-05T06:58:06Z	-
dc.date.issued	2022	-
dc.identifier.other	B1809239	-
dc.identifier.uri	https://dspace.ctu.edu.vn/jspui/handle/123456789/84794	-
dc.description	38 Tr	vi_VN
dc.description.abstract	Tự động xây dựng câu mô tả cho hình ảnh là một trong những bài toán quan trọng trong lĩnh vực hiểu hình ảnh liên quan đến thị giác máy tính và xử lý ngôn ngữ tự nhiên. Trong luận văn này, mô hình học sâu dựa được sử dụng để tạo câu mô tả cho hình ảnh bằng tiếng Việt. Kiến trúc hợp kết hợp đặc trưng hình ảnh được rút trích tư mô hình Vision Transformer với các câu mô tả đã được mã hóa bằng BiTransformer. Mô hình được huấn luyện trên tập dữ liệu Flickr8k. Kết quả đánh giá mô hình sử dụng tập dữ liệu Flickr8k là BLEU-1: 81.57, BLEU-2: 75.93, BLEU-3: 70.06, BLEU-4: 64.80.	vi_VN
dc.language.iso	vi	vi_VN
dc.publisher	Trường Đại Học Cần Thơ	vi_VN
dc.subject	CÔNG NGHỆ THÔNG TIN	vi_VN
dc.title	XÂY DỰNG CÂU MÔ TẢ CHO HÌNH ẢNH SỬ DỤNG MÔ HÌNH VISION TRANSFORMER VÀ BI-TRANSFORMER	vi_VN
dc.title.alternative	IMAGE CAPTIONING USING VISION TRANSFORMER AND BI-TRANSFORMER	vi_VN
dc.type	Thesis	vi_VN
Appears in Collections:	Trường Công nghệ Thông tin & Truyền thông

Files in This Item:

File	Description	Size	Format
_file_ Restricted Access		1.65 MB	Adobe PDF
Your IP: 216.73.216.197

LRC Digital repo