XÂY DỰNG CÂU MÔ TẢ CHO HÌNH ẢNH SỬ DỤNG MÔ HÌNH VISION TRANSFORMER VÀ BI-TRANSFORMER

Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: https://dspace.ctu.edu.vn/jspui/handle/123456789/84794

Nhan đề:	XÂY DỰNG CÂU MÔ TẢ CHO HÌNH ẢNH SỬ DỤNG MÔ HÌNH VISION TRANSFORMER VÀ BI-TRANSFORMER
Nhan đề khác:	IMAGE CAPTIONING USING VISION TRANSFORMER AND BI-TRANSFORMER
Tác giả:	Lâm, Nhựt Khang Nguyễn, Thành Huy
Từ khoá:	CÔNG NGHỆ THÔNG TIN
Năm xuất bản:	2022
Nhà xuất bản:	Trường Đại Học Cần Thơ
Tóm tắt:	Tự động xây dựng câu mô tả cho hình ảnh là một trong những bài toán quan trọng trong lĩnh vực hiểu hình ảnh liên quan đến thị giác máy tính và xử lý ngôn ngữ tự nhiên. Trong luận văn này, mô hình học sâu dựa được sử dụng để tạo câu mô tả cho hình ảnh bằng tiếng Việt. Kiến trúc hợp kết hợp đặc trưng hình ảnh được rút trích tư mô hình Vision Transformer với các câu mô tả đã được mã hóa bằng BiTransformer. Mô hình được huấn luyện trên tập dữ liệu Flickr8k. Kết quả đánh giá mô hình sử dụng tập dữ liệu Flickr8k là BLEU-1: 81.57, BLEU-2: 75.93, BLEU-3: 70.06, BLEU-4: 64.80.
Mô tả:	38 Tr
Định danh:	https://dspace.ctu.edu.vn/jspui/handle/123456789/84794
Bộ sưu tập:	Trường Công nghệ Thông tin & Truyền thông

Các tập tin trong tài liệu này:

Tập tin	Mô tả	Kích thước	Định dạng
_file_ Giới hạn truy cập		1.65 MB	Adobe PDF
Your IP: 216.73.216.197

Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.

LRC Digital repo