Please use this identifier to cite or link to this item:
https://dspace.ctu.edu.vn/jspui/handle/123456789/94831
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Lâm, Nhựt Khang | - |
dc.contributor.author | Ngô, Đức Hiếu | - |
dc.date.accessioned | 2024-01-12T08:39:20Z | - |
dc.date.available | 2024-01-12T08:39:20Z | - |
dc.date.issued | 2023 | - |
dc.identifier.other | B1910223 | - |
dc.identifier.uri | https://dspace.ctu.edu.vn/jspui/handle/123456789/94831 | - |
dc.description | 38 Tr | vi_VN |
dc.description.abstract | Sinh câu mô tả cho hình ảnh là một trong những bài toán quan trọng trong lĩnh vực hiểu hình ảnh liên quan đến thị giác máy tính và xử lý ngôn ngữ tự nhiên. Trong luận văn này, mô hình học sâu dựa được sử dụng để tạo câu mô tả cho hình ảnh tiếng Việt và tiếng Anh. Kiến trúc hợp kết hợp đặc trưng hình ảnh được rút trích từ mô hình CLIP, cùng với các câu mô tả được mã hoá và đặc trựng ảnh đưa vào deep attention kết hợp mô hình GPT kết để sinh câu mô tả cho hình ảnh. Mô hình được huấn luyện trên tập dữ liệu Flickr8k. Kết quả đánh giá mô hình sử dụng tập dữ liệu Flickr8k tiếng Việt BLEU-1: 72.39, BLEU-2: 59.79, BLEU-3: 49.2, BLEU-4: 39.51. Và trên tập dữ liệu Flickr8k tiếng Anh BLEU-1: 73.9 , BLEU-2: 56.69, BLEU-3: 41.54, BLEU-4: 30.57 . | vi_VN |
dc.language.iso | vi | vi_VN |
dc.publisher | Trường Đại Học Cần Thơ | vi_VN |
dc.subject | CÔNG NGHỆ THÔNG TIN | vi_VN |
dc.title | SINH CÂU MÔ TẢ CHO HÌNH ẢNH DỰA TRÊN MÔ HÌNH SMALLCAP VỚI DEEP ATTENTION | vi_VN |
dc.title.alternative | IMAGE CAPTIONING BASED ON SMALLCAP WITH DEEP ATTENTION | vi_VN |
dc.type | Thesis | vi_VN |
Appears in Collections: | Trường Công nghệ Thông tin & Truyền thông |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
_file_ Restricted Access | 2.3 MB | Adobe PDF | ||
Your IP: 18.224.69.47 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.