Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://dspace.ctu.edu.vn/jspui/handle/123456789/78035
Toàn bộ biểu ghi siêu dữ liệu
Trường DC | Giá trị | Ngôn ngữ |
---|---|---|
dc.contributor.advisor | Lâm, Nhựt Khang | - |
dc.contributor.author | Ngô, Đình Trường | - |
dc.date.accessioned | 2022-07-04T02:17:14Z | - |
dc.date.available | 2022-07-04T02:17:14Z | - |
dc.date.issued | 2022 | - |
dc.identifier.other | B1607136 | - |
dc.identifier.uri | https://dspace.ctu.edu.vn/jspui/handle/123456789/78035 | - |
dc.description | 39 Tr | vi_VN |
dc.description.abstract | Image captioning, a topic in the field of machine learning, uses image recognition techniques and natural language processing models to generate captions of photos. In this thesis, we perform experiments with several models to automatically create descriptions for images using the ResNet and Transformer models. In particular, the ResNet-50, ResNet-101, and ResNet-152 models, are used to extract image features, which are later used to feed into the Transform or BiTransformer models to generate image captions. We perform experiments on the Flickr8k dataset in English and Vietnamese, and evaluated it using the BLEU metric. The experimental results show that the combination of ResNet-152 and BiTransformer helps achieve better BLEU scores than another one. | vi_VN |
dc.language.iso | en | vi_VN |
dc.publisher | Trường Đại Học Cần Thơ | vi_VN |
dc.subject | CÔNG NGHỆ THÔNG TIN-CHẤT LƯỢNG CAO | vi_VN |
dc.title | IMAGE CAPTIONING USING RESNET AND BI-TRANSFORMER MODELS | vi_VN |
dc.type | Thesis | vi_VN |
Bộ sưu tập: | Trường Công nghệ Thông tin & Truyền thông |
Các tập tin trong tài liệu này:
Tập tin | Mô tả | Kích thước | Định dạng | |
---|---|---|---|---|
_file_ Giới hạn truy cập | 1.25 MB | Adobe PDF | ||
Your IP: 3.133.138.72 |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.