Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://dspace.ctu.edu.vn/jspui/handle/123456789/75326
Nhan đề: | TẠO CÂU MÔ TẢ CHO HÌNH ẢNH VỚI MÔ HÌNH RESNET-50 VÀ TRANSFORMER |
Nhan đề khác: | IMAGE DESCRIPTION GENERATING USING RESNET-50 AND TRANSFORMER MODELS |
Tác giả: | Lâm, Nhựt Khang Nguyễn, Lam Anh |
Từ khoá: | CÔNG NGHỆ THÔNG TIN |
Năm xuất bản: | 2021 |
Nhà xuất bản: | Trường Đại Học Cần Thơ |
Tóm tắt: | Phát hiện đối tượng, trích xuất được đặc trưng từ ảnh sau đó tạo câu chú thích cho hình ảnh là một trong những tác vụ khó trong việc kết hợp thị giác máy tính và xử lý ngôn ngữ tự nhiên. Những phương pháp tiếp cận chính để giải quyết bài toán dựa trên kiến trúc bộ mã hóa – giải mã (Encoder – Decoder) bao gồm Merge Architecture và Inject Architecture. Trong luận án này, mô hình được lựa chọn để triển khai dựa trên Merge Architecture. Kiến trúc này tách biệt phần mô hình hóa hình ảnh đầu vào, sau đó là các câu chú thích và tổng hợp lại các đầu vào đã được mã hóa. Mô hình tạo câu mô tả cho hình ảnh dựa trên kiến trúc Transformer nhiều lớp, trích xuất hình ảnh bằng cách sử dụng ResNet-50 và tạo chú thích nhờ mô hình Transformer sau khi đã xử lý tập câu mô tả qua mô hình nhúng từ tiếng Việt PhoBERT. Kết quả thử nghiệm được kiểm tra trên tập Flickr8k bằng tiếng Việt. Cuối cùng, mô hình sử dụng chỉ số BLEU score để đánh giá độ chính xác của câu dự đoán dựa trên câu mô tả gốc. |
Mô tả: | 42 Tr |
Định danh: | https://dspace.ctu.edu.vn/jspui/handle/123456789/75326 |
Bộ sưu tập: | Trường Công nghệ Thông tin & Truyền thông |
Các tập tin trong tài liệu này:
Tập tin | Mô tả | Kích thước | Định dạng | |
---|---|---|---|---|
_file_ Giới hạn truy cập | 1.5 MB | Adobe PDF | ||
Your IP: 18.118.119.146 |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.