Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://dspace.ctu.edu.vn/jspui/handle/123456789/124232| Nhan đề: | KAGI: CẢI TIẾN PHÂN LỚP ẢNH VĂN HOÁ PHI VẬT THỂ VỚI MẠNG HỌC SÂU ĐỒ THỊ VÀ MÔ HÌNH KAN |
| Nhan đề khác: | KAGI: IMPROVING INTANGIBLE CULTURAL HERITAGE IMAGE CLASSIFICATION THROUGH KAN-ENHANCED GRAPH DEEP LEARNING |
| Tác giả: | Mã, Trường Thành Trần, Hải Nhân |
| Từ khoá: | KHOA HỌC MÁY TÍNH |
| Năm xuất bản: | 2025 |
| Nhà xuất bản: | Trường Đại Học Cần Thơ |
| Tóm tắt: | Trong kỷ nguyên chuyển đổi số, việc tự động phân lớp dữ liệu di sản văn hóa phi vật thể (ICH) đóng vai trò quan trọng trong công tác bảo tồn và quảng bá giá trị văn hóa. Tuy nhiên, các phương pháp CNN truyền thống chỉ khai thác dữ liệu hình ảnh vẫn còn nhiều hạn chế, đặc biệt khi phải xử lý dữ liệu có tính đa phương thức và mức độ tương đồng cao về trang phục, nghi thức cũng như bối cảnh lễ hội. Nhằm khắc phục những hạn chế này, tôi đề xuất một kiến trúc học sâu kết hợp Graph Attention Network trên đồ thị đa phương thức (MGAT) với FastKAN (mạng Kolmogorov–Arnold). Kiến trúc này cho phép khai thác và tích hợp đồng thời ba nguồn dữ liệu gồm hình ảnh, văn bản và âm thanh trong một không gian biểu diễn chung. Kết quả thực nghiệm trên tập dữ liệu ICH thu thập được cho thấy phương pháp đề xuất đạt hiệu quả cao hơn so với các mô hình so sánh, trong đó cấu hình DenseNet121 + MGAT + FastKAN đạt độ chính xác 94.35%. Đồng thời, các mô hình gọn nhẹ như MobileNetV3 Small và ShuffleNetV2 1.0x cũng ghi nhận mức cải thiện trên 8%. Việc tích hợp FastKAN giúp mô hình học được các quan hệ phi tuyến phức tạp hiệu quả hơn so với MLP truyền thống. Bên cạnh đó, đề tài còn xây dựng và triển khai hệ thống web ICH Predictor, hỗ trợ tra cứu và trực quan hóa quy trình phân lớp dữ liệu ICH, góp phần nâng cao khả năng ứng dụng thực tế của mô hình đề xuất. Từ khóa: Di sản văn hóa phi vật thể, Phân loại đa phương thức, Mạng noron đồ thị, MGAT, FastKAN, Học sâu. |
| Mô tả: | 74 Tr |
| Định danh: | https://dspace.ctu.edu.vn/jspui/handle/123456789/124232 |
| Bộ sưu tập: | Trường Công nghệ Thông tin & Truyền thông |
Các tập tin trong tài liệu này:
| Tập tin | Mô tả | Kích thước | Định dạng | |
|---|---|---|---|---|
| _file_ Giới hạn truy cập | 4.27 MB | Adobe PDF | ||
| Your IP: 216.73.216.55 |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.