Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://dspace.ctu.edu.vn/jspui/handle/123456789/121863
Nhan đề: | NGHIÊN CỨU PHƯƠNG PHÁP TỰ ĐỘNG PHÁT HIỆN VÀ VÁ LỖI TRONG ẢNH 360 ĐỘ CHO TỐI ƯU HÓA HIỂN THỊ TRÊN NỀN TẢNG WEB |
Nhan đề khác: | RESEARCH METHODS FOR AUTOMATIC DETECTION AND PATCHING OF ERRORS IN 360- DEGREE IMAGES FOR OPTIMIZED DISPLAY ON WEB PLATFORMS |
Tác giả: | Huỳnh, Ngọc Thái Anh Nguyễn, Sơn Lộc |
Từ khoá: | KHOA HỌC MÁY TÍNH |
Năm xuất bản: | 2025 |
Nhà xuất bản: | Trường Đại Học Cần Thơ |
Tóm tắt: | Ảnh 360 độ đang trở thành công nghệ quan trọng trong các lĩnh vực du lịch số, bất động sản và triển lãm trực tuyến, tuy nhiên vẫn đối mặt với nhiều thách thức về chất lượng hình ảnh do lỗi ghép nối và xuất hiện đối tượng không mong muốn. Luận văn này nghiên cứu và phát triển hệ thống phát hiện và vá lỗi trong ảnh 360 độ, nhằm tối ưu hóa chất lượng hiển thị trên nền tảng web. Nghiên cứu triển khai ba phương pháp xử lý chính. Thứ nhất, phương pháp LaMa (Large Mask Inpainting) sử dụng kiến trúc Fast Fourier Convolution để xử lý các vùng lỗi lớn với khả năng học ngữ cảnh toàn cục. Thứ hai, phương pháp DeepFill v1 áp dụng cơ chế Contextual Attention để tái tạo chi tiết bằng cách mượn thông tin từ vùng ảnh lành. Thứ ba, kỹ thuật Human Segmentation được tích hợp để tự động tạo mask, giảm thiểu công sức xử lý thủ công. Cả ba phương pháp được kết hợp trong quy trình xử lý thống nhất từ trích xuất ảnh phối cảnh, cắt mảnh, vá lỗi đến ghép nối hoàn chỉnh. Kết quả thực nghiệm trên 22 ảnh 360 độ cho thấy hệ thống đạt SSIM trung bình 0.9273, PSNR 28.28 dB, S-PSNR 28.73 dB, WS-PSNR 27.85 dB và LPIPS 0.0193, chứng minh hiệu quả cao trong việc phục hồi vùng lỗi. Đánh giá khả năng xóa người cho thấy LaMa (BRISQUE 29.87, NIQE 4.36) vượt trội hơn DeepFill v1 (BRISQUE 30.72, NIQE 4.40) trong việc tạo kết quả tự nhiên. Nghiên cứu đã xây dựng thành công pipeline xử lý hoàn chỉnh và ứng dụng web hiển thị, tạo nền tảng cho việc phát triển tích hợp AI thời gian thực và mở rộng sang video 360 độ trong tương lai. Từ khóa: DeepFill v1, Human Segmentation , LaMa. |
Mô tả: | 80 Tr |
Định danh: | https://dspace.ctu.edu.vn/jspui/handle/123456789/121863 |
Bộ sưu tập: | Trường Công nghệ Thông tin & Truyền thông |
Các tập tin trong tài liệu này:
Tập tin | Mô tả | Kích thước | Định dạng | |
---|---|---|---|---|
_file_ Giới hạn truy cập | 3.52 MB | Adobe PDF | ||
Your IP: 216.73.216.3 |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.