Please use this identifier to cite or link to this item:
https://dspace.ctu.edu.vn/jspui/handle/123456789/127491| Title: | CHUYỂN ĐỔI ẢNHCHỤPTHÀNH TÁC PHẨMNGHỆTHUẬT |
| Other Titles: | PHOTO-TO-ART STYLE TRANSFORMATION |
| Authors: | Huỳnh, Ngọc Thái Anh Nguyễn, Lê Tấn Thành |
| Keywords: | KHOA HỌC MÁY TÍNH |
| Issue Date: | 2026 |
| Publisher: | Đại Học Cần Thơ |
| Abstract: | Đề tài tập trung nghiên cứu lĩnh vực chuyển đổi phong cách ảnh nghệ thuật nhằm giải quyết thách thức về sự cân bằng giữa chất lượng thẩm mỹ và tốc độ xử lý trong các mô hình học sâu hiện nay. Mục tiêu chính của nghiên cứu là thiết kế và huấn luyện mô hình NST chất lượng dựa trên kiến trúc mạng VGG-19. Đầu vào là ảnh có kích thước 512 x 512 và thực hiện đánh giá hiệu năng dựa trên các thước đo khoa học định lượng như SSIM và PSNR. Quy trình thực hiện được triển khai hệ thống từ bước khảo cứu lý thuyết về ma trận Gram và các hàm mất mát, đến việc thực nghiệm trên nhiều mô hình như Gatys, FastNST, Multi-Style, AdaIN. Từ đó đề xuất một mô hình kết hợp giữa Gatys và AdaIN nhằm cải thiện các nhược điểm của các mô hình trên như thời gian xử lý, linh hoạt thay đổi giữa nhiều phong cách hoặc sự chi tiết vủa nét vẽ. Kết quả nghiên cứu không chỉ dừng lại ở các phân tích dữ liệu mà còn được hiện thực hóa thông qua một ứng dụng minh họa trực quan. Cho phép người dùng tùy chỉnh tham số và tích hợp chức năng ghi lại quá trình sáng tạo dưới dạng video góp phần hoàn thiện quy trình từ nghiên cứu lý thuyết đến ứng dụng thực tiễn. This research focuses on the field of Neural Style Transfer (NST), aiming to address the critical challenge of balancing aesthetic quality and processing efficiency in contemporary deep learning models. The primary objective of the study is to design and train a high-quality NST model based on the VGG-19 network architecture. The research utilizes input images with a resolution of 512 x 512 pixels and conducts performance evaluations using quantitative scientific metrics, specifically the Structural Similarity Index (SSIM) and Peak Signal-to-Noise Ratio (PSNR). The methodology is systematically implemented, beginning with a theoretical investigation of Gram matrices and loss functions, followed by extensive experimentation across various baseline models, including Gatys, FastNST, Multi-Style, and AdaIN. Based on these findings, the study proposes a hybrid model combining the strengths of Gatys and AdaIN to overcome existing limitations such as long processing times, lack of multi-style flexibility, and insufficient brushstroke detailing. The results of this research extend beyond data analysis and are materialized through a visual demonstration application. This application allows users to customize hyperparameters and integrates a feature to record the creative process in video format, thereby completing the workflow from theoretical research to practical implementation. |
| Description: | 65 Tr |
| URI: | https://dspace.ctu.edu.vn/jspui/handle/123456789/127491 |
| Appears in Collections: | Trường Công nghệ Thông tin & Truyền thông |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| _file_ Restricted Access | 5.63 MB | Adobe PDF | ||
| Your IP: 216.73.217.127 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.