Please use this identifier to cite or link to this item:
https://dspace.ctu.edu.vn/jspui/handle/123456789/105939
Title: | ADGENDIFF: HỆ THỐNG SINH ẢNH QUẢNG CÁO DỰA TRÊN MÔ TẢ SỬ DỤNG MÔ HÌNH STABLE DIFFUSION |
Other Titles: | DESCRIPTION BASED ADVERTISING IMAGE GENERATION SYSTEM VIA STABLE DIFFUSION MODEL |
Authors: | Mã, Trường Thành Lý, Quốc Vĩ |
Keywords: | KHOA HỌC MÁY TÍNH |
Issue Date: | 2024 |
Publisher: | Trường Đại Học Cần Thơ |
Abstract: | Trong bối cảnh hiện nay, ngành quảng cáo đang phát triển mạnh mẽ nhờ vào sự tiến bộ của công nghệ và sự phổ biến của internet. Việc tiếp cận thông tin ngày càng dễ dàng qua các thiết bị di động và mạng xã hội đã tạo ra một nhu cầu lớn cho hình ảnh quảng cáo độc đáo và thu hút. Điều này đặt ra áp lực lớn đối với các nhà quảng cáo để sáng tạo ra những nội dung ấn tượng và phù hợp với yêu cầu của khách hàng. Trong khi đó, công nghệ trí tuệ nhân tạo, đặc biệt là trong lĩnh vực học sâu, đang phát triển với tốc độ nhanh chóng. Các mô hình sinh ảnh như Stable Diffusion đã mở ra cơ hội mới cho việc tạo ra hình ảnh chất lượng cao một cách tự động từ dữ liệu đầu vào. Sự kết hợp giữa nhu cầu ngày càng cao của thị trường và sức mạnh của trí tuệ nhân tạo đã thúc đẩy sự xuất hiện của AdGenDiff. Đề tài "AdGenDiff: Hệ thống sinh ảnh quảng cáo dựa trên mô tả sử dụng mô hình Stable Diffusion" tập trung vào việc phát triển một framework hoặc hệ thống để tự động tạo ra hình ảnh quảng cáo dựa trên mô tả từ khách hàng. Ý tưởng chính là thu thập ý kiến của khách hàng, tóm tắt yêu cầu, và sau đó sử dụng một mô hình sinh ảnh như Stable Diffusion để tạo ra hình ảnh quảng cáo. Mục tiêu của dự án là tối ưu hóa quá trình tạo ảnh quảng cáo, giảm thiểu chi phí và thời gian, đồng thời đánh giá các ảnh được tạo ra để đảm bảo chất lượng. Đề tài này đặt nặng vào việc giúp đỡ nhà thiết kế trong quá trình tạo ảnh quảng cáo, nhưng vẫn nhấn mạnh vai trò không thể thay thế của con người trong quá trình này. AdGenDiff gồm 4 chức năng chính: Trích đặc trưng và tóm tắt văn bản sử dụng công nghệ của Gemini, Phân đoạn đối tượng bằng cách sử dụng Segment Anything, Sinh ảnh từ mô tả và ảnh đã chọn đối tượng bằng Stable Diffusion, cuối cùng là đánh giá hình ảnh dựa trên mô hình lenet-5. Các mô hình được sử dụng đều là mới ra mắt sớm nhất hiện nay: Gemini 1.5 (4/2024), SD XL 1.0 (2023). Để phục vụ hỗ trợ cho nhà thiết kế có được ấn phẩm mới nhất, tiên tiến nhất. AdGenDiff còn có một mô hình đánh giá được huấn luyện, lựa chọn sau khi thực nghiệm với các kiến trúc khác nhau của mô hình CNN thì nhận thấy độ chính xác của kiến trúc Lenet-5 đạt kết quả có độ chính xác tổng thể với tập kiểm tra từ 98% - 100%. Hơn nữa, đề tài cũng đã đóng góp một Framework chung cho các kiến trúc, mô hình này. Đề tài cũng đã xây dựng được website tích hợp các công cụ kể trên. |
Description: | 75 Tr |
URI: | https://dspace.ctu.edu.vn/jspui/handle/123456789/105939 |
Appears in Collections: | Trường Công nghệ Thông tin & Truyền thông |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
_file_ Restricted Access | 5.04 MB | Adobe PDF | ||
Your IP: 13.59.83.202 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.