Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://dspace.ctu.edu.vn/jspui/handle/123456789/105939
Nhan đề: | ADGENDIFF: HỆ THỐNG SINH ẢNH QUẢNG CÁO DỰA TRÊN MÔ TẢ SỬ DỤNG MÔ HÌNH STABLE DIFFUSION |
Nhan đề khác: | DESCRIPTION BASED ADVERTISING IMAGE GENERATION SYSTEM VIA STABLE DIFFUSION MODEL |
Tác giả: | Mã, Trường Thành Lý, Quốc Vĩ |
Từ khoá: | KHOA HỌC MÁY TÍNH |
Năm xuất bản: | 2024 |
Nhà xuất bản: | Trường Đại Học Cần Thơ |
Tóm tắt: | Trong bối cảnh hiện nay, ngành quảng cáo đang phát triển mạnh mẽ nhờ vào sự tiến bộ của công nghệ và sự phổ biến của internet. Việc tiếp cận thông tin ngày càng dễ dàng qua các thiết bị di động và mạng xã hội đã tạo ra một nhu cầu lớn cho hình ảnh quảng cáo độc đáo và thu hút. Điều này đặt ra áp lực lớn đối với các nhà quảng cáo để sáng tạo ra những nội dung ấn tượng và phù hợp với yêu cầu của khách hàng. Trong khi đó, công nghệ trí tuệ nhân tạo, đặc biệt là trong lĩnh vực học sâu, đang phát triển với tốc độ nhanh chóng. Các mô hình sinh ảnh như Stable Diffusion đã mở ra cơ hội mới cho việc tạo ra hình ảnh chất lượng cao một cách tự động từ dữ liệu đầu vào. Sự kết hợp giữa nhu cầu ngày càng cao của thị trường và sức mạnh của trí tuệ nhân tạo đã thúc đẩy sự xuất hiện của AdGenDiff. Đề tài "AdGenDiff: Hệ thống sinh ảnh quảng cáo dựa trên mô tả sử dụng mô hình Stable Diffusion" tập trung vào việc phát triển một framework hoặc hệ thống để tự động tạo ra hình ảnh quảng cáo dựa trên mô tả từ khách hàng. Ý tưởng chính là thu thập ý kiến của khách hàng, tóm tắt yêu cầu, và sau đó sử dụng một mô hình sinh ảnh như Stable Diffusion để tạo ra hình ảnh quảng cáo. Mục tiêu của dự án là tối ưu hóa quá trình tạo ảnh quảng cáo, giảm thiểu chi phí và thời gian, đồng thời đánh giá các ảnh được tạo ra để đảm bảo chất lượng. Đề tài này đặt nặng vào việc giúp đỡ nhà thiết kế trong quá trình tạo ảnh quảng cáo, nhưng vẫn nhấn mạnh vai trò không thể thay thế của con người trong quá trình này. AdGenDiff gồm 4 chức năng chính: Trích đặc trưng và tóm tắt văn bản sử dụng công nghệ của Gemini, Phân đoạn đối tượng bằng cách sử dụng Segment Anything, Sinh ảnh từ mô tả và ảnh đã chọn đối tượng bằng Stable Diffusion, cuối cùng là đánh giá hình ảnh dựa trên mô hình lenet-5. Các mô hình được sử dụng đều là mới ra mắt sớm nhất hiện nay: Gemini 1.5 (4/2024), SD XL 1.0 (2023). Để phục vụ hỗ trợ cho nhà thiết kế có được ấn phẩm mới nhất, tiên tiến nhất. AdGenDiff còn có một mô hình đánh giá được huấn luyện, lựa chọn sau khi thực nghiệm với các kiến trúc khác nhau của mô hình CNN thì nhận thấy độ chính xác của kiến trúc Lenet-5 đạt kết quả có độ chính xác tổng thể với tập kiểm tra từ 98% - 100%. Hơn nữa, đề tài cũng đã đóng góp một Framework chung cho các kiến trúc, mô hình này. Đề tài cũng đã xây dựng được website tích hợp các công cụ kể trên. |
Mô tả: | 75 Tr |
Định danh: | https://dspace.ctu.edu.vn/jspui/handle/123456789/105939 |
Bộ sưu tập: | Trường Công nghệ Thông tin & Truyền thông |
Các tập tin trong tài liệu này:
Tập tin | Mô tả | Kích thước | Định dạng | |
---|---|---|---|---|
_file_ Giới hạn truy cập | 5.04 MB | Adobe PDF | ||
Your IP: 3.144.227.73 |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.