PHÁT TRIỂN ỨNG DỤNG SÁCH NÓI TRÊN NỀN TẢNG DI ĐỘNG TÍCH HỢP GENERATIVE AI ĐỂ CHUYỂN ĐỔI VĂN BẢN TỪ ĐA NGUỒN

Phan, Thành Đạt

Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/124467

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	Châu, Xuân Phương	-
dc.contributor.author	Phan, Thành Đạt	-
dc.date.accessioned	2026-01-14T07:34:14Z	-
dc.date.available	2026-01-14T07:34:14Z	-
dc.date.issued	2025	-
dc.identifier.other	B2110119	-
dc.identifier.uri	https://dspace.ctu.edu.vn/jspui/handle/123456789/124467	-
dc.description	165 Tr	vi_VN
dc.description.abstract	Bối cảnh: Trong bối cảnh nội dung số ngày càng phát triển, nhu cầu tiếp thu kiến thức và giải trí thông qua âm thanh đang trở thành một xu hướng tất yếu. Tuy nhiên, người dùng thường xuyên đối mặt với các rào cản như: kho sách nói bản quyền có chi phí cao, nguồn cung hạn chế, và đặc biệt là sự thiếu vắng một công cụ linh hoạt để chuyển đổi các tài liệu văn bản cá nhân (tài liệu học tập, bài báo, truyện ngắn) sang định dạng âm thanh. Thực trạng này tạo ra một khoảng trống trải nghiệm, khi người dùng mong muốn "nghe" mọi thứ nhưng lại bị giới hạn bởi các nền tảng hiện có. Mục tiêu: Đề tài được thực hiện nhằm xây dựng một ứng dụng sách nói thế hệ mới, tạo ra một không gian nghe linh hoạt và không giới hạn. Mục tiêu trọng tâm là giải quyết các thách thức trên bằng cách cung cấp một nền tảng "hai trong một": vừa mang đến một thư viện sách nói có sẵn, vừa tích hợp một hệ thống chuyển đổi thông minh, cho phép người dùng biến bất kỳ văn bản nào thành sách nói chỉ với vài thao tác. Qua đó, ứng dụng hướng đến một hành trình tiếp thu tri thức và giải trí liền mạch, hiệu quả và hoàn toàn cá nhân hóa. Phương pháp: Để hiện thực hóa mục tiêu, một kiến trúc công nghệ hiện đại, dựa trên mô hình Backend-as-a-Service (BaaS) đã được áp dụng. Ứng dụng được phát triển trên nền tảng Flutter, đảm bảo hiệu năng và trải nghiệm đồng nhất trên đa nền tảng. Hệ thống backend được xây dựng hoàn toàn trên Supabase, tận dụng sức mạnh của cơ sở dữ liệu PostgreSQL, dịch vụ xác thực, lưu trữ file và cập nhật thời gian thực. Trọng tâm của dự án là hệ thống xử lý nội dung bất đồng bộ, sử dụng Supabase Edge Functions để điều phối các dịch vụ Trí tuệ nhân tạo (AI) chuyên biệt: Google Gemini (Pro và Vision) được dùng để phân tích, làm giàu nội dung và nhận dạng ký tự quang học (OCR), trong khi Google Cloud Text-to-Speech (TTS) đảm nhiệm việc tổng hợp giọng nói chất lượng cao. Kết quả: Kết quả của đề tài là một ứng dụng di động hoàn chỉnh, vận hành ổn định với các chức năng cốt lõi như quản lý tài khoản, khám phá và tìm kiếm sách, trình phát audio đầy đủ tính năng (điều khiển tốc độ, tua, chuyển bài), và quản lý thư viện. Điểm nổi bật là hệ thống tạo sách nói cá nhân hóa từ đa nguồn (văn bản, file PDF/DOCX, link web, hình ảnh) đã được triển khai thành công. Người dùng có thể dễ dàng tạo ra nội dung âm thanh của riêng mình và nhận kết quả tự động cập nhật trong thư viện nhờ cơ chế real-time, qua đó giải quyết được bài toán trung tâm đã đặt ra. Chức năng tùy chỉnh giọng đọc và quản lý hồ sơ cũng hoạt động hiệu quả, tạo nên một trải nghiệm người dùng thống nhất và toàn diện. xviii Kết luận: Đề tài đã chứng minh tính khả thi của việc xây dựng một nền tảng sách nói linh hoạt, kết hợp giữa nội dung có sẵn và nội dung do người dùng tạo. Đồng thời, đề tài khẳng định giá trị thực tiễn của việc áp dụng các mô hình Generative AI vào việc tự động hóa quá trình sản xuất nội dung âm thanh. Sản phẩm cuối cùng không chỉ đáp ứng tốt các yêu cầu chức năng đã đề ra mà còn tạo dựng một nền tảng vững chắc cho các phát triển nâng cao trong tương lai, như nghe offline và lưu tiến trình, cho thấy tiềm năng ứng dụng to lớn trong lĩnh vực giáo dục và giải trí cá nhân.	vi_VN
dc.language.iso	vi	vi_VN
dc.publisher	Trường Đại Học Cần Thơ	vi_VN
dc.subject	KỸ THUẬT PHẦN MỀM	vi_VN
dc.title	PHÁT TRIỂN ỨNG DỤNG SÁCH NÓI TRÊN NỀN TẢNG DI ĐỘNG TÍCH HỢP GENERATIVE AI ĐỂ CHUYỂN ĐỔI VĂN BẢN TỪ ĐA NGUỒN	vi_VN
dc.title.alternative	DEVELOPING AN AUDIOBOOK APPLICATION ON MOBILE PLATFORMS INTEGRATING GENERATIVE AI FOR TEXT CONVERSION FROM MULTIPLE SOURCES	vi_VN
dc.type	Thesis	vi_VN
Appears in Collections:	Trường Công nghệ Thông tin & Truyền thông

Files in This Item:

File	Description	Size	Format
_file_ Restricted Access		3.74 MB	Adobe PDF
Your IP: 216.73.216.15

Show simple item record

LRC Digital repo

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets