Please use this identifier to cite or link to this item:
https://dspace.ctu.edu.vn/jspui/handle/123456789/110798
Title: | ỨNG DỤNG TÓM TẮT VĂN BẢN TỪ YOUTUBE VIDEO SỬ DỤNG MÔ HÌNH NGÔN NGỮ LỚN |
Other Titles: | YOUTUBE VIDEO SUMMARIZATION APPLICATION USING LARGE LANGUAGE MODEL |
Authors: | Trần, Minh Tân Dương, Lê Khánh Trình |
Keywords: | CÔNG NGHỆ THÔNG TIN |
Issue Date: | 2024 |
Publisher: | Trường Đại Học Cần Thơ |
Abstract: | Đề tài "Ứng dụng tóm tắt văn bản từ Youtube video sử dụng ngôn ngữ mô hình lớn" tập trung phát triển một hệ thống hỗ trợ người dùng nắm bắt nhanh nội dung của các video dài thông qua việc chuyển đổi âm thanh thành văn bản và tóm tắt thông tin chính. Hệ thống sử dụng công nghệ nhận dạng giọng nói tự động (ASR) để trích xuất nội dung video thành transcript, sau đó áp dụng mô hình ngôn ngữ lớn (LLM) để tóm tắt văn bản. Ứng dụng được triển khai trên nền tảng Streamlit, cung cấp giao diện đơn giản, thân thiện với người dùng,... Mục tiêu chính của đề tài là tiết kiệm thời gian cho người xem video, đồng thời nâng cao khả năng tiếp cận thông tin một cách hiệu quả. Phạm vi nghiên cứu tập trung vào video Youtube, với các kịch bản kiểm thử cho nhiều loại nội dung, độ dài và ngôn ngữ khác nhau. Hệ thống đã được kiểm chứng về độ chính xác, tốc độ xử lý, và tính ổn định. Kết quả đạt được bao gồm một ứng dụng hoàn chỉnh có khả năng trích xuất, xử lý và tóm tắt nội dung video một cách chính xác. Đề tài không chỉ đóng góp vào việc cải thiện trải nghiệm người dùng mà còn mở ra tiềm năng áp dụng công nghệ này trong lĩnh vực giáo dục, nghiên cứu, và giải trí. Trong tương lai, ứng dụng có thể được mở rộng để hỗ trợ nhiều ngôn ngữ hơn. |
Description: | 79 Tr |
URI: | https://dspace.ctu.edu.vn/jspui/handle/123456789/110798 |
Appears in Collections: | Trường Công nghệ Thông tin & Truyền thông |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
_file_ Restricted Access | 3.67 MB | Adobe PDF | ||
Your IP: 3.23.94.64 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.