Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/73963
Title: XÂY DỰNG ỨNG DỤNG TẠO PHỤ ĐỀ CHO VIDEO
Authors: Nguyễn, Thanh Hải
Lê, Ngọc Tài
Nguyễn, Lâm Thanh Tân
Keywords: HỆ THỐNG THÔNG TIN
Issue Date: 2021
Publisher: Trường Đại Học Cần Thơ
Abstract: Trong thời đại dịch Covid 19 đang căng thẳng hiện nay, mọi người đều phải thực hiện cách ly xã hội. Cùng lúc đó thì nhu cầu giải trí thông qua các bộ phim, video được ưa chuộng hơn bao giờ hết. Song song đó thì việc ứng dụng trí tuệ nhân tạo trong lĩnh vực dịch thuật, nhận dạng giọng nói đang phát triển mạnh mẽ với các thành tựu như là ứng dụng nhận dạng giọng nói chuyển thành văn bản dựa trên tệp âm thanh cụ thể. Mặc dù vậy các nghiên cứu thường tập trung vào cải thiện tốc độ xử lý cũng như độ chính xác của từ ngữ được chuyển thành văn bản bên trong tệp âm thanh mà chưa chú trọng việc làm rõ giọng nói bên trong tệp âm thanh (loại bỏ tiếng ồn) để giúp cho việc nhận dạng được thuận lợi và chính xác. Cũng như chưa có công cụ nào có thể tạo ra phụ đề cho video bằng cách tự động, mà chỉ tạo ra phụ đề một cách thủ công dựa vào lấy dấu thời gian và thêm đoạn phụ đề, việc này khá mất thời gian cho những bộ phim hoặc video dài. Vì vậy, đề tài "Ứng dụng tạo phụ đề cho video" được đề xuất nhằm kết hợp việc xử lý âm thanh để giảm tiếng ồn, loại bỏ tạp âm và nhận dạng âm thanh chuyển thành văn bản tạo ra một công cụ tạo phụ đề một cách tự động và có độ chính xác cao. Ứng dụng được xây dựng với các công cụ, ngôn ngữ và công nghệ như: Ngôn ngữ lập trình Python, API Speech to Text, noisereduce và với các thư viện như: Numpy, pyqt5, autosub,... Kết quả đề tài chỉ mang tính thử nghiệm nhằm tạo ra một định hướng nghiên cứu có thể phát triển và triển khai thành các ứng dụng khả thi trong việc tạo ra phụ đề cho các video mà không cần phải làm thủ công.
Description: 88 Tr
URI: https://dspace.ctu.edu.vn/jspui/handle/123456789/73963
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
4.02 MBAdobe PDF
Your IP: 3.147.103.202


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.