Please use this identifier to cite or link to this item:
https://dspace.ctu.edu.vn/jspui/handle/123456789/94091
Title: | CÁC PHƯƠNG PHÁP TÌM KIẾM NHẠC CÓ LỜI |
Other Titles: | METHODS FOR SEARCHING SONG WITH LYRICS |
Authors: | Nguyễn, Thanh Hải Võ, Huỳnh Đức |
Keywords: | HỆ THỐNG THÔNG TIN |
Issue Date: | 2023 |
Publisher: | Trường Đại Học Cần Thơ |
Abstract: | Trong thời kì công nghệ thông tin phát triển ở hầu hết các lĩnh vực thì âm nhạc cũng phát triển một cách nhanh chóng và đa dạng nhiều thể loại. Với số lượng bài hát đang ngày càng nhiều thì việc tìm kiếm một bản nhạc yêu thích càng trở nên khó khăn khi chúng ta không thể nhớ rõ tên hay thể loại của bài hát đó, chính vì thế đề tài “Các phương pháp tìm kiếm nhạc có lời ” đã được nghiên cứu và ứng dụng vào việc tìm kiếm bài hát có lời, đây là phương pháp nghiên cứu nhằm tìm hay dựa trên việc phân tích đặc trưng của một đoạn nhạc audio có lời hoặc phân tích dữ liệu về từ khóa (lời bài hát) do người dùng cung cấp. Cụ thể hơn, đề tài này nghiên cứu dựa trên 3 phương pháp như sau: Phương pháp thứ nhất sử dụng Google API với thư viện speech recognition để xuất ra văn bản từ đoạn audio mà người dùng đưa vào hoặc có thể nhập trực tiếp văn bản vào để tìm kiếm. Sau đó áp dụng cấu trúc “Inverted Index” để xử lý, lưu trữ các đoạn văn bản lời bài hát gốc. Đây là một thành phần quan trọng trong việc tìm kiếm lời bài hát có độ tương đồng với văn bản lời bài hát gốc đã thu thập trước đó. Phương pháp thứ hai trích xuất âm thanh đặc trưng MFCC (Mel Frequency Cepstral Coefficients) phương pháp này sử dụng các thư viện Librosa, python_speech_features đây là 2 thư viện quan trọng để xử lý tín hiệu âm thanh của đoạn audio người dùng cung cấp và áp dụng thuật toán Approximate Nearest Neighbors (ANN) để hỗ trợ tìm kiếm lân cận cho kết quả chính xác cao. Phương pháp thứ ba là phương pháp vân tay âm thanh (Audio Fingerprint) phương pháp này dùng để nhận biết và phân loại các đoạn âm thanh. Hoạt động bằng cách chuyển đổi tính hiệu âm thanh thành dạng chuỗi dữ liệu duy nhất hay còn gọi là hàm băm (hash). Các dữ liệu này có thể là tần số, âm lượng hoặc các thông số khác, sau đó được lưu trữ trong cơ sở dữ liệu kèm theo thông tin về tên bài hát, ID, tên ca sĩ. Những kết quả của nghiên cứu này mang tính chất thử nghiệm nhằm mục đích góp phần vào việc áp dụng các phương pháp tìm kiếm, các kỹ thuật xử lý ngôn ngữ tự nhiên cũng như xử lý âm thanh. Nghiên cứu hỗ trợ phần nào trong việc nâng cao chất lượng tìm kiếm giúp trải nghiệm của người dùng trở nên tốt hơn khi nghe nhạc. |
Description: | 139 Tr |
URI: | https://dspace.ctu.edu.vn/jspui/handle/123456789/94091 |
Appears in Collections: | Trường Công nghệ Thông tin & Truyền thông |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
_file_ Restricted Access | 2.46 MB | Adobe PDF | ||
Your IP: 52.14.66.242 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.