TÌM KIẾM BÀI HÁT KHÔNG LỜI  DỰA VÀO PHÂN TÍCH GIAI ĐIỆU ÂM THANH

Võ, Đan Linh

Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/85130

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	Nguyễn, Thanh Hải	-
dc.contributor.author	Võ, Đan Linh	-
dc.date.accessioned	2023-02-02T02:58:35Z	-
dc.date.available	2023-02-02T02:58:35Z	-
dc.date.issued	2022	-
dc.identifier.other	B1805636	-
dc.identifier.uri	https://dspace.ctu.edu.vn/jspui/handle/123456789/85130	-
dc.description	67 Tr	vi_VN
dc.description.abstract	Ngày nay nhu cầu nghe nhạc để giải trí rất phổ biến ở mọi lứa tuổi. Nhưng đôi khi lại có những bài nhạc không lời rất hay nhưng bạn lại không nhớ tên thì bạn cũng không thể nào mà tìm ra được bài nhạc đó bằng cách tìm kiếm thông thường. Vì vậy đề tài “Tìm kiếm bài hát không lời dựa vào phân tích giai điệu âm thanh” đã được đề xuất để giúp người nghe có thể tìm kiếm được những bài nhạc không lời.. Hệ thống sử dụng thuật toán Approximate Nearest Neighbors để tiền xử lý bài nhạc và trích xuất đặc trưng để lấy được đặc điểm của bài nhạc trong kho bằng cách sử dụng hàm trích xuất đặc trưng MFCC của thư viện python_speech_features. Sau đó dùng thư viện annoy để tạo chỉ mục. Để tìm kiếm bài hát thì ta sẽ số hóa đoạn nhạc, trích dẫn đặc trưng của đoạn nhạc, tải lại chỉ mục đã tạo, thực hiện tìm kiếm trong chỉ mục với các tham số khác nhau của nfilt (độ dài của mỗi MFCC) và f (số chiều của vector), sau cùng là nhập n để in ra danh sách Top bài hát có độ tương tự với đoạn nhạc. Khi kiểm thử thì thấy được kết quả của bài hát được đề xuất ở tỷ lệ lấy mẫu là 16000 có độ chính xác cao hơn tỷ lệ lấy mẫu là 40000 và tốt nhất khi nfilt = 12 với độ chính xác ở Top 1 là 10%, Top 5 là 16,6667% và Top 10 là 20%. Khi kiểm thử với tập dữ liệu train và test 100 bài thì với tỷ lệ lấy mẫu là 16000 thì với tham số nfilt=13 cho kết quả tốt nhất với độ chính xác ở Top 1 là 36%, Top 5 là 41%, Top 10 là 44%. Giải pháp thứ hai là sử dụng mô hình CNN để phân tích hình ảnh sau khi đã chuyển đổi âm thanh thành hình ảnh quang phổ. Sau khi huấn luyện với các mô hình CNN, VGG, Fully Connected Layer, Efficient thì ta đã tìm ra được các kiến trúc nông cho kết quả tốt hơn nhưng gặp vấn đề overfitting khi độ chính xác trên tập train là 100% nhưng chỉ đạt 9% trên tập test nhưng vẫn cần có sự tinh chỉnh siêu tham số phù hợp với các mô hình trên. Sau khi kiểm thử hoàn tất thì chúng được tích hợp vào hệ thống xây dựng trên nền tảng Website, với những công cụ và ngôn ngữ hỗ trợ như: HTML, CSS, Javascript, Python, Flask Framework cho việc xây dựng giao diện web.	vi_VN
dc.language.iso	vi	vi_VN
dc.publisher	Trường Đại Học Cần Thơ	vi_VN
dc.subject	HỆ THỐNG THÔNG TIN	vi_VN
dc.title	TÌM KIẾM BÀI HÁT KHÔNG LỜI DỰA VÀO PHÂN TÍCH GIAI ĐIỆU ÂM THANH	vi_VN
dc.title.alternative	SEARCH SONG WITHOUT LYRICS BASED ON MELODY ANALYSIS	vi_VN
dc.type	Thesis	vi_VN
Appears in Collections:	Trường Công nghệ Thông tin & Truyền thông

Files in This Item:

File	Description	Size	Format
_file_ Restricted Access		1.97 MB	Adobe PDF
Your IP: 18.216.63.102

Show simple item record

LRC Digital repo

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets