TÌM KIẾM NHẠC KHÔNG LỜI SỬ DỤNG CÁC PHƯƠNG PHÁP TRỰC QUAN PHỔ TẦN SỐ VÀ MẠNG NƠ-RON TÍCH CHẬP

Lê, Anh Tuấn

Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/94208

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	Nguyễn, Thanh Hải	-
dc.contributor.author	Lê, Anh Tuấn	-
dc.date.accessioned	2024-01-04T00:29:15Z	-
dc.date.available	2024-01-04T00:29:15Z	-
dc.date.issued	2023	-
dc.identifier.other	B1906362	-
dc.identifier.uri	https://dspace.ctu.edu.vn/jspui/handle/123456789/94208	-
dc.description	71 Tr	vi_VN
dc.description.abstract	Trong thời đại công nghệ thông tin phát triển nhanh chóng và cuộc sống ngày càng hiện đại, nhu cầu giải trí trở nên cần thiết hơn, đặc biệt là trong lĩnh vực thưởng thức âm nhạc. Việc đang tìm kiếm một bài hát là một điều cần thiết, bên cạnh đó bản quyền bài hát cũng là điều đáng quan tâm. Vì vậy, việc nhận diện một bài hát từ một đoạn nhạc nhỏ là cần thiết và hữu ích, được đề xuất để giúp người nghe có thể tìm kiếm được những bài nhạc không lời. Nghiên cứu này đề xuất một phương pháp phân loại và xác định các bài hát dựa trên các tính năng cụ thể mà mô hình học được từ dữ liệu âm nhạc. Ngôn ngữ lập trình Python được sử dụng để xây dựng mô hình Convolutional Neural Network (CNN) và Fully Connected Layer (FC) . Trước hết xử lý, các thư viện hỗ trợ được sử dụng để trích xuất dữ liệu âm thanh. Tập dữ liệu A bao gồm 100 bài hát không lời, trong khi tập dữ liệu B bao gồm 100 tệp âm thanh có cùng tên bài hát nhưng chơi bằng nhiều loại nhạc cụ khác nhau. Thư viện pydub sau đó cắt ngẫu nhiên các file âm thanh gốc thành các clip có thời lượng dưới 10 giây vì người dùng thường sử dụng một đoạn nhỏ cụ thể để tìm toàn bộ bản nhạc. Các tệp âm thanh gốc được chia thành các đoạn có độ dài khác nhau trong quá trình đào tạo, bao gồm 1 giây, 3 giây, 5 giây, 10 giây, 20 giây, 30 giây, 60 giây và 90 giây. Tiếp theo, phương pháp chuyển đổi tệp âm thanh thành ảnh phổ được thực hiện thông qua việc sử dụng thư viện librosa để chuyển đổi âm thanh về dạng ảnh phổ. Cuối cùng, hai mô hình CNN và FC được sử dụng để thực hiện phân loại bài hát. Kết quả cho thấy việc tăng cường dữ liệu bằng cách chia toàn bộ các bài hát thành các phần nhỏ dựa trên độ dài đã cải thiện đáng kể hiệu suất phân loại so với việc không sử dụng kỹ thuật này. Ngoài ra, CNN có tiềm năng tổng hợp cao hơn và mang lại hiệu suất tốt hơn hơn FC. Những kết quả này có ý nghĩa quan trọng đối với sự phát triển của hệ thống âm nhạc thương mại điện tử.	vi_VN
dc.language.iso	vi	vi_VN
dc.publisher	Trường Đại Học Cần Thơ	vi_VN
dc.subject	HỆ THỐNG THÔNG TIN	vi_VN
dc.title	TÌM KIẾM NHẠC KHÔNG LỜI SỬ DỤNG CÁC PHƯƠNG PHÁP TRỰC QUAN PHỔ TẦN SỐ VÀ MẠNG NƠ-RON TÍCH CHẬP	vi_VN
dc.title.alternative	INSTRUMENTAL SONG CLASSIFICATION USING SPECTROGRAMS AND CONVOLUTIONAL NEURAL NETWORKS	vi_VN
dc.type	Thesis	vi_VN
Appears in Collections:	Trường Công nghệ Thông tin & Truyền thông

Files in This Item:

File	Description	Size	Format
_file_ Restricted Access		2.95 MB	Adobe PDF
Your IP: 18.116.50.131

Show simple item record

LRC Digital repo

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets