Please use this identifier to cite or link to this item:
https://dspace.ctu.edu.vn/jspui/handle/123456789/94208
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Nguyễn, Thanh Hải | - |
dc.contributor.author | Lê, Anh Tuấn | - |
dc.date.accessioned | 2024-01-04T00:29:15Z | - |
dc.date.available | 2024-01-04T00:29:15Z | - |
dc.date.issued | 2023 | - |
dc.identifier.other | B1906362 | - |
dc.identifier.uri | https://dspace.ctu.edu.vn/jspui/handle/123456789/94208 | - |
dc.description | 71 Tr | vi_VN |
dc.description.abstract | Trong thời đại công nghệ thông tin phát triển nhanh chóng và cuộc sống ngày càng hiện đại, nhu cầu giải trí trở nên cần thiết hơn, đặc biệt là trong lĩnh vực thưởng thức âm nhạc. Việc đang tìm kiếm một bài hát là một điều cần thiết, bên cạnh đó bản quyền bài hát cũng là điều đáng quan tâm. Vì vậy, việc nhận diện một bài hát từ một đoạn nhạc nhỏ là cần thiết và hữu ích, được đề xuất để giúp người nghe có thể tìm kiếm được những bài nhạc không lời. Nghiên cứu này đề xuất một phương pháp phân loại và xác định các bài hát dựa trên các tính năng cụ thể mà mô hình học được từ dữ liệu âm nhạc. Ngôn ngữ lập trình Python được sử dụng để xây dựng mô hình Convolutional Neural Network (CNN) và Fully Connected Layer (FC) . Trước hết xử lý, các thư viện hỗ trợ được sử dụng để trích xuất dữ liệu âm thanh. Tập dữ liệu A bao gồm 100 bài hát không lời, trong khi tập dữ liệu B bao gồm 100 tệp âm thanh có cùng tên bài hát nhưng chơi bằng nhiều loại nhạc cụ khác nhau. Thư viện pydub sau đó cắt ngẫu nhiên các file âm thanh gốc thành các clip có thời lượng dưới 10 giây vì người dùng thường sử dụng một đoạn nhỏ cụ thể để tìm toàn bộ bản nhạc. Các tệp âm thanh gốc được chia thành các đoạn có độ dài khác nhau trong quá trình đào tạo, bao gồm 1 giây, 3 giây, 5 giây, 10 giây, 20 giây, 30 giây, 60 giây và 90 giây. Tiếp theo, phương pháp chuyển đổi tệp âm thanh thành ảnh phổ được thực hiện thông qua việc sử dụng thư viện librosa để chuyển đổi âm thanh về dạng ảnh phổ. Cuối cùng, hai mô hình CNN và FC được sử dụng để thực hiện phân loại bài hát. Kết quả cho thấy việc tăng cường dữ liệu bằng cách chia toàn bộ các bài hát thành các phần nhỏ dựa trên độ dài đã cải thiện đáng kể hiệu suất phân loại so với việc không sử dụng kỹ thuật này. Ngoài ra, CNN có tiềm năng tổng hợp cao hơn và mang lại hiệu suất tốt hơn hơn FC. Những kết quả này có ý nghĩa quan trọng đối với sự phát triển của hệ thống âm nhạc thương mại điện tử. | vi_VN |
dc.language.iso | vi | vi_VN |
dc.publisher | Trường Đại Học Cần Thơ | vi_VN |
dc.subject | HỆ THỐNG THÔNG TIN | vi_VN |
dc.title | TÌM KIẾM NHẠC KHÔNG LỜI SỬ DỤNG CÁC PHƯƠNG PHÁP TRỰC QUAN PHỔ TẦN SỐ VÀ MẠNG NƠ-RON TÍCH CHẬP | vi_VN |
dc.title.alternative | INSTRUMENTAL SONG CLASSIFICATION USING SPECTROGRAMS AND CONVOLUTIONAL NEURAL NETWORKS | vi_VN |
dc.type | Thesis | vi_VN |
Appears in Collections: | Trường Công nghệ Thông tin & Truyền thông |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
_file_ Restricted Access | 2.95 MB | Adobe PDF | ||
Your IP: 3.136.22.12 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.