Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: https://dspace.ctu.edu.vn/jspui/handle/123456789/94208
Nhan đề: TÌM KIẾM NHẠC KHÔNG LỜI SỬ DỤNG CÁC PHƯƠNG PHÁP TRỰC QUAN PHỔ TẦN SỐ VÀ MẠNG NƠ-RON TÍCH CHẬP
Nhan đề khác: INSTRUMENTAL SONG CLASSIFICATION USING SPECTROGRAMS AND CONVOLUTIONAL NEURAL NETWORKS
Tác giả: Nguyễn, Thanh Hải
Lê, Anh Tuấn
Từ khoá: HỆ THỐNG THÔNG TIN
Năm xuất bản: 2023
Nhà xuất bản: Trường Đại Học Cần Thơ
Tóm tắt: Trong thời đại công nghệ thông tin phát triển nhanh chóng và cuộc sống ngày càng hiện đại, nhu cầu giải trí trở nên cần thiết hơn, đặc biệt là trong lĩnh vực thưởng thức âm nhạc. Việc đang tìm kiếm một bài hát là một điều cần thiết, bên cạnh đó bản quyền bài hát cũng là điều đáng quan tâm. Vì vậy, việc nhận diện một bài hát từ một đoạn nhạc nhỏ là cần thiết và hữu ích, được đề xuất để giúp người nghe có thể tìm kiếm được những bài nhạc không lời. Nghiên cứu này đề xuất một phương pháp phân loại và xác định các bài hát dựa trên các tính năng cụ thể mà mô hình học được từ dữ liệu âm nhạc. Ngôn ngữ lập trình Python được sử dụng để xây dựng mô hình Convolutional Neural Network (CNN) và Fully Connected Layer (FC) . Trước hết xử lý, các thư viện hỗ trợ được sử dụng để trích xuất dữ liệu âm thanh. Tập dữ liệu A bao gồm 100 bài hát không lời, trong khi tập dữ liệu B bao gồm 100 tệp âm thanh có cùng tên bài hát nhưng chơi bằng nhiều loại nhạc cụ khác nhau. Thư viện pydub sau đó cắt ngẫu nhiên các file âm thanh gốc thành các clip có thời lượng dưới 10 giây vì người dùng thường sử dụng một đoạn nhỏ cụ thể để tìm toàn bộ bản nhạc. Các tệp âm thanh gốc được chia thành các đoạn có độ dài khác nhau trong quá trình đào tạo, bao gồm 1 giây, 3 giây, 5 giây, 10 giây, 20 giây, 30 giây, 60 giây và 90 giây. Tiếp theo, phương pháp chuyển đổi tệp âm thanh thành ảnh phổ được thực hiện thông qua việc sử dụng thư viện librosa để chuyển đổi âm thanh về dạng ảnh phổ. Cuối cùng, hai mô hình CNN và FC được sử dụng để thực hiện phân loại bài hát. Kết quả cho thấy việc tăng cường dữ liệu bằng cách chia toàn bộ các bài hát thành các phần nhỏ dựa trên độ dài đã cải thiện đáng kể hiệu suất phân loại so với việc không sử dụng kỹ thuật này. Ngoài ra, CNN có tiềm năng tổng hợp cao hơn và mang lại hiệu suất tốt hơn hơn FC. Những kết quả này có ý nghĩa quan trọng đối với sự phát triển của hệ thống âm nhạc thương mại điện tử.
Mô tả: 71 Tr
Định danh: https://dspace.ctu.edu.vn/jspui/handle/123456789/94208
Bộ sưu tập: Trường Công nghệ Thông tin & Truyền thông

Các tập tin trong tài liệu này:
Tập tin Mô tả Kích thước Định dạng  
_file_
  Giới hạn truy cập
2.95 MBAdobe PDF
Your IP: 3.21.46.13


Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.