Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/94208
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorNguyễn, Thanh Hải-
dc.contributor.authorLê, Anh Tuấn-
dc.date.accessioned2024-01-04T00:29:15Z-
dc.date.available2024-01-04T00:29:15Z-
dc.date.issued2023-
dc.identifier.otherB1906362-
dc.identifier.urihttps://dspace.ctu.edu.vn/jspui/handle/123456789/94208-
dc.description71 Trvi_VN
dc.description.abstractTrong thời đại công nghệ thông tin phát triển nhanh chóng và cuộc sống ngày càng hiện đại, nhu cầu giải trí trở nên cần thiết hơn, đặc biệt là trong lĩnh vực thưởng thức âm nhạc. Việc đang tìm kiếm một bài hát là một điều cần thiết, bên cạnh đó bản quyền bài hát cũng là điều đáng quan tâm. Vì vậy, việc nhận diện một bài hát từ một đoạn nhạc nhỏ là cần thiết và hữu ích, được đề xuất để giúp người nghe có thể tìm kiếm được những bài nhạc không lời. Nghiên cứu này đề xuất một phương pháp phân loại và xác định các bài hát dựa trên các tính năng cụ thể mà mô hình học được từ dữ liệu âm nhạc. Ngôn ngữ lập trình Python được sử dụng để xây dựng mô hình Convolutional Neural Network (CNN) và Fully Connected Layer (FC) . Trước hết xử lý, các thư viện hỗ trợ được sử dụng để trích xuất dữ liệu âm thanh. Tập dữ liệu A bao gồm 100 bài hát không lời, trong khi tập dữ liệu B bao gồm 100 tệp âm thanh có cùng tên bài hát nhưng chơi bằng nhiều loại nhạc cụ khác nhau. Thư viện pydub sau đó cắt ngẫu nhiên các file âm thanh gốc thành các clip có thời lượng dưới 10 giây vì người dùng thường sử dụng một đoạn nhỏ cụ thể để tìm toàn bộ bản nhạc. Các tệp âm thanh gốc được chia thành các đoạn có độ dài khác nhau trong quá trình đào tạo, bao gồm 1 giây, 3 giây, 5 giây, 10 giây, 20 giây, 30 giây, 60 giây và 90 giây. Tiếp theo, phương pháp chuyển đổi tệp âm thanh thành ảnh phổ được thực hiện thông qua việc sử dụng thư viện librosa để chuyển đổi âm thanh về dạng ảnh phổ. Cuối cùng, hai mô hình CNN và FC được sử dụng để thực hiện phân loại bài hát. Kết quả cho thấy việc tăng cường dữ liệu bằng cách chia toàn bộ các bài hát thành các phần nhỏ dựa trên độ dài đã cải thiện đáng kể hiệu suất phân loại so với việc không sử dụng kỹ thuật này. Ngoài ra, CNN có tiềm năng tổng hợp cao hơn và mang lại hiệu suất tốt hơn hơn FC. Những kết quả này có ý nghĩa quan trọng đối với sự phát triển của hệ thống âm nhạc thương mại điện tử.vi_VN
dc.language.isovivi_VN
dc.publisherTrường Đại Học Cần Thơvi_VN
dc.subjectHỆ THỐNG THÔNG TINvi_VN
dc.titleTÌM KIẾM NHẠC KHÔNG LỜI SỬ DỤNG CÁC PHƯƠNG PHÁP TRỰC QUAN PHỔ TẦN SỐ VÀ MẠNG NƠ-RON TÍCH CHẬPvi_VN
dc.title.alternativeINSTRUMENTAL SONG CLASSIFICATION USING SPECTROGRAMS AND CONVOLUTIONAL NEURAL NETWORKSvi_VN
dc.typeThesisvi_VN
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
2.95 MBAdobe PDF
Your IP: 18.116.50.131


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.