
1
LỜI CAM ĐOAN
Tôi xin cam đoan tất cả các nội dung trong luận án “Định danh tự động một số làn
điệu dân ca Việt Nam” là công trình nghiên cứu của cá nhân tôi. Các số liệu, kết quả
trong luận án là trung thực và chưa từng được tác giả khác công bố. Việc tham khảo
các nguồn tài liệu đã được thực hiện trích dẫn đầy đủ và ghi nguồn tài liệu tham khảo
đúng quy định.
GIÁO VIÊN HƯỚNG DẪN
H Ni, ngy 25 thng 8 năm 2023
TÁC GIẢ LUẬN ÁN
PGS.TS. Trịnh Văn Loan
Chu Bá Thành

2
LỜI CẢM ƠN
Để hoàn thành Luận án này, ngoài sự nỗ lực, cố gắng của bản thân, tôi còn nhận
được sự hỗ trợ, giúp đỡ tận tình từ thầy hướng dẫn; các thầy cô trong Khoa Kỹ thuật
máy tính - Trường Công nghệ Thông tin & Truyền thông, Đại học Bách khoa Hà Nội
và các thành viên trong gia đình. Tôi muốn bày tỏ lòng biết ơn của mình đến các thầy
cô, bạn bè và đồng nghiệp đã giúp đỡ tôi để có được kết quả này.
Trước hết, tôi xin gửi lời cảm ơn sâu sắc đến thầy hướng dẫn là PGS.TS. Trịnh
Văn Loan. Thầy đã luôn tận tình giúp đỡ, chỉ bảo, đưa ra những lời khuyên bổ ích,
những định hướng khoa học và phương pháp nghiên cứu hết sức quý báu để tôi có
thể triển khai và hoàn thành luận án này.
Tiếp đến, tôi xin trân trọng cảm ơn Đại học Bách khoa Hà Nội; Trường Công nghệ
Thông tin & Truyền thông; Khoa Kỹ thuật máy tính đã tạo điều kiện tốt nhất cho tôi
trong thời gian học tập. Tôi cũng xin chân thành cảm ơn các đồng nghiệp tại Khoa
Công nghệ Thông tin - Trường Đại học Sư phạm Kỹ thuật Hưng Yên đã hỗ trợ, giúp
đỡ và động viên tôi trong suốt thời gian học tập.
Cuối cùng, tôi xin bày tỏ lòng biết ơn sâu sắc đến cha mẹ, anh, chị, em và gia đình
đã luôn ở bên để động viên, giúp đỡ tôi vượt qua các khó khăn, trở ngại để hoàn thành
quá trình học tập của mình.
Xin trân trọng cảm ơn!

3
MỤC LỤC
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ................................................ 6
DANH MỤC CÁC BẢNG ......................................................................................... 7
DANH MỤC CÁC HÌNH ẢNH, ĐỒ THỊ ................................................................. 9
MỞ ĐẦU .................................................................................................................. 12
Chương 1. TỔNG QUAN VỀ ÂM NHẠC VÀ PHÂN LỚP ÂM NHẠC THEO THỂ
LOẠI ......................................................................................................................... 16
1.1 Âm thanh, âm nhạc ................................................................................................. 16
1.1.1 Khái niệm âm thanh, âm nhạc................................................................... 16
1.1.2 Một số yếu tố cơ bản của âm nhạc ............................................................ 17
1.2 Một số đặc trưng trích chọn từ tín hiệu âm nhạc ................................................... 18
1.2.1 Đặc trưng thống kê .................................................................................... 18
1.2.2 Đặc trưng trong miền thời gian ................................................................. 19
1.2.3 Đặc trưng phổ............................................................................................ 22
1.3 Một số thể loại âm nhạc phổ biến trên thế giới ..................................................... 25
1.4 Đôi nét về nhạc dân ca Việt Nam ........................................................................... 26
1.4.1 Đặc điểm âm nhạc, lời ca trong Chèo ....................................................... 27
1.4.2 Đặc điểm âm nhạc, lời ca trong Quan họ .................................................. 28
1.4.3 Đặc điểm kỹ thuật hát Chèo và Quan họ .................................................. 30
1.5 Phân lớp âm nhạc theo thể loại ............................................................................... 34
1.6 Một số bộ dữ liệu âm nhạc theo thể loại điển hình ............................................... 35
1.7 Một số mô hình dùng trong phân lớp thể loại âm nhạc ........................................ 35
1.7.1 Bộ phân lớp SVM (Support Vector Machine) .......................................... 35
1.7.2 Bộ phân lớp GMM (Gaussian Mixture Model) ........................................ 36
1.7.3 Mạng nơ-ron nhân tạo (Artificial Neural Network) ................................. 38
1.8 Một số kết quả nghiên cứu phân lớp thể loại âm nhạc trong và ngoài nước ....... 48
1.8.1 Tình hình nghiên cứu ngoài nước ............................................................. 48
1.8.2 Tình hình nghiên cứu trong nước ............................................................. 54
1.9 Kết chương 1 ........................................................................................................... 55

4
Chương 2. ĐỊNH DANH MỘT SỐ LÀN ĐIỆU DÂN CA VIỆT NAM ................. 56
2.1 Bộ dữ liệu âm nhạc Chèo và Quan họ ................................................................... 56
2.2 Một số phương pháp tăng cường dữ liệu ............................................................... 58
2.2.1 Chia đôi các file dữ liệu âm nhạc .............................................................. 59
2.2.2 Tạo tiếng vọng (creating echo) ................................................................. 59
2.2.3 Cộng nhiễu trắng (adding white noise) ..................................................... 59
2.2.4 Thay đổi cao độ (changing pitch) ............................................................. 60
2.3 Phân lớp, định danh một số làn điệu dân ca Việt Nam dùng một số thuật toán học
máy truyền thống ........................................................................................................... 61
2.3.1 Trường hợp 1: Định danh một số làn điệu Quan họ dùng một số mô hình
truyền thống thuộc bộ công cụ WEKA .............................................................. 61
2.3.2 Trường hợp 2: Định danh một số làn điệu Quan họ dùng GMM ............. 64
2.3.3 Trường hợp 3: Phân lớp, định danh Chèo và Quan họ ............................. 66
2.3.4 Trường hợp 4: Phân lớp Chèo và Quan họ ............................................... 69
2.3.5 Trường hợp 5: Định danh Chèo hoặc Quan họ ......................................... 72
2.3.6 Trường hợp 6: Định danh Chèo và Quan họ dùng i-vector ...................... 75
2.4 Phân lớp và định danh một số làn điệu dân ca Việt Nam dùng học sâu .............. 77
2.4.1 Bộ dữ liệu và tham số sử dụng .................................................................. 77
2.4.2 Các mạng nơ-ron sâu dùng trong nghiên cứu ........................................... 78
2.4.3 Kết quả nghiên cứu phân lớp và định danh .............................................. 84
2.5 Kết chương 2 ........................................................................................................... 88
Chương 3. PHÂN LỚP THỂ LOẠI ÂM NHẠC TRÊN BỘ DỮ LIỆU NHẠC VIỆT,
GTZAN VÀ FMA DÙNG HỌC SÂU ..................................................................... 89
3.1 Các độ đo Accuracy, Precision, Recall và f1-score .............................................. 89
3.2 Phân lớp nhạc Việt dùng RAN (Residual Attention Network) ............................ 90
3.3 Nghiên cứu phân lớp thể loại âm nhạc đối với các bộ dữ liệu GTZAN và
FMA_SMALL ............................................................................................................... 93
3.3.1 Nghiên cứu phân lớp đối với GTZAN ...................................................... 93
3.3.3 Nghiên cứu phân lớp đối với FMA_SMALL ......................................... 102
3.4 Kết chương 3 ......................................................................................................... 108

5
KẾT LUẬN VÀ ĐỊNH HƯỚNG PHÁT TRIỂN .................................................. 110
1. Kết luận ........................................................................................................ 110
2. Định hướng phát triển .................................................................................. 111
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA LUẬN ÁN ................. 113
TÀI LIỆU THAM KHẢO ...................................................................................... 114

