HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
-----------------------------------
TRẦN THỊ NHI AN
NHẬN DẠNG NGƯỜI NÓI
THEO TIẾP CẬN MÁY HỌC HIỆN ĐẠI
LUẬN VĂN THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)
TP. H CHÍ MINH NĂM 2022
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
--------------------------------------
TRẦN THỊ NHI AN
NHẬN DẠNG NGƯỜI NÓI
THEO TIẾP CẬN MÁY HỌC HIỆN ĐẠI
Chuyên ngành: HỆ THỐNG THÔNG TIN
Mã số: 8.48.01.04
LUẬN VĂN THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS VŨ HẢI QUÂN
TP. H CHÍ MINH NĂM 2022
i
LỜI CAM ĐOAN
Tôi cam đoan rằng luận văn: “Nhận dạng người nói theo tiếp cận máy học
hiện đại” là công trình nghiên cứu của chính tôi dưới sự hướng dẫn của PGS.TS
Hải Quân.
Tôi cam đoan các số liệu, kết quả nêu trong luận văn trung thực chưa
từng được ai công bố trong bất kỳ công trình nào khác.
Không có sản phẩm/nghiên cứu nào của người khác được sử dụng trong luận
văn này mà không được trích dẫn theo đúng quy định.
TP. Hồ Chí Minh, ngày 04 tháng 05 m 2022
Học viên thực hiện luận văn
Trần Thị Nhi An
ii
LỜI CẢM ƠN
Trước hết, em xin bày tỏ lòng biết ơn chân thành và sâu sắc tới Thầy PGS.TS
Hải Quân người Thầy kính yêu đã hết lòng giúp đỡ, hướng dẫn, động viên, tạo
điều kiện cho tôi trong suốt quá trình thực hiện và hoàn thành luận văn.
Tôi xin chân thành cảm ơn Ban Giám Đốc, Phòng đào tạo sau đại học và quý
Thầy của Học viện Công Nghệ Bưu Chính Viễn thông sở tại TP.HCM đã giảng
dạy và tạo điều kiện học tập thuận lợi trong suốt khóa học.
Tôi xin chân thành cảm ơn gia đình, bạn bè, đồng nghiệp trong quan đã
động viên, hỗ trợ tôi trong lúc khó khăn để tôi có thể học tập và hoàn thành luận văn.
Mặc đã nhiều cố gắng, nỗ lực, nhưng do thời gian kinh nghiệm nghiên
cứu khoa học còn hạn chế nên không thể tránh khỏi những thiếu sót. Tôi rất mong
nhận được sự góp ý của quý Thầy cùng bạn bè đồng nghiệp để kiến thức của tôi
ngày một hoàn thiện hơn.
Một lần nữa tôi xin chân thành cảm ơn!
TP. Hồ Chí Minh, ngày 04 tháng 05 m 2022
Học viên thực hiện luận văn
Trần Thị Nhi An
iii
DANH SÁCH HÌNH VẼ
Hình 1.1: Các đặc tính sinh trắc .................................................................................. 1
Hình 2.1: Phân biệt xác minh và định danh .............................................................. 14
Hình 2.2: Trí tuệ nhân tạo AI ................................................................................ 18
Hình 2.3: Lấy mẫu và số hóa tín hiệu analog, sau đó tái tạo lại tín hiệu này ........... 19
Hình 2.4: Cấu trúc của hệ thống nhận dạng người nói ............................................. 20
Hình 2.5: Các bước trích xuất MFCC từ tín hiệu âm thanh ...................................... 24
Hình 2.6: Các lĩnh vực ứng dụng của Machine Learning ........................................ 27
Hình 2.7: Ba mô hình học tập cho các thuật toán ..................................................... 28
Hình 3.1: Các lớp của một mạng nơ-ron điển hình ................................................... 30
Hình 3.2: Mối liên hệ giữa AI, ML và DL ................................................................ 32
Hình 3.3: Perceptron ................................................................................................. 33
Hình 3.4: Feed Forward Neural Networks ................................................................ 33
Hình 3.5: Multilayer Perceptron ............................................................................... 34
Hình 3.6: Convolutional Neural Network ................................................................. 35
Hình 3.7: Radial Basis Function Neural Networks ................................................... 35
Hình 3.8: Recurrent Neural Networks ...................................................................... 36
Hình 3.9: Long Short-Term Memory ........................................................................ 37
Hình 3.10: Modular Neural Network ........................................................................ 38
Hình 3.11: Ví dụ về dự đoán thời tiết ....................................................................... 39
Hình 3.12: Một mô hình Markov ẩn ......................................................................... 41
Hình 3.13: Các giai đoạn xử lý trong HTK ............................................................... 42
Hình 3.14: Huấn luyện từ phụ trong HMM .............................................................. 45
Hình 3.15: Mạng truyền thẳng một lớp ẩn ................................................................ 49
Hình 3.16: Cấu trúc mạng feedforward-DNN .......................................................... 54
Hình 4.1: Biểu đồ hiển thị tỉ lệ giới tính trong bộ dữ liệu ......................................... 56
Hình 4.2: Biểu đồ hiển thị tỉ lệ vùng miền trong bộ dữ liệu ..................................... 57
Hình 4.3: Biểu đồ thống kê độ tuổi của bộ dữ liệu ................................................... 57