
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
Dương Văn Hiếu
PHÂN LOẠI ÂM THANH HO BẰNG HỌC SÂU ÍT MẪU
Chuyên ngành: Khoa học máy tính
Mã số: 8.48.01.01
TÓM TẮT ĐỀ ÁN TỐT NGHIỆP THẠC SĨ
HÀ NỘI - NĂM 2023

2
Đề án tốt nghiệp được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: Phó Giáo sư, Tiến sĩ Phạm Văn Cường
Phản biện 1: Tiến sĩ. Vũ Văn Thoả
Phản biện 2: Phó Giáo sư, Tiến sĩ Đỗ Trung Tuấn
Đề án tốt nghiệp được bảo vệ trước Hội đồng chấm đề án tốt nghiệp thạc
sĩ tại Học viện Công nghệ Bưu chính Viễn thông
Vào lúc: ....... giờ ....... ngày ....... tháng ....... .. năm ...............
Có thể tìm hiểu đề án tốt nghiệp tại:
- Thư viện của Học viện Công nghệ Bưu chính viễn thông


1
TÓM TẮT ĐỀ ÁN
Hệ hô hấp của con người đóng vai trò quan trọng
trong việc cung cấp oxy cho cơ thể và loại bỏ khí thải. Có
nhiều bệnh và vấn đề liên quan đến hệ thống hô hấp, từ
những bệnh phổ biến hàng ngày đến những bệnh lý nghiêm
trọng. Việc gia tăng ô nhiễm môi trường, biến đổi khí hậu,
môi trường thay đổi thất thường tạo điều kiện cho sự phát
triển của các bệnh liên quan đến hô hấp ngày càng tăng cao.
Phân loại tự động tiếng ho là một trong những nhiệm vụ
quan trọng giúp đẩy nhanh quá trình chẩn đoán và điều trị
các bệnh đường hô hấp. Tuy nhiên, việc thu thập một lượng
lớn dữ liệu ho được dán nhãn là một thử thách lớn do dữ
liệu khan hiếm, tốn nhiều chi phí và công sức và lo ngại
về quyền riêng tư cá nhân.
Trong đề án này, tác giả mong muốn phát triển một
khuôn khổ có thể thực hiện phân loại ho hiệu quả ngay cả
trong tình huống dữ liệu ít, không có sẵn. Cụ thể, đề án đề
xuất mô hình phân loại tiếng ho bằng phương pháp học sâu
ít mẫu. Mô hình sử dụng phương pháp học sâu ít mẫu (few-
shot learning) kết hợp với mạng nguyên mẫu (Prototypical
network) để phân loại dữ liệu. Học ít mẫu cho phép đào tạo
mô hình từ một tập dữ liệu lớn có sẵn, được gọi là tập cơ sở.
Sau đó, mô hình này sẽ sử dụng để phân loại các lớp truy

2
vấn mới chưa nhìn thấy trong đào tạo trong khi chỉ yêu cầu
một vài mẫu của mỗi lớp.
Đề án sử dụng bộ dữ liệu COVID-19 Thermal Face
& Cough Dataset [19], bao gồm dữ liệu nhiệt mặt và hộ dữ
liệu ho, tác giả sử dụng bộ dữ liệu ho cho các thử nghiệm.
Các tệp dữ liệu kéo dài 1 giây, được lấy mẫu ở tốc độ 44.100
Hz và được phân loại thành 8 thư mục đặt tên và gắn nhãn
cụ thể. Kết quả thu được của phương pháp với điểm F1-
Score trung bình là 86%. Cho thấy tính khả thi của mô hình
phân loại âm thanh ho bằng cách kết hợp học ít mẫu và
mạng nguyên mẫu. Đây cũng là khuôn khổ cơ bản để xây
dựng và phát triển ứng dụng chẩn đoán và hỗ trợ khám bệnh
trong y tế.
Nội dung đề án được chưa thành 3 chương, cụ thể
như sau:
Chương 1: Tổng quan về bài toán phân loại ho
Chương 1 sẽ tổng quan về bệnh lý ho, các khái niệm
và phân biệt về âm thanh của các bệnh ho ướt, ho khan,
Covid-19 …trong phần này tác giả cũng giới thiệu về các
ứng dụng học sâu để phân loại âm thanh hô hấp chẩn đoán
bệnh Covid-19 của các nhà khoa học, điển hình như nghiên
cứu của Kranthi Kumar Lella và Alphonse Pja[12] đã triển

