
LÝ THUYẾT NHẬN DẠNG
CHƯƠNG 3:
NHẬN DẠNG MẪU DỰA TRÊN THỐNG KÊ
Biên soạn: TS Ngô Hữu Phúc
Bộ môn: Khoa học máy tính
Học viện kỹ thuật quân sự
Email: ngohuuphuc76@gmail.com
Nhận dạng dựa trên thống kê
1

3.4. BỘPHÂN LỚP CỰC TIỂU KHOẢNG CÁCH
3.4.1. Phân lớp theo khoảng cách Euclidean (1/2)
Bộ phân lớp Bayesian tối ưu thỏa một số rằng buộc sau:
Các lớp có xác suất như nhau.
Dữ liệu của tất cả các lớp theo phân bố chuẩn Gaussian.
Ma trận hiệp phương sai là giống nhau với tất cả các lớp.
Ma trận hiệp phương sai có dạng đường chéo và tất cả các
thành phần trên đường chéo giống nhau, dạng S=σ2I,với Ilà
ma trận đơn vị.
2
Nhận dạng dựa trên thống kê

3.4. BỘPHÂN LỚP CỰC TIỂU KHOẢNG CÁCH
3.4.1. Phân lớp theo khoảng cách Euclidean (2/2)
Với các rằng buộc trên, bộ phân lớp Bayesian tối ưu tương
đương bộ phân lớp cực tiểu khoảng cách Euclidean.
Như vậy, cho vecto x chưa biết, xsẽ được gán vào lớp ωinếu:
𝐱−𝐦𝐢≡ 𝐱−𝐦𝐢𝐓𝐱−𝐦𝐢< 𝐱−𝐦𝐣,∀𝐢≠𝐣
Nhận xét:
Bộ phân lớp Euclidean thường được sử dụng vì tính đơn giản của nó,
kể cả trong trường hợp các rằng buộc trên không thỏa mãn.
Cách phân lớp này còn được gọi là phân lớp gần nhất theo tiêu chuẩn
Euclidean.
3
Nhận dạng dựa trên thống kê

3.4. BỘPHÂN LỚP CỰC TIỂU KHOẢNG CÁCH
3.4.2. Phân lớp theo khoảng cách Mahalanobis
Trong bộ phân lớp Bayesian tối ưu, nếu bỏ yếu tố:ma trận hiệp
phương sai có dạng đường chéo với các phần tử giống nhau,
khi đó, bộ phân lớp này tương đương với phân lớp cực tiểu theo
khoảng cách Mahalanobis.
Như vậy, với vecto x chưa biết, xđược gán vào lớp ωinếu:
𝐱−𝐦𝐢𝐓𝐒−𝟏 𝐱−𝐦𝐢< 𝐱−𝐦𝐣𝐓𝐒−𝟏 𝐱−𝐦𝐣,∀𝐣≠𝐢
Trong đó, Slà ma trận hiệp phương sai.
4
Nhận dạng dựa trên thống kê

VÍDỤ MỤC 3.4-1
Xem xét bài toán phân lớp (với 2lớp) trên không gian 3chiều.
Hai lớp lần lượt là ω1và ω2với:
Sử dụng mô hình phân bố Gaussian.
m1= 0,0,0T;m1= 0.5,0.5,0.5T.
Cả hai lớp có xác suất như nhau.
Ma trận hiệp phương sai là:
S= 0.8 0.01 0.01
0.01 0.2 0.01
0.01 0.01 0.2
Với vecto x= 0.1,0.5,0.1T, x được gán là nhãn gì theo 2
khoảng cách Euclidean và Mahalanobis?
5
Nhận dạng dựa trên thống kê