Kỹ thuật điện tử & Khoa học máy tính<br />
<br />
<br />
Kü thuËt ph©n tÝch thµnh phÇn ®éc lËp<br />
sö dông íc lîng nguyªn lý cùc ®¹i trong<br />
t¸ch c¸c tæ hîp tÝn hiÖu ©m thanh<br />
NGUYỄN THỊ HUYỀN, PHAN TRỌNG HANH<br />
Tóm tắt: Phân tích thành phần độc lập (Independent Component Analysis -<br />
ICA) là một kỹ thuật tính toán phân tách nguồn mù hiệu quả trong nhiều ứng<br />
dụng thực tế của các lĩnh vực khoa học và công nghệ khác nhau. Bài báo nghiên<br />
cứu cách áp dụng phương pháp ước lượng hợp lý cực đại trong ICA, đề xuất<br />
cách đánh giá độ hội tụ của thuật toán thông qua số lần lặp để cải thiện tốc độ<br />
của thuật toán.<br />
Từ khóa: ICA, Ước lượng ML.<br />
<br />
1. MỞ ĐẦU<br />
Kỹ thuật ICA là một phát minh tương đối mới ở cuối thế kỷ 20 được giới thiệu<br />
lần đầu tiên vào những năm đầu thập niên 1980 trong khung cảnh mô hình mạng<br />
nơ ron. ICA có thể được xem như phần mở rộng của kỹ thuật phân tích thành phần<br />
chủ yếu (Principal Component Analysis - PCA) [1].<br />
ICA định nghĩa một mô hình sinh cho dữ liệu đa biến quan sát được, thường<br />
được cho như một cơ sở dữ liệu lớn của các mẫu. Trong mô hình, các biến dữ liệu<br />
được giả thiết là tổ hợp tuyến tính hoặc phi tuyến của một số biến ẩn chưa biết và<br />
hệ thống các tham số tổ hợp cũng chưa được biết trước. Các biến ẩn được giả thiết<br />
là không chuẩn, độc lập tương hỗ và được gọi là các thành phần độc lập của dữ<br />
liệu quan sát được. Các thành phần độc lập này cũng được gọi là các nguồn hoặc<br />
các hệ số, có thể được xác định bởi kỹ thuật ICA. Để thực hiện nhiệm vụ này, ICA<br />
giả thiết rằng tín hiệu thu được bao gồm một số thành phần độc lập thống kê với<br />
nhau và thực hiện xử lí sao cho tính độc lập của các thành phần này là cực đại.<br />
Trước đây, kỹ thuật ICA được xử lý nhờ các thuật toán cực đại hóa tính phi<br />
Gaussian hay nguyên lý thông tin cực đại, tuy nhiên, các thuật toán này có độ hội<br />
tụ khá chậm [2]. Có một cách tiếp cận cải thiện đáng kể thời gian xử lý của kỹ<br />
thuật ICA, đó là sử dụng phương pháp ước lượng hợp lý cực đại [3] trong ước<br />
lượng các tham số mô hình ICA.<br />
2. ICA SỬ DỤNG PHƯƠNG PHÁP ƯỚC LƯỢNG HỢP LÝ CỰC ĐẠI<br />
2.1 Mô hình ICA<br />
Mô hình ICA được đề cập trong [4]. Trong đó, giả sử ta quan sát n xáo trộn<br />
tuyến tính của n thành phần độc x1, x2, …, xn, chẳng hạn như các tín hiệu thu được<br />
từ micro trong một hội nghị hoặc tổ hợp tín hiệu từ Sonar, hình ảnh,... Bỏ tham số<br />
thời gian ta có:<br />
xi ai1 s1 ai 2 s2 ... ain sn với mọi giá trị của i =1, …, n (1)<br />
Với xi, s1, s2… đều là hàm của tham số thời gian t và aij, i,j = 1, …, n là các hệ<br />
số thực.<br />
Định nghĩa x là véc tơ ngẫu nhiên chứa các phần tử là các tổ hợp x1 , x2 ,..., x n và<br />
s là véc tơ ngẫu nhiên với các phần tử s1 , s2 ,..., sn được gọi là các thành phần độc<br />
<br />
<br />
<br />
106 Nguyễn Thị Huyền, Phan Trọng Hanh “Kỹ thuật phân tích …tín hiệu âm thanh”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
lập. A gồm các phần tử aij được gọi là ma trận trộn. Tất cả các véc tơ đều được viết<br />
dưới dạng véc tơ cột. Ta có mô hình trộn: x=As<br />
Gọi ai là các véc tơ cột của ma trận A, mô hình cũng có thể được viết lại như sau:<br />
n<br />
x a i si (2)<br />
i 1<br />
<br />
Mô hình trên được gọi là phân tích thành phần độc lập hoặc mô hình ICA. Mô<br />
hình ICA là một mô hình sinh (generative model) với ý nghĩa là nó mô tả quá trình<br />
dữ liệu được quan sát được tạo ra bởi một quá trình tổ hợp các phần tử si như thế<br />
nào. Khởi đầu cho ICA là một giả thiết rất đơn giản rằng các phần tử si là độc lập<br />
thống kê và có phân bố phi Gaussian (nongaussian). Giả thiết thứ hai là các ma<br />
trận xáo trộn chưa biết là các ma trận vuông. Cái chúng ta quan sát được chỉ là véc<br />
tơ ngẫu nhiên x và ta cần phải ước lượng cả A và s sử dụng nó.<br />
Trong mô hình ICA, xem mỗi một tổ hợp xi cũng như mỗi một thành phần độc<br />
lập sk là một biến ngẫu nhiên thay thế cho một tín hiệu riêng. Không mất tính tổng<br />
quát, giả thiết rằng cả tín hiệu được tổ hợp và cả thành phần độc lập đều có trung<br />
bình 0. Nếu không, các biến xi quan sát được có thể luôn luôn được định tâm lại<br />
bằng cách trừ đi một lượng trung bình mẫu để đảm bảo mô hình có trung bình 0.<br />
Tức là các tổ hợp đầu vào của thuật toán x ' là kết quả tiền xử lý bởi:<br />
x x ' E x ' (3)<br />
được xử lý trước khi kỹ thuật ICA thực hiện. Do các thành phần độc lập có trung<br />
bình 0, nên:<br />
E s A 1E x (4)<br />
Như vậy, sau khi ước lượng ma trận tổ hợp và các thành phần độc lập với các<br />
dữ liệu trung bình 0 có thể đơn giản được xây dựng lại bằng việc thêm A 1 E x ' <br />
vào các thành phần độc lập trung bình 0. Với mô hình có trung bình 0 này sẽ thuận<br />
tiện cho việc sử dụng ma trận véc tơ để thay thế cho các tổng trong biểu thức trên.<br />
2.2. Ước lượng hợp lý cực đại<br />
Ước lượng hợp lý cực đại (Maximum Likelihood- ML) [5] thực hiện ước lượng<br />
đại lượng ˆML của véc tơ tham số θ được chọn sao cho ˆML làm cực đại hóa hàm<br />
phân bố xác suất chung:<br />
p x n p x 1 , x 1 ,..., x n | p ( x1 ) p ( x2 ) ... p ( xn ) (5)<br />
của các tham số x(1), x(2), …, x(n) là n quan sát độc lập thống kê và có phân bố<br />
xác định. Ước lượng hợp lý cực đại tương ứng với giá trị ˆML làm cho các tham số<br />
xác định được là hợp lý nhất.<br />
Các phân bố điển hình thường có hàm mật độ xác suất có dạng mũ nên để thuận<br />
tiện hơn khi giải quyết vấn đề ước lượng hợp lý cực đại, ta thường xét hàm log hợp<br />
lý: lnp(xn| θ). Hiển nhiên là ước lượng hợp lý cực đại ˆML cũng làm cực đại hóa<br />
hàm log hợp lý. Như vậy, ước lượng hợp lý cực đại chính là nghiệm của biểu thức:<br />
<br />
ln p x n 0 (6)<br />
ˆML<br />
<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số 33, 10 - 2014 107<br />
Kỹ thuật điện tử & Khoa học máy tính<br />
<br />
Biểu thức (6) xác định các giá trị của θ làm cực đại hóa (cực tiểu hóa) hàm hợp<br />
lý. Trong trường hợp hàm hợp lý phức tạp, phải có thêm một số cực trị địa phương,<br />
ta phải lựa chọn giá trị của ˆML tương ứng với trị tuyệt đối cực đại. Biểu thức hợp<br />
lý (6) bao gồm m biểu thức:<br />
<br />
i<br />
<br />
ln p x n ˆML <br />
0, i 1,..., m (7)<br />
ˆ ML<br />
<br />
<br />
cho m tham số ước lượng ˆi , ML , i 1,..., m .<br />
Dựa trên các công thức toán học của phương pháp ước lượng hợp lý cực đại, xét<br />
việc áp dụng nguyên lý này vào mô hình ICA để ước lượng các véc tơ của ma trận<br />
trộn các thành phần độc lập.<br />
2.3. Mô hình ICA theo ước lượng hợp lý cực đại<br />
Để xây dựng hàm hợp lý xét mô hình ICA không có tạp âm:<br />
x = As (8)<br />
Đặt W = (w1,…, wn)T = A-1, biểu thức loga của hợp lý được cho bởi:<br />
T n<br />
<br />
L log f i w Ti x t T log det W (9)<br />
t 1 i 1<br />
Trong đó, fi là các hàm mật độ của si (ở đây ta giả thiết là đã biết trước) và x(t),<br />
t = 1, …, T là phần thực của x. Với một véc tơ ngẫu nhiên x bất kỳ có hàm mật độ<br />
xác suất px và với một ma trận W bất kỳ thì hàm mật độ của véc tơ y=Wx được<br />
xác định là px(Wx)|detW|.<br />
Nếu việc ước lượng ma trận A (hoặc W) chính xác thì y=Wx = WAs = A-1As =<br />
s tức là ta đã xác định được các thành phần độc lập.<br />
Thay thế tổng theo chỉ số t trong (9) bởi hàm kỳ vọng và chia cho T ta được:<br />
L n <br />
E log f i w Ti x log det W (10)<br />
T i 1 <br />
Hàm kỳ vọng này cho phép ta xác định được giá trị trung bình của các mẫu<br />
quan sát được.<br />
Xét các thuật toán thực hiện kỹ thuật ICA sử dụng ước lượng hợp lý cực đại:<br />
Thuật toán Bell-Sejnowski: [4] Là lớp các thuật toán đơn giản nhất để cực đại<br />
hóa hàm hợp lý trong nhóm các phương pháp gradient. Gradient thống kê của log-<br />
hàm hợp lý:<br />
1 L 1 1<br />
W T E g Wx xT W T E g y xT (11)<br />
T W<br />
g(y) = (gi(yi), …, gn(yn) là một hàm véc tơ hàng bao gồm các hàm tỷ lệ gi âm<br />
của các phân bố si, được định nghĩa:<br />
' fi ' (12)<br />
gi log fi <br />
fi<br />
Xét thuật toán sử dụng ước lượng ML theo biểu thức:<br />
1<br />
W WT E g y xT (13)<br />
Bỏ qua hàm kỳ vọng trong mỗi bước của thuật toán, tính toán cho một điểm dữ<br />
liệu được sử dụng ta có:<br />
<br />
<br />
108 Nguyễn Thị Huyền, Phan Trọng Hanh “Kỹ thuật phân tích …tín hiệu âm thanh”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
1<br />
W WT g y xT (14)<br />
Thuật toán trong biểu thức (13) hội tụ rất chậm vì phải xác định nghịch đảo của<br />
ma trận W trong các bước xử lý của thuật toán. Vì thế dù thuật toán Bell-<br />
Sejnowski khá đơn giản nhưng ít được sử dụng trong thực tế.<br />
Thuật toán gradient tự nhiên: [4] Thực hiện đơn giản hóa việc xác định cực<br />
đại của hàm hợp lý. Nguyên lý của gradient tự nhiên dựa trên cấu trúc hình học của<br />
không gian tham số.<br />
Nhân vế phải của biểu thức (13) với WTW, ta có:<br />
<br />
W I E g y yT W (15)<br />
Thuật toán hội tụ khi E g y y I tức là yi và gj (yj) là không tương quan với<br />
T<br />
<br />
<br />
mọi i ≠ j. Các lớp hàm g thường được chọn thuộc về tập các lớp hàm không toàn<br />
phương và trong thuật toán này ta chọn g là một hàm tanh (tanhx = sinhx/coshx),<br />
xét với các phân bố trên chuẩn (supergaussian), chọn:<br />
g y 2 tanh y (16)<br />
Với các thành phần độc lập dưới chuẩn(subgaussian) ta lựa chọn hàm g:<br />
g y tanh y y (17)<br />
Việc lựa chọn sử dụng hai thành phần phi tuyến trong (16) và (17) dựa trên kết<br />
quả tính toán của mô men phi đa thức:<br />
<br />
E tanh si si 1 tanh si <br />
2<br />
(18)<br />
Việc sử dụng mô men phi đa thức yêu cầu đầu tiên là các ước lượng của các<br />
thành phần độc lập phải có cùng tỷ lệ chính xác, ràng buộc chúng có phương sai<br />
bằng 1. Nếu dấu của mô men tính được là âm thì lựa chọn g theo (16), ngược lại<br />
thì chọn theo (17)<br />
Thuật toán được tóm tắt lại trong bảng 1. Trong bảng này, quá trình trắng hóa<br />
và chuẩn hóa dữ liệu thô được thực hiện ở bước tiền xử lý của ICA.<br />
Bảng 1. Thuật toán gradient tự nhiên thống kê trực tuyến cho ước lượng ML.<br />
STT Nội dung thực hiện<br />
các bước<br />
Bước 1 Định tâm dữ liệu.<br />
Bước 2 Khởi tạo giá trị ban đầu cho ma trận W. Chọn các giá trị ban đầu của si ,<br />
i=1, …, n có thể tạo một cách ngẫu nhiên hoặc sử dụng các thông tin biết<br />
trước. Chọn tốc độ học µ và µγ<br />
Bước 3 Tính toán biểu thức y = Wx<br />
Bước 4 Nếu các hàm phi tuyến là không cố định trước thì:<br />
<br />
Cập nhật si 1 si s E tanh yi yi 1 tanh yi <br />
2<br />
(19)<br />
- Nếu si > 0 thì định nghĩa lại gi theo biểu thức (2.16), nếu không thì sử<br />
dụng biểu thức (2.17).<br />
Bước 5 Cập nhật ma trận phân tách bởi: W W I g y y T W (20)<br />
Bước 6 <br />
Nếu không hội tụ ( E g y y T I ) quay lại bước 3.<br />
<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số 33, 10 - 2014 109<br />
Kỹ thuật điện tử & Khoa học máy tính<br />
<br />
Thuật toán cố định điểm nhanh - FastICA<br />
Hàm hợp lý có thể được cực đại hóa theo thuật toán cố định điểm nhanh. Thuật<br />
toán cố định điểm thuộc lớp thuật toán FastICA [3, 4] là một phương pháp có tốc<br />
độ hội tụ rất nhanh và tin cậy để cực đại hóa tính không chuẩn sử dụng trong ước<br />
lượng ICA. Thực tế, thuật toán FastICA có thể được áp dụng trực tiếp để cực đại<br />
hóa hàm hợp lý.<br />
Bước lặp thuật toán FastICA cho dữ liệu đã thực hiện trắng hóa (norm w =1)<br />
được thực hiện như sau:<br />
<br />
w w E zg w T z w E g ' w T z <br />
<br />
(21)<br />
Trong đó, β được xác định: E yi g yi , w+ là giá trị cập nhật mới của w và<br />
z là véc tơ sau thủ tục trắng hóa của x. Viết dưới dạng ma trận ta có:<br />
W W diag i diag i E g y yT W (22)<br />
<br />
<br />
Với αi = 1 E g ' wT z i và y = Wz.<br />
Sau mỗi bước lặp, ma trận W cần được tham chiếu đến tập các ma trận trắng<br />
hóa để đảm bảo tính trực giao của nó:<br />
1 2<br />
W WCWT W (23)<br />
Với C = E{xxT} là ma trận tương quan của dữ liệu.<br />
Các bước xử lý của thuật toán FastICA được tóm tắt trong bảng 2. Trong<br />
FastICA, tốc độ hội tụ được tối ưu bởi việc lựa chọn các ma trận đường chéo diag<br />
(αi) và diag (βi). Hai ma trận này quyết định kích thước bước lặp tối ưu được sử<br />
dụng trong thuật toán.<br />
Bảng 2. Thuật toán FastICA cho ước lượng hợp lý cực đại.<br />
STT Nội dung thực hiện<br />
các bước<br />
Bước 1 Định tâm dữ liệu. Tính ma trận tương quan C=E{xxT}.<br />
Bước 2 Chọn một giá trị khởi tạo cho ma trận phân tách W (có thể chọn ngẫu<br />
nhiên).<br />
Bước 3 Thực hiện tính toán: y Wx (24)<br />
i E yi g yi ; i 1,..., n (25)<br />
i 1 i E g ' yi ; i 1,..., n (26)<br />
Bước 4 Cập nhật ma trận phân tách theo:<br />
W W diag i diag i E g y yT W (27)<br />
Bước 5 Giải tương quan và chuẩn hóa bởi:<br />
1 2<br />
W WCWT W; W = W W W T (28)<br />
Bước 6 Nếu không hội tụ ( E g y y T I ) quay lại bước 3.<br />
<br />
Trong FastICA, đầu ra yi là được giải tương quan và được chuẩn hóa với<br />
phương sai bằng 1 sau mỗi bước lặp. Không có các thao tác phức tạp như trong<br />
<br />
<br />
110 Nguyễn Thị Huyền, Phan Trọng Hanh “Kỹ thuật phân tích …tín hiệu âm thanh”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
thuật toán gradient chính vì thế tốc độ xử lý của FastICA nhanh hơn hẳn so với các<br />
phương pháp truyền thống. Như vậy trong các thuật toán xử lý kỹ thuật ICA theo<br />
nguyên lý ước lượng hợp lẽ cực đại thì thuật toán FastICA bằng thủ tục trắng hóa<br />
và giải tương quan ma trận trộn đã giảm số lượng các phần tử cần phải ước lượng<br />
của ma trận trộn từ n2 xuống còn n(n-1)/2 vì ma trận W là trực giao. Một ưu điểm<br />
khác nữa của FastICA là nó có thể ước lượng cả các thành phần độc lập có phân bố<br />
trên và dưới chuẩn.<br />
2.4. Một số ứng dụng điển hình của ICA<br />
ICA trong lĩnh vực y tế [6]: Xét các bản ghi điện tử của các hoạt động não bộ<br />
của con người được ghi lại bởi điện não đồ MEG (Magneto Encephalo Graphy).<br />
Dữ liệu MEG bao gồm các bản ghi của các điện áp tại các vùng khác nhau của vỏ<br />
não. Các điện áp này được tạo ra bằng cách trộn một số thành phần điện áp nằm<br />
dưới hoạt động não bộ. Bài toán đặt ra là cần tìm ra các thành phần ban đầu của<br />
hoạt động não bộ nhưng lại chỉ có thể quan sát các tổ hợp của các thành phần. Để<br />
giải quyết bài toán này, sử dụng thuật toán ICA, FastICA để tách các hình ảnh độc<br />
lập trong tín hiệu MEG nhằm phát hiện ra các thành phần chuyển động của các cơ<br />
quan và đặc biệt hơn là tìm ra được các thành phần lạ là các xung bệnh lý. Như<br />
hình 1 minh họa, với thuật toán FastICA có thể tách ra được cả thành phần chuyển<br />
động của mắt và nháy mắt (IC3, IC5) cũng như các thành phần của tim, cơ và các<br />
thành phần khác từ các tín hiệu MEG, trong đó phát hiện ra IC4 thể hiện thành<br />
phần lạ của tim chính là xung bệnh lý cần khắc phục. Thuật toán FastICA là một<br />
công cụ đặc biệt phù hợp với việc phân tích tín hiệu hình ảnh MEG này bởi vì việc<br />
phát hiện chuyển động của thành phần lạ là một kỹ thuật tương hỗ và việc tìm ra<br />
chúng có thể thoải mái lựa chọn bao nhiêu thành phần độc lập (IC- Independent<br />
Component) muốn có.<br />
<br />
<br />
<br />
<br />
a) b)<br />
Hình 1. a) Các mẫu của tín hiệu MEG.<br />
b) Các thành phần độc lập được tách từ dữ liệu MEG.<br />
<br />
ICA trong khử giao thoa cho tín hiệu Sonar thụ động [7]: thực hiện phân tách<br />
thành phần độc lập đối với tín hiệu đầu ra của các hydrophone gồm ba thành phần<br />
độc lập: hai tín hiệu từ hai mục tiêu ở hướng 1900, 2050 và tín hiệu tự nhiễu nhằm<br />
giảm nhiễu giao thoa trong các hướng lân cận nhau. Xét ví dụ phân tích DEMON<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số 33, 10 - 2014 111<br />
Kỹ thuật điện tử & Khoa học máy tính<br />
<br />
(Demodulation of Envolope Modulation On Noise - giải điều chế đường bao trên<br />
nền nhiễu) tín hiệu thu được từ hướng 2050 bị nhiễu giao thoa bởi mục tiêu theo<br />
hướng 1900 khi không sử dụng ICA và sử dụng ICA như trong hình 2.<br />
<br />
<br />
<br />
<br />
a) b)<br />
Hình 2. Phân tích DEMON ở 2050: a) không sử dụng ICA, b) sử dụng ICA.<br />
Với việc sử dụng ICA, biên độ các thành phần tần số giao thoa FA và FC đã được<br />
giảm từ -5.9dB và -3.2dB tương ứng xuống mức -9.1dB và -4.2dB. Trên thực tế,<br />
phương pháp sử dụng ICA để giảm nhiễu giao thoa đã được ứng dụng trong Hải<br />
quân Braxin.<br />
Trong lĩnh vực viễn thông, xét ứng dụng thực tế của kỹ thuật FastICA trong tách<br />
các tổ hợp âm thanh sử dụng trong quốc phòng, an ninh.<br />
3. THỰC HIỆN THUẬT TOÁN FASTICA<br />
3.1. Xử lý các tổ hợp tín hiệu âm thanh<br />
Bài toán mô phỏng thực tế: Trong một phòng họp, ta có 4 micro đặt tại 4 vị trí<br />
khác nhau và thu được tổ hợp 4 tín hiệu từ 4 người nói đồng thời. Yêu cầu đặt ra là<br />
chỉ chọn lấy một tín hiệu âm thanh trong số 4 tín hiệu âm thanh ban đầu đó mới là<br />
thông tin có ích. Bốn âm thanh này chính là 4 thành phần độc lập trong bài toán<br />
ICA đang xét.<br />
Xét tổ hợp 4 tín hiệu âm thanh ban đầu có dạng sóng như trong hình 3:<br />
Tin hieu am thanh 1<br />
Amplitude<br />
<br />
<br />
<br />
<br />
0.5<br />
0<br />
-0.5<br />
0 1 2 3 4 5 6 7 8 9<br />
time (ms) 4<br />
x 10<br />
Tin hieu am thanh 2<br />
Amplitude<br />
<br />
<br />
<br />
<br />
0.5<br />
0<br />
-0.5<br />
0 1 2 3 4 5 6 7 8 9<br />
time(ms) 4<br />
x 10<br />
Tin hieu am thanh 3<br />
Amplitude<br />
<br />
<br />
<br />
<br />
1<br />
0<br />
-1<br />
0 1 2 3 4 5 6 7 8 9<br />
time(ms) 4<br />
x 10<br />
Tin hieu am thanh 4<br />
Amplitude<br />
<br />
<br />
<br />
<br />
0.5<br />
0<br />
-0.5<br />
0 1 2 3 4 5 6 7 8 9<br />
time(ms) 4<br />
x 10<br />
<br />
Hình 3. Các tín hiệu âm thanh gốc.<br />
<br />
<br />
<br />
112 Nguyễn Thị Huyền, Phan Trọng Hanh “Kỹ thuật phân tích …tín hiệu âm thanh”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
Giả sử ma trận tổ hợp của 4 tín hiệu là:<br />
A = [1 0.75 0.8 0.6; 0.75 1 0.8 0.75; 0.6 0.7 1 0.6; 0.5 0.7 0.8 1]<br />
Việc lựa chọn ma trận tổ hợp là hoàn toàn ngẫu nhiên, để phù hợp hơn với thực<br />
tế, ta giả thiết rằng mỗi một micro được đặt gần nhất với một tín hiệu tương ứng<br />
khi đó tỷ lệ trộn của tín hiệu này là 1. Như vậy, ta có 4 tổ tín hiệu sau trộn tương<br />
ứng với 4 tổ hợp ta thu được sau micro như thể hiện trong hình 4.<br />
Sử dụng thuật toán FastICA theo phương pháp ước lượng hợp lẽ cực đại ta thu<br />
được 4 tín hiệu có dạng như nhể hiện trong hình 5. So sánh giữa tín hiệu sau khi<br />
tách và tín hiệu ban đầu ta thấy thuật toán đã thực hiện tách được 4 âm thanh từ tổ<br />
hợp trộn ngẫu nhiên của 4 âm thanh gốc. Mặc dù biên độ của tín hiệu là không xác<br />
định được tuy nhiên dạng sóng của tín hiệu sau khi tách là hoán toàn trùng khớp<br />
với dạng sóng của tín hiệu ban đầu.<br />
<br />
Tin hieu tron 1 Tin hieu sau tach 1<br />
Amplitude<br />
Amplitude<br />
<br />
<br />
<br />
<br />
1 2<br />
0 0<br />
-1 -2<br />
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9<br />
time (ms) 4 time (ms) 4<br />
x 10 x 10<br />
Tin hieu tron 2 Tin hieu sau tach 2<br />
Amplitude<br />
Amplitude<br />
<br />
<br />
<br />
<br />
0.5 2<br />
0 0<br />
-0.5 -2<br />
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9<br />
time(ms) 4 time(ms) 4<br />
x 10 x 10<br />
Tin hieu tron 3 Tin sau tach 3<br />
Amplitude<br />
Amplitude<br />
<br />
<br />
<br />
<br />
1 2<br />
0 0<br />
-1 -2<br />
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9<br />
time(ms) 4 time(ms) 4<br />
x 10 x 10<br />
Tin hieu tron 4 Tin sau tach 4<br />
Amplitude<br />
Amplitude<br />
<br />
<br />
<br />
<br />
0.5 2<br />
0 0<br />
-0.5 -2<br />
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9<br />
time(ms) 4 time(ms) 4<br />
x 10 x 10<br />
<br />
Hình 4. Các tín hiệu âm thanh sau khi trộn Hình 5. Các tín hiệu âm<br />
(tín hiệu thu được trong thực tế). thanh sau khi tách.<br />
<br />
<br />
3.2. Đánh giá chất lượng thuật toán<br />
Việc đánh giá chất lượng thuật toán thông qua số bước lặp để thuật toán hội tụ<br />
là việc hết sức cần thiết bởi nó quyết định đến tốc độ xử lý và khả năng thực hiện<br />
của thuật toán theo thời gian thực. Để đo tính hiệu quả của thuật toán, bài báo đề<br />
xuất phương pháp đánh giá thuật toán dựa trên ma trận ước lượng theo chỉ số thực<br />
hiện (PI- Performance Index) được định nghĩa theo biểu thức:<br />
n n gik n g ki <br />
1 <br />
PI <br />
n n 1 i 1 k 1 max j gij<br />
1<br />
<br />
<br />
k 1 max j g ji<br />
1 <br />
<br />
(29)<br />
<br />
-1<br />
Ở đây gij là thành phần (i,j) của ma trận G = W .A. và maxj|gij| biểu diễn cho<br />
giá trị lớn nhất trong số các phần tử của vector hàng thứ i của G, maxj|gji| biểu diễn<br />
cho giá trị lớn nhất trong số các phần tử của vector cột thứ i của G. Khi việc tách<br />
tín hiệu hoàn chỉnh đạt được, chỉ số hiệu quả bằng không (đồng nghĩa với việc ma<br />
trận ước lượng W là hoàn toàn khớp với ma trận tổ hợp A). Thực tế, giá trị chỉ số<br />
hiệu quả khoảng 10-2 đã là thực hiện khá tốt.<br />
<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số 33, 10 - 2014 113<br />
Kỹ thuật điện tử & Khoa học máy tính<br />
<br />
So sánh PI theo số lần lặp theo hình 6.<br />
<br />
0.7<br />
<br />
<br />
0.6<br />
<br />
<br />
0.5<br />
Chi so thuc hien PI<br />
<br />
<br />
<br />
<br />
0.4<br />
<br />
<br />
0.3<br />
<br />
<br />
0.2<br />
<br />
<br />
0.1<br />
<br />
<br />
0<br />
0 20 40 60 80 100 120 140 160 180 200<br />
So lan lap<br />
<br />
<br />
Hình 6. Chất lượng thuật toán cải thiện qua số lần lặp.<br />
<br />
Nhận xét:<br />
Số lần lặp của thuật toán càng lớn thì chỉ số thực hiện PI càng thấp, chứng tỏ<br />
chất lượng của thuật toán được cải thiện đáng kể sau khi tăng số lần lặp. Tuy nhiên<br />
khi lần lặp lớn hơn 150 lần thì thuật toán hội tụ có nghĩa là dù có tăng số lần lặp<br />
lên nữa thì chất lượng tín hiệu đầu ra vẫn không cải thiện thêm. Vì thế, tùy số<br />
lượng tổ hợp tín hiệu đầu vào mà ta có thể lựa chọn số lần lặp cho phù hợp để đảm<br />
bảo tốc độ và thời gian xử lý của thuật toán.<br />
<br />
<br />
4. KẾT LUẬN<br />
Bài báo đã nghiên cứu kỹ thuật ICA theo theo phương pháp ước lượng hợp lý<br />
cực đại, mô phỏng thuật toán bằng chương trình Matlab với tổ hợp 4 âm thanh. Đề<br />
xuất cách đánh giá chất lượng thuật toán qua số lần lặp thông qua hệ số thực hiện<br />
được xây dựng trên ma trận tổng thể G là tích của ma trận tổ hợp (A) và nghịch<br />
đảo ma trận ước lượng của nó (W-1). Rút ra kết luận: kỹ thuật ICA sử dụng ước<br />
lượng hợp lý cực đại là một phương pháp phân tách các nguồn tín hiệu mù cho độ<br />
tin cậy cao và thời gian xử lý nhanh nhất trong nhóm các phương pháp phân tách<br />
nguồn mù áp dụng cho xử lý các tổ hợp âm thanh, hình ảnh,… sử dụng trong lĩnh<br />
vực viễn thông, xử lý ảnh…<br />
<br />
TÀI LIỆU THAM KHẢO<br />
[1]. Bell, AJ, & Sejnowski. “An information-maximization approach to blind<br />
separation and blind deconvolution”. “Neural computation” (1995).<br />
[2]. Lee, London, Kluwer Academic Press. “Independent component analysis”<br />
(2001).<br />
[3]. A.Hyvarinen, Oja.“A fast fixed-point algorithm for independent component<br />
analysis”. “Neural computation” (1997).<br />
<br />
<br />
<br />
<br />
114 Nguyễn Thị Huyền, Phan Trọng Hanh “Kỹ thuật phân tích …tín hiệu âm thanh”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
[4]. A.Hyvarinen, Juha-Karhunen, Erkki - Oja. “Independent Component<br />
Analysis” (2001), pages 182-188.<br />
[5]. Cardoso, J-F. “Infomax and maximum likelihood for blind source separation”.<br />
Ieee signal processing letters (1997).<br />
[6]. J. L. Contreras-Vidal and S. E. Kerick, “Independent component analysis<br />
of dynamic brain responses during visuomotor adaptation” (2004).<br />
[7]. Natanael Nunes de Moura, Eduardo Simas Filho and Joso Manoel de Seixas<br />
“Independent Component Analysis for Passive Sonar Signal Processing”<br />
(2009).<br />
<br />
<br />
ABSTRACT<br />
INDEPENDENT COMPONENT ANALYSIS TECHNIQUE USING MAXIMUM<br />
LIKELIHOOD ESTIMATION IN ANALIZING MIXED AUDIO SIGNALS<br />
Independent Component Analysis (ICA) is a computationally efficient<br />
blind source separation technique for many practical applications in various<br />
fields of science and engineering. This paper studies the method of applying<br />
maximum likelihood estimation on ICA and propose evaluating the<br />
convergence of the algorithm via iteration number to improve the algorithm’s<br />
speed.<br />
Keywords: ICA, ML estimation.<br />
<br />
<br />
<br />
<br />
Nhận bài ngày 20 tháng 07 năm 2014<br />
Hoàn thiện ngày 18 tháng 08 năm 2014<br />
Chấp nhận đăng ngày 15 tháng 09 năm 2014<br />
<br />
<br />
Địa chỉ: * Học viện Kỹ thuật Quân sự.<br />
Email: nguyenhuyenhvktqs@gmail.com. Phone: 0912959582<br />
Email : tronghanhmai@yahoo.com<br />
<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số 33, 10 - 2014 115<br />