LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA<br />
<br />
<br />
ỨNG DỤNG GIẢI THUẬT DI TRUYỀN (GA) ĐỂ TỐI ƯU THAM SỐ<br />
HỆ MỜ TRONG PHÂN LỚP TÍN HIỆU ĐIỆN TIM<br />
APPLICATION OF GA FOR OPTIMISING PARAMETERS OF FUZZY<br />
SYSTEMS IN ECG CLASSIFICATION<br />
Hoàng Thị Ngọc Diệp, Trần Duy Khánh, Hoàng Thị An<br />
Email: hoangdiepdtth@gmail.com<br />
Trường Đại Học Sao Đỏ<br />
Ngày nhận bài: 16/2/2017<br />
Ngày nhận bài sửa sau phản biện: 6/11/2017<br />
Ngày chấp nhận đăng: 28/12/2017<br />
<br />
Tóm tắt<br />
<br />
Bài báo trình bày các bước xây dựng một mô hình phân lớp điện tim sử dụng hệ mờ không đơn trị<br />
(NSFLS). Đầu tiên, các tín hiệu điện tim được cho qua một khối tiền xử lý để loại nhiễu do môi trường<br />
ghi điện tâm đồ gây ra. Tín hiệu sau khi xử lý nhiễu sẽ được phân tích và trích rút các đặc trưng thích<br />
hợp. Các đặc trưng này là đầu vào của một hệ phân lớp mờ không đơn trị. Sau khi xác định cấu trúc<br />
của mô hình phân lớp, xây dựng các tham số của mô hình qua một quá trình học dựa vào tập dữ liệu<br />
huấn luyện. Cuối cùng, nhóm tác giả sử dụng giải thuật di truyền để tối ưu tham số hệ mờ nhằm thu<br />
được kết quả phân lớp tín hiệu điện tim tốt nhất.<br />
Từ khóa: Hệ mờ không đơn trị (NSFLS); giải thuật di truyền (GA); phân loại mẫu; phân lớp tín hiệu điện<br />
tim (ECG).<br />
Abstract<br />
The paper presents a method to construct a non-singleton fuzzy logic system (NSFLS) for ECG<br />
arrhythmic classification. The classifier is applied to distinguish normal sinus rhythm (NSR),<br />
ventricular fibrillation (VF) and ventricular tachycardia (VT). Two features of ECG signal, the average<br />
period and the pulse width, are inputs to the fuzzy classifier. The rule base used in the fuzzy system is<br />
constructed from training data. The generalized bell membership function is used to examine the<br />
performance of the classifier with different shapes of membership function. The results of experiments with<br />
data from the MIT-BIH Malignant Ventricular Arrhythmia Database show the viability of a non-singleton<br />
fuzzy system in ECG classification. Then, GA Optimisation of Non-Singleton Fuzzy Logic System for ECG<br />
Classification to obtain the best results.<br />
Keywords: Non-singleton fuzzy logic system (NSFLS); genetic algorithm (GA); pattern classification;<br />
electrocardiogram (ECG).<br />
<br />
1. GIỚI THIỆU phân loại nhưng chúng đều có chung cấu trúc nền<br />
tảng và các bước khi thiết kế. Theo [8] các thành<br />
Trong thực tế có rất nhiều bài toán cần phân loại<br />
phần của một bộ phân loại và trình tự thiết kế bộ<br />
mẫu như bài toán phân loại ảnh khuôn mặt, phân<br />
phân loại được chỉ ra trên hình 1.<br />
loại văn bản, phát hiện lỗi trong các phân tích máy<br />
móc và y tế, phân loại chữ viết… Có rất nhiều vấn Bước trích chọn đặc trưng biến đổi dữ liệu đầu<br />
đề con người xử lý khá đơn giản. Trái lại, trong vào (trong không gian quan sát) thành các vectơ<br />
nhiều trường hợp, phương án sử dụng máy tính đặc trưng (trong không gian đặc trưng). Không<br />
đã chỉ ra mức độ khó của vấn đề. Tuy gặp nhiều gian đặc trưng có số chiều ít hơn nhiều so với<br />
khó khăn nhưng việc sử dụng máy tính trong các không gian quan sát. Bước tiếp theo là biến đổi<br />
bài toán nhận dạng mẫu ngày càng trở nên phổ từ không gian đặc trưng sang không gian quyết<br />
biến. Mục đích chính của việc phân loại mẫu là tự định được định nghĩa bởi tập các lớp (xác định).<br />
động trợ giúp con người khi phân tích khối lượng Một bộ phân loại hay một thuật toán sẽ sinh ra<br />
dữ liệu cực lớn và từ đó trích chọn ra những tri một phân hoạch của không gian đặc trưng bởi các<br />
thức hữu ích. Mặc dù có nhiều phương thức khi miền quyết định. Sau khi thiết kế bộ phân loại với<br />
<br />
<br />
Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017 5<br />
NGHIÊN CỨU KHOA HỌC<br />
<br />
hiệu năng mong muốn, ta có thể sử dụng nó để loại mẫu và tiết kiệm chi phí tính toán. Nếu những<br />
phân loại các đối tượng mới. Điều này có nghĩa đặc trưng thừa hay không thích hợp ảnh hưởng<br />
là bộ phân loại sẽ gán từng vectơ đặc trưng trong đến hiệu năng cũng như chất lượng phân loại<br />
không gian đặc trưng với một lớp trong không mẫu, thậm chí có thể dẫn tới việc phân loại sai.<br />
gian quyết định. Do có nhiều cách lựa chọn thuật toán nên độ khó<br />
Trong bài toán phân loại mẫu, trích chọn đặc khi trích chọn đặc trưng cũng rất đa dạng. Hơn<br />
trưng là nhiệm vụ khó khăn nhất, quyết định đến nữa, trong các ứng dụng ta luôn phải đối mặt với<br />
độ chính xác của thuật toán. Khi trích chọn đặc nhiễu. Nguyên nhân của chúng là do nhiễu điện<br />
trưng cần lựa chọn những đặc trưng hữu ích để trong các thiết bị trích chọn hoặc thao tác các thiết<br />
tìm ra thuật toán học hiệu quả cho bài toán phân bị không đúng.<br />
Dữ liệuvào<br />
Dữ liệu vào<br />
Thu<br />
Thunhập dữdữ<br />
thập liệu<br />
<br />
<br />
Cảm biến<br />
Cảm biến<br />
Lựa chọn<br />
Lựa đặcđặc<br />
chọn trưng<br />
<br />
<br />
Tiền xử lýlý<br />
Tiền xử<br />
Lựa<br />
Lựachọn lớp<br />
chọ lớp<br />
<br />
<br />
<br />
Trích<br />
Trích chọn<br />
chọn đặcđặc<br />
trưng<br />
Huấnluyện<br />
Huấn luyện phân<br />
phân loại<br />
t<br />
<br />
Phân lớp<br />
Phân lớp Đánh<br />
Đánhgiágiá<br />
hiệu suất<br />
hiệu<br />
ấ<br />
<br />
<br />
Quyết<br />
Quyếtđịnh<br />
định Kết thúc<br />
Kết thúc<br />
<br />
a) b) b)<br />
a)<br />
Hình 1. a) Các thành phần của bộ phân loại; b) Trình tự thiết kế bộ phân loại sử dụng GA<br />
<br />
Đã có nhiều nghiên cứu để phân lớp tín hiệu điện đơn trị khi có nhiễu trong các đặc trưng được trích<br />
tim. Theo [3] với mô hình mờ sử dụng logic mờ chọn. Điều này rất hữu ích khi không thể tránh<br />
loại 2 khoảng đơn trị thì khả năng làm việc với khỏi sự nhập nhằng trong dữ liệu đầu vào [8].<br />
nhiễu hiệu quả chưa cao. Theo [9] sử dụng hệ mờ<br />
2. GIẢI THUẬT DI TRUYỀN ÁP DỤNG VÀO BÀI<br />
loại hai khoảng và thuật toán VF - Filter Leakage<br />
TOÁN ECG<br />
thì khả năng phân lớp chưa tối ưu hóa hàm thuộc<br />
và cơ sở luật. Do đó, hệ mờ không đơn trị được 2.1. Bài toán ECG<br />
chọn vì nó thích hợp hơn hệ mờ đơn trị khi làm<br />
Bài toán phân lớp điện tim được mô tả theo sơ đồ<br />
việc với nhiễu. Giải thuật di truyền được dùng để<br />
tối ưu hóa đồng thời hàm thuộc và cơ sở luật. như hình 2, trong đó:<br />
Bài báo này trình bày khả năng của hệ mờ không - Đầu vào gồm hai đặc trưng: độ rộng xung (PW),<br />
đơn trị và giải thuật di truyền để xử lý nhiễu trong<br />
chu kỳ xung (T).<br />
các bài toán phân loại mẫu. Hiệu năng của các hệ<br />
thống đơn trị và không đơn trị được so sánh với - Đầu ra loại nhịp tim (phân làm ba lớp): NRS (nhịp<br />
nhau trong bài toán phân lớp điện tim. Các kết tim bình thường), VF (chứng rung tâm thất) và VT<br />
quả chỉ ra rằng giải thuật di truyền tốt hơn hệ mờ (chứng tim đập nhanh).<br />
<br />
<br />
6 Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017<br />
LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA<br />
<br />
<br />
rn trong đó n = 1, 2, …, 9. Do vậy, tổng cộng 21<br />
Tín hiệu điện tim đầu vào tham số (3 chức năng thành viên × 2 tham số × 2<br />
biến đầu vào + 9 quy tắc) cần thiết để giải thuật di<br />
truyền điều chỉnh.<br />
+ Mỗi tham số luật được mã hóa thành chuỗi<br />
Xử lý và trích rút đặc trưng của tín hiệu nhị phân 2-bit.<br />
+ Mỗi tham số của hàm được mã hóa thành<br />
chuỗi nhị phân 8-bit.<br />
Do đó, chiều dài của chuỗi nhị phân là 114 bit<br />
Phân lớp tín hiệu (12x8+2x9=114 bit). Minh họa cấu trúc của nhiễm<br />
sắc thể (hình 3).<br />
<br />
<br />
Loạn nhịp tim<br />
<br />
Hình 2. Sơ đồ bài toán ECG Hình 3. Cấu trúc của nhiễm sắc thể<br />
Trong quá trình thẩm định thích hợp các tham số<br />
2.2. Giải thuật di truyền<br />
phải được giải mã (kiểu hình đại diện).<br />
Giải thuật di truyền sử dụng các mã hóa nhị phân, + Tham số luật giải mã thành dãy số<br />
mỗi cá thể là một chuỗi bit, thông qua các toán tử nguyên 0-4.<br />
di truyền: chọn lọc, lai ghép, đột biến, tái tạo. + Tham số hàm giải mã thành số thực bằng<br />
procedure Genetic_Algorithm; cách sử dụng phương trình lập bản đồ tuyến tính<br />
như dưới đây [3]:<br />
begin Aq<br />
min max min (1)<br />
g p = Gq + (Gq − Gq ) ×<br />
t ← 0; 2N −1<br />
Khởi tạo thế hệ ban đầu P(t); trong đó: p và q: chuỗi gen tương ứng; gp biểu thị<br />
giá trị thực tế của các tham số qth; Aq biểu diễn các<br />
Đánh giá P(t) (theo hàm thích nghi); số nguyên đại diện là chuỗi gen N-bit; Gq<br />
max<br />
và<br />
repeat Gqmin biểu thị cho người dùng xác định giới hạn<br />
trên và dưới của gen tương ứng.<br />
t ← t + 1;<br />
3. CẤU TRÚC CỦA MÔ HÌNH PHÂN LỚP MỜ<br />
Sinh ra thế hệ mới P(t) từ P(t-1) bởi<br />
SỬ DỤNG GA ĐỂ TỐI ƯU THAM SỐ<br />
• Chọn lọc<br />
Về cơ bản, kiến trúc chung của mô hình GA giống<br />
• Lai ghép với mô hình phân lớp loại hai khoảng. Tuy nhiên<br />
• Đột biến trong cấu trúc có thêm khối tiền xử lý và giảm bớt<br />
khối giảm loại và khử mờ.<br />
Đánh giá P(t);<br />
until Điều kiện kết thúc được thỏa mãn;<br />
end;<br />
<br />
2.3. Giải thuật di truyền ứng dụng vào bài<br />
toán ECG<br />
Khi thiết kế một hệ mờ giải quyết bài toán ECG<br />
dùng giải thuật di truyền, đầu tiên là xem xét chiến<br />
lược trình bày và cách thức mã hóa hệ mờ vào<br />
nhiễm sắc thể. Trong thiết kế giải thuật di truyền<br />
ở bài báo này có hai đầu vào và mỗi đầu vào gồm<br />
hai biến x1 và x2 (có thể là độ rộng xung và chu<br />
kỳ hoăc độ rộng xung và biên độ) được phân chia<br />
thành ba hàm, do đó, có 12 tham số (vì 2 tham số<br />
x 2 đầu vào x 3 chức năng thành viên = 12 tham<br />
số). Giả sử không mất tính tổng quát và độ lệch<br />
tiêu chuẩn của hàm tham gia là mxi và σ xi , với<br />
l l<br />
<br />
i = 1, 2 và l = 1, 2, 3. Ngoài ra có 9 luật (3x3) trong Hình 4. Cấu trúc của một hệ phân loại mờ<br />
các quy tắc cơ sở, thêm kết quả phụ 9 tham số, sử dụng GA<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017 7<br />
NGHIÊN CỨU KHOA HỌC<br />
<br />
3.1. Khái niệm hệ mờ không đơn trị dữ liệu trong cửa sổ dài 4s à ta có n = 1000 mẫu<br />
có các giá trị Xi với i = 1, 2,.., 1000.<br />
Kaufman và Gupta [7] định nghĩa phép mờ hóa<br />
không đơn trị: Một bộ mờ hóa không đơn trị có Lấy x[m] là trung bình cộng các phần tử của mảng<br />
′) 1(=<br />
dạng µ X i ( xi= i 1,..., p ) và µ X i ( xi ) giảm dần từ {Xi}. Tạo một mảng X’ bằng cách lấy giá trị của<br />
1 khi xi xa dần xi′ . mỗi phần từ trừ đi Xm: X’i = {xi – xm}<br />
3.2. Khối tiền xử lý Làm các công việc sau trên mảng X’:<br />
Xét một bộ phân loại, giả sử có thể có một số loại - Tính giá trị âm nhỏ nhất Vn và giá trị dương lớn<br />
nhiễu. Đầu tiên, các đầu vào của bộ phân loại có nhất Vp.<br />
thể bị hỏng. Các tín hiệu điện tim ghi được (đặc biệt - Tạo một phần chuỗi nhị phân: Nếu các phần<br />
là tín hiệu điện tim đo trên bề mặt) rất nhạy cảm với tử có giá trị trong khoảng (0