HUFLIT Journal of Science
CI TIN MNG HC SÂU GOOGLENET H TR PHÂN LOI BNH CAO
HUYT ÁP TRÊN NH VÕNG MC MT
Võ Th Hng Tuyết, Nguyn Thanh Bình
Khoa Công Nghệ Thông Tin, Trường Đại học Ngoại ngữ-Tin học TP.HCM
tuyetvth@huflit.edu.vn, binh@huflit.edu.vn
TÓM TẮT nh võng mc mt cha nhiu thông tin hữu ích. Đặc trưng của nh võng mc mắt được rút trích t các mô hình
hc cần được ci thin và tối ưu giúp quá trình phân loạ i bnh được chính xác hơn. Khả năng phân loại càng cao thì quá trình
chẩn đ n và điề u tr bnh lý càng thun li. Thách thc trong xnh võng mc trích xut đặc trưng quan trọng vi các
tham s đầu phù hp vi hình thái học tương ng. Trong nghiên cu này, chúng tôi đ xut quá trình ci tiến mng
GoogLeNet dựa vào chế hình thái học waveform đ phân loi bnh cao huyết áp trên nh võng mc mắt. Phương pháp đề
xut gồm hai giai đoạn: tin x tham s đầu vào cho hình hc vi hình thái hc waveform, GoogLeNet chiết xuất đặc
trưng với s ci tiến s ng tng Inception h tr chiết xuất đặc trưng sâu. Kết qu đưc th nghim trên tp d liu
STARE với độ chính xác 93.25 %. Quá trình so sánh kết qu phân loại đ ưc so sánh vi mt s phương pháp gần đây cho
kết qu kh quan hơn.
Từ khóa— GoogLeNet, hình thái hc waveform, phân lp bnh cao huyết áp, nh võng mc mt.
I. GIỚI THIỆU
Bnh cao huyết áp vi nhiu biến chng phc tp đã gây ra nhiu h ly bnh phc tp. Vic phát hin sm
căn bệnh này th h tr cho quá trình chn đoán điều tr lâm ng ca các chuyên gia y tế. Ngoài các thiết
b đo, thiết b thăm khám c th đã áp dụng, vic da trên các hình thái b phận trong thể bệnh nhân để chn
đoán bệnh là mt trong các yếu t đáng lưu tâm. Da vào võng mc mắt đánh giá các yếu t bnh nhãn khoa. Tuy
nhiên, các mch u này vn chứa đựng nhiu thông tin hu ích. vy, phát hin bnh nhân b bnh cao huyết
áp da trên nh võng mc mt là mt trong các ch đề đưc quan tâm trong th giác máy tính.
Do đ dày ca mch u ng mc ch t 3 đến 5 điểm nh liên tc gn nhau trong nh, nên vic trích xut
các đặc trưng phải chi tiết đảm bo yếu t hàng xóm gn nhau. Chính nhng yếu t này, nếu quá trình làm
mn (smoothing) hay ci thin chất lượng (enhancing) din ra vi nhiều ngưỡng (threshold)/ b lc (filter) s
gây mt thông tin cn thiết. Trong thi gian qua, nhiều phương pháp đã được đề xuất để thc hin vic này
xoay quanh các ch đề: ca s trượt, phép biến đổi min không gian hay th b qua giai đoạn làm mn, thc
hin tiếp tc c hình hc trích xuất đặc trưng. Bản đồ đặc trưng được trích xut t c hình hc vi s
ng tham s đầu vào ổn đnh, chu chi phi bi s tng, cu trúc hóa giải mã, đặc trưng h c b sung,
Tuy nhiên, nếu la chn s ổn định ca tham s đầu vào, s can thip vào vic bình n này cần đư c quan m.
Chính vậy, c phương pháp tin x đầu o ảnh đã đưc nghiên cu th k đến như: miền tn s, min
không gian, phép biến đổi hình thái hc. Quá trình này tn dng kết qu đầu vào được phát trin trong các
nghiên cu gần đây do các kết qu kh quan khi áp dng mô hình máy hc trích xuất đặc trưng. Kiến trúc ca các
hình máy hc hoc học sâu đã được đề xut trin khai rng khp vi nhiu la chn cu trúc backbone.
GoogLeNet vi kiến trúc phân tng Inception tích chp b lc kết hợp đã mang lại nhng kết qu kh quan
cho bản đồ đặc trưng.
Bài báo này đề xut một phương pháp phân loại bnh cao huyết áp trên nh võng mc mt s dng hình thái hc
waveform ci tiến GoogLeNet. Phư ơng pháp đề xut gồm hai giai đoạn: tin x lý tham s đầu vào hình
hc vi hình thái hc waveform, và GoogLeNet ci tiến s ng tng Inception h tr trích xuất đặc trưng sâ u.
B cc ca bài báo này gm 5 phn: phn 1 gii thiu tng quan; các nghiên cứu liên quan đến vn đ nghiên cu
đưc trình bày phần 2; phương phá p đề xut phân loi bnh cao huyết áp trên nh võng mc mắt được nêu
phn 3; kết qu thc nghiệm và định hưng phát trin trong tương lai được trình bày ln lượt phn 4 và 5.
II. CÁC NGHIÊN CỨU LIÊN QUAN
Kh năng trích xuất đặc trưng ca c hình học được áp dng nhiu trong bài toán phân loi, vi phân loi
bnh cao huyết áp trên nh võng mc mt không phi ngoi lệ. Phương pháp phát hiện t động bnh cao
huyết áp vi h thng h tr đưc trin khai t 2012 vi công trình [1] ca Kevin cng s. Quá trình nhn
dng t động ti nghiên cu này c òn s ơ khi vi phép biến đổi Radon vi h tr tính toán đặ c trưng bằng ROI
(Region of Interest). Công trình [2] tiếp tc phát trin ROI bằng chế cc b trung tâm đ xác định bản đồ đặc
trưng. Vào năm 2019, bài toán phân vùng đã đư c áp dụng đ h tr phát hin bnh cao huyết áp với cơ chế
mạng -ron hc sâu ng nghĩa hình ảnh. Đây cũng chính mt trong nhng cách thc tn dng h thng
hóa gii mã cho quá trình tng hợp đặc trưng của bài toán phân lp. Vi s phát trin rng khp ca mạng lưi
RESEARCH ARTICLE
2 CẢI TIẾN MẠNG HỌC SÂU GOOGLENET HỖ TRỢ PHÂN LOẠI BỆNH CAO HUYẾT ÁP TRÊN ẢNH VÕNG MẠC MẮT
hc sâu cho chiết xuất đặc trưng, lần lưt các mạng lướ i mới được đề xuất như: ResNet-50 [4], DenseNet [5], hay
kết hp vi điều kiện chế phân tích điều kin lọc đặc trưng [6, 7]. Nhược điểm của các phương pháp theo
định hướng này vic tối ư u tham s đầu o cho hình hc gii hạn phương pháp tin x d liu. Bên
cạnh đó, các hình hc vi h thng mã hóa giải chung thưng bao gm trình t tương xứng v s ng
block thc hin tng tng, từng giai đoạn nên đồng nghĩa việc chiết xuất đặc trưng sâu là vấn đ thách thc.
Tin x lý hình nh đầu vào ca các h thng phân lp bao gm nhiu hình thức: đa cấp độ min không gian
hoc ci thin chất lượng điểm ảnh. Tính toán wave đã đư c đề xut bi Nucci cng s [8]. Tại đây quá trình
trích xuất đặc t rưng hình thái học được thc hin t động da trên hc ground-truth ca đối tượng trong nh.
Đa dạng hóa hình thái vi biến đổi waveform cho tín hiệu đầu vào h tr phân tích phân lp tối ưu vi
support vector machine (SVM) đã được đề xut ti [9]. Năm 2023, Yang cộng s [10] đã tiến hành nghiên cu
máy hc áp dng cho chp ct lp động mch phi nhm đánh giá áp lực này lên bnh nhân cao huyết áp. Quá
trình s dng máy hc đánh giá đã s dng hình dng, khu vc hình thái c a đối tượng cn thiết. Điểm chung
ca các công trình nghiên cu này không biến đổi hình thái ch tp trung o vic tái kết ni gia các khu
vc cùng tính cht.
Biến đổi nh thái học đối tượng còn th da o các yếu t: tng din tích khu vực, biên độ, thi gian (tùy
loi tín hiu s) hoặc đặc trưng hình thái. Các yếu t này đã được đề xut ti [11 13]. Bên cạnh đó, kết hp gia
học sâu đặc trưng hình thái tín hiệu đã đưc áp dụng để nh toán gim ti m tht trái theo dng bài toán
phân lp [12] hình thái biu hin gen [13]. Nhìn chung, các đ c trưng hình thái học được s dụng như yếu t
tin x cho hình nh đầu vào ca các h thng phân lp hay phát hiện đối tượng s s dụng đi kèm hình
hc sâu hoc ci thiện đầu vào cho hc sâu [14-17]. Quá trình học đặc trưng trải qua kết cu nhiu tng x lý ca
học sâu và các cơ chế tối ưu bản đ đặc trưng bằ ng thuyết ng nghĩa phân đon hoc xác sut tính toán.
Da vào các nghiên cứu c ó liên quan đã lit kê trên, kết qu liên đới và kết hp gia hình thái hc cùng các
hình học s âu đã trở thành xu thế tt yếu trong các h thng phân lp hay phát hin bất thường trên nh t
nhiên và y khoa.
III. PHƯƠNG PHÁP ĐỀ XUẤT PHÂN LOẠI BỆNH CAO HUYẾT ÁP
Như đã trình bày phn 1, nghiên cứu y đề xuất phương pháp phân loi bnh cao huyết áp da trên hình thái
hc waveform ci tiến hình GoogLeNet. C ác giai đoạn của phương pháp đ xuất được t như hình 1
ới đây.
Hình 1. Phương pháp đ xut phân loi bnh cao huyết áp
Như đã mô tả, phươ ng pháp đề xut bao gồm hai giai đoạn:
Giai đoạ n 1: ti ền xử với hình thái học waveform cải thiện chấ t lượng tham số đầu vào cho giai đoạn
sau. Quá trình này tập trung o hình gợn sóng th eo biên waveform i sdụng cho quá trình làm
mịn.
Giai đoạn 2: cải tiến tầng Inception trong kiến trúc hình GoogLeNet. Kết quả tầng cuối cùng là xác
suất dự đoán softmax nhằm lựa c họn kết quả phân loại.
A. HÌNH THÁI HC WAVEFORM
Hình thái hc waveform là trng thái ca nh thái dng sóng ca tín hiệu. Hình thái này liên quan đến khu vc
đối tượng, biên độ khong cách giữa các điểm nh. Vi hình thái học cơ bản s bao gm các yếu t:
Giãn nỡ (Dilation).
Xói mòn (Erosion).
Mở thực thi (Opening p erforms).
Đóng thực thi (Closing p erforms).
Tính toán khác biệt (To pHat calculates).
Tính toán watershed (Watershed calculates).
Quá trình tính toán từng giai đon hay tng hợp quy trình đều dựa vào cơ chế thun đc trưng của giãn n xói
mòn trên nn tảng đóng/ mở khu vực được la chọn. Đi vi nh ng mc mắt, hình thái s óng còn đưc ghi
nhn theo kết hp vi phn ng cm quang khi chụp và đ nhy sáng. Các giá tr độ y trong quá trình phc v
hồi độ nhy sáng có hình nón và thường được ty trắng. Đây chính là các yếu t quan trng để c định hình thái
Hình nh
đầu vào
Hình thái hc
waveform
Đầu ra
softmax
GoogLeNet ci tiến
tng Inception
Võ Thị Hồng Tuyết, Nguyễn Thanh Bình 3
gn sóng ci thin chất lượng tham s đầu vào cho giai đoạn lin sau. Hình thái sóng waveform trong phương
pháp đề xuất đư c áp dụng như sau:
Tính toán điểm ni bt trên toàn cc nh.
Chọn lự a số điểm nổi bật trung tâm (số cụm hình thái) bằng tính chất gom cụm k-means. Lựa chọn số
cụm tùy theo từng khu vực sau khi đã xói mòn và giãn nỡ.
Tính toán đường sở giữa mỗi điểm nh với điểm trun g m của cụm gần nhất. Quá trình này được
tính theo khoảng cách Euclidean.
Trên mỗi điểm ảnh p, tính khoảng ch với các điểm hàng xóm trong khu vực cửa sổ 3 3. Điểm q
nào gần với p hơn sẽ hợp với p 1 góc sao cho p và q là 2 tia tạo ra được từ điểm trung tâm cụm của p.
Nếu góc hợp thành độ lớn hơn 30o sẽ được gộp chung khu vực gom cụm cập nhật giá trị mới
bằng giá trị điểm p ban đầu. Ngược lại sẽ loại khỏi khu vực gom cụm hiện tại.
Việc tính toán này đã hỗ tr cho hình thái gn giữa các điểm nh trong nh võng mc mắt được tăng ng tính
liên đới gần hơn so với trước đây. Trở thành tin đ tt cho mô hình hc chiết xuất đặc trưng.
B. PHÂN LOI BNH CAO HUYT ÁP VỚI GOOGLENET ĐƯC CI TIN
Hình 2. Quá trình ci tiến GoogLeNet.
Sau khi trải qua giai đoạn tin x vi waveform, kết qu đầu ra giai đoạn 1 s thành đầu o cho hình
GoogLeNet ci tiến giai đon 2. Kiến trúc ca mt hình GoogLeNet truyn thng bao gm 3 khối như hình
2, bao gm:
Khối 1: 1 tầng Convolutional (strike = 2), 1 tầ ng M axPooling (strike = 2) 1 tầng tích chập tái sử
dụng dài hạn (Long-Term Recurrent Convolutional Network LRCN).
Conv
7 7
MaxPool
3 3
LRCN
Conv
3 3
Conv
1 1
Inception layer
Conv
1 1
Conv
1 1
Conv
3 3
Conv
1 1
Conv
5 5
Conv
1 1
MaxPool
3 3
Bottleneck
Filter
concatenation
Khối 1
Khối 2
Khối 3
Average Pool
7 7
FC
Softmax
Activation
Input
Softmax
output
4 CẢI TIẾN MẠNG HỌC SÂU GOOGLENET HỖ TRỢ PHÂN LOẠI BỆNH CAO HUYẾT ÁP TRÊN ẢNH VÕNG MẠC MẮT
Khối 2: 1 tầ ng Convolutional (1 kernel), 1 tầng Convolutiona l (strike = 1) 1 tầng LRCN, tầng
Inception.
Khối 3: 1 tầng Average Pool (1 kernel), 1 tầng Fully Connected (FC) và 1 tầng softmax activation.
Kiến trúc ca tng Inception s bao gm 4 thành phn tính song song nhau:
Thành phần 1: 1 tầng Convolution (1 1)
Thành phần 2: 1 tầng Convolution (1 1) và 1 tầng Convolution (3 3)
Thành phần 3: 1 tầng Convolution (1 1) và 1 tầng Convolution (5 5)
Thành phần 4: 1 tầng MaxPooling (3 3) và 1 tầng Convolution (1 1)
Kết nối Filter Concatenation.
Khi ci tiến tng Inception, phương pháp đ xut áp d ng chế Bottleneck cho thành phn 1 ca tng này. C
th chi tiết toàn b kiến trúc GoogLeNet ci tiến như hình 2. Vi Bottleneck, quá trình thc hin bao gm:
1 tầng batch normal ization: giữ kích thước của bản đồ đặc trưng ở tầng trước đó.
1 tầng batch normalization: huấ n luy ện vớ i k ích cỡ 64 16 và giữ padding.
Nối kết bản đồ đặc trưng cho bước filter concatenation liền sau.
Bottleneck đưc s dng nhm mục đích tăng cường đặc trưng trích xuất sâu trên cùng kích c ca bản đồ đầu
vào. Quá trình tối ưu sâu này hu ích vi hình trên hình nh võng mc mt. do đến t độ dày mỏng độ
liên kết gn giữa các đim nh trên loi hình nh này. Vốn bệnh nhân cao huyết áp s gặp khó khăn d liu
đầu vào so vi mô hình hc u. Vic la chn tái to ti tng Inception c òn tăng cư ng cho tng lc kết hp
cui khi 2 ca GoogLeNet.
IV. THÍ NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ
A. TP D LIU
Tp d liu STARE (STructured Analysis of the Retina) [18], được m rng gm 402 nh ng mc mt kích
thước 605 700 chun 24 bit trên 1 điểm ảnh màu RG B. Trong đó, 26 nh ca bnh nhân b cao huyết
áp và s còn li là không có du hiu bnh cao huyết áp (có th rơi vào loại bnh khác).
(a) Hình nh võng mc mt ca bnh nhân không b cao huyết áp
(b) Hình nh võng mc mt ca bnh nhân b cao huyết áp
Hình 3. Mt s hình nh trong tp d liu STARE [18]
Bng 1. Các tham s đ tăng d liu cho tp d liu STARE
Loi biến đổi
Mô t
Xoay (rotation)
Xoay ngu nhiên gia (-10, 10)
Ct (clipping)
Ct ngu nhiên trong các góc (-10, 10)
Lt (flipping)
Lt ngang (horizontal) và dc (vertical)
Dch chuyn (translation)
Dch chuyn ngu nhiên trong phm vi -5% đến 5% s ợng điểm nh
Hình 3 trình bày mt s hình nh trong tp STARE [18]. Toàn b hình nh được thc hiện thay đổi kích thưc
512 512, biến đổi xoay cắt đ đa dạng hóa tp d liu mu thành 1000 nh phc v cho thc nghim. Các
phép biến đi xoay quanh các tính ch t như bảng 1.
B. THC NGHIM
Quá trình thc nghim trên tập STARE [18] được áp dng theo từng giai đon của phương pháp đề xut. Kết qu
đưc thc thi so sánh vi phương pháp GoogLeNet truyn thng [17], ResNet-50 [4] AI semantic [3]. Môi
Võ Thị Hồng Tuyết, Nguyễn Thanh Bình 5
trường thực thi môi trường tương đồng v tham s kích c đầu vào. Kết qu thc nghiệm được đánh giá
bằng đ chính c (Accuracy) ca kết qu phân lp bnh nhân cao huyết áp trên nh võng mc mắt được nêu c
th bng 2. Giá tr độ đo chính xác theo công thức dưới đây:
(1)
Trong đó:
True Positive (TP): số lượng kết quả phân loại đúng lớp so với dữ liệu mẫu.
True Negative (TN): số lượng kết quả không thuộc về nhóm đúng (ground–truth), kết quả phân loại là
kết quả không thuộc lớ p (phân lớp khác so với TP) nhưng trong dữ liệu mẫu lại thuộc.
False Positive (FP): số lượng kết quả thuộc phân lớp nhưng không đún g với thực tế (groundtruth),
kết quả thuộc phân lớp nhưng không đúng trong dữ liệu mẫu.
False Negative (FN): s lượng kết quả không thu ộc phân lớp nhưng không đúng với thực tế (ground-
truth), kết quả phân loại không thuộc lớp và không thuộc cả trong dữ liệu mẫu.
Khi đánh giá, ACC càng cao cho thy phương pháp đang th nghim cho kết qu phân loi càng chính xác.
Bng 2. Đ chính xác trung bình ca phương pháp đ xut và mt s phương pháp khác khi thc nghim trên tp STARE
Phương pháp thực nghim
Độ chính xác
(tp STARE gc)
Độ chính xác
(tập STARE đã được biến đổi ng dữ liu)
GoogLeNet truyn thng [17]
91.17%
90.33%
ResNet-50 [4]
90.08%
89.92%
AI semantic [3]
89.66%
88.35%
Phương pháp đề xut
94.68%
93.25%
Để kim chng s thích hp giữa waveform và ngưng lọc để to mịn cho đầu vào GoogLeNet ci tiến, chúng tôi
đã tiến hành thc nghim vi mt s ngưỡng ph biến: Gaussian, Bayesian vi Waveform. Hình ảnh được đánh
giá bng giá tr độ chính xác ca toàn b tp d liệu STAR E đã đưc biển đổi tăng dữ liệu tương ng vi tng
ngưỡng này. Các giá tr c th đưc th hin bảng 3 dưới đây.
Bng 3. Đ chính xác trung bình gia các ngưỡng lc và waveform trên tp STARE
Phương pháp thực nghim
Độ chính xác
(tp STARE gc)
Độ chính xác
(tập STARE đã được biến đổi ng dữ liu)
Gaussian + GoogLeNet ci tiến
92.89%
92.13%
Bayesian + GoogLeNet ci tiến
90.77%
89.04%
Waveform + GoogLeNet ci tiến
94.68%
93.25 %
Da trên các kết qu so sánh trên, chúng tôi nhn thy hình thái hc waveform phù hp vi s ci tiến ca
GoogLeNet. T vic ci thin tham s đầu vào, quá trình ci tiến tng Inception bng Bottleneck đã mang li kết
qu kh thi tối ưu được bản đồ đặc trưng cho quá trình phân lp bnh cao huyết áp trên nh võng mc mt.
Quá trình chiết xuất đặc trưng sâu đã phù hợp vi chế Bottleneck do đ dày đ liên kết yếu giữa c ác điểm
nh võng mc cn s kết ni sâu tầng tính toán đặ c trưng.
V. KẾT LUẬN VÀ HƯỚNG NGHIÊN CỨU MỞ RỘNG
Phân loi bnh cao huyết áp rt cn thiết cho y hc hiện đại. Nghiên cứu này đã đề xut một phương pháp h tr
phân loi bnh cao huyết áp da trên nh ng mc mt nh vào hình thái hc waveform và ci tiến GoogLeNet
để trích xu t đặc trưng sâu. T đó, bản đồ đặc trưng góp phần xác định đâu là c mch máu võng mc ca bnh
nhân b cao huyết áp. Phương pháp đ xuất đã đưc thc nghim trên tp STARE [18] và so sánh với các phương
pháp: GoogLeNet truyn thng [17], ResNet-50 [4] và AI semantic [3]. Kết qu đã cho thấy tính kh thi ca s kết
hp hình thái hc waveform và mô hình hc sâu GoogLeNet trong bài toán phân lp này. Tuy nhiên, trong tương
lai cn tiến hành đa dng hóa yếu t hình thái hc cho bản đồ đặc trưng sâu và th nghim trên nhiu tp d liu
khác đ hình được hc chuẩn xác n. Bên cạnh đó, nghiên cứu ci thin s tng cho hình hc sâu da
trên trng thái hình thái cũng vấn đề cần được u tâm nhằm gim thiu thi gian hun luyn vn tn
dng tt các tham s d liệu đầu vào.