14
Tạp chí Khoa học Kinh tế Phát triển Trường Đại học Nam Cần Thơ ISSN: 2588 1272. Số 21 (2023)
Tạp chí Khoa học Kinh tế Phát triển Trường Đại học Nam Cần Thơ ISSN: 2588 1272. Số 21 (2023)
SỬ DỤNG THUẬT TOÁN BẰNG MÁY DỰA TRÊN RADIOMICS TRONG DỰ
ĐOÁN MỨC ĐỘ ĐỘT BIẾN TRONG U BỆNH NHÂN U THẦN KINH ĐỆM
PHÂN ĐỘ THẤP
Lưu Hồ Thanh Lâm, Chu Thy Ngân, Trần Thị Oanh, Đỗ Thị Duyên, Nguyễn Lê Quốc Khánh
Ngày nhn bài: 7/7/2023
Ngày duyt bài: 17/7/2023
ABSTRACT
Lower-grade glioma (LGG) is a type of central nervous system
neoplasm that arises from the glial cells. Patients with Lower-
grade glioma have a median survival time in the range of 1.58
years, depending on the tumor genotypes. In terms of
epidemiology, most lower-grade glioma patients are diagnosed at
a young age, leading to an early age of death. For an accurate
diagnosis and effective treatment, a pathological result from a
biopsy sample is required, however, this has a long turnaround
time. In this study, using pre-operative magnetic resonance
images, we developed a non-invasive model to classify tumor
mutational burden (TMB), a prognostic factor of treatment
response in lower-grade glioma patients, with an accuracy of
0.7936. To our knowledge, our study represented the best model
for the classification of TMB in LGG patients at present.
TÓM TT
Glioma một khối u của Hệ thần kinh trung ương (CNS) phát
sinh từ các tế bào thần kinh đệm. U thần kinh đệm phân độ độ thấp
(LGG) là u thần kinh đệm ở độ IIIII trong bảng phân độ mới
của Tổ chức Y tế Thế giới năm 2016. Qua quá trình ức chế điều
hoà miễn dịch ngược, liệu pháp miễn dịch đang hứa hẹn một
phương pháp điều trị hiệu quả cho bệnh nhân u thần kinh đệm. Tuy
nhiên, phương pháp này không thể áp dụng tốt cho tất cả các loại
LGG mức độ đột biến trong u (TMB) đã được chứng minh
một dấu ấn sinh học tiềm năng cho tính nhạy cảm và tiên lượng
của liu pháp min dch bệnh nhân u thần kinh đệm phân độ
thấp. Do đó, dự đoán TMB có li cho bệnh nhân ung thư thần kinh
đệm. Trong nghiên cu y, cng tôi khảo sát mi tương quan
của các tính ng radiomics dựa trên MRI (Chụp cộng ng t)
và đột biến trong u bệnh nhân u thần kinh đệm phân độ thấp
bằng cách áp dụng các phương pháp tính toán dùng máy. Sau khi
kim tra thống nhất gia dữ liu xác thực và dữ liu sẵn có, chúng
i đã s dụng sáu loại thuật tn kết hợp các mô nh để tìm các
tính năng hiu qunhất và so sánh các mô hình để chọn hiu suất
tốt nhất. Sự kết hợp Light Gradient Boosting Machine thuật toán
di truyn đã thành công trong vic chọn chữ ký 11 radiomics cho
phân loại TMB. Cng tôi đã giải quyết vấn đề dữ liu mất cân
bằng bằng cách s dụng k thuật SVMSMOTE trong Python và đạt
đưc kết quả ấn tưng. Mô nh LightGBM dẫn đến đcnh xác
cao 0,7936 và đạt đưc s cân bằng gia độ nhạy và đđặc hiu,
vi độ nhạy 0,76 và độ đặc hiu 0,8107. Theo hiu biết của chúng
tôi, nghiên cu này có sđcnh xác cao nhất trong các mô nh
mô nh hin nay đ phân loại TMB bệnh nhân LGG.
1. GII THIU
Trong nhiu thập k, vic pn loại ung t
tng dựa trên các đc đim mô học, thông
qua quan sát bằng kính hin vi, s dụng thuốc
nhuộm hematoxylin và eosin, biu hin protein
hóa mô miễn dch và các đc điểm siêu cấu trúc.
V mt mô hc, u thn kinh đm là khối u của
hệ thần kinh trung ương (CNS) phát sinh t các
tế o không phải tế bào thần kinh, bao gồm các
kiu nh u tế o nh sao, u tế o ít si, u thần
kinh đệm ít nhánh và u nguyên o thần kinh
đệm [1]. Mong muốn có một chẩn đoán phân
bit hẹp n và phân loại cnh c n, T
chc Y tế Thế gii (WHO) đã sa đổi pn loi
u thần kinh đm m 2007 vào m 2016 bằng
cách đưa các thông sphân t vào sơ đồ [2]. Sơ
đồ cp nhật phân loại u thn kinh đệm tnh bốn
nhóm: Cp I đến cp IV theo mc độ ác tí
trong khối u. Trong khi trưc đây, cụm t u
thần kinh đệm cp thấp” dùng để chỉ u thần kinh
đệm cp I và II, một thuật ng mi trong
cơng trình mi, u thần kinh đệm phân độ
thấp (LGGs), bao gồm cp độ II và III của
WHO, đang dần tr phổ biến hơn. Pn loi u
thần kinh đệm phân độ thp đóng một vai trò
thiết yếu trong tiên lưng của bnh nhân [3].
Mc phân loại LGG của WHO m 2016 đã
đưc áp dụng để chn đoán phân t, nhưng các
dấu hiu phân t đã biết vn còn hạn chế để gii
tch tiên lưng của LGG. Do đó, vic km
phá thêm v chế di truyền và xác đnh các
dấu n sinh học mi để d đoán tiên lưng của
LGG là điều cần thiết đphát triển c phương
pháp điu tr chính xác.
Tạp chí Khoa học và Kinh tế Phát triển
Trường Đại học Nam Cần Thơ
Website: jsde.nctu.edu.vn
15
Tạp chí Khoa học Kinh tế Phát triển Trường Đại học Nam Cần Thơ ISSN: 2588 1272. Số 21 (2023)
Tạp chí Khoa học Kinh tế Phát triển Trường Đại học Nam Cần Thơ ISSN: 2588 1272. Số 21 (2023)
SỬ DỤNG THUẬT TOÁN BẰNG MÁY DỰA TRÊN RADIOMICS TRONG D
ĐOÁN MỨC ĐỘ ĐỘT BIẾN TRONG U BỆNH NHÂN U THẦN KINH ĐỆM
PHÂN ĐTHẤP
Lưu HThanh Lâm, Chu Thy Ngân, Trn Th Oanh, ĐTh Duyên, Nguyn Lê Quốc Knh
n bài: 7/7/2023
Ngày duyt bài: 17/7/2023
ABSTRACT
Lower grade glioma (LGG) is a type of central nervous system
neoplasm that arises from the glial cells. Patients with Lower
grade glioma have a median survival time in the range of 1.5
years, depending on the tumor genotypes. In terms of
epidemiology, most lower grade glioma patients are diagnosed at
a young age, leading to an early age of death. For an accurate
diagnosis and effective treatment, a pathological result from a
biopsy sample is required, however, this has a long turnaround
time. In this study, using pre operative magnetic resonance
images, we developed a non invasive model to classify tumor
mutational burden (TMB), a prognostic factor of treatment
response in lower grade glioma patients, with an accuracy of
0.7936. To our knowledge, our study represented the best model
for the classification of TMB in LGG patients at present.
Glioma là một khối u của H thần kinh trung ương (CNS) phát
sinh t các tế bào thần kinh đệm. U thần kinh đệm phân độ độ thấp
(LGG) là u thần kinh đệm độ II và III trong bảng phân độ mi
của T chức Y tế Thế gii năm 2016. Qua quá trình c chế điu
hoà min dịch ngưc, liu pháp min dịch đang hứa hẹn là một
phương pháp điu tr hiu quả cho bệnh nhân u thần kinh đệm. Tuy
nhiên, phương pháp này không thể áp dụng tốt cho tt ccác loại
LGG và mc độ đột biến trong u (TMB) đã đưc chứng minh là
một dấu ấn sinh học tim năng cho tính nhạy cảm và tiên lưng
của liu pháp min dch bệnh nhân u thần kinh đệm phân độ
thấp. Do đó, dự đoán TMB có li cho bệnh nhân ung thư thần kinh
đệm. Trong nghiên cu y, cng tôi khảo sát mi tương quan
của các tính ng radiomics dựa trên MRI (Chụp cộng ng t)
và đột biến trong u bệnh nhân u thần kinh đệm phân độ thấp
bằng cách áp dụng các phương pháp tính toán dùng máy. Sau khi
kim tra thống nhất gia dữ liu xác thực và dữ liu sẵn có, chúng
i đã s dụng sáu loại thuật tn kết hợp các mô nh để tìm các
tính năng hiu qunhất và so sánh các mô hình để chọn hiu suất
tốt nhất. Sự kết hợp Light Gradient Boosting Machine thuật toán
di truyn đã thành công trong vic chọn chữ ký 11 radiomics cho
phân loại TMB. Cng tôi đã giải quyết vấn đề dữ liu mất cân
bằng bằng cách s dụng k thuật SVMSMOTE trong Python và đạt
đưc kết quả ấn tưng. Mô nh LightGBM dẫn đến đcnh xác
cao 0,7936 và đạt đưc s cân bằng gia độ nhạy và đđặc hiu,
vi độ nhạy 0,76 và độ đặc hiu 0,8107. Theo hiu biết của chúng
tôi, nghiên cu này có sđcnh xác cao nhất trong các mô nh
mô nh hin nay đ phân loại TMB bệnh nhân LGG.
1. GII THIU
Trong nhiu thập k, vic pn loại ung t
tng dựa trên các đc đim mô học, thông
qua quan sát bằng kính hin vi, s dụng thuốc
nhuộm hematoxylin và eosin, biu hin protein
hóa mô miễn dch và các đc điểm siêu cấu trúc.
V mt mô hc, u thn kinh đm là khối u của
hệ thần kinh trung ương (CNS) phát sinh t các
tế o không phải tế bào thần kinh, bao gồm các
kiu nh u tế o nh sao, u tế o ít si, u thần
kinh đệm ít nhánh và u nguyên o thần kinh
đệm [1]. Mong muốn có một chẩn đoán phân
bit hẹp n và phân loại cnh c n, T
chc Y tế Thế gii (WHO) đã sa đổi pn loi
u thần kinh đm m 2007 vào m 2016 bằng
cách đưa các thông sphân t vào sơ đồ [2]. Sơ
đồ cp nhật phân loại u thn kinh đệm tnh bốn
nhóm: Cp I đến cp IV theo mc độ ác tí
trong khối u. Trong khi trưc đây, cụm t u
thần kinh đệm cp thấp” dùng để chỉ u thần kinh
đệm cp I và II, một thuật ng mi trong
cơng trình mi, u thần kinh đệm phân độ
thấp (LGGs), bao gồm cp độ II và III của
WHO, đang dần tr phổ biến hơn. Pn loi u
thần kinh đệm phân độ thp đóng một vai trò
thiết yếu trong tiên lưng của bnh nhân [3].
Mc phân loại LGG của WHO m 2016 đã
đưc áp dụng để chn đoán phân t, nhưng các
dấu hiu phân t đã biết vn còn hạn chế để gii
tch tiên lưng của LGG. Do đó, vic km
phá thêm v chế di truyền và xác đnh các
dấu n sinh học mi để d đoán tiên lưng của
LGG là điều cần thiết đphát triển c phương
pháp điu tr chính xác.
Tạp chí Khoa học Kinh tế Phát triển
Trường Đại học Nam Cần Thơ
Tạp chí Khoa học Kinh tế Phát triển Trường Đại học Nam Cần Thơ ISSN: 2588 1272. Số 21 (2023)
SỬ DỤNG THUẬT TOÁN BẰNG MÁY DỰA TRÊN RADIOMICS TRONG DỰ
ĐOÁN MỨC ĐỘ ĐỘT BIẾN TRONG U BỆNH NHÂN U THẦN KINH ĐỆM
PHÂN ĐỘ THẤP
Lưu Hồ Thanh Lâm, Chu Thy Ngân, Trần Thị Oanh, Đỗ Thị Duyên, Nguyễn Lê Quốc Khánh
n bài: 7/7/2023
Ngày duyt bài: 17/7/2023
ABSTRACT
Lower grade glioma (LGG) is a type of central nervous system
neoplasm that arises from the glial cells. Patients with Lower
grade glioma have a median survival time in the range of 1.5
years, depending on the tumor genotypes. In terms of
epidemiology, most lower grade glioma patients are diagnosed at
a young age, leading to an early age of death. For an accurate
diagnosis and effective treatment, a pathological result from a
biopsy sample is required, however, this has a long turnaround
time. In this study, using pre operative magnetic resonance
images, we developed a non invasive model to classify tumor
mutational burden (TMB), a prognostic factor of treatment
response in lower grade glioma patients, with an accuracy of
0.7936. To our knowledge, our study represented the best model
for the classification of TMB in LGG patients at present.
Glioma một khối u của Hệ thần kinh trung ương (CNS) phát
sinh tcác tế bào thần kinh đệm. U thần kinh đệm phân độ độ thấp
(LGG) u thần kinh đệm độ II III trong bảng phân độ mới
của Tổ chức Y tế Thế giới năm 2016. Qua quá trình ức chế điều
hoà miễn dịch ngược, liệu pháp miễn dịch đang hứa hẹn một
phương pháp điều trị hiệu quả cho bệnh nhân u thần kinh đệm. Tuy
nhiên, phương pháp này không thể áp dụng tốt cho tất cả các loại
LGG và mức độ đột biến trong u (TMB) đã được chứng minh
một dấu ấn sinh học tiềm năng cho tính nhạy cảm tiên lượng
của liệu pháp miễn dịch bệnh nhân u thần kinh đệm phân độ
thấp. Do đó, dự đoán TMB có lợi cho bệnh nhân ung thư thần kinh
đệm. Trong nghiên cứu này, chúng tôi khảo sát mối tương quan
của các tính năng radiomics dựa trên MRI (Chụp cộng hưởng từ)
đột biến trong u bệnh nhân u thần kinh đệm phân độ thấp
bằng cách áp dụng các phương pháp tính toán dùng máy. Sau khi
kiểm tra thống nhất giữa dữ liệu xác thực và dữ liệu sẵn có, chúng
tôi đã sử dụng sáu loại thuật toán kết hợp các mô hình để tìm các
tính năng hiệu quả nhất và so sánh các mô hình để chọn hiệu suất
tốt nhất. Sự kết hợp Light Gradient Boosting Machine- thuật toán
di truyền đã thành công trong việc chọn chữ ký 11-radiomics cho
phân loại TMB. Chúng tôi đã giải quyết vấn đề dữ liệu mất cân
bằng bằng cách sử dụng kỹ thuật SVMSMOTE trong Python và đạt
được kết quả ấn tượng. Mô hình LightGBM dẫn đến độ chính xác
cao 0,7936 và đạt được sự cân bằng giữa độ nhạy và độ đặc hiệu,
với độ nhạy 0,76 và độ đặc hiệu 0,8107. Theo hiểu biết của chúng
tôi, nghiên cứu này có số độ chính xác cao nhất trong các mô hình
mô hình hiện nay để phân loại TMB ở bệnh nhân LGG.
1. GIỚI THIỆU
Trong nhiều thập kỷ, việc phân loại ung t
thường dựa trên các đặc điểm học, thông
qua quan sát bằng kính hiển vi, sử dụng thuốc
nhuộm hematoxylin và eosin, biểu hiện protein
hóa miễn dịch các đặc điểm siêu cấu trúc.
V mặt mô hc, u thn kinh đm là khối u của
hệ thần kinh trung ương (CNS) phát sinh từ các
tế bào không phải tế bào thần kinh, bao gồm các
kiểu nh u tế bào hình sao, u tế bào ít sợi, u thần
kinh đệm ít nhánh u nguyên bào thần kinh
đệm [1]. Mong muốn một chẩn đoán phân
biệt hẹp hơn phân loại chính xác hơn, Tổ
chức Y tế Thế giới (WHO) đã sửa đổi phân loại
u thần kinh đệm năm 2007 vào năm 2016 bằng
cách đưa các thông số phân tử vào đồ [2].
đồ cập nhật phân loại u thần kinh đệm thành bốn
nhóm: Cấp I đến cấp IV theo mức độ ác nh
trong khối u. Trong khi trước đây, cụm t“u
thần kinh đệm cấp thấp” dùng để chỉ u thần kinh
đệm cấp I II, một thuật ngữ mới trong
chương trình mới, “u thần kinh đệm phân độ
thấp (LGGs)”, bao gồm cấp độ II III của
WHO, đang dần trở phổ biến hơn. Phân loại u
thần kinh đệm phân độ thấp đóng một vai trò
thiết yếu trong tiên lượng của bệnh nhân [3].
Mặc dù phân loại LGG của WHO năm 2016 đã
được áp dụng để chẩn đoán phân tử, nhưng các
dấu hiệu phân tử đã biết vẫn còn hạn chế để giải
thích tiên lượng của LGG. Do đó, việc khám
phá thêm về chế di truyền xác định các
dấu ấn sinh học mới để dự đoán tiên lượng của
LGG là điều cần thiết để phát triển các phương
pháp điều trị chính xác.
16
Tạp chí Khoa học Kinh tế Phát triển Trường Đại học Nam Cần Thơ ISSN: 2588 1272. Số 21 (2023)
Tạp chí Khoa học Kinh tế Phát triển Trường Đại học Nam Cần Thơ ISSN: 2588 1272. Số 21 (2023)
Một điều đáng chú ý giải thưởng Nobel
2018 đã được trao cho James Allison và Tasuku
Honjo trong lĩnh vực Sinh lý học hoặc Y học vì
đã phát triển phương pháp điều trị bệnh ác tính
[4], liệu pháp miễn dịch, sẽ trở thành phương
pháp điều trị ung thư được sử dụng rộng rãi. Tuy
nhiên, dấu ấn sinh học về đột biến trong u
(TMB) đã được chứng minh một yếu ttiên
đoán đáp ứng với liệu pháp miễn dịch [5]. TMB,
được định nghĩa số lượng đột biến hóa
soma trên mỗi megabase (đột biến/Mb) của kiểu
gen khối u [6], đã trở thành một dấu ấn sinh học
giá trị trên nhiều loại ung thư để dự đoán hiệu
quả của phong tỏa điểm kiểm tra miễn dịch
(ICB) [5],]7]. Một nghiên cứu trước đây cho
thấy TMB mối tương quan nghịch với tỷ l
sống sót chung TMB cao thể ức chế sự
xâm nhập miễn dịch trong LGGs [8]. Tương tự,
Wang et al. [9] kết luận rằng TMB có liên quan
đến kết quả kém trong u thần kinh đệm lan tỏa
TMB cao kích hoạt cả hoạt động tăng sinh
phản ứng miễn dịch trong u thần kinh đệm.
Trình tự toàn bộ exome (WES) được coi
tiêu chuẩn vàng để đo lường TMB; tuy nhiên,
hiện không được sử dụng trong môi trường
lâm sàng do chi phí cao và thời gian quay vòng
dài. Phát triển các mô hình trí tuệ nhân tạo để
chẩn đoán chính xác bệnh hay phân loại dấu ấn
miễn dịch, trong đó TMB, giúp tiết kiệm thời
gian, giảm chi phí là xu hướng nổi bật trong thế
giới hiện đại.
Trong nghiên cứu của chúng tôi, chúng tôi
đã phát hiện ra một phương pháp đại diện cho
nh rất tốt để phân loại TMB cho LGG hiện
tại. Nghiên cứu của chúng tôi đưa ra giả thuyết
rằng các thuật toán học bằng máy thể pn
loại TMB cao thấp bằng cách sử dụng
phương pháp chụp cộng hưởng từ (MRI) ở bệnh
nhân LGG. Cụ thể, chúng tôi đã đề xuất một
hình học nhân tạo, tên LightGBM, có thể
xác định các nhóm TMB bằng cách sử dụng
MRI trước phẫu thuật.
Để cải thiện hiệu suất của hình, sau đó
chúng tôi đã sử dụng thuật toán di truyền để
chọn các tính năng radiomics đặc trưng, hiệu
quả nhất để xác định TMB cao thấp, đồng
thời đưa chúng vào các thuật toán khác nhau để
tìm ra hình tốt nhất. Sau đó, chúng tôi đã s
dụng các kỹ thuật giải dữ liệu mất cân bằng khác
nhau trên dữ liệu của mình để đạt được sự cân
bằng tốt giữa độ nhạy độ đặc hiệu, cho kết
quả chính xác và cân bằng nhất hiện nay. Mặc
nghiên cứu của chúng tôi cỡ mẫu nhỏ,
nhưng kết quả của chúng tôi cho thấy có thể sử
dụng hình máy học sử dụng hình ảnh MRI
để hỗ trợ các tình huống lâm sàng.
2. KT QU
2.1 Đặc đim bnh nhân
D liu ca bệnh nhân bao gồm tui, gii
tính, học, cấp độ WHO, các phân nhóm
của phân loại u thn kinh đệm bng cách tích
hợp thông tin di truyền. Theo dịch tễ hc ca u
thần kinh đệm phân độ thp, hu hết bệnh nhân
của chúng tôi còn trẻ tại thi đim chẩn đoán,
với đ tuổi trung bình ln lượt 44,06 49,67.
Sự khác bit v tui gia d liệu đào tạo và xác
nhn có ý nghĩa thống với p <0,05. Ngoài ra,
hu hết bệnh nhân của chúng tôi có đột biến
IDH (84 đột biến so vi 21 kiểu hoang dã)
trạng thái không mã hóa 1p_19q (78 không mã
hóa so với 27 mã hóa) trong thông tin bộ gen
ca họ.
2.2 So sánh cơ s xây dng đ
radiomics
Trong quy trình l ọn tính ng, chúng
i đã s dụng các mô nh thuật tn di truy
(GA) kết hp với loi máy kc nhau để
các tính năng hiu qu t, đư i tính
năng GA, t726 tính năng trong giai đon trích
xuất. Sau đó, các tính năng GA y đưc đánh
giá bi sáu mô nh máy học kc nhau (hồi quy
tuyến tinh LR, vector htr SVM, ng
nhiên RF, phân tích phân bit tuyến tính
LDA, máy tăng cưng đ dốc ánh sáng
LGBM và máy tăng ng đ dố c cao
XGB) trong vic d đoán nhóm TMB. Kết quả
n tính năng GA và hiu sut mô nh
đưc đưa ra trong Bng 2.
Như th n trong Bng 2, mô nh
LGBM đt hiu sut tt nht vi đ
0,72, đ đặ u = 0,8893, đ cnh xác =
0,8367 và đcnh xác = 0,8218, vi 11 tính
ng GA. Mô nh LGBM không chđạt đ
chính c cao nht trong 6 thut toán máy h
dựa trên GA khi dđoán nhóm TMB mà còn
th n s cân bằ a đ y độ đặ
u. Một phiên bản cũ n ca thut tn
LGBM, thut tn XGBoost, cũng cho thy đ
ính xác cao là 0,7808 vi 7 tính năng GA
trong th a cng tôi. Mô nh RF
u sut tt thhai vi đchính c
0,8089 vi 6 tính năng GA. LR cho kết quả tốt
với đcnh c 0,7936 và đ cnh xác
0,836667 ca bng vớ u tốt nht,
LGBM. Hiu sut kém nht đến thai mô nh
còn li, SVM và LDA, vi đcnh xác l
lưt là 0,7462 và 0,7449; tuy nhiên, đây là m
n đưc đi vi thtch phân loi.
Chúng tôi cũng đã thự n các th
thng kê McNemar đxem skhác bit đáng k
a mô nh đã chọ ủa cng tôi
(LightGBM) và các mô hình khác. Kết quả sau
đó cho thấy LightGBM tốt hơn đáng k so vớ
các thut toán khác v độ y. Hơn nữa, độ
cnh c của cũng vưt trội so vi các m
SVM, LDA và XGBoost. Đối v số
khác (đ đặ u và đ cnh c), không có
bất ksự kc bit đáng k o gia tt cc
thuật tn. Tuy nhiên, các thử m thng
y cho thấy LightGBM l ọn tối ưu cho
m v dự đoán này v u sut cao. Vì mô
nh LightGBM là mô nh tt nht vi 11 tính
ng tối ưu, đưc GA c n, cng tôi đã coi 11
tính ng GA y là đc trưng radiomics c
dự đoán TMB trong nghiên c a chúng tôi.
Chúng tôi đã nghiên cu các đc trưng
radiomics da trên MRI trong mối quan hệ vớ
gánh nặng đột biến kh u thn kinh đ
phân đ thp, mô hình ca chúng tôi là mô hình
đầu tiên áp dụng phương pháp tính toán b
máy. Bng cách bắt cc mô nh của s phát
trin, máy LightGBM GA đã thu đưc 11 đ
tính radiomics đ phân loạ TMB. Mô hình
LightGBM của chúng tôi đã đạt đưc kết quả
đầ n vi đ cnh xác cao là 0,7936 và
sự cân b a đ y và đ đặ u (tương
ng là 0,76 và 0,8107).
17
Tạp chí Khoa học Kinh tế Phát triển Trường Đại học Nam Cần Thơ ISSN: 2588 1272. Số 21 (2023)
Tạp chí Khoa học Kinh tế Phát triển Trường Đại học Nam Cần Thơ ISSN: 2588 1272. Số 21 (2023)
Một điu đáng cý là gii tng Nobel
2018 đã đưc trao cho James Allison và Tasuku
Honjo trong lĩnh vực Sinh lý hc hoc Y hc
đã phát trin pơng pháp điu tr bệnh ác tính
[4], liu pháp min dch, s tr thành phương
pháp điu tr ung t đưc s dụng rộng rãi. Tuy
nhiên, du n sinh học v đột biến trong u
(TMB) đã đưc chứng minh là một yếu ttiên
đoán đáp ng vi liu pháp min dịch [5]. TMB,
đưc đnh nga là slưng đột biến mã hóa
soma trên mi megabase (đt biến/Mb) của kiu
gen khối u [6], đã tr tnh một dấu n sinh học
có giá tr trên nhiu loại ung t để d đoán hiu
qu của phong ta điểm kiểm tra miễn dch
(ICB) [5],]7]. Một nghiên cu trưc đây cho
thấy TMB có mối tương quan nghịch vi t l
sống t chung và TMB cao thc chế sự
m nhập min dịch trong LGGs [8]. Tương t,
Wang et al. [9] kết lun rng TMB có liên quan
đến kết quả kém trong u thần kinh đệm lan tỏa
và TMB cao kích hoạt choạt đng tăng sinh và
phản ng min dịch trong u thần kinh đệm.
Trình t tn bộ exome (WES) đưc coi là
tiêu chuẩn vàng để đo lưng TMB; tuy nhiên,
hin không đưc s dng trong môi trưng
lâm sàng do chi phí cao và thời gian quay vòng
i. Pt trin các mô nh trí tuệ nhân to để
chẩn đoán chính xác bệnh hay phân loại du n
min dịch, trong đó có TMB, giúp tiết kim thời
gian, gim chi phí là xu ng ni bật trong thế
gii hin đi.
Trong nghiên cu của cng tôi, chúng tôi
đã phát hin ra một phương pháp đại din cho
mô nh rt tốt để phân loi TMB cho LGG hin
ti. Nghiên cu của chúng tôi đưa ra gi thuyết
rằng các thuật toán hc bng máy thphân
loi TMB cao và thấp bằng cách sử dng
phương pháp chụp cộng ng t (MRI) bệnh
nhân LGG. Cthể, cng tôi đã đề xuất một mô
nh học nhân to, có tên là LightGBM, có thể
xác đnh các nhóm TMB bằng cách sử dng
MRI trưc phu thuật.
Đcải thiện hiu suất ca mô nh, sau đó
chúng tôi đã s dụng thut tn di truyn đ
chọn các tính năng radiomics đặc trưng, hiu
quả nhất để c định TMB cao và thấp, đồng
thi đưa cng o các thut tn khác nhau đ
tìm ra mô nh tốt nhất. Sau đó, chúng tôi đã s
dụng các kỹ thuật gii dữ liu mt cân bằng kc
nhau trên dữ liu của mình để đạt đưc s cân
bằng tốt gia độ nhạy và độ đặc hiu, cho kết
quchính xác và n bằng nhất hiện nay. Mặc
nghiên cu ca chúng tôi có c mu nhỏ,
nhưng kết quả của chúng tôi cho thấy có th s
dụng mô nh máy học s dụng nh nh MRI
để hỗ tr các tình huống lâm sàng.
2.1 Đc đi
a bnh nn bao gm tu
tính, mô họ p độ WHO, và các phân nhóm
ủa phân loại u thn kinh đệm bng cách tích
p thông tin di truyn. Theo dịch t
thn kinh đệm phân độ th ết bệnh nhân
ủa chúng tôi còn tr tại thi đi n đn,
với đtui trung nh ln lưt là 44,06 và 49,67.
Sự khác bit vtu a d u đào to xác
n có ý nga thống kê vi p <0,05. Ngi ra,
ết bnh nhân ca chúng tôi có đột biế
IDH (84 đột biến so vi 21 kiu hoang ) và
trng ti không mã hóa 1p_19q (78 không mã
hóa so vi 27 mã hóa) trong thông tin bộ gen
ọ.
2.2 So sánh cơ s xây dng đ
radiomics
Trong quy trình l ọn tính ng, chúng
i đã s dụng các mô nh thuật tn di truy
(GA) kết hp với loi máy kc nhau để
các tính năng hiu qu t, đư i tính
năng GA, t726 tính năng trong giai đon trích
xuất. Sau đó, các tính năng GA y đưc đánh
giá bi sáu mô nh máy học kc nhau (hồi quy
tuyến tinh LR, vector htr SVM, ng
nhiên RF, phân tích phân bit tuyến tính
LDA, máy tăng cưng đ dốc ánh sáng
LGBM và máy tăng ng đ dố c cao
XGB) trong vic d đoán nhóm TMB. Kết quả
n tính năng GA và hiu sut mô nh
đưc đưa ra trong Bng 2.
Như th n trong Bng 2, mô nh
LGBM đt hiu sut tt nht vi đ
0,72, đ đặ u = 0,8893, đ cnh xác =
0,8367 và đcnh xác = 0,8218, vi 11 tính
ng GA. Mô nh LGBM không chđạt đ
chính c cao nht trong 6 thut toán máy h
dựa trên GA khi dđoán nhóm TMB mà còn
th n s cân bằ a đ y độ đặ
u. Một phiên bản cũ n ca thut tn
LGBM, thut tn XGBoost, cũng cho thy đ
ính xác cao là 0,7808 vi 7 tính năng GA
trong th a cng tôi. Mô nh RF
u sut tt thhai vi đchính c
0,8089 vi 6 tính năng GA. LR cho kết quả tốt
với đcnh c 0,7936 và đ cnh xác
0,836667 ca bng vớ u tốt nht,
LGBM. Hiu sut kém nht đến thai mô nh
còn li, SVM và LDA, vi đcnh xác l
lưt là 0,7462 và 0,7449; tuy nhiên, đây là m
n đưc đi vi thtch phân loi.
Chúng tôi cũng đã thự n các th
thng kê McNemar đxem skhác bit đáng k
a mô nh đã chọ ủa cng tôi
(LightGBM) và các mô hình khác. Kết quả sau
đó cho thấy LightGBM tốt hơn đáng k so vớ
các thut toán khác v độ y. Hơn nữa, độ
cnh c của cũng vưt trội so vi các m
SVM, LDA và XGBoost. Đối v số
khác (đ đặ u và đ cnh c), không có
bất ksự kc bit đáng k o gia tt cc
thuật tn. Tuy nhiên, các thử m thng
y cho thấy LightGBM l ọn tối ưu cho
m v dự đoán này v u sut cao. Vì mô
nh LightGBM là mô nh tt nht vi 11 tính
ng tối ưu, đưc GA c n, cng tôi đã coi 11
tính ng GA y là đc trưng radiomics c
dự đoán TMB trong nghiên c a chúng tôi.
Chúng tôi đã nghiên cu các đc trưng
radiomics da trên MRI trong mối quan hệ vớ
gánh nặng đột biến kh u thn kinh đ
phân đ thp, mô hình ca chúng tôi là mô hình
đầu tiên áp dụng phương pháp tính toán b
máy. Bng cách bắt cc mô nh của s phát
trin, máy LightGBM GA đã thu đưc 11 đ
tính radiomics đ phân loạ TMB. Mô hình
LightGBM của chúng tôi đã đạt đưc kết quả
đầ n vi đ cnh xác cao là 0,7936 và
sự cân b a đ y và đ đặ u (tương
ng là 0,76 và 0,8107).
Tạp chí Khoa học Kinh tế Phát triển Trường Đại học Nam Cần Thơ ISSN: 2588 1272. Số 21 (2023)
Một điều đáng chú ý giải thưởng Nobel
2018 đã được trao cho James Allison và Tasuku
Honjo trong lĩnh vực Sinh lý học hoặc Y học vì
đã phát triển phương pháp điều trị bệnh ác tính
[4], liệu pháp miễn dịch, sẽ trở thành phương
pháp điều trị ung thư được sử dụng rộng rãi. Tuy
nhiên, dấu ấn sinh học về đột biến trong u
(TMB) đã được chứng minh một yếu ttiên
đoán đáp ứng với liệu pháp miễn dịch [5]. TMB,
được định nghĩa số lượng đột biến hóa
soma trên mỗi megabase (đột biến/Mb) của kiểu
gen khối u [6], đã trở thành một dấu ấn sinh học
giá trị trên nhiều loại ung thư để dự đoán hiệu
quả của phong tỏa điểm kiểm tra miễn dịch
(ICB) [5],]7]. Một nghiên cứu trước đây cho
thấy TMB mối tương quan nghịch với tỷ l
sống sót chung TMB cao thể ức chế sự
xâm nhập miễn dịch trong LGGs [8]. Tương tự,
Wang et al. [9] kết luận rằng TMB có liên quan
đến kết quả kém trong u thần kinh đệm lan tỏa
TMB cao kích hoạt cả hoạt động tăng sinh
phản ứng miễn dịch trong u thần kinh đệm.
Trình tự toàn bộ exome (WES) được coi
tiêu chuẩn vàng để đo lường TMB; tuy nhiên,
hiện không được sử dụng trong môi trường
lâm sàng do chi phí cao và thời gian quay vòng
dài. Phát triển các mô hình trí tuệ nhân tạo để
chẩn đoán chính xác bệnh hay phân loại dấu ấn
miễn dịch, trong đó TMB, giúp tiết kiệm thời
gian, giảm chi phí là xu hướng nổi bật trong thế
giới hiện đại.
Trong nghiên cứu của chúng tôi, chúng tôi
đã phát hiện ra một phương pháp đại diện cho
nh rất tốt để phân loại TMB cho LGG hiện
tại. Nghiên cứu của chúng tôi đưa ra giả thuyết
rằng các thuật toán học bằng máy thể pn
loại TMB cao thấp bằng cách sử dụng
phương pháp chụp cộng hưởng từ (MRI) ở bệnh
nhân LGG. Cụ thể, chúng tôi đã đề xuất một
hình học nhân tạo, tên LightGBM, có thể
xác định các nhóm TMB bằng cách sử dụng
MRI trước phẫu thuật.
Để cải thiện hiệu suất của hình, sau đó
chúng tôi đã sử dụng thuật toán di truyền để
chọn các tính năng radiomics đặc trưng, hiệu
quả nhất để xác định TMB cao thấp, đồng
thời đưa chúng vào các thuật toán khác nhau để
tìm ra hình tốt nhất. Sau đó, chúng tôi đã s
dụng các kỹ thuật giải dữ liệu mất cân bằng khác
nhau trên dữ liệu của mình để đạt được sự cân
bằng tốt giữa độ nhạy độ đặc hiệu, cho kết
quả chính xác và cân bằng nhất hiện nay. Mặc
nghiên cứu của chúng tôi cỡ mẫu nhỏ,
nhưng kết quả của chúng tôi cho thấy có thể sử
dụng hình máy học sử dụng hình ảnh MRI
để hỗ trợ các tình huống lâm sàng.
2.1 Đặc đi
a bệnh nhân bao gồm tu
tính, họ ấp độ WHO, các phân nhóm
ủa phân loại u thn kinh đệm bng cách tích
ợp thông tin di truyền. Theo dịch tễ
thần kinh đệm phân độ th ết bệnh nhân
ủa chúng tôi còn trẻ tại thi đi ẩn đoán,
với đtuổi trung nh lần lưt 44,06 49,67.
Sự khác bit vtu a d ệu đào tạo và xác
n có ý nghĩa thống với p <0,05. Ngoài ra,
ết bệnh nhân của chúng tôi đột biế
IDH (84 đột biến so với 21 kiểu hoang dã)
trạng thái không mã hóa 1p_19q (78 không mã
hóa so với 27 hóa) trong thông tin bộ gen
ọ.
2.2 So sánh sở xây dựng đc tính
radiomics
Trong quy trình lựa chọn tính năng, chúng
tôi đã s dụng các mô hình thuật toán di truyền
(GA) kết hợp với loại máy khác nhau để chn
các tính năng hiệu quả nhất, được gi là tính
ng GA, t 726 tính năng trong giai đon trích
xuất. Sau đó, các tính năng GA này được đánh
giá bởi sáu mô hình máy học khác nhau (hồi quy
tuyến tinhLR, vector h trSVM, ngẫu
nhiênRF, phân tích phân bit tuyến tính
LDA, máy tăng cường đ dốc ánh sáng
LGBM máy tăng ng đ dốc cc cao
XGB) trong vic d đoán nhóm TMB. Kết quả
la chn tính năng GA và hiệu suất hình
được đưa ra trong Bảng 2.
Như th hin trong Bng 2, mô hình
LGBM đạt hiệu sut tt nht vi đ nhy =
0,72, đ đặc hiu = 0,8893, đ chính xác =
0,8367 đ chính xác = 0,8218, vi 11 tính
năng GA. hình LGBM không ch đạt đ
chính xác cao nht trong 6 thut toán máy hc
dựa trên GA khi d đoán nhóm TMB mà còn
th hin s cân bằng gia đ nhạy độ đặc
hiệu. Một phiên bản hơn của thut toán
LGBM, thut toán XGBoost, cũng cho thy đ
chính xác cao 0,7808 vi 7 tính năng GA
trong th nghim ca chúng tôi. hình RF
mang li hiu suất tốt th hai vi đ chính xác
0,8089 vi 6 tính năng GA. LR cho kết quả tốt
với đ chính xác 0,7936 đ chính xác
0,836667 ca bằng với mu tốt nhất,
LGBM. Hiu sut kém nht đến t hai mô hình
còn li, SVM và LDA, vi đ chính xác ln
t 0,7462 0,7449; tuy nhiên, đây mc
chp nhn đưc đi vi th thách phân loại.
Chúng tôi cũng đã thực hin các th nghim
thng McNemar đ xem s khác bit đáng k
giữa hình đã chọn của chúng tôi
(LightGBM) các hình khác. Kết quả sau
đó cho thấy LightGBM tốt hơn đáng kể so với
các thut toán khác v độ nhạy. Hơn nữa, độ
chính xác của nó cũng vượt trội so với các mẫu
SVM, LDA XGBoost. Đối vi hai ch số
khác đặc hiu và đ chính xác), không
bất k sự khác bit đáng k nào giữa tt c các
thuật toán. Tuy nhiên, các thử nghim thng kê
này cho thấy LightGBM là la chọn tối ưu cho
nhim v dự đoán này vi hiu suất cao. Vì mô
hình LightGBM là mô hình tốt nht với 11 tính
năng tối ưu, được GA chọn, chúng tôi đã coi 11
tính năng GA này đc trưng radiomics ca
dự đoán TMB trong nghiên cu ca chúng tôi.
3. KT LUN
Chúng tôi đã nghiên cứu các đc trưng
radiomics da trên MRI trong mối quan hệ với
gánh nặng đột biến khi u u thn kinh đm
phân đ thp, mô hình ca chúng tôi là mô hình
đầu tiên áp dụng phương pháp tính toán bằng
máy. Bằng cách bắt chước hình của sự phát
trin, máy LightGBM-GA đã thu được 11 đc
tính radiomics đ phân loại TMB. hình
LightGBM của chúng tôi đã đạt đưc kết quả
đầy ha hn vi đ chính xác cao 0,7936
sự cân bng gia đ nhy đ đặc hiệu (tương
ứng là 0,76 và 0,8107).
18
Tạp chí Khoa học Kinh tế Phát triển Trường Đại học Nam Cần Thơ ISSN: 2588 1272. Số 21 (2023)
Tạp chí Khoa học Kinh tế Phát triển Trường Đại học Nam Cần Thơ ISSN: 2588 1272. Số 21 (2023)
Table 1. Comparative performance among different GA-based machine learning algorithms in
predicting the TMB group
TÀI LIU THAM KHO
[1] Louis, D.N. (2007). WHO Classification of
Tumours of the Central Nervous System;
WHO Regional Office Europe:
Copenhagen, Denmark. [Google Scholar].
[2] Louis, D.N., Perry, A., Reifenberger, G.,
Von Deimling, A., Figarella-Branger, D.,
Cavenee, W.K., Ohgaki, H., Wiestler,
O.D., Kleihues, P., & Ellison, D.W.
(2016). The 2016 World Health
Organization classification of tumors of
the central nervous system: A
summary. Acta Neuropathol. 131, 803
820. [Google Scholar] [CrossRef]
[PubMed][Green Version].
[3] The Cancer Genome Atlas Research
Network. (2015). Comprehensive,
integrative genomic analysis of diffuse
lower-grade gliomas. N. Engl. J. Med. 372,
24812498. [Google Scholar] [CrossRef]
[PubMed][Green Version].
[4] Ballas, Z.K. (2018). The 2018 Nobel Prize
in Physiology or Medicine: An exemplar
of bench to bedside in immunology. J.
Allergy Clin. Immunol. 142, 1752–1753.
[Google Scholar] [CrossRef]
[PubMed][Green Version].
[5] Chan, T.A., Yarchoan, M., Jaffee, E.,
Swanton, C., Quezada, S.A., Stenzinger,
A., & Peters, S. (2019). Development of
tumor mutation burden as an
immunotherapy biomarker: Utility for the
oncology clinic. Ann. Oncol. 30, 4456.
[Google Scholar] [CrossRef].
[6] Chalmers, Z.R., Connelly, C.F., Fabrizio,
D., Gay, L., Ali, S.M., Ennis, R., Schrock,
A., Campbell, B., Shlien, A., &
Chmielecki, J. (2017). Analysis of 100,000
human cancer genomes reveals the
landscape of tumor mutational
burden. Genome Med. , 34. [Google
Scholar] [CrossRef][Green Version].
[7] Braun, D.A., Burke, K.P., & Van Allen,
E.M. (2016). Genomic approaches to
understanding response and resistance to
immunotherapy. Clin. Cancer Res.
5650. [Google Scholar]
[CrossRef][Green Version].
[8] Yin, W., Jiang, X., Tan, J., Xin, Z., Zhou,
Q., Zhan, C., Fu, X., Wu, Z., Guo, Y., &
Jiang, Z. (2020). Development and
Validation of a Tumor Mutation Burden
Related Immune Prognostic Model for
Lower Grade Glioma. Front. Oncol.
1409. [Google Scholar] [CrossRef].
[9] Wang, L., Ge, J., Lan, Y., Shi, Y., Luo, Y.,
Tan, Y., Liang, M., Deng, S., Zhang, X., &
Wang, W. (2020). Tumor mutational
burden is associated with poor outcomes in
diffuse glioma. BMC Cancer. , 213.
[Google Scholar] [CrossRef].