Hong Bang International University Journal of Science ISSN: 2615-9686
277
Tp chí Khoa hc Tng Đi học Quốc tế Hng Bàng S Đc bit: Hi ngh Khoa học Tui tr Ln thứ 1 - 5/2024
DOI: https://doi.org/10.59294/HIUJS.KHTT.2024.032
DU N GEN CA LICHEN PHNG MING QUA PHÂN TÍCH D LIU PHIÊN MÃ
Thị Duy Phúc1, và Choi Youngnim2
1Trường Đại hc Quốc tế Hồng Bàng,
2Đại hc Quc gia Seoul
TÓM TT
Lichen phẳng miệng (LPM) mt trong những bệnh niêm mạc miệng ph biến nht, nhưng vẫn
chưa có cách chữa. Nghiên cu này nhằm hiểu rõ hơn vdu n gen trong sinh bệnh hc LPM thông
qua phân tích các b dữ liệu phiên sẵn trong sở dữ liệu công cng. Hai tập dữ liệu phiên
mã được tải xuống phân tích theo hai hướng: toàn b hoặc mt phn dữ liệu sau khi loại bỏ các
ngoại lai. Các gen biểu hiện khác biệt (DEG) tăng điều hoà trong b dữ liệu biểu LPM so với
người khỏe mạnh về phát triển biểu bì, biệt hóa tế bào sừng, sừng hóa, phản ng với nhiễm khuẩn
phản ng miễn dch bẩm sinh. Ngược lại, DEG tăng điều hoà trong b dữ liệu ca toàn b lớp niêm
mạc LPM ch yếu phản ánh hoá ng đng ca tế bào miễn dch phản ng viêm/miễn dch. 43
DEG trng lặp trong hai tập dữ liệu được xác đnh sau khi loại bỏ các ngoại lai khỏi mỗi tập dữ liệu.
Các DEG chung liên quan đến tăng sừng, lành thương, khiếm khuyết hàng rào biểu mô và phản ng
với nhiễm khuẩn. Tóm lại, chúng tôi xác đnh được các du n gen liên quan đến sự tăng sừng, lành
thương, khiếm khuyết hàng rào biểu mô và phản ng với nhiễm trng trong LPM.
Từ khóa: lichen phẳng miệng, dữ liệu phiên mã, khiếm khuyết hàng rào biểu mô, nhiễm trng
GENE SIGNATURES IN ORAL LICHEN PLANUS BY TRANSCRIPTOMIC
DATA ANALYSIS
Vo Thi Duy Phuc and Choi Youngnim
ABSTRACT
Oral lichen planus (OLP) is one of the most common oral mucosal diseases, but there is still no cure.
This study aimed to investigate the gene signatures of OLP through analysis of transcriptomic
datasets available in public databases. Two transcriptomic datasets were downloaded and analyzed
in two ways: the entire set or subset of data after removing outliers. Differentially expressed genes
(DEGs) upregulated in OLP epithelial dataset compared to healthy individuals involved in
keratinocyte differentiation, keratinization, epidermal development, response to infection, and innate
immune response. In contrast, the upregulated DEGs in the dataset of the OLP mucosa mainly
reflected immune cell chemotaxis and inflammatory/immune responses. 43 overlapping DEGs in the
two datasets were identified after removing outliers from each dataset. Common DEGs were involved
in hyperkeratosis, wound healing, barrier defects, and response to infection. In summary, we
identified gene signatures associated with hyperkeratosis, wound healing, epithelial barrier defects,
and response to infection in OLP.
Keywords: oral lichen planus, transcriptomic data, barrier dysfunction, iìnection
1. GII THIU
Lichen phng ming (LPM), mt biến th ca bệnh lichen phẳng, bnh viêm mn tnh qua trung
gian tế bào T vi nguyên nhân chưa rõ. T l lưu hành toàn cu ưc tnh ca LPM trong dân s tng
Tác giả liên hệ: TS. Võ Th Duy Phúc, Email: phucvtd@hiu.vn
(Ngày nhận bài: 20/03/2024; Ngày nhận bản sửa: 15/04/2024; Ngày duyệt đăng: 24/04/2024)
ISSN: 2615-9686 Hong Bang International University Journal of Science
278
Tp chí Khoa hc Tng Đi học Quốc tế Hng Bàng S Đc bit: Hội ngh Khoa hc Tui trẻ Ln th1 - 5/2024
quát là 1101%, dao đng t 0.47% đến 1.74% vi s khác bit v đa l. LPM thường gp hơn đ
tui trên 40, vi t l n chiếm ưu thế là 1.5:1. Ngoài ra, LPM được T chc Y tế Thế gii đnh nghĩa
là mt ri lon c nguy ác tnh ming, vi tỷ lệ hoá ác là 2.28%. Sang thương LPM được phân
thành sáu dng trên lâm sàng, gồm dng lưi, dng nhú, dng mảng, dng teo đỏ, dng lot, và dng
bóng nưc. LPM thường hiện diện  niêm mc má, lưỡi và nưu [1]. Đặc đim mô hc ca LPM bao
gm dày sng, thâm nhim tế bào lympho dng di và thoái ha lng lp tế bào đáy. Đặc bit, thoái
ha lng phn ánh s lo ha ca các tế bào đáy b tn thương ging vi s thay đi chuyn tiếp
biu mô-trung mô đin hnh, do đ, c th liên quan đến s biến đi ác tnh của LPM [2].
Mc d mt s tác nhân tim tàng bao gm yếu t di truyn và tâm l, thuốc điu tr toàn thân, chn
thương và nhim trng được đ xut, nhưng sinh bệnh hc của LPM vẫn cn mơ hồ. Baek cng
sự trưc đây đ đ xut mt vng tròn lun qun ca ri lon chc năng hàng rào biu mô và nhim
trng ni bào ca các tế bào đáy biu mô như là mt hnh tim năng cho quá trnh sinh bệnh của
LPM [3]. Thay đi biu hin ca mt s yếu t liên quan đến s bit ha biu mô và chc năng hàng
rào bảo vệ trong LPM, cng như gợi  tnh trng nhiễm khun đ được báo cáo trưc đây [4]. Trong
s các cytokine liên quan đến phản ứng viêm được phát hin trong các tn thương LPM, yếu t hoi
t khi u (TNFα), interferon-γ (IFN-γ) và interleukin 1-β (IL-1β) phá huỷ các mối nối biu mô của
hàng rào bảo vệ, nhưng interleukin-17 (IL-17) duy tr tnh toàn vn ca hàng rào này thông qua s
điu ha của protein occludin của mối nối [5].
Ngược li, vi các nghiên cu ch kim tra mt vài thành phn phân t riêng lẽ, việc lp h sơ phiên
m cung cp mt bc tranh tng th v cơ s phân t ca mt bệnh. Cho đến nay, c 5 nhm đ báo
cáo các gen biu hin khác biệt (DEG) liên quan đến LPM vi kết quả khác nhau thông qua việc phân
tch phiên m [610]. Tuy nhiên, mi nhm c mc tiêu khác nhau ch báo cáo mt s DEG
h quan tâm. Nhm hiu sâu hơn v vai tr ca ri lon chc năng hàng rào biu mô và nhim trng
trong sinh bnh hc LPM, chúng tôi tiến hành phân tch hai tập dữ liệu phiên m c sn trong cơ s
d liu công cng và xác đnh các DEG liên quan đến s bit ha tế bào sng bất thường và sự nhiễm
trùng.
2. PHƯƠNG PHÁP NGHIÊN CỨU VÀ VẬT LIỆU NGHIÊN CỨU
2.1 Biu hiện gen của dữ liu phiên mã
Trong s năm nghiên cu trưc đ, hai tập dữ liu phiên m được gi vào cơ s d liu công cng là
GSE52130 [7] và GSE38616 [8] được đưa vào nghiên cu hin ti. Các tập dữ liệu được ti xung
t kho lưu tr công cng Gene Expression Omnibus (GEO) ca Trung tâm thông tin công ngh sinh
hc quc gia (National Center of Biotechnology Information, NCBI, www.ncbi.nlm.nih.gov/geo).
Tập dữ liu GSE52130 chứa bảy mẫu biu mô LPM và bảy mu khe mnh da trên nn tng
GPL10558 (Illumina HumanHT-12 V4.0 expression BeadChip), trong khi tp d liu GSE38616 da
trên nn tng GPL6244 (Affymetrix Human Gene 1.0 ST Array) và bao gồm 7 mẫu niêm mc LPM
và 7 mu niêm mc khe mnh.
2.2 Phân tích gen biểu hiện khác biệt (differentially expressed gene, DEG)
Phn mm R (phiên bn 3.5.1) (http://www.r-project.org/) vi gi Bioconductor (phiên bản 3.8) được
s dụng đ thc hin tin xử l dữ liệu, tinh sch trnh tự đc, ánh x trnh tự đc lên hệ gen tham
chiếu và ưc tnh biu hiện. Kim đnh T-test được s dụng đ xác đnh DEG gia các mẫu LPM và
mẫu đối chng khe mnh. Giá tr p < 0.05 và |đ sai khác| 2 được chn làm tiêu ch gii hn đ
sàng lc DEG. Phương pháp Benjamini-Hochberg được s dụng đ tnh toán giá tr p được điu chnh
theo tham số đ tin cậy FDR (False discovery rate) đ báo cáo giá tr q. Giá tr q < 0.05 được xem là
c nghĩa thng kê. Bản đồ nhit (heatmap) ca các DEG kèm phân cụm thứ bậc được to bng gi
hclust stats trên R (http://stat.ethz.ch/R-manual/R-patched/library/stats/html/hclust. html) và biu đồ
phân tch thành phn chnh (Principal components analysis, PCA) được to bng gi FactoMineR
(http://factominer.free.fr) và rgl (http://r-forge.r-project.org/projects/rgl/) trên R.
Hong Bang International University Journal of Science ISSN: 2615-9686
279
Tp chí Khoa hc Tng Đi học Quốc tế Hng Bàng S Đc bit: Hi ngh Khoa học Tui tr Ln thứ 1 - 5/2024
2.3. Phân tích Gene Onology (GO)
Phn mm trc tuyến Database for Annotation, Visualization, and Integrated Discovery (DAVID;
phiên bn 6.8; http://david.abcc.ncifcrf.gov) được s dụng đ phân tch các quá trnh sinh hc chc
năng cho tt c các b dữ liu DEG da trên trên cơ s d liu GO (http://www.geneontology.org/).
Giá tr p < 0.05 và s gen liên quan ≥ 4 được chn làm tiêu ch gii hn đ sàng lc.
2.4. Phương pháp thống kê
Kim đnh T-test được sdụng đ xác đnh các DEG giữa các mẫu LPM mẫu đối chứng khỏe
mnh. Kim đnh T-test Benjamin-Hochberg được thực hiện trên R. Mức nghĩa được đặt p
hoặc q < 0,05.
3. KẾT QUẢ VÀ BÀN LUẬN
3.1. Kết quả phân tích các DEG trong mỗi bộ dliệu và các DEG trng lặp giữa các tập dữ liệu
V phân tch hệ phiên m thường thc hin trên c mu nh nên chúng tôi đ tự hỏi liu c DEG
chung nào giữa hai tập dữ liu nghiên cứu đc lp GSE52130 và GSE38616 c sn trong cơ s d
liu NCBI GEO.
Trong tập dữ liu GSE52130, tng cng c 200 DEG (137 tăng và 63 giảm) được xác đnh khi so
sánh biu mô t by bnh nhân LPM và bảy đối tượng khe mnh vi tiêu ch p < 0,05, |đ sai khác|
≥ 2 q < 0,05. Loi b các dữ liệu ngoi lai là mt phương pháp ph biến đ tăng cường đ mnh
của việc phát hiện các DEG. Áp dụng phương pháp phân tch cụm (cluster analysis) hệ phiên m của
14 mẫu này, chúng tôi thấy ba mẫu LPM và mt mẫu chứng không phân cụm vi các mu khác trong
mi nhm tương ng (Hnh 1a và 1b). Sau khi loi b bốn mẫu ngoi lai này, các mu LPM và mẫu
khe mnh phân cụm thành hai nhm riêng bit trong biu đồ phân tch thành phn chnh (PCA)
(Hnh 1c). T phân tch nhm này, chúng tôi thu được 444 DEG (257 tăng và 187 gim).
Tập dữ liệu GSE38616 thu được 33 DEG (22 tăng và 11 gim) khi so sánh bảy mẫu niêm mc LPM
và bảy mẫu niêm mc khe mnh vi tiêu ch p < 0,05 và |đ sai khác| ≥ 2, nhưng không c gen nào
thoả q < 0.05. Phân tch cm của hệ phiên m này ch ra hai mẫu LPM và ba mẫu khỏe mnh không
phân cm vi các mu khác trong mi nhm tương ng (Hnh 1d và 1e). Phân tích nhóm sau loi tr
năm mẫu ngoi lai (Hnh 1f) thu được 348 DEG (294 tăng và 54 giảm) vi tiêu ch p < 0,05, |đ sai
khác| ≥ 2 và q < 0.05.
ISSN: 2615-9686 Hong Bang International University Journal of Science
280
Tp chí Khoa hc Tng Đi học Quốc tế Hng Bàng S Đc bit: Hội ngh Khoa hc Tui trẻ Ln th1 - 5/2024
Hình 1. Phân tch gen biu hiện khác biệt (DEG) của hai tập dữ liệu GSE52130 và GSE38616. (a-c)
Tập GSE52130 của biu mô và (d-f) tập GSE38616 của niêm mc. (a, d) Bản đồ nhiệt của DEG kết
hợp vi phân cụm thứ bậc. Sự thay đi màu t nâu sang xanh tượng trưng cho sự thay đi t tăng
điu ha sang giảm điu ha. Hnh vuông đen đánh dấu các dữ liệu ngoi lai b loi bỏ trong các tập
dữ liệu mt phn. (b, c, e, f) Biu đồ phân tch thành phn chnh của tập dữ liệu toàn b (b, e) và
mt phn (c, f). (g, h) Biu đồ minh ha số lượng DEG trong hai tập dữ liệu toàn b (g) và mt
phn (h). Vng trn đen đi diện cho tập dữ liệu GSE52130 và vng trn màu xám đi diện cho tập
dữ liệu GSE38616. Giao đim của 2 vng trn biu th các DEG chung giữa hai tập dữ liệu
Đ xác đnh các DEG chung của hai tập dữ liu, danh sách các DEG được so sánh vi nhau. Khi so
sánh các DEG của toàn b tp d liệu của lp biu mô vi toàn b tp d liệu của lp niêm mc, ch
mt DEG chung được tm thy (Hnh 1g): KLK12, mt gen m ha cho serine protease tham gia vào
quá trnh to mch, được tăng điu hoà gấp 4.2 ln  biu mô (p = 0.001, q = 0.018) và gp 2.6 ln
niêm mc của bệnh nhân LPM (p = 0.028, q = 0.43). Khi so sánh các DEG của 2 tập dữ liệu lp biu
mô và lp niêm mc sau khi loi tr các dữ liệu ngoi lai, 43 DEG chung (23 tăng và 20 giảm) được
xác đnh (Hnh 1h). Không c mt DEG chung nào tăng điu hoà trong tập dữ liệu này mà giảm điu
hoà trong tập khác. Các DEG chung tăng điu hoà nhiu nhất (đ sai khác > 10) bao gm LCE3E,
KRT17, TMEM45A và IL-36G, tương ứng m ha cho late cornified envelope protein 3E, keratin 17,
protein xuyên màng 45A và interleukin-36 gamma (IL-36γ, cn được gi là IL-1F9).
Những thay đi trong h sơ phiên m được phát hin bng phân tích cm có thdo s khác bit v
các dng sang thương trên lâm sàng của LPM, thành phn ca các tế bào min dch thâm nhim hoc
chất lượng ca RNA. Các DEG chung trong hai tp d lin mt phn ca c biu mô và niêm mc có
th phn ánh những thay đi thc s xy ra trong lp biu ca LPM trong các trường hợp đin
hình. Trong s 43 DEG chung, tăng biu hin ca LCE3E TMEM45A c liên quan đến quá trình
sng hóa biu b, tăng điu hòa IL36G, TNC, TGFBI KRT17 đ được m thy niêm mc
ming hoc da b tn thương [11]. Giảm điu hoà FRAS1 BCL11A c liên quan đến các khiếm
khuyết hàng rào biu mô. Protein FRAS1 là mt trong ba loi protein liên quan đến hi chng Fraser,
to phc hp protein n đnh tương hỗ màng đáy neo màng đáy vào phn trung mô bên dưi. S
thiếu ht hoặc đt biến gen này dẫn đến s hnh thành bng nưc [12], do đ, sự giảm điu hoà
FRAS1 có th phn ánh s tách ri ca biu mô khi lp đệm thường xy ra trong LPM. BCL11A là
yếu t phiên m điu hòa quá trình chuyn ha lipid và giai đon cui trong bit hóa tế bào sng và
quan trng đối vi hàng rào thm qua da [13]. Vic giảm điu hoà BCL11A th dẫn đến khiếm
khuyết v hàng rào thm thu, biu hin bng tình trng tăng sng biu mô quan sát được trong LPM.
Do đ, dấu n gen trong hai b d liu LPM gi ý những thương tn mãn tính và ri lon chức năng
hàng rào biu mô.
3.2. Kết quả phân tích GO
Đ tìm các quá trnh sinh hc chc năng trong LPM, các phân tch phong phú hoá (enrichment
analysis) được thc hiện bng DAVID. Các DEG tăng điu ha ca toàn b và mt phn của tập dữ
Hong Bang International University Journal of Science ISSN: 2615-9686
281
Tp chí Khoa hc Tng Đi học Quốc tế Hng Bàng S Đc bit: Hi ngh Khoa học Tui tr Ln thứ 1 - 5/2024
liệu của biu mô được tăng cường đáng k v các quá trnh phát trin biu b, bit ha tế bào sng,
sng ha, sư lành thương, phản ng vi nhim khun và phn ng min dch bm sinh. Các quá trình
sinh hc này phản ánh sự bất thường hàng rào biu như tnh trng tăng sng quan sát được trên
sang thương LPM khả năng nhiễm khun. Trong khi đ, các DEG giảm điu ha ch yếu liên quan
đến quá trnh oxy ha-kh và phn ng vi mt s ion (Hnh 2a và 2b). Mt khác, các DEG tăng điu
hoà của toàn b và mt phn dữ liệu của tp niêm mc ch yếu tăng lên  các quá trnh ha ứng đng
ca các tế bào min dch, biệt hoá các tế bào miễn dch, c phn ng viêm, phản ứng miễn dch bm
sinh và mắc phải của các tế bào thâm nhim trong mô. Các quá trnh sinh hc  tập dữ liệu mt phn
của niêm mc cng được phong phú hoá v các phn ng vi lipopolysaccharide (LPS) và trnh din
kháng nguyên thông qua phức hợp tương thch mô chính (MHC) lp II (Hnh 2c và 2d), cng như
các quá trnh v lành thương phản ứng vi vết thương. Các quá trnh sinh hc này cng nhấn mnh
khả năng nhiễm khun tim n trong LPM, và gợi  rng quá trnh lành thương đang diễn ra ti đây.