K yếu Hi tho Khoa học: “An ninh Sinh viên trong thi k Chuyển đổi số”
340
MÔ NH CNG TÁC PHÁT HIN TN CÔNG MNG VÀ SĂN
TÌM MI ĐE DỌA DA TRÊN PHƯƠNG PP HỌC LIÊN KT
A FEDERATED LEARNING APPROACH FOR
COLLABORATIVE INTRUSION DETECTION AND
CYBER THREAT HUNTING
Trần Đức Lương, Hunh Thái Thi, Nguyn Hu Quyn,
Vương Minh Tiến, Ngô Đức Hoàng Sơn
Trường Đại hc Công ngh Thông tin, ĐHQG-HCM
Email: 19521815@gm.uit.edu.vn
THÔNG TIN
TÓM TT
T khóa:
Trung tâm điu hành an
ninh, phương pháp học liên
kết, trình phát hin xâm
nhp mạng, săn tìm mối đe
da, mng kh lp trình,
chng tn công nhiễm độc.
Keywords:
SOC, Federated Learning,
IDS, Threat Hunting, SDN,
anti-poisoning, LOF
Trong bi cnh các cuc tn công có ch đích ngày
càng tr nên tinh vi, nhu cu hp tác gia các Trung tâm
điu hành an ninh (SOC) các doanh nghip, t chc ngày
càng tr nên cn thiết. Bng vic tham gia vào quá trình
hun luyn các trình phát hin xâm nhp mng (IDS) theo
phương pháp hc liên kết, các t chc này th tn dng
các ngun thông tin d liệu phân tán để hun luyn mô hình
IDS hc máy phát hin các cuc tn công mng không
xâm phm đến quyền riêng của t chức kc; đồng thi
làm giàu thông tin trong quá trình săn tìm mối đe dọa nhm
phòng chng các cuc tn công 0-day trong tương lai. Bên
cạnh đó, chế chng tn công nhim độc h thng hc
liên kết cũng được đề xuất trong đề tài. Kết qu thc
nghim trên tp d liu Kitsune và trin khai h thng làm
giàu thông tin trong môi tng mng kh lp trình cho thy
tính kh thi ca b gii pháp trong quá trình liên kết các
SOC nhm phát hin các cuc tn công mạng săn tìm
mối đe dọa.
ABSTRACT
Witnessing the increasing sophistication of
Advanced Persistent Threat (APT), the need for
cooperation among Security Operations Centers (SOCs) is
becoming more and more imperative. Thus, this work
introduces a federated learning (FL) approach for intrusion
detection systems (IDS) and cyber threat hunting in the
K yếu Hi tho Khoa học: “An ninh Sinh viên trong thi k Chuyển đổi số”
341
context of SOC by leveraging the data privacy assurance
from collaborative parties. Not only do these SOC teams
take advantage of distributed data sources in training
machine learning-based IDS (ML-based IDS), but they also
enrich the outcome of ML-based IDS in recognizing
malicious indicators and the threat hunting process.
Additionally, an anti-poisoning mechanism called Local
Outlier Factor (LOF) is carried out in order to prevent
poisoning attacks against our FL-based system. The
experiment results on the Kitsune dataset and the
implementation of a knowledge enrichment system in a
Software Defined Network (SDN) context have
demonstrated the feasibility of the proposed architecture in
detecting and hunting network-based threats by
collaborative SOC teams.
TNG QUAN
Trong những m gần đây, săn tìm mối đe dọa (Threat Hunting) đang được s
dng rng rãi bi các t chc SOC trong việc đảm bo s an toàn ca h thống trước
các cuc tấn công APT. Tuy nhiên, đây một quá trình ph thuc nhiu vào kinh
nghim, công sc thi gian của các chuyên gia. Trong khi đó, nhiu nhà nghiên cu
đã tiến hành nghiên cu các giải pháp săn m ch động kết hp vi trí tu nhân to
(Artificial Intelligence - AI) mà đặc bit là h thng IDS s dng AI. Mt khác, d liu
đầu ra ca các h thống này thường không phù hp cho quá trình Theat Hunting nên cn
được làm giàu mt cách t động đ tăng cường hiu qu cho cuộc săn tìm. thế, vic
thiết kế mt h thng có kh năng làm giàu thông tin [1] cho các h thng IDS s dng
AI là hết sc cn thiết.
Mặt khác, các hình IDS này cũng đòi hỏi khối lượng d liu rt ln dẫn đến
các quan ngi v tính riêng tư ca d liu trong quá trình thu thp. Bên cạnh đó, việc s
dng d liu ni ti ca t chc hoc các ngun d liệu được chia s không đủ để
hun luyn tt các hình IDS nhm phát hin các dng tn công tinh vi mi. Trong
bi cảnh đó, phương pháp hc liên kết [2] xut hiện như một giải pháp đầy ha hẹn để
xây dng mô hình hc cng tác phát hin tn công mng, cho phép c t chc cùng
nhau hun luyn vẫn đảm bo quyền riêng giữa các ch s hu d liu. Mc
vậy, phương pháp hc liên kết vn tn ti mt s l hng khi th b tn công
đầu độc (poisoning attack) bi các t chc không thiện chí. Để khc phục điều đó, nhóm
đề xut gii pháp phòng chng tấn công đầu độc (anti-poisoning) [3] s dng thut toán
K yếu Hi tho Khoa học: “An ninh Sinh viên trong thi k Chuyển đổi số”
342
LOF nhm xác thc các cp nht cc b trưc khi tng hp thành hình toàn cc
hoàn chnh.
PHƯƠNG PHÁP NGHIÊN CỨU
H thng hun luyn hình IDS máy hc dựa trên phương pháp học liên
kết với cơ chế anti-poisoning
Trong hình tổng quan được đề xut, tng trung m SOC tham gia vào quá
trình hun luyn liên kết được xem như một vùng (zone). Trong mi vùng, h thng IDS
s đóng vai trò giao tiếp trc tiếp vi máy ch FL trung tâm cũng nơi thc hin
quá trình hun luyn cc b (local training). Ngoài ra, cơ chế anti-poisoning s được áp
dng nhm kim tra các hình cc b trưc khi được tng hp vào hình chung.
Các hình cc b s được xác định là Outlier hay không dựa vào đim lân cn (Score)
được tính bi thut toán LOF.
Hình 1: Mô hình tng quan
H thng t động phát hin tn ng mng m gu thông tin phc v săn
m mi đe da.
H thng IDS sau khi đưc hun luyn tng qua hc liên kết s đưc s dng trong
h thng t đng phát hin tnng mng và làm giàu thông tin (zone model trong Hình 1).
ch thc hot động ca được mô t n sau: Đầu tiên, các d liu mạng đươc từ mng
SDN s đưc thu thp, chuẩn a và u trữ bởi SIEM. Sau đó, dữ liu t nơi lưu tr đưc
chuyn tiếp đến h thng tin x và m giàu thông tin (Data preprocessing and enrichment
system - DPE). đây, các thuộc nh cn thiết cho quá trình hun luyn các trình phát hin
m nhp s đưc trích xut và gi đến h thống IDS. Đồng thi, h thống DPE cũng sẽ thc
hin trích xut c thông tin làm giàu t c d liu ni ti ca t chc SOC và d liệu đưc
chia s ngi cng đồng thông qua h thng CTI. Cui ng, kết qu d đoán từ h thng
IDS và thông tin làm giàu s đưc lưu lại i dạng log. Sau đó, log này s đưc thu thp,
phân ch và s dng bi h thng SIEM nhm phc v cho q trình nm mối đe dọa.
K yếu Hi tho Khoa học: “An ninh Sinh viên trong thi k Chuyển đổi số”
343
KT QU THC NGHIM
Độ hiu qu ca gii pháp anti-poisoning bng LOF
Để xem nh ng ca các tn ng đầu độc n phương pháp học ln kết vi
hình đề xut, chúng i tiến hành thc hin hai cuc tnng: tn công lt nn và tnng
bng mô hình mạng sinh đối kháng trên zone th hai k t ln cp nht th m tr đi. Kết
qu Hình 2 cho thy Accuracy ca mô nh cngc giảm đáng k xungn mc xp x
40% khi b tấn công đầu độc. Tuy nhiên, bng vic ng dng cơ chế xác thc bng LOF để
loi b c thành phn tn ng, hiu qu của mô nh đã đưc hi phc và ổn định ngưỡng
99% đối vi Accuracy. Kết qu này mt phn đã chứng minh tính hiu qu ca gii pháp
anti-poisoning nhm mang li tính bo mt và chính xác cho quá trình hun luyn mô nh
phát hin tn công mng trong thc tế.
Hình 2: Kết qu chng tấn công đầu độc bng LOF
Xây dng h thng phát hin và làm giàu thông tin ca trung m SOC phc
v sănm mối đe doạ
H thng phát hin bất thường và làm giàu thông tin đưc chúng tôi trin khai
theo hình ca mt SOC zone ti Hình 1. Mạng SDN được trin khai s dng
Containernet. Đối vi SIEM, chúng tôi ng dng các công c ngun m Wazuh
cùng vi ELK stack. Ngoài ra, chúng tôi đã viết một chương trình để hin thc h thng
DPE. Trong mng SDN, chúng tôi thc hin tn công DOS t mt máy có IP là 10.0.0.1
đến mt máy khác trong mạng có IP là 10.0.0.4. Ngay sau đó, h thống săn tìm đã phát
hin và trc quan hóa cuc tấn công như
Hình 3.
Hình 3: Log ti các trung tâm SOC khi phát hin cuc tn công kèm theo thông tinm gu
KT LUN
K yếu Hi tho Khoa học: “An ninh Sinh viên trong thi k Chuyển đổi số”
344
Đề tài đã đề xut mt b khung gii pháp an toàn ng dng FL trong quá trình
phát hin tấn công và săn tìm mối đe dọa. So với các mô hình săn tìm mối đe dọa trước,
chúng tôi đã ng dng hc liên kết trong vic hun luyn các h thng IDS máy hc
nhm phc v săn tìm mối đe da trên mạng. Tuy nhiên, hình đề xut còn tn ti
mt s hn chế như: xác thực mô hình chưa phi tập trung, đ tr khi truy vn d liu
trong quá trình làm giàu thông tin, chưa có cơ chế khuyến khích, …
TÀI LIU THAM KHO
[1]
H. T. Thi, N. D. H. Son, P. T. Duy and P. Van-Hau, "Federated learning-based cyber threat
hunting forAPT attack detection in SDN-enabled networks," in 21st International
Symposium on Communications and Information Technologies (ISCIT 2022),
Xi'an, China, 2022.
[2]
T. D. Luong, V. M. Tien, H. T. Anh, N. V. Luyen, N. C. Vy, P. T. Duy and P. Van-Hau,
"FedChain: A Collaborative Framework for Building Artificial Intelligence Models
using Blockchain and Federated Learning," in 2021 8th NAFOSTED Conference
on Information and Computer Science (NICS), 2021.
[3]
N. C. Vy, N. H. Quyen, P. T. Duy and P. Van-Hau, "Federated Learning-Based Intrusion
Detection in the Context of IIoT Networks: Poisoning Attack and Defense," in
Network and System Security (NSS 2021), 2021.