HC VIN CÔNG NGH BƯU CHÍNH VIỄN THÔNG
---------------------------------------
Vũ Thị Quý
NGHIÊN CU PHÁT HIN TẤN CÔNG WEB CƠ BẢN
DA TRÊN HC MÁY S DNG WEB LOG
Chuyên ngành : KHOA HC MÁY TÍNH
Mã s : 8.48.01.01
TÓM TT LUN VĂN THẠC SĨ KỸ THUT
HÀ NI NĂM 2020
Luận văn được hoàn thành ti:
HC VIN CÔNG NGH BƯU CHÍNH VIỄN THÔNG
Người hướng dn khoa hc: TS. HOÀNG XUÂN DU
Phn bin 1: ……………………………………………………………………
Phn bin 2:……………………………………………………………………
Luận văn sẽ đưc bo v trước Hội đồng chm luận văn thạc tại Hc
vin Công ngh Bưu chính Viễn thông
Vào lúc: ....... gi ....... ngày ....... tháng ......... năm 2020
Có th tìm hiu luận văn tại:
- Thư viện ca Hc vin Công ngh Bưu chính Viễn thông
1
PHẦN MỞ ĐẦU
Trong thế gii hin đại ngày nay, ng dng web ngày mt tr nên quan trng
mt phn không th thiếu trên mng Internet. Các ng dng web, website chiếm t l áp đảo
trong s các ng dng trên nền Internet. Cũng chính vì vậy mà vấn đề v bo mt web ngày
càng tr thành mt vấn đề được quan tâm.
Theo s liu thng ca BKAV [11], năm 2019, thiệt hi do virus y tính gây ra
đối với người dùng Việt Nam đã n tới 20.892 t đồng (902 triu USD), vượt xa con s
14.900 t đồng của m 2018. Tng s t máy tính b nhiễm độc đưc ghi nhn trong
năm 2019 lên tới 85,2 triệu lượt, tăng 3,5% so với năm 2018. m này cũng tiếp tc chng
kiến s hoành hành ca các loại đc hóa d liu tng tin (ransomware). S ng
máy tính b mt d liu trong m 2019 lên ti 1,8 triệu lượt, tăng 12% so với m 2018.
Nghiêm trng hơn, trong sốy có rt nhiu máy ch (server) cha d liu của các cơ quan.
Không ch y thit hi ln, vic các máy ch b xóa d liệu cũng gây đình tr hoạt động
của cơ quan, doanh nghiệp trong nhiều ngày sau đó, thậm chí đến c tháng.
Đối với các công ty lớn, nguy bị tấn công vào hệ thống đồng nghĩa với việc họ sẽ
bị thiệt hại hàng tỷ USD, uy tín trước khách hàng bị giảm sút. Với c cơ quan y tế quốc
phòng thì thiệt hại còn có thể thảm khốc hơn gấp nhiều lần.
Qua s liu trên cho thy tấn ng web bn các dng tấn công thường gp lên
các website, web portal các ng dng trên nn web. Các dng tn công này có th bao
gm: tn công chèn SQL (SQLi hay SQL Injection), tn công chèn XSS (Cross-Site
Scripting), tn ng duyệt đường dn (Path traversal) tn ng chèn dòng lnh h điều
hành (CMDi hay Command Injection). Trong s y, tn công chèn SQL mt trong
các dng tn công ph biến nguy him nht. y o mức độ tinh vi, tn công chèn
SQL th cho phép k tấn công (1) t qua các khâu xác thực người dùng, (2) chèn, sa
đổi, hoc xóa d liệu, (3) đánh cắp các thông tin trong cơ sở d liu (4) chiếm quyn
điều khin h thng máy ch sở d liu [1]. Tn công XSS th cho phép tin tặc đánh
cp d liệu người dùng lưu trong cookie của trình duyt, t đó kiểm soát tài khon ca
người dùng trên máy ch. Theo một hưng khác, tn công duyệt đường dn cho phép tin tc
ti hoc truy nhp vào các file cha d liu nhy cm trên các máy ch thông qua đó
th m nhp sâu vào h thng. Tn công chèn dòng lnh h điều hành th cho phép tin
tc thc hin các lnh nguy him cho phép xóa file, d liu trên h thng nn nhân.
2
Mc các dng tấn công thường gp lên các website các ng dng trên nn web
đã được biết đến t lâu đã có nhiều bin pháp phòng chống được nghiên cu, trin khai,
như sử dng các b lọc, tường lửa, các chế kim soát truy nhậpTuy nhiên, các dạng
tấn công web bản vn khá ph biến gây nhiu thit hi cho các trang web, các cng
thông tin điện tử, các trang thương mại điện t của các quan tổ chc. Nguyên nhân ca
điều y do vn nhiu website các ng dng trên nn web không có, hoc thiếu
chế lc d liệu đầu vào thc s hiu qu, và/hoc s dụng các mã chương trình trộn ln vi
d liu, tạo điều kin cho tin tặc chèn độc tn công h thng [1]. Vic y dng các b
lc da trên các mu c định thc s gặp kkhăn, khi các mẫu tn công liên tục thay đổi
và ngàyng tinh vi hơn. Vic xây dng các b lc phát hin các dng tấn công web bản
da trên hc y một ng gii quyết hiu qu thay thế cho các b lc mu truyn
thống. Theo hướng nghiên cứu này, đề tài luận văn thạc ca hc viên có tên Nghiên cu
phát hin tấn công web cơ bn da trên hc máy s dụng web log” tp trung nghiên cu
vấn đề phát hin tấn công web cơ bản da trên hc máy s dng web log.
Do còn nhiu hn chế v thi gian và tài liệu nên đề tài còn nhiu thiếu sót. Rt mong
nhận được s đóng góp của các thy cô và các bạn để đề tài được hoàn thiện hơn.
Tôi xin chân thành cảm ơn!
Tổng quan về vấn đề nghiên cứu
Đã nhiều gii pháp phòng chng các dng tấn công web bản được nghiên cu
ng dng [1][3]. Các gii pháp thc tế có th k đến gm:
Sử dụng các bộ lọc để kiểm tra lọc dữ liệu đầu vào. Các bộ lọc thể sử dụng
bao gồm, lọc dựa trên từ khóa, lọc dựa trên mẫu lọc dựa trên biểu thức chính
quy.
Sử dụng các dạng ờng lửa, hoặc proxy mức ứng dụng, như tường lửa ứng
dụng web (WAF Web Application Firewall). WAF được sử dụng để lọc tất cả
truy vấn của người ng. WAF ưu điểm thể bảo vệ đồng thời nhiều
website và không đòi hỏi chỉnh sửa mã nguồn của website.
Kết hợp sử dụng các biện pháp kiểm soát truy nhập, phân quyền người dùng để
giảm thiểu khả năng bị tấn công, khai thác.
3
Sử dụng các công cụ theo dõi, giám sát website, ứng dụng web, như các bộ phát
hiện xâm nhập (IDS).
Trên phương diện nghiên cu hc thut, có th chia các đề xut nghiên cu phát hin
tn công, xâm nhp nói chung tấn công web bản nói riêng thành 2 nhóm da trên k
thut phát hin: (1) nhóm phát hin da trên ch ký, mu, hoc lut (2) nhóm phát hin
da trên bt thưng.
Phát hin da trên ch (signature), mu (pattern), hoc luật (rule) phương pháp
phát hin tn công da trên vic tìm hay so khp tp ch ký ca các tấn công đã biết vi các
d liu giám sát thu thập được. Mt tấn công được phát hin khi có ít nht mt so khp ch
ký thành công. K thut phát hin tn công, xâm nhp da trên ch ký có ưu điểm là có kh
năng phát hiện nhanh chính xác các dng tấn công đã biết. Tuy nhiên, k thut y
nhược điểm không kh năng phát hiện các dng tn công mi, hay tn công khai thác
l hng zero-day do ch của chúng chưa tn tại trong dữ liu. Ngoài ra, vic y
dng cp nhật sở d liu ch thường được thc hin th công, nên tn nhiu công
sc.
Phát hin tn công, xâm nhp da trên bất thường da trên gi thiết: các hành vi tn
công, xâm nhập thường có quan h cht ch vi các hành vi bất thường. Quá trình xây dng
trin khai mt h thng phát hin xâm nhp da trên bất thưng gồm 2 giai đoạn: (1)
hun luyn và (2) phát hiện. Trong giai đoạn hun luyn, h sơ (profile) của đối tượng trong
chế độ m việc bình thường đưc y dng. Để thc hiện giai đoạn hun luyn này, cn
giám sát đối tưng trong mt khong thời gian đủ dài để thu thập được đầy đ d liu mô t
các hành vi của đối ng trong điu kiện nh thưng m d liu hun luyn. Tiếp theo,
thc hin hun luyn d liệu để xây dng hình phát hin, hay h của đối tượng.
Trong giai đoạn phát hin, thc hin giám sát hành vi hin ti ca h thng cnh báo nếu
khác bit nét gia hành vi hin tại các hành vi lưu trong h của đối tượng. Ưu
điểm ca phát hin m nhp da trên bất thường tiềm năng phát hiện các loi tn
công, xâm nhp mi không yêu cu biết trước thông tin v chúng. Tuy nhiên, phương
pháp này có t l cảnh báo sai tương đi cao so với phương pháp phát hin da trên ch.
Điu này làm gim kh năng ng dng thc tế ca phát hin xâm nhp da trên bất thưng.
Ngoài ra, cũng tiêu tốn nhiu tài nguyên h thng cho vic y dng h đối tượng
phân tích hành vi hin ti.