HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
Lê Ngọc Khoa
NGHIÊN CỨU PHƯƠNG PHÁP PHÁT HIỆN TẤN CÔNG ỨNG
DỤNG WEB SỬ DỤNG HỌC SÂU CNN
Chuyên ngành: Khoa học máy tính
Mã số: 8.48.01.01
Hà Nội 2024
Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: PGS.TS. HOÀNG XUÂN DẬU
Phản biện 1: ……………………………………………
Phản biện 2: ……………………………………………
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học
viện Công nghệ Bưu chính Viễn thông
Vào lúc: ....... giờ ....... ngày ....... tháng .......năm ...............
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông.
1
MỞ ĐẦU
1. Tính cấp thiết của đề tài
Ứng dụng web hay web application, web app là một trình ứng dụng mà có thể
tiếp cận qua web thông qua mạng như Internet hay intranet. Web Application thường
được lưu trữ trên một máy chủ từ xa người dùng có thể truy cập nó thông qua việc
sử dụng Phần mềm được gọi trình duyệt web. Các Web Application thể được
thiết kế cho nhiều mục đích sử dụng khác nhau và có thể được sử dụng bởi bất k ai,
một tổ chức hoặc một cá nhân.
Trên nền tảng internet, các ứng dụng web đang chiếm tỷ lệ không hề nhỏ. Các
khổng lồ công nghệ (Google, Facebook, Amazon…) đều có những ứng dụng web
với số lượng lên tới hàng tỉ người dùng. Chính vậy yếu tố bảo mật phòng
chống tấn công ứng dụng web trở nên quan trọng hơn bao giờ hết.
Tấn công ứng dụng web thể gây ra nhiều hậu quả nghiêm trọng đối với cả
người dùng, tổ chức và các dự án trực tuyến. Dưới đây là một số hậu quả quan trọng
của tấn công ứng dụng web:
Mất thông tin cá nhân
Tiết lộ thông tin doanh nghiệp
Tấn công từ chối dịch vụ (Denial of Service - DoS)
Xâm nhập trái phép hệ thống
Mất lợi nhuận
Sự can thiệp pháp lý
Phát triển mã độc
Do các cuộc tấn công web thể dẫn đến những hậu quả nặng nề cho các
nhân, tổ chức nên việc nghiên cứu phương pháp hiệu quả cho phát hiện tấn công ứng
dụng web là rất cần thiết. Mặc dù đã có một số đề xuất và công cụ phát hiện tấn công
ứng dụng web, việc nghiên cứu nhằm nâng cao độ chính xác phát hiện, cảnh báo,
ngăn chặn sai vẫn cần được tiếp tục triển khai. Hơn nữa các phương pháp học y
đặc biệt học sâu đã đang được ứng dụng hiệu quả trong giải quyết các bài
toán thực tiễn của lĩnh vực khoa học máy tính cũng như an toàn thông tin. Đây cũng
2
mục tiêu của đề án y, với đề tài “Nghiên cứu phương pháp phát hiện tấn công
Web dựa trên học sâu”.
2. Tổng quan vấn đề cần nghiên cứu
Hiện nay, tình trạng tấn công ứng dụng web đang xảy ra ngày càng nhiều, đặc
biệt đối với các sở trọng yếu, khối ngân hàng, tài chính các doanh nghiệp
lớn. Thách thức đó đặt ra cần phải thực hiện các phương pháp bao mật ứng dụng
web. Để bảo vệ ứng dụng web khỏi các cuộc tấn công, cần phải triển khai một loạt
các biện pháp phát hiện tấn công web hiệu quả. Hiện tại nhiều phương pháp, giải
pháp được ứng dụng để phát hiện các cuộc tấn công web như hệ thống phát hiện xâm
nhập (IDS), phát hiện dựa trên chữ ký, dựa trên hành vi, sử dụng tưởng lửa ứng dụng
web (WAF), phân tích dữ liệu lưu lượng mạng (theo dõi bất thường, chủ động phòng
chống DOS), sử dụng các tập rule (xây dựng dựa trên các mẫu tấn công đã biết), giám
sát hệ thống và dựa trên các kỹ thuật học máy, học sâu.
Gần đây, các giải pháp phát hiện tấn công ứng dụng web sử dụng các kỹ thuật
thống kê, học máy, học sâu được triển khai áp dụng tương đối rộng rãi, cho kết
quả khả quan. Theo đó các kỹ thuật thống kê, học máy, học sâu được sử dụng để y
dựng mô hình phân loại các loại tấn công từ tập dữ liệu gồm các request bình thường
các các request chứa các mã khai thác đã biết. Nhờ số lượng request thu thập lớn
phương pháp xử lý hiệu quả, việc phát hiện các cuộc tấn công ứng dụng web dựa trên
ký thuật thống kê, học máy, học sau cho độ chính xác cao và tỷ lệ cảnh báo sai thấp.
Theo hướng sử dụng học máy học xâu để y dựng mô hình phát hiện tấn công
thể liệt một số đề xuất, như nhóm tác giả Tikam Alma Manik Lal Das đề
xuất phương pháp phát hiện hiện tấn công ứng dụng web sử dụng học sâu trên cơ sở
mạng nơ ron LSTM (Long Short Term Memory) và cung cấp đầu vào theo thứ tự [3].
Kết quả thử nghiệm cho thấy độ chính xác rất cao với tỉ lệ 0.9968. Prasanna Kottapalle
đề xuất mô hình kết hợp CNN-LSTM cho IDS trên tập dữ liệu KDD99 cũng đạt được
độ chính xác cao (99.78%), một số thử nghiệm với các hình khác như SVM
(98.20%), DBN (98.59%) CNN* (99.23%) [4]. Ngoài ra tác giả Abdu Salam cùng
cộng sự đề xuất hình phát hiện tấn công ứng dụng web sử dụng học sâu trên
3
sở mạng nơ ron CNN, kết quả đạt được cũng rất tích cực với tỉ lệ chính xác 94% và
tỉ lệ phân loại các lỗ hổng cũng mức cao (DDOS 91%, SQL Injection 90%, XSS
92%) [5].
Đề án này đề xuất sử dụng các phương pháp học sâu, gồm CNN để xây dựng
mô hình phát hiện tấn công ứng dụng web. Ưu điểm của các phương pháp học sâu là
giảm thiểu việc trích xuất chọn đặc trưng và khả năng xử lý các tập dữ liệu lớn.
3. Mục đích nghiên cứu
Đề án nghiên cứu, khảo sát các phương pháp phát hiện tấn công ứng dụng web
tập trung cài đặt, thử nghiệm đánh giá hình phát hiện tấn ng web dựa trên
học sâu.
4. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu: Các request bình thường và request chứa payload
tấn công, các phương pháp học máy và học sâu
Phạm vi nghiên cứu: Giới hạn các request với hai method GET và POST.
5. Nội dung
Chương 1: Các phương pháp tấn công ứng dụng web và cách phòng chống
1.1 Tổng quan về ứng dụng web
Ứng dụng web là gì?
Mô hình client server của ứng dụng web
Giao thức HTTP/HTTPS
1.2 Các Lỗ hổng, rủi do bảo mật ứng dụng web
Lỗ hổng bảo mật ứng dụng web là gì?
Khái niệm unstrusted data, unsafe method.
Top 10 rủi do/lỗ hổng OWASP
Một số lỗ hổng bảo mật Web phổ biến
1.3 Các giải pháp bảo vệ và phòng chống tấn công ứng dụng web
Triển khai các giải pháp bảo mật bảo vệ ứng dụng web
Cấu hình, cập nhật phiên bản ứng dụng định kỳ