HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
Kiều Công Minh
ỨNG DỤNG REPRESENTATION LEARNING
PHÁT HIỆN TẤN CÔNG BOTNET
LUẬN VĂN THẠC S KỸ THUẬT
(Theo định hướng ứng dụng)
THÀNH PHỐ HỒ CHÍ MINH - 2023
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
Kiều Công Minh
ỨNG DỤNG REPRESENTATION LEARNING
PHÁT HIỆN TẤN CÔNG BOTNET
CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN
MÃ SỐ: 8.48.01.04
LUẬN VĂN THẠC SỸ KỸ THUẬT
(Theo định hướng ứng dụng)
NGƯỜI ỚNG DN KHOA HỌC:
TS. NGUYỄN HỒNG SƠN
THÀNH PHỐ HỒ CHÍ MINH - 2023
i
LỜI CAM ĐOAN
Tôi cam đoan rằng luận văn: “Ứng dụng Representation Learning phát hiện
tấn công Botnet là công trình nghiên cứu của chính tôi.
Tôi cam đoan các số liệu, kết quả nêu trong luận văn trung thực chưa
từng được ai công bố trong bất kỳ công trình nào khác.
Không có sản phẩm/nghiên cứu nào của người khác được sử dụng trong luận
văn này mà không được trích dẫn theo đúng quy định.
TP. Hồ Chí Minh, ngày 28 tháng 02 năm 2023
Học viên thực hiện luận văn
Kiều Công Minh
ii
LỜI CẢM ƠN
Trong suốt quá trình học tập nghiên cứu thực hiện luận văn, ngoài nỗ lực
của bản thân, tôi đã nhận được sự hướng dẫn nhiệt tình quý báu của quý Thầy Cô,
cùng với sự động viên và ủng hộ của gia đình, bạn bè và đồng nghiệp. Với lòng kính
trọng và biết ơn sâu sắc, tôi xin gửi lời cảm ơn chân thành tới: Ban Giám Đốc, Phòng
đào tạo sau đại học quý Thầy đã tạo mọi điều kiện thuận lợi giúp tôi hoàn
thành luận văn.
Tôi xin chân thành cảm ơn Thầy TS. Nguyễn Hồng Sơn, người thầy kính yêu
đã hết lòng giúp đỡ, hướng dẫn, động viên, tạo điều kiện cho tôi trong suốt quá trình
thực hiện và hoàn thành luận văn.
Tôi xin chân thành cảm ơn gia đình, bạn bè, đồng nghiệp trong cơ quan đã
động viên, hỗ trợ tôi trong lúc khó khăn để tôi có thể học tập và hoàn thành luận văn.
Mặc dù đã nhiều cố gắng, nỗ lực, nhưng do thời gian và kinh nghiệm nghiên cứu
khoa học còn hạn chế nên không thể tránh khỏi những thiếu sót. Tôi rất mong nhận
được sự góp ý của quý Thầy cùng bạn đồng nghiệp để kiến thức của tôi ngày
một hoàn thiện hơn.
Xin chân thành cảm ơn!
TP. Hồ Chí Minh, ngày 28 tháng 02 năm 2023
Học viên thực hiện luận văn
Kiều Công Minh
iii
DANH SÁCH HÌNH V
Hình 1.1. Ví d v botnet ......................................................................................... 11
Hình 1.2. Sơ đồ cách thc tn công ca Botnet ....................................................... 12
Hình 1.3. Mô hình client server ............................................................................ 13
Hình 1.4. Mô hình peer-to-peer ................................................................................ 14
Hình 1.5. Vòng đi ca Botnet ................................................................................ 15
Hình 1.6. Mạng nơ-ron vi hai lp hidden .............................................................. 21
Hình 1.7. Mi liên h gia AI, Machine Learning và Deep Learning ...................... 22
Hình 1.8. Các k thut Representation Learning ...................................................... 24
Hình 1.9. Kết qu so sánh hai phương pháp vi các đ đo ....................................... 31
Hình 1.10. So sánh các phương pháp phát hiện ....................................................... 31
Hình 2.1. Thiết kế chi tiết mô hình ........................................................................... 33
Hình 2.2. Khởi tạo thư mục làm việc và lưu trữ dữ liệu ........................................... 36
Hình 2.3. Tải xuống các bản chụp của bộ dữ liệu CTU-13 ...................................... 37
Hình 2.4. Import các thư viện cần thiết ..................................................................... 37
Hình 2.5. Chuyển dữ liệu dạng binetflow sang csv lưu trữ vào thư mục đã tạo trước
đó ............................................................................................................................... 38
Hình 2.6. Những thuộc tính của bản chụp 8 và các dòng dữ liệu đầu tiên ............... 38
Hình 2.7. Biểu đồ tương quan số lượng giữa 3 nhãn trong bộ dữ liệu ..................... 40
Hình 2.8. Biểu đồ tương quan số lượng giữa 3 nhãn trong bộ dữ liệu sau khi cân bằng
................................................................................................................................... 40
Hình 2.9. Dữ liệu sau khi được mã hóa .................................................................... 41
Hình 2.10. Chuyển dữ liệu về dạng hình ảnh ............................................................ 42
Hình 2.11. Tạo thư mục lưu trữ tương ứng cho mỗi loại Normal, Botnet và C&C.. 42
Hình 2.12. Định nghĩa nơi lưu trữ dữ liệu của từng loại ........................................... 43
Hình 2.13. Chia dữ liệu và di chuyển vào nơi lưu trữ tương ứng mỗi loại ............... 43
Hình 2.14. Định nghĩa đường dẫn chứa các tập đã chia ........................................... 44
Hình 2.15. Thực hiện khai báo mạng Resnet-18 CNN và kiểm tra feature .............. 44