HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
LÊ HOÀNG BẢO
PHÂN LOẠI LƯU LƯỢNG MẠNG INTERNET
DÙNG MACHINE LEARNING
LUẬN VĂN THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)
TP. HỒ CHÍ MINH - NĂM 2022
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
LÊ HOÀNG BẢO
PHÂN LOẠI LƯU LƯỢNG MẠNG INTERNET
DÙNG MACHINE LEARNING
Chuyên ngành: HTHỐNG THÔNG TIN
Mã số: 8.48.01.04
LUẬN VĂN THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)
NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS. NGUYỄN HỒNG SƠN
TP. HỒ CHÍ MINH - NĂM 2022
i
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cu khoa hc ca riêng tôi. Các s
liu s dng phân tích trong lun án phi ngun gốc ràng, đã công bố theo đúng
quy định. Kết qu nghiên cu trong lun án do tôi t tìm hiu, phân tích mt cách
trung thc, khách quan. Ngoài ra kết qu này phù hp vi thc tin ca Vit Nam.
Các kết qu này chưa từng được công b trong bt k nghiên cu nào khác.
TP HCM, ngày 25 tháng 01 năm 2022
Hc viên thc hiên luận văn
Lê Hoàng Bo
ii
LỜI CẢM ƠN
Trong quá trình thc hiện đề i Phân Loại Lưu Lượng Internet Dùng
Machine Learning.”, Tôi đã nhận được rt nhiu s giúp đ, tạo điều kin ca tp
th lãnh đạo, cán b, ging viên, cán b các phòng, ban chức năng Trường Hc Vin
Công Ngh Bưu Chính Viễn Thông Cơ Sở H Chí Minh.Tôi xin bày t lòng cảm ơn
chân thành v s giúp đỡ đó.
Tôi xin bày t lòng biết ơn sâu sắc ti TS.Nguyn Hồng Sơn thy giáo trc
tiếp hướng dn và ch bo cho Tôi hoàn thành lun án này.
Tôi xin chân thành cảm ơn bạn bè, đồng nghip của Tôi đang công tác tại
VNPT Tây Ninh gia đình đã động viên, khích l, tạo điều kiện giúp đỡ Tôi
trong sut quá trình thc hin và hoàn thành lun án này.
TP HCM, ngày 25 tháng 01 năm 2022
Hc viên thc hiên luận văn
Lê Hoàng Bo
iii
MỤC LỤC
LỜI CAM ĐOAN ............................................................................................ i
LỜI CẢM ƠN ................................................................................................. ii
MỤC LỤC ...................................................................................................... iii
DANH MỤC CÁC THUÂT NGỮ,CHỮ VIẾT TẮT ...................................... v
DANH SÁCH BẢNG .................................................................................... vi
DANH SÁCH HÌNH VẼ .............................................................................. vii
MỞ ĐẦU .......................................................................................................... 1
Chương 1: NGHIÊN CỨU TỔNG QUAN ...................................................... 2
1.1 Nhu cầu phân tích lưu lượng mng Internet ........................................ 2
1.2 Các phương pháp tiền x lý d liu .................................................... 3
1.2.1 Phương pháp chun hóa ................................................................ 4
1.2.2 Vấn đề d liu b khuyết (missing data) ....................................... 7
1.3 Mt s thuât toán học máy được áp dng vào phân loại lưu lượng .... 8
Chương 2 : TỔNG QUAN VỀ HỌC MÁY ................................................... 12
2.1 Gii thiu ........................................................................................... 12
2.2 Các phương pháp học trong quá trình hc máy ................................ 13
2.3 Các loại bài toán cơ bản trong hc máy ............................................ 14
Chương 3: PHÁT TRIỂN MÔ HÌNH ............................................................ 32
3.1 . Tp d liu ....................................................................................... 32
3.2 Mô hình phân loại lưu lưng ............................................................. 33
3.2.1 Xây dng mô hình ...................................................................... 33
3.2.2 Tin x lý d liu ....................................................................... 34
3.2.5 K Lân cn (KNN K-Nearest Neighbors) .............................. 42
3.2.6 Mng Neuron nhân to (ANN Artificial Neural Networks) .... 44
3.2.7 Rng ngu nhiên (RF - Random Forest): ................................... 47