HC VIN CÔNG NGH BƯU CHÍNH VIỄN THÔNG
---------------------------------------
ĐẶNG TH NGC YN
PHÁT HIN LẬP TRƯỜNG
S DNG K THUT HC SÂU
LUẬN VĂN THẠC SĨ KỸ THUT
(Theo định hướng ng dng)
HÀ NI 2021
HC VIN CÔNG NGH BƯU CHÍNH VIỄN THÔNG
---------------------------------------
ĐẶNG TH NGC YN
PHÁT HIN LẬP TRƯỜNG
S DNG K THUT HC SÂU
Chuyên ngành : Khoa hc máy tính
Mã s : 8.48.01.01
LUẬN VĂN THẠC SĨ KỸ THUT
(Theo định ng ng dng)
NGƯỜI HƯỚNG DN KHOA HC:
TS. TRN TH OANH
HÀ NI 2021
i
LỜI CAM ĐOAN
Tôi xin cam đoan đây công trình nghiên cứu của bản thân. Các sliệu, kết
quả trình bày trong luận văn là trung thực và chưa từng được ai công bố trong bất kỳ
công trình nào trước đây.
Tác giả
Đặng Thị Ngọc Yến
ii
LỜI CẢM ƠN
Em xin chân thành cảm ơn TS. Trần Thị Oanh, bộ môn Khoa học máy tính,
Quốc tế, Đại học Quốc Gia Nội đã tận tình chỉ dạy hướng dẫn cho em trong
việc lựa chọn đề tài, thực hiện đề tài viết báo cáo luận văn, giúp cho em thể
hoàn thành tốt luận văn này.
Em xin chân thành cảm ơn các thầy giáo Khoa Công nghệ thông tin
những người giảng dạy em, đặc biệt PGS.TS. Ngô Xuân Bách các thầy trong
khoa Sau đại học đã tận tình dạy dỗ và chỉ bảo em trong suốt hai năm học.
Xin chân thành cảm ơn hai em Nguyễn Phương Ly Đào Thanh Trang đã
tham gia xây dựng kho ngữ liệu cho bài toán.
Cuối cùng em xin cảm ơn gia đình, bạn bè, những người đã luôn bên cạnh
động viên em những lúc khó khăn giúp đem trong suốt thời gian học tập
nghiên cứu, tạo mọi điều kiện tốt nhất cho em để thể hoàn thành tốt luận văn của
mình.
Mặc đã cố gắng hoàn thành nghiên cứu trong phạm vi và khả năng cho phép
nhưng chắc chắn sẽ không tránh khỏi những thiếu sót. Em kính mong nhận được sự
thông cảm của thầy cô và các bạn.
Em xin chân thành cảm ơn!
Nội, 05/2021
Đặng Thị Ngọc Yến
iii
MỤC LỤC
LỜI CAM ĐOAN ........................................................................................................ i
LI CẢM ƠN .............................................................................................................ii
MC LC ................................................................................................................. iii
DANH MC CÁC THUT NG, CH VIT TT ................................................ v
DANH MC HÌNH V ............................................................................................. vi
DANH MC BNG BIU ......................................................................................vii
M ĐẦU ..................................................................................................................... 1
CHƯƠNG I: BÀI TOÁN PHÁT HIN LẬP TRƯỜNG ........................................... 3
1.1 Gii thiu bài toán phát hin lập trường ............................................................ 3
1.2 Mt s nghiên cu liên quan ............................................................................. 4
1.4 Kết luận chương ............................................................................................... 7
CHƯƠNG II: CÁC PHƯƠNG PHÁP HỌC MÁY S DNG TRONG BÀI TOÁN
PHÁT HIN LP TRƯỜNG ..................................................................................... 8
2.1 Phương pháp học máy truyn thng ................................................................. 8
2.1.1 Thut toán phân lp naïve Bayes .............................................................. 8
2.1.1 Cây quyết đnh (Decision tree) ................................................................... 9
2.2 Phương pháp học sâu ...................................................................................... 10
2.1.2 Mô hình mạng nơ-ron hi quy (RNN - Recurrent Neural Network) ....... 10
3.1.1 Mng b nh dài - ngn (Long Short Term Memory) ............................. 15
3.3 Kết luận chương ............................................................................................. 21
CHƯƠNG III: ĐỀ XUẤT PHƯƠNG PHÁP, GIẢI PHÁP ...................................... 22
4.1 Mô t bài toán ................................................................................................. 22
4.2 Tin x lý d liu ........................................................................................... 23
4.3 Phát hin lập trường s dng mô hình hc máy truyn thng ....................... 23
4.3.1 Trích chọn đặc trưng ............................................................................... 23
4.3.2 Các bước thc hin .................................................................................. 27
4.4 Phát hin lập trường s dng mô hình hc sâu .............................................. 28