HC VIN CÔNG NGH BƯU CHÍNH VIỄN THÔNG
---------------------------------------
ĐẶNG ĐÌNH QUÂN
XÁC ĐNH T L TIN XẤU TRÊN BÁO ĐIỆN T TING VIT
BẰNG PHƯƠNG PHÁP HỌC SÂU
LUẬN VĂN THẠC SĨ KỸ THUT
(Theo định hướng ng dng)
HÀ NI NĂM 2020
HC VIN CÔNG NGH BƯU CHÍNH VIỄN THÔNG
---------------------------------------
ĐẶNG ĐÌNH QUÂN
XÁC ĐNH T L TIN XU TRÊN BÁO ĐIỆN T TING VIT
BẰNG PHƯƠNG PHÁP HỌC SÂU
CHUYÊN NGÀNH: KHOA HC MÁY TÍNH
MÃ S: 8.48.01.01
LUẬN VĂN THẠC SĨ K THUT
(Theo định hướng ng dng)
NGƯỜI HƯỚNG DN KHOA HC: PGS. TS. TRN QUANG ANH
HÀ NI NĂM 2020
i
LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu ca riêng tôi. Ni dung ca luận văn
tham kho s dng các tài liệu, thông tin được đăng tải trên nhng tp chí các trang
web theo danh mc tài liu tham kho. Tt c các tài liu tham khảo đều xut x
ràng và đưc trích dn hp pháp.
Tôi xin hoàn toàn chu trách nhim chu mi hình thc k lut theo quy định
cho lời cam đoan của mình.
Ni, ngày tháng năm 2020
Người cam đoan
Đặng Đình Quân
ii
LI CẢM ƠN
Trong quá trình thc hin luận văn y, hc viên luôn nhận được s hướng dn,
ch bo rt tn tình ca PGS. TS. Trn Quang Anh cán b trc tiếp hướng dn khoa
hc. Thy đã giành nhiu thi gian trong việc hướng dn học viên cách đọc tài liu, thu
thập đánh gthông tin cùng phương pháp nghiên cứu để hoàn thành mt luận văn
cao hc.
Hc viên xin chân thành cảm ơn các thy, cô giáo trong Hc vin Công ngh Bưu
chính Viễn thông đã luôn nhiệt tình giúp đ và tạo điu kin tt nht cho em trong sut
quá trình hc tp tại trưng.
Xin chân thành cảm ơn các anh, các chị các bn hc viên lp Cao hc trong
Hc viện đã luôn đng viên, giúp đỡ nhit tình chia s vi em nhng kinh nghim
hc tp, công tác trong sut khoá hc.
Học viên cũng xin chân thành cảm ơn các vị lãnh đạo các bạn đồng nghip ti
quan đã luôn tạo mọi điều kin tt nhất đ em có th hoàn thành tốt đẹp khoá hc Cao
hc này.
Em xin chân thành cảm ơn!
Hà Ni, ngày tháng năm 2020
iii
MC LC
LỜI CAM ĐOAN ....................................................................................................................... i
LI CẢM ƠN ............................................................................................................................ ii
DANH MC CÁC THUT NG, CH VIT TT ............................................................ v
DANH MC CÁC HÌNH V VÀ BNG .............................................................................. vi
M ĐẦU .................................................................................................................................... 1
Chương 1 C V HC MÁY, HỌC SÂU BÀI TOÁN XÁC ĐỊNH T L
TIN XU .................................................................................................................................... 5
1.1. GII THIỆU BÀI TOÁN XÁC ĐỊNH T L TIN XU .............................................. 5
1.1.1. Định nghĩa về tin xu ............................................................................................... 6
1.1.2. Phân loại văn bản ..................................................................................................... 7
1.1.3. Phân tích cm xúc .................................................................................................... 8
1.2. SƠ LƯỢC V HC MÁY .............................................................................................. 9
1.2.1. Hc máy có giám sát .............................................................................................. 11
1.2.2. Hc máy không giám sát ........................................................................................ 12
1.2.3. Hc máy bán giám sát ............................................................................................ 13
1.2.4. Hàm mc tiêu, hàm tn tht, hàm chi phí .............................................................. 13
1.2.5. Overfitting .............................................................................................................. 14
1.3. SƠ LƯỢC V HC SÂU ............................................................................................. 15
1.3.1. Mạng nơ-ron ........................................................................................................... 16
1.3.1.1. Perceptron ....................................................................................................... 16
1.3.1.2. Mạng nơ-ron truyn thng nhiu lp .............................................................. 17
1.3.2. Hàm kích hot ........................................................................................................ 18
1.3.2.1. Softmax ........................................................................................................... 18
1.3.2.2. Sigmoid ........................................................................................................... 19
1.3.2.3. Hàm tanh ......................................................................................................... 19
1.3.3. Hun luyn mạng nơ-ron ....................................................................................... 20
1.3.3.1. SGD ................................................................................................................ 20
1.3.3.2. Backpropagation ............................................................................................. 23
1.3.3.3. Hàm kích hot ReLU ...................................................................................... 24
1.3.3.4. Adam ............................................................................................................... 24
1.3.4. Mt s hàm chi phí ................................................................................................. 25
1.3.4.1. MSE ................................................................................................................ 25
1.3.4.2. Categorical Cross Entropy .............................................................................. 25