HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
TỐNG NGUYÊN SƠN
PHÁT HIỆN CÂU CHỨA GỢI Ý TRÊN DIỄN ĐÀN
TRỰC TUYẾN SỬ DỤNG MẠNG NƠ - RON
LUẬN VĂN THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)
HÀ NỘI - 2020
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
TỐNG NGUYÊN SƠN
PHÁT HIN CÂU CHA GI Ý TRÊN DIỄN ĐÀN
TRC TUYN S DNG MẠNG NƠ-RON
Chuyên ngành: Hệ thống thông tin
Mã s: 8.48.01.04
LUẬN VĂN THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)
NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. NGÔ XUÂN BÁCH
HÀ NI 2020
i
LỜI CAM ĐOAN
Tôi xin cam đoan đây công trình nghiên cu ca riêng tôi dưới s hướng
dn ca Tiến Ngô Xuân Bách. Các kết qu đạt được trong luận văn sản phm
ca riêng nhân, không sao chép của ngưi khác. Ni dung ca luận văn tham
kho s dng mt s thông tin, tài liu t các ngun sách, tạp chí được lit trong
danh mc các tài liu tham kho.
Tác gi luận văn ký và ghi rõ h tên
Tống Nguyên Sơn
ii
LI CẢM ƠN
Tôi xin gi li cảm ơn chân thành nhất đến Thầy TS. Ngô Xuân Bách, người
đã tận tình hướng dn, h tr giúp đ tôi rt nhiu trong nghiên cu luận văn. Thầy
đã đưa ra những định hướng, nhận xét góp ý quý giá đ luận văn này được hoàn
thành tt nht.
Kính gi li cảm ơn đến quý Thy, giảng viên đã tận tình ging dy
truyền đạt nhng kiến thc chuyên môn cn thiết trong quá trình tôi đưc hc tp ti
Hc vin Công ngh Bưu chính Viễn thông.
Xin gi li biết ơn đến gia đình đã không ngừng quan tâm, động viên, ng h
v mt tinh thn ln vt cht trong sut thi gian tôi tham gia khóa hc và thc hin
luận văn này.
Cảm ơn các bạn lp Cao học M18CQIS02B đã giúp đỡ đồng hành cùng i
trong những năm tháng hc tp tại nhà trường.
Thi gian thc hin luận văn còn khá ngắn, kinh nghim v lĩnh vc x
ngôn ng t nhiên ca bn thân còn hn chế, luận văn cũng còn nhiều thiếu sót rt
mong nhận được nhng ý kiến đóng góp của quý Thy các bn để tôi th
hoàn thin luận văn mt cách tt nht.
Xin trân trng cảm ơn!
iii
MỤC LỤC
LỜI CAM ĐOAN ...................................................................................................... 1
LI CM ƠN ........................................................................................................... ii
MỤC LỤC ................................................................................................................ iii
BNG DANH MC THUT NG TING ANH ................................................. v
DANH MC BNG BIU ..................................................................................... vi
DANH MC HÌNH ................................................................................................ vii
LỜI NÓI ĐẦU ........................................................................................................... 1
CHƯƠNG 1: GII THIU BÀI TOÁN PHÂN LOI CÂU CHA GI Ý ...... 3
1.1. Gii thiu v x ngôn ng t nhiên .............................................................. 3
1.2. Bài toán phát hin câu cha gi ý trên diễn đàn trực tuyến ............................. 4
1.2.1. Phân loi d liu văn bản ........................................................................... 4
1.2.2. Phát biu bài toán phân loi phát hin câu cha gi ý ............................... 5
1.2.3. Ý nghĩa bài toán: ........................................................................................ 6
1.3. Các nghiên cu liên quan .................................................................................. 6
1.4. Kết lun chương ................................................................................................ 7
CHƯƠNG 2: PHƯƠNG PHÁP PHÁT HIN CÂU CHA GI Ý S DNG HC
MÁY ........................................................................................................................... 8
2.1. Phương pháp gii quyết bài toán: ..................................................................... 8
2.1.1. Tin x lý d liu ..................................................................................... 10
2.1.2. Lc nhiu (loi b t không mang nghĩa) ................................................ 10
2.1.3. Loi b các t ph biến (stop word): ....................................................... 10
2.2. Gii thiu chung mô hình mạng Nơ-ron: ....................................................... 11
2.2.1. Mạng Nơ-ron nhân to (ANN) ................................................................. 11
2.2.2. Mạng nơ-ron sinh học .............................................................................. 12
2.2.3. Kiến trúc tổng quát của mạng neural nhân tạo: ........................................ 13
2.3. Mạng nơron tích chập CNN: .......................................................................... 16
2.4. Mạng nơron hi quy RNN: ............................................................................. 20
2.5. Mạng nơ-ron có b nh ngn dài LSTM: ....................................................... 23