ĐẠI HC QUC GIA HÀ NI
TRƯỜNG ĐẠI HC CÔNG NGH
NGUYN TH LIÊN
PHÂN TÍCH QUAN ĐIỂM TRONG LĨNH VỰC THỨC ĂN TRẺ EM
S DNG K THUT HC MÁY
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DN KHOA HC: TS. NGUYỄN VĂN VINH
Hà Ni 2021
ĐẠI HC QUC GIA HÀ NI
TRƯỜNG ĐI HC CÔNG NGH
NGUYN TH LIÊN
PHÂN TÍCH QUAN ĐIỂM TRONG LĨNH VỰC THỨC ĂN TRẺ
EM S DNG K THUT HC MÁY
NGÀNH: CÔNG NGH THÔNG TIN
CHUYÊN NGÀNH: H THNG THÔNG TIN
MÃ S: 60480104
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DN KHOA HC: TS. NGUYỄN VĂN VINH
Hà Ni 2021
MC LC
DANH MC CÁC KÝ HIU VÀ CH VIT TT .......................................... v
DANH MC CÁC BNG BIU ........................................................................ vi
DANH MC CÁC HÌNH VẼ, ĐỒ TH ............................................................. vii
LỜI CAM ĐOAN……....................................................................................... viii
LI CẢM ƠN………. ......................................................................................... ix
M ĐẦU……………. .......................................................................................... 1
1. do chọn đề tài ................................................................................. 1
2. Mc tiêu và nhim v ca luận văn .................................................... 2
3. B cc luận văn ................................................................................... 2
CHƯƠNG 1: TNG QUAN V BÀI TOÁN PHÂN TÍCH QUAN ĐIỂM ........ 3
1.1. Gii thiu .......................................................................................... 3
1.2. Định nghĩa và khái niệm trong phân tích quan điểm ....................... 4
1.2.1. Các thành phn ca một quan điểm .......................................... 4
1.2.2. Các nhim v của phân tích quan điểm .................................... 7
1.3. Nhng thách thc trong lĩnh vực phân tích quan điểm.................. 10
1.4. Các ng dng của phân tích quan điểm ......................................... 12
1.5. Phân lớp quan điểm ........................................................................ 13
Kết lun chương .................................................................................... 14
CHƯƠNG 2: CÁC K THUT HC MÁY TRONG BÀI TOÁN PHÂN TÍCH
QUAN ĐIỂM ......................................................................................... 15
2.1. Các phương pháp tiếp cn của phân tích quan điểm...................... 15
2.1.1. Phương pháp tiếp cn da trên lut ......................................... 15
2.1.2. Phương pháp tiếp cn da vào hc máy ................................. 16
2.2. Phương pháp Naïve Bayes ............................................................ 16
2.3. Phương pháp Support Vector Machine (SVM) ............................. 18
2.4. Phương pháp Hồi quy Logistic (Logistic regression) .................... 21
2.4.1. Gii thiu ................................................................................. 21
2.4.2. Mô hình Logistic ..................................................................... 21
2.4.3. Hàm Logistic và các t l ......................................................... 23
2.5. Phương pháp tiếp cn hc sâu (Deep Learning) ............................ 25
2.5.1. Mng Neural hi quy RNN ..................................................... 26
2.5.2. Mng Long Short-Term Memory ........................................... 28
Kết luận chương .................................................................................... 32
CHƯƠNG 3: NG DỤNG PHÂN TÍCH QUAN ĐIỂM VI D LIU THC
ĂN TRẺ EM ......................................................................................... 33
3.1. H thng phân tích quan điểm ....................................................... 33
3.2. Đặc điểm ca d liu thức ăn trẻ em.............................................. 34
3.3. Tin x lý d liu và gán nhãn ....................................................... 35
3.3.1. Tin x lý d liu .................................................................... 35
3.3.2. Gán nhãn d liu ..................................................................... 36
3.4. Trích chọn đặc trưng ...................................................................... 39
3.5. Xây dng và la chn mô hình ...................................................... 41
3.6. Phương pháp đánh giá mô hình ..................................................... 42
CHƯƠNG 4: THC NGHIỆM VÀ ĐÁNH G ............................................... 45
4.1. Môi trường thc nghim: ............................................................... 45
4.2. Xây dng và la chn mô hình ...................................................... 45
4.3. Hun luyn mô hình ....................................................................... 48
4.4. Kết qu thc nghim ...................................................................... 48
4.5. Đánh giá thực nghim .................................................................... 51
Kết luận chương……………………………………………………….52
KT LUẬN………………. ................................................................................ 53
Tài liu tham khảo….. ......................................................................................... 54
v
DANH MC CÁC KÝ HIU VÀ CH VIT TT
Viết tt
Đầy đủ tiếng anh
Ý nghĩa tiếng vit
ACC
Accuracy
Độ chính xác trung bình các
thut toán
BOW
Bag of word
Túi t
LSTM
Long Short Term Memory
Mng b nh thut ng ngn
dài
NLP
Natural Language Processing
X lý ngôn ng t nhiên
OA
Opinion analysis
Phân tích quan điểm
SA
Sentiment Analysis
Phân tích cm xúc
SVM
Support Vector Machine
Máy véc-tơ hỗ tr
TF-IDF
Term Frequency Inverse
Document Frequency
Tn sut tài liu nghịch đảo
thut ng