
1
Tóm tắt luận văn
Với tốc độ phát triển của công nghệ và Internet hiện nay, khi mà lượng dữ liệu bùng
nổ trên khắp thế giới thì đó là một nguồn tài nguyên vô tận để chúng ta có thể khai thác
và tận dụng. Trong đó lượng dữ liệu về đánh giá, nhận xét trên các trang web thương mại
điện là vô cùng lớn. Từ đó xuất hiện theo một nhu cầu cấp thiết là làm sao có thể khai phá
và trích xuất thông tin được từ lượng dữ liệu trên một cách hiệu quả và hợp lý. Nhu cầu
trên xuất phát từ mong muốn hiểu rõ thị trường của các doanh nghiệp hoặc các nhà sản
xuất.
Trong những năm ngần đây, mô hình học sâu (Deep Learning) nổi lên như một
phương pháp hiệu quả để giải quyết các bài toán thuộc các lĩnh vực nhận diện hình ảnh,
nhận diện giọng nói, xử lý ngôn ngữ tự nhiên... Điểm đặc biệt của Deep Learning là tính
chính xác dựa vào lượng dữ liệu, lượng dữ liệu có thể có kích thước khổng lồ mà không
bị hạn chế. Với sự ra đời của ngày càng nhiều các thiết bị có khả năng tính toán mạnh mẽ,
cộng với lượng dữ liệu dồi dào, các mô hình Deep Learning hứa hẹn sẽ ngày càng phát
triển, trở thành nhân tố chính cho cuộc cách mạng 4.0 ngày nay.
Trong báo cáo luận văn này, tôi sẽ đề xuất một mô hình giải quyết bài toán trích xuất
khía cạnh và phân tích cảm xúc trong văn bản (mà ở đây là các đánh giá, nhận xét của
khách hàng đối với sản phẩm trên các trang thương mại điện tử). Tôi sẽ trình bày về kiến
thức nền tảng của Deep Learning, các áp dụng Deep Learning vào bài toán phân loại văn
bản. Từ các kiến thức trên và tham khảo từ các công trình liên quan trên thế giới, mô hình
mà tôi đề xuất cụ thể là sự kết hợp giữa mạng nơ-ron tích chập nhiều lớp (Convolutional
Neural Network - CNN) và mạng nơ-ron hồi quy bộ nhớ ngắn-dài (LSTM), để giải quyết
bài toán được đặt ra. Sau đó tôi đã thực hiện một hệ thống nhằm thu thập các đánh giá,
nhận xét của khách hàng trên trang thương mại điện tử thegioididong.com để đưa vào mô
hình đề xuất của tôi. Cuối cùng tôi sử dụng những thông tin đã được trích xuất để trực
quan hóa trên giao diện website.