Xử lý cho dữ liệu tiếng Việt
-
Bài giảng "Xử lý dữ liệu với SPSS" cung cấp cho người học các kiến thức: Thang đo định danh, các dạng câu hỏi của thang đo định danh, thang đo thứ bậc, tiếng Việt theo Unicode, làm sạch dữ liệu,.... Mời cascbanj cùng tham khảo nội dung chi tiết.
97p doinhugiobay_07 16-12-2015 134 18 Download
-
Luận án Tiến sĩ Kỹ thuật "Nghiên cứu các phương pháp học máy cho trích xuất thông tin tự động từ văn bản" trình bày các nội dung chính sau: Tổng quan về trích xuất thông tin tự động từ văn bản; Trích xuất khía cạnh và phân loại quan điểm cho tiếng Việt tận dụng nguồn dữ liệu đã được gán nhãn từ ngôn ngữ khác; Trích xuất thực thể và quan hệ trong văn bản pháp quy tiếng Việt sử dụng học máy truyền thống và học sâu.
158p vilazada 02-02-2024 17 3 Download
-
Luận văn "Ứng dụng máy học trong tạo sinh câu trả lời cho hệ thống hỏi đáp" sẽ nghiên cứu các mô hình máy học để xây dựng mô hình hệ thống trả lời tự động có chức năng tạo sinh câu trả lời bằng tiếng Việt cho người dùng.
24p trankora03 05-08-2023 7 4 Download
-
Đồ án tìm hiểu về một số phương pháp biểu diễn từ bằng véc-tơ, một số phương pháp học sâu sử dụng đặc trưng véc-tơ từ làm đầu vào xử lý và úng dụng phương pháp LSTM sử dụng véc-tơ từ là đặc trưng cho bài toán phân loại quan điểm bình luận tiếng Việt.
62p spiritedaway36 26-11-2021 57 7 Download
-
Luận văn đã trình bày các kiến thức cơ bản về phát hiện trùng lặp, phân loại tin tức, xác định từ khóa quan trọng và đề xuất câu tóm tắt cho tin tức trên miền dữ liệu tiếng Việt. Bên cạnh đó, luận văn đã trình bày chi tiết các phương pháp tiếp cận bài toán, cũng như hướng giải quyết và kết quả thực tế.
59p tamynhan0 04-07-2020 38 4 Download
-
Luận văn sẽ trình bày về lý thuyết mạng neural RNN và cải tiến của nó là LSTM cùng với một số thuật toán học máy quan trọng trong quá trình xử lý dữ liệu ngôn ngữ. Cuối cùng, luận văn sẽ mô tả việc áp dụng và kết quả khi sử dụng mô hình LSTM trong bài toán trích xuất thông tin quan điểm. Thuật toán sẽ được đánh giá dựa trên hai tập dữ liệu tiếng Anh và tiếng Việt.
24p tamynhan1 13-06-2020 58 6 Download
-
Trong đề tài này, tác giả tiến hành nghiên cứu, xây dựng một mô hình đối thoại cho tiếng Việt, dựa trên phương pháp học chuỗi liên tiếp, sequence-to-sequence, để sinh ra câu trả lời từ một chuỗi đầu vào tương ứng. Lợi thế của phương pháp này là mô hình có thể được huấn luyện end-to-end trên tập dữ liệu có sẵn, và yêu cầu ít hơn các luật bằng tay. Mời các bạn cùng tham khảo tài liệu để nắm biết thêm về kết quả của đề tài nghiên cứu này.
23p hanh_tv26 03-04-2019 55 3 Download
-
Luận văn sẽ trình bày về lý thuyết mạng neural RNN và cải tiến của nó là LSTM cùng với một số thuật toán học máy quan trọng trong quá trình xử lý dữ liệu ngôn ngữ. Cuối cùng, luận văn sẽ mô tả việc áp dụng và kết quả khi sử dụng mô hình LSTM trong bài toán trích xuất thông tin quan điểm. Thuật toán sẽ được đánh giá dựa trên hai tập dữ liệu tiếng Anh và tiếng Việt.
61p hanh_tv25 02-04-2019 75 11 Download
-
Luận văn sẽ trình bày về lý thuyết mạng neural RNN và cải tiến của nó là LSTM cùng với một số thuật toán học máy quan trọng trong quá trình xử lý dữ liệu ngôn ngữ. Cuối cùng, luận văn sẽ mô tả việc áp dụng và kết quả khi sử dụng mô hình LSTM trong bài toán trích xuất thông tin quan điểm. Thuật toán sẽ được đánh giá dựa trên hai tập dữ liệu tiếng Anh và tiếng Việt.
24p hanh_tv25 02-04-2019 54 3 Download
-
Xứ Đoài (nay thuộc ngoại thành Hà Nội) là một vùng đất mang đậm dấu ấn Phật giáo, với hàng trăm ngôi chùa lớn, nhỏ. Mang một phong cách rất riêng và độc đáo, với chất liệu xây dựng chủ yếu bằng đá xanh, ngôi chùa Cực Lạc nằm trên đỉnh quả đồi thuộc thôn Yên Lạc, xã Cần Kiệm, huyện Thạch Thất, Hà Nội là một sự ngạc nhiên thú vị cho du khách.
6p rain123123 30-06-2013 59 3 Download
-
Nhờ khả năng hỗ trợ người dùng trong việc khai thác các tài nguyên trên Internet một cách hiệu quả và dễ dàng, hệ thống hỏi đáp nói chung đã được quan tâm nghiên cứu từ khá lâu, tuy nhiên các dạng hệ thống hỏi đáp đặc biệt, trong đó có hệ thống hỏi đáp danh sách vẫn còn đang ở bước đầu phát triển. Hệ thống hỏi đáp danh sách là hệ thống hỏi đáp, nhận đầu vào là câu hỏi dưới dạng ngôn ngữ tự nhiên và trả về câu trả lời dưới dạng một danh sách. Tại...
62p chieu_mua 25-08-2012 102 25 Download
-
Tóm tắt: Hiện nay, tiếng Việt có hơn 40 loại bảng mã khác nhau được sử dụng để mã hóa các loại văn bản: từ trang web, các dữ liệu điện tử đến các cơ sở dữ iệu… Việc nhận biết bảng mã và chuyển đổi giữa các bảng mã tiếng Việt là rất cần thiết, không chỉ mang lại lợi ích cho các lập trình viên mà cho cả nhân viên văn phòng, nhân viên xử lý văn bản. Công việc này cũng tạo tiền đề cho các việc xử lý tiếp theo trong tiếng Việt như: kiểm tra...
4p thulanh1 06-09-2011 83 6 Download
-
Xây dựng một ứng dụng, đôi lúc bạn muốn thiết lập giao diện với nhiều ngôn ngữ. Thường thì với chúng ta sẽ xây dựng là tiếng Anh và tiếng Việt. Ở đây tớ có bài hướng dẫn thiết lập và chuyển đổi giữa 2 ngôn ngữ là tiếng Anh và tiếng Việt. Ai chơi tiếng Trung, Nhật hay Thái thì cho tớ vài cái font và bộ gõ để chơi vui hen. Đầu tiên bạn tạo một project đặt tên gì đó thì tùy, sau đó cho vào một menu hay vài button, label gì đó để xử lý...
3p kienk6e 30-03-2011 101 5 Download