Xử lý văn bản Tiếng Việt
-
Luận văn "Nghiên cứu phương pháp học máy có giám sát để phân loại văn bản tại Văn phòng tỉnh Quảng Ngãi" đã nghiên cứu kỹ thuật xử lý ngôn ngữ tiếng Việt; xây dựng kho dữ liệu huấn luyện để ứng dụng vào bài toán phân loại văn bản; ứng dụng kỹ thuật học máy vào bài toán phân loại văn bản tại Văn phòng tỉnh Quảng Ngãi.
91p xuanphongdacy03 29-08-2024 6 2 Download
-
Luận án Tiến sĩ Kỹ thuật "Nghiên cứu các phương pháp học máy cho trích xuất thông tin tự động từ văn bản" trình bày các nội dung chính sau: Tổng quan về trích xuất thông tin tự động từ văn bản; Trích xuất khía cạnh và phân loại quan điểm cho tiếng Việt tận dụng nguồn dữ liệu đã được gán nhãn từ ngôn ngữ khác; Trích xuất thực thể và quan hệ trong văn bản pháp quy tiếng Việt sử dụng học máy truyền thống và học sâu.
158p vilazada 02-02-2024 13 3 Download
-
Luận văn "Nhận diện cảm xúc trong văn bản tiếng Việt bằng mô hình máy học" được hoàn thành với mục tiêu nhằm mô hình giải quyết bài toán nhận diên cảm xúc trong văn bản tiếng việt phải được tối ưu về độ chính xác, hiệu suất thời gian thực hiện, giúp giải quyết các vấn đề còn mắc phải trong nhận diện cảm xúc khách hàng nói riêng và xử lý ngôn ngữ tự nhiên ở Việt Nam nói chung.
28p trankora03 05-08-2023 14 5 Download
-
Hệ thống chữ cái Tiếng Việt là được xây dựng dựa trên chữ cái Latinh có thêm chữ ghép và dấu phụ. Do đó việc nhận dạng sẽ gặp khó khăn hơn so với chữ cái Latinh thông thường và cần phải có thuật toán xử lý đem lại độ chính xác cao. Mời các bạn cùng tham khảo để nắm chi tiết nội dung đề tài.
45p bobietbay 22-12-2021 26 6 Download
-
Đề tài “Tìm hiểu kỹ thuật Tóm tắt đa văn bản tiếng Việt sử dụng mô hình đồ thị” tập trung vào việc tìm hiểu, khảo sát, đánh giá và đưa vào ứng dụng một phương pháp tóm tắt đa văn bản phù hợp với ngôn ngữ tiếng Việt. Mời các bạn cùng tham khảo!
80p heavysweetness 04-08-2021 24 4 Download
-
Đề tài tập trung nghiên cứu xây dựng hệ thống nhận dạng tiếng Việt liên tục với hướng tiếp cận mẫu thống kê dựa vào mô hình Markov ẩn (HMM). Với giới hạn thời gian làm đồ án, việc xây dựng một hệ thống nhận dạng tiếng Việt liên tục với kích thước lớn là rất khó khăn vì vậy đề tài giới hạn nghiên cứu hệ thống nhận dạng tiếng nói tiếng Việt cho 10 chữ số. Mời các bạn cùng tham khảo!
61p heavysweetness 04-08-2021 33 4 Download
-
Mục đích của Luận văn này tập trung nghiên cứu các kỹ thuật nhận dạng tiếng nói, từ đó xây dựng ứng dụng nhận dạng một số từ, các số và cụ thể là nhận dạng âm thanh và ứng dụng trong chuyển đổi âm thoại sang văn bản sử dụng mô hình Markov ẩn dựa trên các đặc trưng MFCC. Ngoài ra, một số kỹ thuật khử nhiễu dữ liệu như CMS cũng được tích hợp để tăng tính hiệu quả của hệ thống. Các kỹ thuật nhận dạng giọng nói trong luận văn tập trung vào loại dữ liệu âm thanh tiếng Việt.
24p monsterhunterer 15-06-2021 35 5 Download
-
Luận văn có ba chương chính là: Chương 1 - Một số vấn đề cơ sở lý thuyết; chương 2 - Một số chiến lược từ chối trong tiếng Nhật (Liên hệ với tiếng Việt) và chương 3 - Khảo sát việc sử dụng các chiến lược từ chối trong tiếng Nhật của người Nhật và của người Việt học tiếng Nhật. Mời các bạn tham khảo!
108p meangirls 15-06-2021 48 6 Download
-
Luận văn đã trình bày các kiến thức cơ bản về phát hiện trùng lặp, phân loại tin tức, xác định từ khóa quan trọng và đề xuất câu tóm tắt cho tin tức trên miền dữ liệu tiếng Việt. Bên cạnh đó, luận văn đã trình bày chi tiết các phương pháp tiếp cận bài toán, cũng như hướng giải quyết và kết quả thực tế.
59p tamynhan0 04-07-2020 36 4 Download
-
Mục đích của đề tài là tìm hiểu các đặc trưng chính tả của hệ viết tiếng Lào, các phương pháp tách từ và PLVB đã được đề xuất cho tiếng Anh, tiếng Thái và tiếng Việt, đánh giá hiệu quả của các phương pháp này, đề xuất được giải pháp tách từ hiệu quả, lựa chọn các phương pháp PLVB phù hợp và các điều kiện thử nghiệm, từ đó áp dụng giải quyết bài toán PLVB kết hợp tách từ tiếng Lào, thử nghiệm phân loại các VBHC của trường ĐH Champasack, nước CHDCND Lào và đánh giá các kết quả thử nghiệm.
99p cotithanh000 07-10-2019 53 8 Download
-
Mục tiêu của đề tài là hệ thống hoá và phân tích đầy đủ các vấn đề liên quan đến phân loại văn bản gồm: các mô hình phân loại, các phương pháp, kỹ thuật học có giám sát, học không có giám sát, học bán giám sát và học tăng cường; Đề xuất được các giải pháp nhằm cải tiến phương pháp phân loại văn bản tiếng Việt để cải thiện chất lượng phân loại cả về kết quả lẫn tốc độ xử lý;
142p cotithanh000 07-10-2019 57 6 Download
-
Nội dung luận văn "Xử lý văn bản Tiếng Việt và xây dựng hệ mật kép an toàn" được trình bày như sau: Chương 1) Xử lý ngôn ngữ tự nhiên và xử lý văn bản Tiếng Việt. Chương 2) Một số kiến thức về mật mã. Chương 3) Xây dựng hệ mật kép và ứng dụng. Phần kết luận và hướng phát triển: Rút ra kết luận và hướng phát triển của luận văn.
67p hanh_tv26 04-04-2019 70 5 Download
-
Trong đề tài này, tác giả tiến hành nghiên cứu, xây dựng một mô hình đối thoại cho tiếng Việt, dựa trên phương pháp học chuỗi liên tiếp, sequence-to-sequence, để sinh ra câu trả lời từ một chuỗi đầu vào tương ứng. Lợi thế của phương pháp này là mô hình có thể được huấn luyện end-to-end trên tập dữ liệu có sẵn, và yêu cầu ít hơn các luật bằng tay. Mời các bạn cùng tham khảo tài liệu để nắm biết thêm về kết quả của đề tài nghiên cứu này.
23p hanh_tv26 03-04-2019 55 3 Download
-
Luận văn mang ý nghĩa là sự kế thừa, tiếp tục các kiến thức, lý thuyết của những xu hướng nghiên cứu ngôn ngữ theo hướng ngữ pháp chức năng, ngữ pháp ngữ nghĩa, ngữ dụng trong tiếng Việt. Mời các bạn cùng tham khảo nội dung chi tiết.
25p dien_vi09 04-11-2018 46 4 Download
-
Bài 2 bao gồm những nội dung kiến thức cơ bản về tách từ tiếng Việt. Đây là bước xử lý quan trọng đối với các hệ thống xử lý ngôn ngữ tự nhiên, đặc biệt là đối với các ngôn ngữ đơn lập. Với các ngôn ngữ đơn lập, một từ có thể có một hoặc nhiều âm tiết. Vấn đề của bài toán tách từ là khử được sự nhập nhằng trong ranh giới từ. Mời các bạn cùng tham khảo bài giảng để biết thêm chi tiết.
5p dien_vi01 04-10-2018 70 7 Download
-
Bài giảng này cung cấp cho người học những hiểu biết cơ bản về nghĩa từ vựng và phân giải nhập nhằng từ. Nội dung trình bày gồm có: Từ đồng âm, phân loại từ đồng âm tiếng việt, từ đa nghĩa, đồng nghĩa, nghĩa từ vựng, ràng buộc về lựa chọn: mã hóa ngữ nghĩa trong văn phạm, ràng buộc lựa chọn, khai thác quan hệ từ vựng,... Mời các bạn cùng tham khảo.
7p dien_vi01 04-10-2018 38 1 Download
-
Chương này cung cấp cho người học những hiểu biết cơ bản về phân loại tin tự động cho báo điện tử. Mục đích của việc phân loại này nhằm tìm hiểu và thử nghiệm các phương pháp phân loại văn bản áp dụng trên Tiếng Việt. Chương này sẽ trình bày một số phương pháp thực hiện phân loại, các chương trình thực nghiệm và đánh giá kết quả. Mời các bạn cùng tham khảo.
4p dien_vi01 04-10-2018 62 2 Download
-
Chương này trình bày về phân lớp văn bản tiếng việt theo hướng tiếp cận lexical chain. Nội dung chính gồm có: Tổng quan về bài toán phân lớp văn bản, tiếp cận bài toán phân lớp văn bản tiếng Việt theo hướng lexical chain. Mời các bạn cùng tham khảo.
6p dien_vi01 04-10-2018 50 2 Download
-
Tóm tắt luận án: Xây dựng mô hình trường xử ký tiếng Ê Đê ứng dụng trong dạy và học tiếng Ê Đê có nội dung gồm 4 chương. Chương 1: tiếp cận xử lý ngôn ngữ dân tộc thiểu số, trình bày vấn đề về xử lý tiêng dân tộc thiểu số Việt Nam, xử lý ngôn ngữ dân tộc thiểu số. Chương 2: môi trường xử lý tiếng Ê Đê, trình bày những vấn đề về soạn thảo văn bản tiếng Ê Đê, sử dụng unicode trong soạn thảo văn bản. Chương 3: xử lý tiếng Ê Đê, trình bày mô hình hợp nhất nguồn dữ liệu song ngữ Việt-Ê Đê, xây dựng kho ngữ vựng Việt-Ê Đê. Chương 4: xây dựng ứng dụng xử lý tiếng Ê Đê.
27p dtphuongg 05-09-2018 68 7 Download
-
“Lọc thư spam” là bài toán đang được các nhà nghiên cứu quan tâm và đã xuất hiện nhiều hướng tiếp cận để xây dựng các hệ thống lọc cho hiệu quả cao. Tuy nhiên, có những vấn đề khó khăn thách thức khác đối với bài toán này: xây dựng bộ lọc thư spam tiếng Việt. Bài báo cáo này đề xuất mô hình áp dụng thuật toán Naïve Bayes để lọc thư spam tiếng Việt thông qua việc xử lý ngôn ngữ tiếng Việt. Mời bạn đọc tham khảo.
11p benben121 31-10-2014 129 14 Download