Giới thiệu tài liệu
Nhóm nghiên cứu sử dụng hệ thống máy tính để xây dựng một mô hình phân tích dữ liệu theo chuyên mục và từ điển tham khảo tiếng Việt, tập hợp từ nghiên cứu lịch sử và khoa học phát triển ngôn ngữ tiếng Việt. Mô hình được áp dụng trong các yêu cầu tuyến tính cho một số bài toán trong việc phân tích và quyết định chất lượng văn bản tiếng Việt.
Đối tượng sử dụng
Nhóm nghiên cứu này có thể được sử dụng bởi những người làm việc trong lĩnh vực học sự phát triển ngôn ngữ tiếng Việt, cũng như nhà khoa học hoặc doanh nghiệp có yêu cầu phân tích văn bản tiếng Việt
Nội dung tóm tắt
Trong báo cáo này, nhóm nghiên cứu giới thiệu một hệ thống máy tính cho phép phân tích dữ liệu văn bản theo chuyên mục và từ điển. Hệ thống này sử dụng các kỹ thuật phân tích từ điển đã được áp dụng trong nghiên cứu lịch sử và học sự phát triển ngôn ngữ tiếng Việt. Nhóm đã thử nghiệm các yêu cầu tuyến tính cho một số bài toán, chẳng hạn như phân loại văn bản theo loại hoặc quyết định độ chính xác của văn bản. Kết quả thử nghiệm cho thấy hệ thống phân tích dữ liệu này có khả năng cung cấp độ chính xác cao trong việc phân tích và quyết định chất lượng văn bản tiếng Việt.