Khai phá dữ liệu văn bản tiếng việt
-
Bài viết "Ứng dụng Orange trong khai phá luật kết hợp" đề cập đến vấn đề khai phá luật kết hợp (Association rules), một phương pháp phân tích nền tảng trong kiến thức khai phá dữ liệu cũng như nổi tiếng vì là công cụ hỗ trợ các hoạt động sales và marketing trong lĩnh vực bán lẻ, thương mại điện tử – E-commerce từ trước đến nay. Mời các bạn cùng tham khảo!
16p lieuyeuyeu18 23-12-2022 45 6 Download
-
Mục tiêu của bài viết này nhằm xây dựng hệ thống đánh giá nhà hàng đạt hiệu quả phân lớp cao trong lĩnh vực du lịch. Để xây dựng hệ thống, chúng tôi sử dụng phương pháp khai phá quan điểm dựa trên từ vựng kết hợp với bộ từ điển quan điểm tiếng Việt thuộc lĩnh vực du lịch VietSentiWordNetPlus.
8p vikissinger 03-03-2022 34 3 Download
-
Mục đích của sáng kiến kinh nghiệm là tạo điều kiện để học sinh có cơ hội tham gia vào các hoạt động nhận thức, khám phá, chiếm lĩnh các tri thức một cách tốt nhất để có điều kiện khắc sâu, nhớ lâu, vận dụng tốt. Giúp học sinh nắm vững khái niệm ngữ pháp, biết vận dụng để giải các bài tập, học tốt các bộ môn khác của Tiếng Việt cũng như trong ngôn ngữ giao tiếp thông qua “Cách” phân tích dữ liệu.
30p tomjerry007 18-01-2022 34 4 Download
-
Trong bài viết đề xuất một giải pháp mới trong xử lý tiếng Việt bằng cách xây dựng mô hình chủ đề tiếng Việt. Phương pháp này sử dụng cách thức tìm một từ lõi và phát triển để tự sinh ra các từ khác trong chủ đề dựa trên Naive Bayes. Dựa trên tập dữ liệu huấn luyện, chúng tôi tính toán xác suất của các từ trong mô hình chủ đề tiếng Việt. Kết quả thực nghiệm cho thấy rằng, phương pháp của chúng tôi đề xuất có hiệu quả trong việc phân loại các văn bản tiếng Việt theo nhiều lớp chủ đề nhỏ hơn.
6p quenchua9 20-11-2020 82 3 Download
-
Trong bài báo này, trình bày phương pháp phân loại văn bản tiếng Việt dựa trên mô hình chủ đề và phân loại dựa trên lý thuyết Naive Bayes. Đề xuất một cách tiếp cận mới để xây dựng tập từ chủ đề dựa trên mô hình xác suất có điều kiện nhằm giảm thiểu thời gian và chi phí so với việc xây dựng thủ công. Kết quả thực nghiệm cho thấy rằng, phương pháp của chúng tôi đề xuất có hiệu quả trong việc phân loại các văn bản tiếng Việt theo nhiều lớp chủ đề nhỏ hơn.
7p minhxaminhyeu4 15-07-2019 169 5 Download
-
Đề tài được thực hiện với mục tiêu nhằm xây dựng một mô hình hệ tư vấn tự động trên các website tạp chí Tiếng Việt, nhằm mục đích gợi ý những nội dung liên quan tới sở thích của từng cá nhân người dùng, dựa trên lịch sử duyệt web của họ trên website đó (vết duyệt web). Mời các bạn cùng tham khảo Luận văn.
25p hanh_tv26 03-04-2019 34 1 Download
-
Tóm tắt luận văn Thạc sĩ Kỹ thuật: Khai phá dữ liệu từ các mạng xã hội để khảo sát ý kiến đánh giá các địa điểm du lịch tại Đà Nẵng được nghiên cứu nhằm phân tích từ vựng trong đoạn văn bản tiếng Việt, bước đầu xây dựng ứng dụng demo có thể phân tích ý kiến đánh giá từ một đoạn văn bản. Dữ liệu đầu vào của chương trình được khai thác từ các trang mạng xã hội như Facebook, Twitter.
26p hacgiay01 17-11-2016 193 15 Download
-
Tóm tắt luận văn Thạc sĩ Kỹ thuật: Ứng dụng khai phá dữ liệu để trích rút thông tin theo chủ đề từ các mạng xã hội được nghiên cứu nhằm nghiên cứu các phương pháp, kỹ thuật khai phá văn bản; nghiên cứu phương pháp tách từ, phân loại văn bản Tiếng Việt; nghiên cứu phương pháp lấy dữ liệu của người dùng về các chủ đề trên mạng xã hội Twitter; xây dựng hệ thống phân loại văn bản SVM theo chủ đề từ dữ liệu lấy từ mạng xã hội Twitter.
26p hacgiay01 17-11-2016 219 30 Download
-
Xây dựng hệ thống quảng cáo trực tuyến dựa trên từ khóa tiếng Việt nhằm tìm hiểu kỹ thuật khai phá dữ liệu web để định phần nội dung của trang web thuộc mạng quảng cáo.
13p mobile_12 27-12-2013 81 22 Download
-
Thuật toán SOM là một biểu tƣợng của lớp mạng neural học không giám sát. Trong đó, sơ khai đầu tiên của SOM đƣợc phát minh bởi giáo sƣ Teuvo Kohonen tại trung tâm nghiên cứu của mạng Neural- Network (1981-1982). Ông đã ứng dụng SOM vào rất nhiều những chƣơng trình phiên bản một cách nhanh chóng và hiệu quả.
50p samsung_12 06-05-2013 117 29 Download
-
Cùng với sự gia tăng nhanh chóng về số lượng các trang Web thì nhu cầu về khai phá dữ liệu Web ngày càng nhận được sự quan tâm của các nhà khoa học và các nhóm nghiên cứu. Trong lĩnh vực khai phá Web thì phân cụm Web là một trong những bài toán cơ bản và quan trọng. Đây cũng là thành phần chịu nhiều ảnh hưởng của các đặc trưng ngôn ngữ. Khóa luận này tập trung nghiên cứu về bài toán phân cụm Web sử dụng phương pháp xếp hạng. Trên cơ sở lý thuyết phân...
55p chieu_mua 25-08-2012 234 50 Download