Tách tử tiếng việt

Xem 1-20 trên 58 kết quả Tách tử tiếng việt
  • Tìm hiểu các hướng tiếp cận cho bài toán phân loại văn bản và xây dựng ứng dụng phân loại tin tức báo điện tử” nhằm tìm hiểu và thử nghiệm các phương pháp phân loại văn bản áp dụng trên tiếng Việt. Để thực hiện việc phân loại, điều bắt buộc đối với tiếng Việt đó là việc tách từ.

    pdf132p rose_12 04-12-2012 189 82   Download

  • Nhận dạng chữ in nói chung và nhận dạng chữ in tiếng Việt nói riêng đã và đang là những bài toán thu hút nhiều sự quan tâm và nghiên cứu. Bài toán nhận dạng chữ in tiếng Việt gồm ba công đoạn chủ yếu: Phân đoạn ảnh, nhận dạng kí tự và hậu xử lý. Trong luận văn này tôi tập trung chủ yếu vào giai đoạn Phân đoạn ảnh, nhằm đưa ra những cải tiến để đẩy nhanh tốc độ xử lý. Đồng thời chúng tôi cũng sử dụng môdul nhận dạng để xây dựng thành một hệ...

    pdf55p chieu_mua 29-08-2012 210 121   Download

  • Đề tài sẽ tiếp cận theo hƣớng tích hợp tri thức ngôn ngữ vào hệ thống dịch máy thống kê Anh – Việt ở mức độ hình thái từ. Từ tiếng Anh sẽ được đưa về nguyên mẫu, tách các phụ tố và gán nhãn từ loại, từ tiếng Việt sẽ được phân đoạn từ và gán nhãn từ loại. Đề tài cũng sẽ phân tích các từ loại có ảnh hưởng tích cực đến chất lượng dịch của hệ thống. Read more: http://luanvan.thanhcuong.info/?p=66...

    pdf92p conchokon 06-09-2012 79 29   Download

  • 3.1. Tính chất và thời gian tương đối Tiếp theo thời kì tiền Việt-Mường là thời kì tiếng Việt chuyển sang một giai đoạn mới, giai đoạn Việt-Mường cổ (pré Việt-Mường). Người ta có thể giải thích đây là quãng thời gian khối tiền Việt-Mường do có sự khác biệt nội bộ trước đây đã dẫn tới sự chia tách ra thành một bên là một bộ phận về sau này trở thành các ngôn ngữ như Arem, Rục, Mã Liềng, Thà Vựng v.v...

    pdf13p abcdef_38 20-10-2011 74 20   Download

  • 1. Giai đoạn phát triển Mon-Khmer 1.1. Tính chất và thời gian tương đối Thực ra, trong quan niệm của chúng tôi đây không phải là giai đoạn đầu tiên trong lịch sử phát triển riêng của tiếng Việt. Nhưng vì tiếng Việt là một ngôn ngữ có nguồn gốc Nam Á, nhánh Mon-Khmer nên để tiện cho việc theo dõi lịch sử của nó, chúng tôi tạm tách ra một giai đoạn cụ thể được gọi là giai đoạn Mon-Khmer.

    pdf5p abcdef_38 20-10-2011 84 16   Download

  • Xây dựng hệ thống quảng cáo trực tuyến dựa trên từ khóa tiếng Việt nhằm tìm hiểu kỹ thuật khai phá dữ liệu web để định phần nội dung của trang web thuộc mạng quảng cáo.

    pdf13p mobile_12 27-12-2013 34 16   Download

  • Sử dụng phương pháp tách từ xây dựng công cụ phân tích văn bản trong ngữ cảnh hạn chế nhằm xây dựng một công cụ phân tích văn bản tiếng Việt, sử dụng tiếng Việt để khử ngôn ngữ nhập nhằng.

    pdf13p mobile_12 28-12-2013 48 13   Download

  • Tìm hiểu web ngữ nghĩa, xây dựng ứng dụng tìm kiếm tài liệu tiếng Việt nhằm tìm hiểu các phương pháp bóc tách dữ liệu tự động.

    pdf13p mobile_12 28-12-2013 50 11   Download

  • Trong xử lý tự nhiên (XLNNTN), thường gặp bài toán tách từ trong phân loại văn bản tự động, hay phân tích, dịch thuật văn bản… Do cách viết tiếng Lào không dùng dấu cách, hay ký hiệu phân biệt các từ trong câu, việc xác định ranh giới giữa các từ, cụm từ trở nên khó khăn hơn so với các ngôn ngữ có dấu cách từ rõ ràng như tiếng Anh, tiếng Việt…

    pdf1p sunshine_6 15-07-2013 48 5   Download

  • Tóm tắt Đồ án tốt nghiệp: Nhận dạng biển chỉ dẫn dịch sang tiếng Việt bằng PCA tập trung vào việc nhận dạng các từ trên biển chỉ dẫn rồi dịch sang tiếng Việt. Ứng dụng một phần nào đó góp phần nào đó vào việc tách ký tự ra khỏi vùng ảnh, nhận dạng ảnh ký tự, rồi cuối cùng mang đi dịch nghĩa.

    pdf16p only_you_2111 07-05-2016 15 3   Download

  • Phân đoạn từ (Word segmentation) và gán nhãn từ loại( Part-of-speech tagging - POS tagging) là hai bài toán đạc biệt quan trọng trong xử lý ngôn ngữ tự nhiên. Tuy nhiên, các nghiên cứu tại Việt Nam về hai vấn đề này vẫn còn ở giai đoạn ban đầu. Do đó, nhu cầu là rất lớn cả về cơ sở khoa học và xây dựng công cụ thực hiện sẵn dùng. Thực tế cho thấy hai quá trình này có liên quan với nhau và ảnh hưởng đến chất lượng của một hệ chung. Vì thế, trong luận văn...

    pdf56p bluesky_12 26-12-2012 143 94   Download

  • Tóm tắt luận văn thạc sĩ kỹ thuật - Đề tài: Xây dựng kho ngữ vựng song ngữ Việt - Êđê trong xử lý tiếng Êđê tìm hiểu về cơ sở lý thuyết xây dựng kho ngữ vựng song ngữ, các phương pháp dịch máy và các kỹ thuật tách từ. Xây dựng kho ngữ vựng song ngữ Việt - Êđê và ứng dụng dịch thuật. Mời bạn đọc cùng tham khảo.

    pdf26p quangtriyeuthuong32 23-05-2014 65 20   Download

  • Bài báo trình bày một số kết quả nghiên cứu ứng dụng các thuật toán tìm tập phổ biến và luật kết hợp vào bài toán phân lớp văn bản. Mô hình vector có thành phần là các cụm danh từ phổ biến được dùng để đặc trưng văn bản. Thuật toán tách từ, gán nhãn từ loại được sử dụng để rút trích các cụm danh từ.

    pdf10p phalinh19 19-08-2011 53 17   Download

  • 1. Về phương pháp xác định nguồn gốc ngôn ngữ Trong lịch sử, có những ngôn ngữ mà vì một lí do nào đó đã bị chia tách ra thành nhiều ngôn ngữ khác nhau. Ngôn ngữ bị chia tách đó thường được gọi là ngôn ngữ mẹ hay ngôn ngữ cơ sở. Như vậy, về nguyên tắc, có thể tìm tòi ngược dòng thời gian lịch sử của những ngôn ngữ được giả định là vốn cùng “sinh ra” từ một ngôn ngữ mẹ, để quy chúng vào những nhóm, những chi, những ngành, những dòng...

    pdf10p abcdef_38 20-10-2011 92 16   Download

  • Yêu cầu đối với một hệ thống phân loại email và ngăn chặn email spam đương nhiên là phân loại được email là spam hay non-spam, từ đó sẽ có biện pháp ngăn chặn email spam, hiệu quả phân loại email phải khả quan, tuy nhiên không thể đánh đổi hiệu quả phân loại email spam cao mà bỏ qua lỗi sai cho rằng email non-spam là spam, bởi vì cùng với việc tăng khả năng phân loại email spam thì khả năng xảy ra lỗi nhận nhầm email non-spam thành email spam cũng tăng theo. Do đó yêu cầu...

    pdf0p japet75 18-01-2013 52 14   Download

  • Giai đoạn Việt Mường chung là một giai đoạn rất quan trọng trong lịch sử phát triển của tiếng Việt. Theo nghiên cứu hiện nay, vào giai đoạn này tiếng Việt và tiếng Mường đang còn là một ngôn ngữ thống nhất. Chỉ về sau giai đoạn này tiếng Việt mới tách ra thành một ngôn ngữ riêng lẻ thực sự. 4.1.

    pdf9p abcdef_38 20-10-2011 48 10   Download

  • Các mức độ tương đồng và tách biệt trong một kiểu tổ chức nhóm từ của tiếng Việt

    pdf7p butmaudo 21-08-2013 11 2   Download

  • Tóm tắt luận văn Thạc sĩ Kỹ thuật: Ứng dụng khai phá dữ liệu để trích rút thông tin theo chủ đề từ các mạng xã hội được nghiên cứu nhằm nghiên cứu các phương pháp, kỹ thuật khai phá văn bản; nghiên cứu phương pháp tách từ, phân loại văn bản Tiếng Việt; nghiên cứu phương pháp lấy dữ liệu của người dùng về các chủ đề trên mạng xã hội Twitter; xây dựng hệ thống phân loại văn bản SVM theo chủ đề từ dữ liệu lấy từ mạng xã hội Twitter.

    pdf26p hacgiay01 17-11-2016 3 1   Download

  • Giáo trình Tiếng Anh chuyên ngành Công nghệ thông tin do Thạc Bình Cường (chủ biên)  biên soạn đặc biệt chú trọng vào việc phát triển kỹ năng đọc; những thuật ngữ và từ vựng quan trọng được tách ra thành một mục riêng để thu hút và phát triển vốn từ của học viên; trong mỗi bài có phần bài tập ngữ pháp giúp học viên ôn lai những điểm ngữ pháp cơ bản.

    pdf141p uocvongxua03 16-06-2015 147 89   Download

  • Những phương pháp thường được áp dụng trong SHPT Từ những năm giữa thê kỷ 19, các nhà nghiên cứu sinh học phân tử đã tìm cách tách các phân tử DNA, RNA cũng như protein và khuyếch đại (nhân dòng) những phân tử này. PCR (polymerase chain reaction) Trong các tài liệu tiếng Việt có nhiều cách dịch khác nhau như phản ứng khuyếch đại gene, phản ứng chuỗi trùng hợp v.v.

    pdf8p heoxinhkute6 25-11-2010 139 45   Download

Đồng bộ tài khoản