Xây dựng kho ngữ liệu
-
Dữ liệu song ngữ là rất quan trọng, không thể thiếu khi xây dựng một mô hình dịch máy. Tuy nhiên, khó khăn lớn nhất là lượng dữ liệu này thường rất ít, đặc biệt là đối với nhiều cặp ngôn ngữ ít phổ biến trên thế giới. Việc thu thập và xử lý dữ liệu song ngữ không chỉ tốn kém về mặt tài chính mà còn đòi hỏi sự đầu tư lớn về thời gian và nhân lực. Bài viết này sẽ giới thiệu tổng quan về một cách tiếp cận chính cho hướng nghiên cứu này.
11p viengfa 28-10-2024 4 2 Download
-
Bài nghiên cứu sẽ tiếp cận theo hướng liên ngành (và xuyên ngành giữa Ngôn ngữ học và Khoa học máy tính) nhằm ứng dụng kỹ thuật đo độ khó trong việc xây dựng khối ngữ liệu đọc trình độ A2, B1, B2 theo “Khung năng lực tiếng Việt dành cho người nước ngoài” tại Trường Đại học Ngoại ngữ, Đại học Huế, hướng đến sự khách quan, khoa học, định lượng trong giảng dạy, biên soạn giáo trình/bài giảng, kiểm tra và đánh giá năng lực tiếng Việt kỹ năng đọc trình độ A2, B1, B2.
13p viling 11-10-2024 2 1 Download
-
Luận văn "Nghiên cứu phương pháp học máy có giám sát để phân loại văn bản tại Văn phòng tỉnh Quảng Ngãi" đã nghiên cứu kỹ thuật xử lý ngôn ngữ tiếng Việt; xây dựng kho dữ liệu huấn luyện để ứng dụng vào bài toán phân loại văn bản; ứng dụng kỹ thuật học máy vào bài toán phân loại văn bản tại Văn phòng tỉnh Quảng Ngãi.
91p xuanphongdacy03 29-08-2024 6 2 Download
-
Dưới góc nhìn của người đào tạo kế toán, bài viết "Quan điểm của người đào tạo kế toán khi triển khai đề án áp dụng chuẩn mực báo cáo tài chính tại Việt Nam" phân tích thực trạng và đánh giá những khó khăn trong giảng dạy chuẩn mực kế toán của các trường đại học hiện nay trên các khía cạnh chủ yếu: chương trình đào tạo; phương pháp đào tạo; đội ngũ giảng viên và giáo trình, tài liệu giảng dạy. Theo đó, bài viết đề xuất một số định hướng đào tạo kế toán đáp ứng yêu cầu hội tụ IFRS.
10p leminhvu111 07-06-2024 5 1 Download
-
Bài viết này hướng đến mục tiêu đề xuất giải pháp và xây dựng một nền tảng dữ liệu duy nhất dùng chung cho các ứng dụng đa nền tảng bằng các ngôn ngữ lập trình khác nhau (ứng dụng web, ứng dụng di động,…).
12p tueman06 06-09-2023 5 3 Download
-
Bài viết Khảo sát lỗi sử dụng hình thức phủ định câu so sánh hơn trong tiếng Trung Quốc của sinh viên Việt Nam khảo sát lỗi sử dụng hình thức phủ định câu so sánh hơn tiếng Trung Quốc trên kho ngữ liệu ngôn ngữ trung gian tiếng Trung Quốc của sinh viên Việt Nam mà chúng tôi xây dựng.
6p viwolverine 11-07-2023 16 3 Download
-
Nghiên cứu "Ứng dụng kho ngữ liệu trong giảng dạy từ lóng tiếng Trung Quốc" thông qua ứng dụng Lancsbox, xây dựng kho ngữ liệu từ lóng song ngữ Trung-Việt thông dụng để tiến hành phân tích, đối sánh, xây dựng thang đánh giá để phân loại nhóm từ này, nhằm tìm ra phương pháp giảng dạy từ lóng tiếng Trung Quốc một cách hiệu quả hơn.
7p phuong3128 23-06-2023 7 4 Download
-
Bộ tài liệu "Hướng dẫn phòng ngừa, giảm thiểu lao động trẻ em trong khu vực kinh tế tập thể, hợp tác xã" được xây dựng trong khuôn khổ "Dự án Hỗ trợ kỹ thuật nâng cao năng lực quốc gia phòng ngừa và giảm thiểu lao động trẻ em tại Việt Nam (ENHANCE)" của Tổ chức Lao động Quốc tế (ILO) do Bộ Lao động Hoa Kỳ hỗ trợ có mục đích nâng cao chất lượng đội ngũ giảng viên giảng dạy cho khu vực kinh tế tập thể của hệ thống Liên minh Hợp tác xã Việt Nam đồng thời hướng tới việc nâng cao nhận thức, hành động hiệu quả trong công cuộc phòng ngừa, giảm thiểu lao động trẻ em của đội ngũ cán bộ hợp tác xã và...
92p baphap09 24-02-2023 18 6 Download
-
Mục đích nghiên cứu của đề tài "Xây dựng mô hình ngôn ngữ và sửa lỗi tiếng Ba Na tự động" là xây dựng thêm kho ngữ liệu phục vụ huấn luyện mô hình ngôn ngữ và sửa lỗi tự động và phân tích dữ liệu thu thập được gồm các tài nguyên dữ liệu tiếng Ba Na từ đó xây dựng mô hình ngôn ngữ và sửa lỗi tự động. Phân tích các yếu tố ảnh hưởng, lựa chọn các phương pháp học sâu phù hợp với bộ dữ liệu có được để hệ thống xây dựng mô hình ngôn ngữ và hỗ trợ sửa lỗi đạt được độ chính xác cao.
62p dongcoxanh2510 25-10-2022 19 5 Download
-
Bài viết Giải pháp xây dựng kho ngữ liệu đa ngữ Việt - ÊĐê gán nhãn theo ngữ cảnh đề xuất giải pháp xây dựng kho ngữ liệu đa ngữ Việt-ÊĐê với phông chữ Unicode có xử lý nhập nhằng và từ đa ngữ nghĩa, bằng cách gán nhãn theo từng ngữ cảnh thuộc lĩnh vực giáo dục như giáo dục về chăn nuôi, trồng trọt, bảo vệ rừng, chăm sóc sức khoẻ,... cho các đồng bào các dân tộc thiểu số Việt Nam.
4p vikoenigsegg 29-09-2022 21 3 Download
-
"Tài liệu hướng dẫn xây dựng ứng dụng iPhone" được biên soạn với mong muốn tìm hiểu cách xây dựng ứng dụng iPhone để có thêm kiến thức mới, giúp ích cho quá trình làm việc sau khi ra trường cũng như giảm bớt những khó khăn cho người mới bắt đầu tìm hiểu về lập trình ứng dụng trên iPhone. Mời các bạn cùng tham khảo!
420p lam2021 12-07-2022 44 6 Download
-
Bài viết Xác định dữ liệu chuẩn của công cụ sàng lọc ngôn ngữ ở trẻ em 3 tuổi tại miền Trung Việt Nam nghiên cứu này tìm ra dữ liệu chuẩn về ngôn ngữ nhằm xây dựng hoàn thiện bộ công cụ đánh giá những trẻ có dấu hiệu khó khăn trong việc tiếp thu ngôn ngữ và có thể có nguy cơ bị rối loạn ngôn ngữ phát triển (Development language disorder- DLD).
7p visusanwojcicki 28-06-2022 31 6 Download
-
Bài viết Đánh giá vai trò của kho ngữ liệu đối với chất lượng dịch tự động tiếng Việt tiến hành nghiên cứu thực trạng của các kho ngữ liệu song ngữ tiếng Việt hiện nay và tổ chức xây dựng các hệ thống dịch Anh-Việt từ các kho ngữ liệu có kích thước khác nhau, sử dụng các phương pháp dịch khác nhau. Kết quả đánh giá chất lượng của các hệ thống dịch thu được cho thấy, khi sử dụng kho ngữ liệu có kích thước càng lớn thì chất lượng của hệ thống dịch càng tăng.
5p vianapatricia 22-06-2022 12 2 Download
-
Bài viết đề xuất phương pháp xây dựng WordNet tiếng Việt chỉ dựa trên WordNet của 4 ngôn ngữ nguồn là Anh, Tây Ban Nha, Pháp, Nhật Bản; Một số cải tiến như sử dụng kho ngữ liệu TEDTalk, cải tiến phương pháp chọn lọc các tập từ đồng nghĩa (synset).
8p visherylsandberg 18-05-2022 48 2 Download
-
Bài viết này đề xuất phương pháp chẩn đoán bệnh từ thông tin mô tả triệu chứng bằng các phương pháp học sâu. Phương pháp bài báo này đề xuất dựa trên các kỹ thuật xử lý ngôn ngữ tự nhiên đối với tiếng Việt trong quá trình xây dựng kho dữ liệu huấn luyện hệ thống học sâu.
6p vistephenhawking 26-04-2022 19 2 Download
-
Bài viết đề xuất một giải pháp cho việc gán nhãn ngữ nghĩa một cách tự động trên kho ngữ liệu song ngữ Anh-Việt, tận dụng những dịch chuyển từ vựng trong ngôn ngữ chéo, nhưng vẫn đảm bảo yếu tố cốt lõi về mặt ngữ nghĩa của nó. Hệ thống sử dụng kho ngữ liệu song ngữ Anh-Việt để xây dựng các tập hợp liên kết có khả năng kết hợp từ nhiều từ khác nhau được phát hiện trong kho ngữ liệu. Mời các bạn cùng tham khảo!
6p wangziyi_1307 26-04-2022 34 2 Download
-
Bài viết khảo sát hiện tượng nhầm lẫn các phó từ chỉ thời gian yizhi (一直), conglai (从来) và zong(shi) (总(是)) của sinh viên Việt Nam. Trên cơ sở Kho ngữ liệu ngôn ngữ trung gian tiếng Trung Quốc của sinh viên Việt Nam mà chúng tôi xây dựng, chúng tôi tìm được 120 câu sai do lỗi nhầm lẫn gây ra.
9p viedison 13-04-2022 60 10 Download
-
Luận án Tiến sĩ Kỹ thuật "Nghiên cứu giải pháp cải tiến chất lượng dịch tự động tiếng Việt" trình bày các nội dung chính sau: Tổng quan về dịch tự động và chất lượng dịch tự động tiếng Việt hiện nay; Giải pháp cải tiến chất lượng dịch tự động tiếng Việt.
140p vishivnadar 17-01-2022 18 4 Download
-
Mục tiêu nghiên cứu đề tài là nghiên cứu về từ điển, cơ sở dữ liệu từ điển, cấu trúc định dạng của các chuẩn dữ liệu từ điển; kho ngữ liệu, các loại kho ngữ liệu. Tìm ra giải pháp xây dựng cơ sở dữ liệu từ điển bằng cách trích rút từ các kho ngữ liệu. Từ đó, có thể làm nguồn dữ liệu cho các phần mềm từ điển, có thể nguồn cho các chương trình dịch tự động, trích rút thông tin tự động, tóm tắt văn bản tự động,…
37p tomjerry007 21-12-2021 36 7 Download
-
Mục tiêu nghiên cứu đề tài là nghiên cứu cấu trúc, định dạng và kích thước các kho ngữ liệu tiếng Việt được nhiều người biết đến. Đề xuất giải pháp và quy trình xây dựng kho ngữ liệu đánh giá chất lượng dịch tiếng Việt.
44p tomjerry007 21-12-2021 18 5 Download