Hệ thống gán nhãn dữ liệu
-
Trường Đại học Công nghiệp Hà Nội đang sử dụng hệ thống đại học điện tử trong công tác quản lý và đào tạo, với nguồn dữ liệu khổng lồ được thu thập và tổng hợp trong thời gian gần đây; tuy nhiên, việc phân tích và khai thác dữ liệu này vẫn chưa được thực hiện. Do đó, việc tiến hành nghiên cứu dữ liệu người học tại Trường Đại học Công nghiệp Hà Nội để hỗ trợ công tác quản lý đào tạo và tư vấn cho sinh viên là có ý nghĩa và cần thiết.
6p xuanphongdacy04 04-09-2024 4 2 Download
-
Bài viết này đề xuất một hệ thống và phương pháp tự động thu thập, đánh giá phân loại tính chất vụ việc qua nội dung bài báo mạng sử dụng mô hình dựa trên PhoBERT, trong đó sử dụng thêm một lớp phân loại tuyến tính và tinh chỉnh tập dữ liệu gồm hơn 6.000 bài báo được thu thập tự động và hỗ trợ gán nhãn bởi các chuyên viên trong lĩnh vực quản lý thông tin mạng.
6p vithomson 02-07-2024 4 1 Download
-
Bài viết này đề xuất một hệ thống thu thập, quản lý dữ liệu công suất đo đạc cho các trạm phát sóng vô tuyến. Hệ thống bao gồm các môđun chuyển đổi kết nối với các máy đo và hệ thống phần mềm máy tính được xây dựng để thu thập, quản lý, lưu trữ các thông số được gửi tới từ các máy đo. Dữ liệu đo được gán nhãn theo tình trạng của thiết bị để hỗ trợ cho quá trình nhận dạng và xác định lỗi dựa trên các mô hình học máy.
9p vijaychest 24-04-2024 7 3 Download
-
Luận án Tiến sĩ Kỹ thuật "Nghiên cứu các phương pháp học máy cho trích xuất thông tin tự động từ văn bản" trình bày các nội dung chính sau: Tổng quan về trích xuất thông tin tự động từ văn bản; Trích xuất khía cạnh và phân loại quan điểm cho tiếng Việt tận dụng nguồn dữ liệu đã được gán nhãn từ ngôn ngữ khác; Trích xuất thực thể và quan hệ trong văn bản pháp quy tiếng Việt sử dụng học máy truyền thống và học sâu.
158p vilazada 02-02-2024 13 3 Download
-
Mục tiêu nghiên cứu của luận văn "Phân loại lưu lượng internet dùng Machine Learning" nhằm phân tích và phân loại lưu lượng mạng Internet đã đạt được những kết quả đáng chú ý. Các phương pháp này sử dụng các công cụ phân loại thống kê để xây dựng các mô hình phân loại dựa trên các tập dữ liệu huấn luyện đã được gắn nhãn.
89p trankora03 05-08-2023 29 7 Download
-
Luận văn "Ứng dụng học sâu để tối ưu hóa quá trình in 3D SLM để đạt được đường in ổn định" được hoàn thành với mục tiêu nhằm tiến hành nhận dạng các đường in Laser từ dữ liệu có sẵn, gán nhãn cho dữ liệu; Tiến hành xây dựng bộ dữ liệu mới từ hình chụp các đường in Laser; Áp dụng thử nghiệm các mô hình học máy CNN để nhận diện các đường in tốt, xấu từ đó mục tiêu đưa ra các thông số in.
70p chankora08 04-07-2023 13 5 Download
-
Bài viết Một số đánh giá về cuộc thi nhận dạng tiếng nói VLSP 2021 trình bày mô tả cuộc thi từ khâu chuẩn bị dữ liệu đến khi gửi kết quả cuối cùng của các đội tham gia. Trong đó Task1 tập trung vào việc phát triển mô hình ASR cho các bài giảng trực tuyến. Trong nhiệm vụ này, tập dữ liệu đã được phát hành để huấn luyện bao gồm cả dữ liệu có nhãn và chưa được gán nhãn.
3p vipettigrew 15-03-2023 9 3 Download
-
Bài báo "Dò tìm bất thường thiết bị định tuyến bằng kĩ thuật phân lớp" đề xuất cách thức mới để phát hiện dữ liệu bất thường thông qua các kĩ thuật phân lớp dữ liệu. Dữ liệu BGL được sử dụng lại của tổ chức Usenix được gán nhãn theo kinh nghiệm của nhiều chuyên gia. Quá trình thực hiện bao gồm giai đoạn lựa chọn đặc trưng, huấn luyện mô hình, và kiểm thử. Kết quả khả quan khi các dự đoán lỗi hệ thống của các bộ định tuyến được phát hiện nhanh chóng và chính xác, và quan trọng là đã xác thực các đặc trưng được đặt giả thiết là quan trọng qua quá trình quan sát.
10p phuongnguyen0520 14-12-2022 13 5 Download
-
Khi độ chính xác và mật độ dữ liệu tăng theo thời gian, khối lượng dữ liệu tăng theo cấp số nhân nên đó thực sự là nguồn dữ liệu vô cùng khổng lồ mà trong những năm gần đây có dùng thuật ngữ “Big data” để mô tả . Dữ liệu viễn thám là dữ liệu có cấu trúc phức tạp, nhiều định dạng do đó cần phải thiết kế hệ thống có kiến trúc lưu trữ loại big data viễn thám này. Trong phạm vi bài viết này, nhóm nghiên cứu đã thử nghiệm tính khả dụng của môi trường Google Colaboratory phục vụ phân loại ảnh viễn thám.
5p viirenerosenfeld 26-05-2022 31 2 Download
-
Mô hình cấu trúc tuyến tính (SEM) là phương pháp phân tích thống kê thế hệ thứ hai đang rất phổ biến trong các công trình nghiên cứu khoa học trên thế giới và dần nhận được sự quan tâm của các nhà khoa học giáo dục Việt Nam trong vài năm gần đây. Mục đích của nghiên cứu này là so sánh kết quả kiểm định mô hình đo lường giữa hai cách tiếp cận CB-SEM và PLS-SEM dựa trên bộ dữ liệu khảo sát về mô hình đánh giá hiệu quả của hình thức bồi dưỡng giáo viên trực tuyến.
16p vithales 19-04-2022 54 2 Download
-
Bài tập lớn môn Kiểm tra phần mềm gồm 7 đề tài của sinh viên: 1. Công cụ minh họa các khái niệm và thuật toán trong lý thuyết đồ thị 2. Thiết kế web site hỗ trợ giảng dạy môn học mạng máy tính version 1.0 3. Xây dựng hệ thống quản lý tài liệu trực tuyến 4. Website quản lý ĐVTN trường THPT nguyễn du 5. Công cụ soạn thảo và gán nhãn âm thanh 6. Hệ thống thông tin quản lý trung tâm tin học 7. Công cụ tạo đề thi trắc nghiệm
87p redrose24 08-04-2022 198 12 Download
-
Tài liệu bài tập lớn môn Kiểm tra phần mềm gồm 7 đề tài: 1. Công cụ minh họa các khái niệm và thuật toán trong lý thuyết đồ thị 2. Thiết kế web site hỗ trợ giảng dạy môn học mạng máy tính version 1.0 3. Xây dựng hệ thống quản lý tài liệu trực tuyến 4. Website quản lý ĐVTN trường THPT nguyễn du 5. Công cụ soạn thảo và gán nhãn âm thanh 6. Hệ thống thông tin quản lý trung tâm tin học 7. Công cụ tạo đề thi trắc nghiệm
13p redrose24 08-04-2022 52 7 Download
-
Trong những năm gần đây, các hiện tượng thiên tai xảy ra thường xuyên và có xu thế cực đoan hơn. Việc đo đạc, dự báo, cảnh báo lũ lụt là một hoạt động hết sức quan trọng và có ý nghĩa thiết thực giúp cho các ngành sản xuất cũng như ổn định đời sống của người dân cả nước. Báo cáo tập trung trình bày các nội dung chính sau: Mô hình mạng thần kinh nhân tạo hồi tiếp, WebGIS và cơ sở dữ liệu; Xây dựng hệ thống dự báo; Thử nghiệm hệ thống dự báo cho một số lưu vực.
77p vikissinger 03-03-2022 60 8 Download
-
Trong nghiên cứu này, tác giả sử dụng triển khai Faster R-CNN của Detectron2 để phân loại quả cà chua dựa vào ảnh chụp bề mặt quả cà chua. Các quả cà chua không đạt yêu cầu sẽ bị loại trong quá trình phân loại. Tập dữ liệu gồm 857 ảnh với 1280 quả cà chua được gán nhãn (good và bad) và chia theo tỷ lệ 6:2:2. Kết quả thử nghiệm đạt độ chính xác 95,4% và đáp ứng được yêu cầu xử lý thời gian thực là 0.08 giây/quả.
11p vicolinzheng 14-12-2021 30 2 Download
-
Phân tích phả hệ 2 chủng CDVHN6 và CDVHN7 thu nhận tại Hà Nội năm 2019 cho thấy sự gần gũi với chủng CDV/dog/HCM/33/140816 của Việt Nam (số GenBank: LC159587) thuộc genotye Asia-1 cùng với các chủng của châu Á bao gồm Trung Quốc, Thái Lan, Đài Loan. Tuy nhiên, hiện nay mới chỉ có được một hệ gen duy nhất CDV Thành phố Hồ Chí Minh 2014 đã công bố trên Ngân hàng gen, do vậy việc bổ sung thêm thông tin về nguồn dữ liệu gen của virus care là rất cần thiết nhằm góp phần nghiên cứu và sản xuất vaccine tái tổ hợp phòng bệnh cho chó tại Việt Nam.
9p mudbound 10-12-2021 25 2 Download
-
Trong bài viết này, tác giả đề xuất một giải pháp có chi phí thấp để giám sát tự động nhiệt độ mối nối và thiết bị cao áp tại Trạm biến áp ứng dụng cảm biến nhiệt hồng ngoại. Hệ thống thiết kế gồm có 2 thành phần chính: Nút cảm biến bao gồm cảm biến đo nhiệt độ MLX90621 và mô-đun Bluetooth 4.0 lắp đặt gần nơi thiết bị cần đo; Bộ thu thập dữ liệu bao gồm mô-đun nhận dữ liệu Bluetooth và mô-đun phát sóng Wi-Fi tạo Web server cho phép hiển thị và truy xuất dữ liệu nhiệt độ đo đạc thông qua địa chỉ IP của Server.
5p visergeybrin 25-11-2021 43 5 Download
-
Luận văn này được thực hiện nhằm đề xuất phương pháp lựa chọn dữ liệu “quan trọng” cho việc gán nhãn dữ liệu bài toán nhận dạng tiếng nói sử dụng phương pháp học chủ động. Điều này giúp với cùng số tiền ngân quỹ bỏ ra cho việc gán nhãn, ta thu được những dữ liệu chất lượng nhất cho việc huấn luyện mô hình. Mời các bạn cùng tham khảo!
53p pulpfiction 12-09-2021 32 7 Download
-
Bài toán cây khung phân cụm đường đi ngắn nhất được ứng dụng nhiều trong tối ưu hệ thống tưới tiêu nông nghiệp, hệ thống cáp mạng và mạng lưới phân phối hàng hóa, dịch vụ. Do bài toán cây khung phân cụm đường đi ngắn nhất thuộc lớp bài toán NP-Khó nên các hướng tiếp cận gần đây thường sử dụng các thuật toán xấp xỉ để tìm lời giải, trong đó, hướng tiếp cận sử dụng kết hợp giữa thuật toán tiến hóa đa nhân tố và thuật toán tham lam ngẫu nhiên tìm được kết quả tối ưu trên nhiều bộ dữ liệu.
11p vining2711 09-08-2021 34 2 Download
-
Bài viết giới thiệu giải pháp mới trong việc cải thiện dung lượng của hệ thống truyền thông vệ tinh (SatCom) quỹ đạo thấp (LEO) bằng kỹ thuật MIMO (Multiple-Input Multiple-Output). Gần đây chùm vệ tinh LEO cung cấp dịch vụ dữ liệu cố định hoặc di động toàn cầu nhận được nhiều quan tâm của các nhà cung cấp dịch vụ lớn do đặc trưng nổi bật về trễ và tổn hao truyền sóng so với các các quỹ đạo khác.
5p viaespa2711 31-07-2021 45 2 Download
-
Bài viết đề xuất sử dụng các thông tin ngữ cảnh liên quan đến các thực thể nhằm cải thiện độ chính xác trích xuất quan hệ. Bài viết cũng giới thiệu một tập dữ liệu gồm 5031 văn bản pháp quy được gán nhãn thực thể và mối quan hệ giữa các thực thể, được trích xuất từ cổng thông tin văn bản quy phạm pháp luật của Việt Nam.
10p viaespa2711 31-07-2021 11 2 Download