Bài toán thị giác máy
-
Để hỗ trợ thuận tiện hơn và tăng tốc độ tra cứu thông tin của sinh viên, bài viết này trình bày phương pháp nhận diện khuôn mặt để thực hiện tra cứu thông tin của sinh viên. Đầu tiên, mạng nơ ron xếp chồng MTCNN (multitask cascaded convolutional networks) được sử dụng để phát hiện khuôn mặt. Sau đó, phương pháp trích xuất đặc trưng HOG được dùng để trích xuất vector đặc trưng của ảnh khuôn mặt và sử dụng thuật toán phân lớp SVM (Support vector machine) huấn luyện mô hình nhận diện khuôn mặt.
9p gaupanda041 11-07-2024 3 1 Download
-
Bài viết trình bày nội dung nghiên cứu ứng dụng mô hình học sâu trong thị giác máy tính cho hệ bắt-bám mục tiêu của khí cụ bay tự dẫn vác vai huấn luyện. Mục đích của nghiên cứu là sử dụng hệ camera số như một hệ bắt-bám giả lập có tính năng phù hợp với tính năng của đầu tự dẫn khí cụ bay vác vai, làm cơ sở xây dựng các khí cụ bay tự dẫn vác vai huấn luyện.
7p viambani 18-06-2024 7 3 Download
-
Trong bài báo này, các tác giả đề xuất thiết kế Hệ thống nhận dạng biển báo giao thông dựa trên kỹ thuật thị giác máy tính và thuật toán YOLO, phiên bản thứ 7. Hệ thống đề xuất được thiết kế để nhận dạng 9 loại biền báo giao thông ở Việt nam bao gồm: cấm rẽ trái, cấm rẽ phải, cấm rẽ trái-phải, cấm đỗ, cấm dừng-đỗ, cấm ô tô rẽ phải, cấm ô tô rẽ trái, cấm quay đầu và cấm đi thẳng.
14p gaupanda028 22-04-2024 21 6 Download
-
Luận văn "Nghiên cứu phát triển các giải pháp thị giác máy công nghiệp kết hợp AI cho nền tảng Robot thông minh" được hoàn thành với mục tiêu nhằm nghiên cứu ứng dụng trí thông minh nhân tạo trong bài toán tương tác robot với con người qua cử chỉ bàn tay.
56p khanhchi0912 12-04-2024 12 5 Download
-
Bài viết "Phát hiện khẩu trang khuôn mặt bằng phương pháp học sâu" tập trung vào sự phát hiện khuôn mặt người có đeo khẩu trang hoặc không đeo khẩu trang từ dữ liệu của camera giám sát, dữ liệu video thu thập được kết hợp một thuật toán học sâu Convolutional Neural Network (CNN), học máy sẽ phân loại dữ liệu ra hai nhãn.
12p gaupanda017 08-03-2024 10 5 Download
-
Mục tiêu của Luận án "Một số kỹ thuật nhận dạng biểu hiện khuôn mặt phục vụ đánh giá sự tập trung của người học" là nghiên cứu bài toán đánh giá sự tập trung của người học. Từ đó, đưa ra một số vấn đề đánh giá có thể giải quyết thông qua hình ảnh dựa vào các kỹ thuật nhận dạng biểu cảm khuôn mặt, thừa kế các kết quả hiện có và cải tiến chúng nhằm nâng cao chất lượng cho bài toán đánh giá.
124p gaupanda012 03-02-2024 10 5 Download
-
Mục tiêu của Luận án "Một số kỹ thuật nhận dạng biểu hiện khuôn mặt phục vụ đánh giá sự tập trung của người học" là nghiên cứu bài toán đánh giá sự tập trung của người học. Từ đó, đưa ra một số vấn đề đánh giá có thể giải quyết thông qua hình ảnh dựa vào các kỹ thuật nhận dạng biểu cảm khuôn mặt, thừa kế các kết quả hiện có và cải tiến chúng nhằm nâng cao chất lượng cho bài toán đánh giá.
35p gaupanda012 03-02-2024 8 3 Download
-
Bài viết này trình bày tổng quan tình hình nghiên cứu của FL nói chung trên thế giới và ứng dụng trong CV nói riêng, làm nổi bật tầm quan trọng, các ứng dụng tiềm năng, thách thức và triển vọng trong tương lai của nó trong thị giác máy tính.
3p vigeorge 06-12-2023 6 2 Download
-
Bài viết này sẽ trình bày việc thực hiện hiệu chỉnh camera để khử hiện tượng méo ảnh do sự biến dạng ống kính quang học (lens) gây ra và đánh giá kết quả của việc thực hiện đó trong triển khai thực tế. Để thực hiện hiệu chỉnh camera, bài báo sẽ xây dựng mô hình toán học của camera và sử dụng mô hình đó để kiểm tra với thiết bị thực.
7p visystrom 22-11-2023 12 6 Download
-
Bài viết Một mô hình tìm kiếm ảnh dựa trên cấu trúc R-Tree kết hợp KD-Tree Random Forest trình bày các công trình liên quan về gom cụm trên R-Tree, phân lớp ảnh bằng KD-Tree và rừng ngẫu nhiên; Đề xuất mô hình tìm kiếm ảnh dựa trên sự kết hợp của cấu trúc KD-Tree Random Forest và R-Tree; Cấu trúc và phương pháp xây dựng KD-Tree Random Forest, xây dựng và tìm kiếm trên R-Tree cho bài toán tìm kiếm ảnh.
13p visystrom 22-11-2023 11 4 Download
-
Bài viết Nhận dạng một số nhãn hàng trên kệ hàng siêu thị sử dụng kỹ thuật học sâu khảo sát một số phương pháp mới nhất về phát hiện đối tượng bằng kỹ thuật học sâu được cài đặt dựa trên thư viện MMDetection, để giải quyết bài toán nhận dạng một số nhãn hàng nước giải khát trên các kệ hàng trong siêu thị.
27p vifriedrich 06-09-2023 11 5 Download
-
Mục tiêu của luận án "Tra cứu ảnh dựa vào nội dung với học biểu diễn và giảm chiều dữ liệu" là nghiên cứu, đề xuất được một số phương pháp cải tiến độ chính xác và thời gian tra cứu đối với những bài toán có cỡ lớp nhỏ, cỡ mẫu nhỏ và dữ liệu chiều cao bằng việc sử dụng kỹ thuật học máy vào quá trình CBIR với phản hồi liên quan.
115p kimphuong1124 28-08-2023 25 9 Download
-
Mục tiêu của luận án "Tra cứu ảnh dựa vào nội dung với học biểu diễn và giảm chiều dữ liệu" là nghiên cứu, đề xuất được một số phương pháp cải tiến độ chính xác và thời gian tra cứu đối với những bài toán có cỡ lớp nhỏ, cỡ mẫu nhỏ và dữ liệu chiều cao bằng việc sử dụng kỹ thuật học máy vào quá trình CBIR với phản hồi liên quan.
28p kimphuong1124 28-08-2023 13 5 Download
-
Bài viết Nhận dạng hình trạng bàn tay sử dụng thuật toán YOLOv7 đề xuất phương pháp nhận dạng hình trạng bàn tay sử dụng thuật toán YOLOv7, một thuật toán phát hiện đối tượng hiệu quả được giới thiệu gần đây; Nghiên cứu khảo sát so sánh hiệu quả của phương pháp nhận dạng hình trạng bàn tay sử dụng thuật toán YOLOv7 với hai phương pháp sử dụng YOLOv5 và sử dụng Faster R-CNN.
7p viannee 02-08-2023 11 5 Download
-
Bài viết Ứng dụng mô hình học sâu thích ứng trong bài toán phát hiện phương tiện giao thông đề xuất giải pháp sử dụng mô hình học thích ứng trên nền mạng học sâu để giải quyết bài toán. Để đánh giá hiệu quả của giải pháp, tác giả đã xây dựng hệ thống thử nghiệm dựa trên mạng học sâu YOLO3.
9p viwolverine 11-07-2023 23 5 Download
-
Bài báo trình bày về việc sử dụng YOLOv7 để xử lý ảnh trong bài toán đếm phương tiện giao thông, nhận dạng các vật cản có thể gây sự cố giao thông và dùng Haar cascade để nhận diện đối tượng và tính toán đo tốc độ phương tiện.
5p phuong3676 03-07-2023 16 6 Download
-
Bài viết Nhận dạng một số loại nhãn (thông qua lá nhãn) dùng công nghệ ảnh và kỹ thuật học sâu trình bày phương pháp sử dụng mạng VGG16 trong bài toán phân loại lá nhãn, dữ liệu đầu vào là hình ảnh của ba loại nhãn được trồng phổ biến ở các nhà vườn Vĩnh Long đã được gán nhãn phân loại dữ liệu (data labeling).
8p viblackwidow 07-04-2023 9 5 Download
-
Bài viết "Nhận diện khuôn mặt khi có hoặc không đeo khẩu trang" áp dụng kĩ thuật MTCNN giúp nhận diện và căn chỉnh khuôn mặt. Kỹ thuật ArcFace để nhận diện những đặc điểm trên khuôn mặt và trích xuất đặc trưng khuôn mặt. Ngoài ra, đề xuất thêm MobileNet cho phép rút gọn lại vài triệu tham số nhưng vẫn giữ được độ chính xác ổn định kết hợp cùng với ResNet giúp tăng độ chính xác khi nhận dạng khuôn mặt có/không đeo khẩu trang. Kết quả bài toán đã được thực nghiệm trên cơ sở dữ liệu RMFRD cho kết quả với độ chính xác trên 72%. Mời các bạn cùng tham khảo.
9p senda222 22-02-2023 12 6 Download
-
Bài viết "Giải pháp truy xuất ảnh nội soi dạ dày hiệu quả trên tập dữ liệu lớn" đề xuất một giải pháp sử dụng Swin Transformer để xây dựng hệ thống truy xuất hình ảnh y tế (Medical images), cụ thể là hình ảnh nội soi (Endoscopic Images). Giải pháp này dựa trên quy trình phân loại của mô hình Swin Transformer để tạo ra vector đặc trưng bằng cách hợp nhất các mảnh hình ảnh được phân chia từ các cửa sổ cục bộ, từ đó tính toán độ tương đồng.
14p lieuyeuyeu18 23-12-2022 11 3 Download
-
Bài viết Ứng dụng công nghệ OCR trích xuất thông tin trên giấy tờ tùy thân trong công tác tiếp dân đề cập đến quy trình trích xuất thông tin trên giấy tờ nhằm cải thiện hiệu suất của phương thức cũ. Quy trình do nhóm nghiên cứu là sự phối hợp giữa kỹ thuật Tesseract OCR và những thuật toán trong lĩnh vực Thị giác máy tính liên quan để đảm bảo quy trình trích xuất nhanh, hiệu quả và mới mẻ.
6p vizenvo 30-11-2022 27 3 Download