
ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA
NGUYỄN VĂN NAM
ỨNG DỤNG MẠNG NƠ RON TÍCH CHẬP NHẬN
DẠNG CÁC ĐỐI TƯỢNG DI ĐỘNG
Chuyên ngành: Kỹ thuật điều khiển và tự động hóa
Mã số: 8520216
LUẬN VĂN THẠC SĨ KỸ THUẬT
Đà Nẵng - Năm 2020

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA
Người hướng dẫn khoa học: TS. NGÔ ĐÌNH THANH
Phản biện 1: TS. Phan Văn Hiền
Phản biện 2: TS. Nguyễn Bê
Luận văn được bảo vệ tại Hội đồng chấm luận văn tốt nghiệp thạc sĩ
chuyên ngành Kỹ thuật điều khiển và tự động hóa họp tại Trường Đại
học Bách khoa vào ngày 18 tháng 1 năm 2020
Có thể tìm hiểu luận văn tại:
- Trung tâm thông tin-Học liệu, Đại học Đà Nẵng
- Thư viện trường Đại học Bách khoa Đà Nẵng

1
MỞ ĐẦU
1. Tính cấp thiết của đề tài
Những năm gần đây, việc ứng dụng các mô hình Deep Learning
vào trong thực tế được nhiều nhà khoa học quan tâm tham gia nghiên
cứu, nổi trội trong đó là mô hình mạng Nơ ron tích chập (CNN -
Convolutional Neural Networks) [1], [2], [3] như một ứng cử viên sáng
giá để giải quyết các vấn đề như: xử lý dữ liệu đầu vào lớn; xử lý
online; nâng cao độ chính xác và khả năng xử lý nhiễu đầu vào. Để
thực hiện được những yêu cầu trên mô hình CNN cũng trải qua các cải
tiến cụ thể: Mạng Nơ ron tích chập khu vực (R-CNN - Regional
convolutional neural networks) [4], [5], [6]; Mạng Nơ ron tích chập
khu vực nhanh (Fast R-CNN - Fast region-based convolutional neural
networks) [7]; Mạng Nơ ron tích chập khu vực nhanh hơn (Faster R-
CNN - Faster region-based convolutional neural networks) [8], [9].
Trong đó, mô hình Faster R-CNN không dùng thuật toán tìm kiếm
chọn lọc để lấy ra các khu vực, mà nó thêm một mạng CNN mới gọi
là mạng đề xuất khu vực (RPN - Region Proposal Networks) để tìm
các khu vực [8]. Đầu tiên cả bức ảnh được cho qua mô hình huấn
luyện trước để lấy bản đồ đặc trưng. Sau đó bản đồ đặc trưng được
dùng cho RPN để lấy được các khu vực, sau khi lấy được vị trí các khu
vực thì thực hiện tương tự Fast R-CNN [7].
Độ chính xác nhận dạng là một yếu tố quan trọng của mô hình khi
ứng dụng vào trong thực tế, khi đầu vào bị nhiễu (nhiễu: hình ảnh trong
môi trường trời tối, trời mưa hoặc ảnh bị che khuất một phần…) nó
ảnh hưởng đến quá trình nhận dạng như thế nào? Do vậy, trong nghiên
cứu này sẽ cho thấy được sự ảnh hưởng của nhiễu ở đầu vào lên độ
chính xác trong nhận dạng của mô hình Faster R-CNN.

2
Với những lý do trên, tôi quyết định chọn nghiên cứu đề tài: “Ứng
dụng mạng Nơ ron tích chập nhận dạng các đối tượng di động”.
Mục tiêu của đề tài là thực nghiệm mô hình Faster R-CNN nhận dạng
các đối tượng tĩnh và di động, đưa ra các đánh giá độ chính xác của
mô hình trong trường hợp tín hiệu đầu vào lúc bình thường và nhiễu.
2. Mục tiêu của đề tài
Mục tiêu của đề tài là thực nghiệm mô hình Faster R-CNN nhận
dạng các đối tượng tĩnh và di động, đưa ra các đánh giá độ chính xác
của mô hình trong trường hợp tín hiệu đầu vào lúc bình thường và
nhiễu. Từ đó tiến hành xây dựng mô hình nhận dạng các đối tượng từ
một hình ảnh, một đoạn video hoặc từ camera online. Đánh giá về khả
năng ứng dụng mô hình Faster R-CNN để phân loại loài hoa, nhận
dạng hệ động thực vật rừng di động.
3. Đối tượng và phạm vi nghiên cứu
3.1 Đối tượng nghiên cứu:
- Cơ sở dữ liệu trên hình ảnh, video trên Google
- Cơ sở lý thuyết về nhận dạng các đối tượng
- Các phương pháp, giải thuật về nhận dạng đối tượng
- Thuật toán mạng Nơ ron tích chập
3.2 Phạm vi nghiên cứu:
- Nghiên cứu về các kỹ thuật nhận dạng các đối tượng từ hình ảnh
- Nghiên cứu nhận dạng đối tượng tĩnh và di động
4. Cách tiếp cận, phương pháp nghiên cứu
4.1 Cách tiếp cận
- Tìm hiểu nghiên cứu các tài liệu liên quan đến đề tài trên các tạp
chí trong và ngoài nước, trên các trang diễn đàn kỹ thuật, nguồn tư liệu
từ các trang mạng internet như Google, YouTube…

3
4.2 Phương pháp nghiên cứu
4.2.1 Phương pháp lý thuyết:
- Tìm hiểu cơ sở lý thuyết về xử lý hình ảnh, xử lý video …
- Tìm hiểu cơ sở lý thuyết về thuật toán mạng Nơ ron tích chập
- Các tài liệu liên quan đến nhận dạng các đối tượng từ hình ảnh,
video, từ kho dữ liệu Google
4.2.2 Phương pháp thực nghiệm:
- Xây dựng mô hình Faster R-CNN để nhận dạng đối tượng tĩnh và
di động
- Kiểm tra đánh giá độ chính xác mô hình Faster R-CNN nhận dạng
thực nghiệm 10 loài hoa trong trường hợp hình ảnh đưa vào lúc bình
thường và nhiễu.
5. Cấu trúc luận văn
Phần mở đầu
Chương 1: Tổng quan về thuật toán nhận dạng
Chương 2: Xây dựng và huấn luyện mô hình Faster R-CNN
Chương 3: Kết quả thực nghiệm và đánh giá độ chính xác mô hình
Faster R-CNN
Kết luận
CHƯƠNG 1 - TỔNG QUAN VỀ THUẬT TOÁN NHẬN DẠNG
Tổng quan về nhận dạng các đối tượng
1.1.1. Khái niệm về nhận dạng
Nhận dạng mẫu là một ngành thuộc lĩnh vực máy học. Nói cách
khác, nó có thể được xem là việc "cần thực hiện một tác động” vào dữ
liệu thô mà tác động cụ thể là gì sẽ tùy vào loại của dữ liệu đó. Như
vậy nó là một tập các phương pháp học có giám sát.

