ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HC BÁCH KHOA
NGUYỄN VĂN NAM
NG DNG MẠNG NƠ RON TÍCH CHP NHN
DẠNG CÁC ĐỐI TƯỢNG DI ĐỘNG
Chuyên ngành: K thuật điều khin và t đng hóa
Mã s: 8520216
LUẬN VĂN THẠC SĨ KỸ THUT
Đà Nẵng - m 2020
ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HC BÁCH KHOA
Người hưng dn khoa học: TS. NGÔ ĐÌNH THANH
Phn bin 1: TS. Phan Văn Hiền
Phn bin 2: TS. Nguyn Bê
Luận văn được bo v ti Hi đồng chm luận văn tốt nghip thạc
chuyên ngành K thuật điu khin t động hóa hp ti Trường Đại
hc Bách khoa vào ngày 18 tháng 1 năm 2020
Có th tìm hiu luận văn tại:
- Trung m thông tin-Hc liệu, Đại học Đà Nẵng
- Thư viện trường Đại học Bách khoa Đà Nẵng
1
M ĐẦU
1. Tính cấp thiết của đề tài
Những năm gần đây, việc ng dng các mô hình Deep Learning
vào trong thc tế được nhiu nhà khoa hc quan tâm tham gia nghiên
cu, ni trội trong đó là nh mạng ron ch chp (CNN -
Convolutional Neural Networks) [1], [2], [3] như một ng c viên sáng
giá để gii quyết các vấn đề như: xử lý d liệu đầu vào ln; x
online; nâng cao độ chính xác kh năng xử nhiễu đầu vào. Để
thc hiện được nhng yêu cầu trên mô hình CNN cũng trải qua các ci
tiến c th: Mng ron tích chp khu vc (R-CNN - Regional
convolutional neural networks) [4], [5], [6]; Mng ron tích chp
khu vc nhanh (Fast R-CNN - Fast region-based convolutional neural
networks) [7]; Mng ron tích chp khu vực nhanh hơn (Faster R-
CNN - Faster region-based convolutional neural networks) [8], [9].
Trong đó, mô hình Faster R-CNN không dùng thut toán tìm kiếm
chn lọc để ly ra các khu vc, mà nó thêm mt mng CNN mi gi
mạng đề xut khu vc (RPN - Region Proposal Networks) để tìm
các khu vực [8]. Đầu tiên c bc ảnh được cho qua hình hun
luyện trước để ly bản đồ đặc trưng. Sau đó bản đồ đặc trưng được
dùng cho RPN để lấy được các khu vc, sau khi ly được v trí các khu
vc thì thc hiện tương tự Fast R-CNN [7].
Độ chính xác nhn dng là mt yếu t quan trng ca mô hình khi
ng dng vào trong thc tế, khi đầu vào b nhiu (nhiu: hình nh trong
môi trường tri ti, trời mưa hoặc nh b che khut mt phần…)
ảnh hưởng đến quá trình nhn dạng như thế nào? Do vy, trong nghiên
cu này s cho thấy được s ảnh hưởng ca nhiu đầu vào lên độ
chính xác trong nhn dng ca mô hình Faster R-CNN.
2
Vi nhng lý do trên, tôi quyết định chn nghiên cứu đề tài: “Ứng
dng mạng ron tích chp nhn dạng các đối tượng di động”.
Mc tiêu của đề tài là thc nghim mô hình Faster R-CNN nhn dng
các đối tượng tĩnh di động, đưa ra các đánh giá độ chính xác ca
mô hình trong trường hp tín hiệu đầu vào lúc bình thường và nhiu.
2. Mục tiêu của đề tài
Mc tiêu của đề tài thc nghim hình Faster R-CNN nhn
dạng các đối tượng tĩnh di động, đưa ra các đánh giá đ chính xác
của hình trong trường hp tín hiệu đầu vào lúc bình thường
nhiu. T đó tiến hành xây dng mô hình nhn dạng các đối tượng t
mt hình nh, một đoạn video hoc t camera online. Đánh giá về kh
năng ng dng hình Faster R-CNN để phân loi loài hoa, nhn
dng h động thc vt rừng di động.
3. Đối tượng và phạm vi nghiên cứu
3.1 Đối tượng nghiên cứu:
- Cơ sở dữ liệu trên hình ảnh, video trên Google
- Cơ sở lý thuyết về nhận dạng các đối tượng
- Các phương pháp, giải thuật về nhận dạng đối tượng
- Thuật toán mạng Nơ ron tích chập
3.2 Phạm vi nghiên cứu:
- Nghiên cứu về các kỹ thuật nhận dạng các đối tượng từ hình ảnh
- Nghiên cứu nhận dạng đối tượng tĩnh và di động
4. Cách tiếp cận, phương pháp nghiên cứu
4.1 Cách tiếp cận
- Tìm hiểu nghiên cứu các tài liệu liên quan đến đề tài trên các tạp
chí trong ngoài nước, trên các trang diễn đàn kỹ thuật, nguồn tư liệu
từ các trang mạng internet như Google, YouTube…
3
4.2 Phương pháp nghiên cứu
4.2.1 Phương pháp lý thuyết:
- Tìm hiểu cơ sở lý thuyết về xử lý hình ảnh, xử lý video …
- Tìm hiểu cơ sở lý thuyết về thuật toán mạng Nơ ron tích chập
- Các tài liệu liên quan đến nhận dạng các đối tượng từ nh ảnh,
video, từ kho dữ liệu Google
4.2.2 Phương pháp thực nghiệm:
- Xây dựng nh Faster R-CNN để nhận dạng đối tượng tĩnh và
di động
- Kiểm tra đánh giá độ chính xác hình Faster R-CNN nhận dạng
thực nghiệm 10 loài hoa trong trường hợp hình ảnh đưa vào lúc bình
thường và nhiễu.
5. Cấu trúc luận văn
Phn m đầu
Chương 1: Tổng quan v thut toán nhn dng
Chương 2: Xây dựng và hun luyn mô hình Faster R-CNN
Chương 3: Kết qu thc nghiệm và đánh giá độ chính xác mô hình
Faster R-CNN
Kết lun
CHƯƠNG 1 - TNG QUAN V THUT TOÁN NHN DNG
Tổng quan về nhận dạng các đối tượng
1.1.1. Khái niệm về nhận dạng
Nhn dng mu mt ngành thuc lĩnh vc máy hc. Nói cách
khác, nó có th được xem là vic "cn thc hin một tác động” vào dữ
liệu thô tác động c th s tùy vào loi ca d liệu đó. Như
vy nó là mt tập các phương pháp hc có giámt.