Tóm tắt Luận án Tiến sĩ Kỹ thuật: Nghiên cứu bài toán tự động nhận dạng mục tiêu ra đa ứng dụng mạng nơ-ron học sâu

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:27

Thêm vào BST

Báo xấu

7
lượt xem 1
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Tóm tắt Luận án Tiến sĩ Kỹ thuật "Nghiên cứu bài toán tự động nhận dạng mục tiêu ra đa ứng dụng mạng nơ-ron học sâu" được nghiên cứu với mục tiêu: Nghiên cứu đề xuất một số giải pháp nhằm nâng cao chất lượng nhận dạng mục tiêu ra đa của mô hình mạng nơron học sâu.

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: Tóm tắt Luận án Tiến sĩ Kỹ thuật: Nghiên cứu bài toán tự động nhận dạng mục tiêu ra đa ứng dụng mạng nơ-ron học sâu

BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ QUỐC PHÒNG VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ NGUYỄN VĂN TRÀ NGHIÊN CỨU BÀI TOÁN TỰ ĐỘNG NHẬN DẠNG MỤC TIÊU RA ĐA ỨNG DỤNG MẠNG NƠ-RON HỌC SÂU Ngành: Kỹ thuật ra đa dẫn đường Mã số: 9 52 02 04 TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT HÀ NỘI - 2024
CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ - BỘ QUỐC PHÒNG Người hướng dẫn khoa học: 1. TS. Vũ Chí Thanh 2. TS. Đoàn Văn Sáng Phản biện 1: GS.TS Bạch Gia Dương Đại học Quốc gia Hà Nội Phản biện 2: TSKH Đào Chí Thành Viện Hàn lâm Khoa học và Công nghệ Việt Nam Phản biện 3: PGS.TS Lê Vĩnh Hà Viện Khoa học và Công nghệ Quân sự Luận án được bảo vệ tại Hội đồng đánh giá luận án tiến sĩ cấp Viện, họp tại Viện Khoa học và Công nghệ quân sự. Vào hồi: giờ ngày tháng năm 2024 Có thể tìm hiểu luận án tại: - Thư viện Viện Khoa học và Công nghệ quân sự - Thư viện Quốc gia Việt Nam
1 MỞ ĐẦU 1. Tính cấp thiết của đề tài luận án Thực tiễn các cuộc xung đột vũ trang và chiến tranh gần đây cho thấy các bên tham chiến sử dụng đa dạng các chủng loại vũ khí đặc biệt là máy bay không người lái, xuồng không người lái và tên lửa hành trình, bom lượn, ... Các loại vũ khí này ngày càng thông minh, có tính sát thương cao. Khi đối phương dùng hỏa lực lớn, tấn công ồ ạt, cường độ cao thì phương pháp nhận dạng xác định thủ công dựa vào kinh nghiệm và năng lực của trắc thủ là không hiệu quả. Do đó, giải pháp tự động nhận dạng mục tiêu là một yêu cầu cấp bách. Áp dụng trí tuệ nhân tạo để giải quyết bài toán nhận dạng mục tiêu ra đa là một hướng tiếp cận phù hợp với xu hướng nghiên hiện nay trong lĩnh vực xử lý tín hiệu ra đa. Trong đó, nghiên cứu các giải pháp để khắc phục các khó khăn như: số lượng tập ảnh ra đa gán nhãn hạn chế, cường độ nhiễu trong ảnh cao, yêu cầu về kích thước mô hình và tốc độ tính toán của mạng nơ-ron nhằm nâng cao chất lượng nhận dạng mục tiêu là một nhiệm vụ quan trọng. Xuất phát từ những lý do trên, luận án lựa chọn đề tài nghiên cứu “Nghiên cứu bài toán tự động nhận dạng mục tiêu ra đa ứng dụng mạng nơ- ron học sâu”. Đây là vấn đề cấp thiết và có tính thời sự, ứng dụng cao, những kết quả của Luận án là tiền đề cho lĩnh vực nghiên cứu, xây dựng các mô đun phần mềm tự động nhận dạng mục tiêu để ứng dụng vào trong tuyến xử lý tín hiệu của các ra đa tại Việt Nam. 2. Mục tiêu nghiên cứu Mục tiêu nghiên cứu của luận án là nghiên cứu đề xuất một số giải pháp nhằm nâng cao chất lượng nhận dạng mục tiêu ra đa của mô hình mạng nơ- ron học sâu. 3. Đối tượng và phạm vi nghiên cứu Đối tượng nghiên cứu của luận án là các mô hình mạng nơ-ron học sâu và bài toán tự động nhận dạng mục tiêu ra đa. Phạm vi nghiên cứu của luận án là: - Nghiên cứu áp dụng các giải pháp nâng cao chất lượng nhận dạng mục tiêu ra đa ứng dụng mạng nơ-ron học sâu; - Luận án tập trung nghiên cứu nhận dạng 3 lớp mục tiêu Flycam, người đi bộ, ô tô và sử dụng bộ dữ liệu đã có sẵn được công bố trên tạp chí có uy tín. 4. Nội dung nghiên cứu Để đạt được các mục tiêu đề ra, luận án tập trung nghiên cứu một số nội dung chính như: Nghiên cứu lý thuyết nhận dạng mục ra đa; Khảo sát các
2 tập dữ liệu ra đa gán nhãn; Nghiên cứu, phân tích, đánh giá các mô hình học sâu và các kỹ thuật nhận dạng mục tiêu ra đa; Nghiên cứu các giải pháp nâng cao chất lượng nhận dạng mục tiêu của mạng nơ-ron học sâu. 5. Phương pháp nghiên cứu Kết hợp nghiên cứu lý thuyết , giải thích, mô tả toán học để xây dựng các mô hình, mô phỏng đánh giá các mô hình bằng phần mềm. Chứng minh hiệu quả các đề xuất bằng công cụ đánh giá của Framework Tensorflow, ngôn ngữ lập trình Python. 6. Ý nghĩa khoa học và ý nghĩa thực tiễn của luận án Ý nghĩa khoa học: Kết quả nghiên cứu của luận án góp phần hoàn thiện cơ sở lý thuyết bài toán nhận dạng mục tiêu ra đa ứng dụng trí tuệ nhân tạo. Ý nghĩa thực tiễn: Kết quả của các nghiên cứu trong luận án là cơ sở khoa học để xây dựng mô đun xử lý nhận dạng mục tiêu áp dụng vào thực tế. Luận án có thể là tài liệu tham khảo trong nghiên cứu khoa học, trong giảng dạy tại Học viện, Nhà trường, và các khóa huấn luyện chuyên ngành. 7. Bố cục của luận án Luận án được xây dựng bao gồm phần Mở đầu, 4 chương, và Kết luận. CHƯƠNG 1. NHẬN DẠNG MỤC TIÊU RA ĐA ỨNG DỤNG TRÍ TUỆ NHÂN TẠO, THIẾT LẬP BÀI TOÁN 1.1. Tổng quan bài toán nhận dạng mục tiêu ra 1.1.1. Giới thiệu bài toán Tự động nhận dạng mục tiêu ra đa (RATR: Radar automatic target recognition) là bài toán xác định kiểu loại của mục tiêu dựa trên những dấu hiệu đặc trưng được trích xuất từ tín hiệu phản xạ ra đa. 1.1.2. Các dấu hiệu nhận dạng Hiện nay, các nhà nghiên cứu tập trung vào 3 dấu hiệu đặc trưng cơ bản trong tín hiệu phản xạ về từ mục tiêu ra đa làm cơ sở nhận dạng. Cụ thể, ba dấu hiệu đặc trưng đó là: - Đặc trưng diện tích phản xạ hiệu dụng ra đa; - Đặc trưng chuyển động của mục tiêu thể hiện qua tham số tần số Doppler và micro-Doppler; - Đặc trưng về pha và đặc tính phân cực tín hiệu phản xạ về từ mục tiêu. 1.1.3. Các phương pháp nhận dạng mục tiêu ra đa Tùy theo cách thức trích xuất đặc trưng, nhận dạng mục tiêu ra đa có thể được chia thành hai phương pháp: phương pháp truyền thống và phương pháp học sâu.
3 Hình 1.12. Nhận dạng mục tiêu theo phương pháp truyền thống. - Phương pháp truyền thống đưa ra quyết định nhận dạng dựa vào việc thực hiện các thuật toán để tính toán độ tương đồng của dữ liệu mục tiêu thu được hiện tại với các mẫu mục tiêu ghi lưu trong bộ nhớ. - Nhận dạng theo phương pháp học sâu có thể chia thành 2 mức độ: + Mạng nơ-ron có chức năng phát hiện và nhận dạng: Trong trường hợp này, luồng xử lý phát hiện và nhận dạng là nối tiếp. Mạng nơ-ron phải đồng bộ về mặt thời gian, tốc độ tính toán với toàn bộ tuyến xử lý tín hiệu của ra đa. Sơ đồ chức năng của ra đa có mạng nơ-ron phát hiện và nhận dạng mục tiêu được mô tả trên Hình 1.15. Phương pháp này áp dụng phù hợp cho các ra đa cỡ nhỏ, tầm gần, số lượng mục tiêu bám bắt đồng thời bé. Hình 1.15 Mạng nơ-ron học sâu phát hiện và nhận dạng mục tiêu ra đa. + Mạng nơ-ron chỉ đảm nhận chức năng nhận dạng: Trong trường hợp này, thông tin mục tiêu nhận dạng được lựa chọn thủ công thông qua thao tác của trắc thủ ra đa trên màn hình HMI hoặc được lựa chọn tự động. Tuyến xử lý phát hiện ra đa và tuyến xử lý nhận dạng ra đa là song song, trong đó hệ thống xử lý nhận dạng là hệ thống xử lý trễ, không yêu cầu đồng bộ tốc với tuyến xử lý phát hiện. Phương pháp này phù hợp và có tính khả thi cao cho việc áp dụng vào thực tế các ra đa cảnh giới với tính năng phát hiện, bám bắt đồng thời nhiều mục tiêu. Sơ đồ chức năng của ra đa có mạng nơ- ron chỉ đảm nhiệm chức năng nhận dạng mục tiêu được mô tả trên Hình 1.17.
4 Hình 1.17. Mạng nơ-ron học sâu nhận dạng mục tiêu ra đa. Luận án lựa chọn hướng tiếp cận mạng nơ-ron học sâu chỉ đảm nhận chức năng nhận dạng mục tiêu để nghiên cứu. 1.1.4. Tập dữ liệu ra đa Trình bày thống kê các tập dữ liệu ra đa gán nhãn đã được công bố trên thế giới. Các tập dữ liệu này chủ yếu được xây dựng từ ra đa điều tần tuyến tính liên tục (FMCW: Frequency Modulated Continuous Wave) cự ly nhỏ trang bị trên hệ thống hỗ trợ lái tự động hoặc ảnh mục tiêu của ra đa tổng hợp mặt mở (SAR: synthetic aperture radar). Trong số các tập dữ liệu đã được công bố, tập dữ liệu RAD-DAR là tập hợp các mẫu mục tiêu ra đa trên miền cự ly – tần số Doppler được trích xuất từ ra đa FMCW cự ly hoạt động đến 3 km. Tập dữ liệu này phù hợp với định hướng nghiên cứu của luận án. Luận án sẽ sử dụng tập dữ liệu RAD-DAR để huấn luyện, đánh giá mô hình mạng nơ-ron và các giải pháp cải tiến đề xuất. 1.2. Tình hình nghiên cứu bài toán nâng cao chất lượng nhận dạng mục tiêu ra đa ứng dụng mạng nơ-ron học sâu 1.2.1. Tình hình nghiên cứu ngoài nước Trong những năm gần đây, đề xuất các giải pháp nâng cao độ chính xác của mô hình là hướng nghiên cứu chính trong lĩnh vực nhận dạng mục tiêu ra đa ứng dụng mạng nơ-ron học sâu. Các nghiên cứu chính để nâng cao độ chính xác mô hình mạng nơ-ron bao gồm: - Nghiên cứu các cấu trúc mạng nơ-ron tích chập phù hợp; - Nghiên cứu cải tiến hàm mất mát; - Nghiên cứu tăng cường dữ liệu; - Nghiên cứu tiền xử lý dữ liệu đầu vào. 1.2.2. Tình hình nghiên cứu trong nước
5 Vấn đề áp dụng trí tuệ nhân tạo vào tuyến xử lý tín hiệu đang bắt đầu được đẩy mạnh triển khai. Tuy nhiên, chưa có nhiều công trình nghiên cứu trong nước ở lĩnh vực này được công bố. Các kết quả công bố trong nước chỉ dừng ở mức độ nghiên cứu lý thuyết hoặc mô phỏng. 1.3. Đề xuất hướng nghiên cứu của luận án Luận án tổng hợp các kết quả nghiên cứu bài toán nhận dạng mục tiêu ra đa ứng dụng trí tuệ nhân tạo và đưa ra một số vấn đề còn tồn tại như: - Số lượng các tập dữ liệu ra đa gán nhãn đã được công bố là ít, đặc biệt là đối với các ra đa quân sự; - Còn ít các công trình nghiên cứu trong nước về lĩnh vực nhận dạng mục tiêu ra đa; - Vấn đề tăng xác suất nhận dạng đúng cho lớp mục tiêu quan trọng chưa được đề cập đến trong các công trình nghiên cứu; - Chưa có công trình nghiên cứu nào tiến hành giải quyết triệt để bài toán lọc nhiễu với yêu cầu bảo tồn các vùng ảnh đặc trưng mục tiêu; - Giải pháp tăng thêm số lượng ảnh cho tập dữ liệu ra đa ít được đề cập trong các công trình nghiên cứu. Chưa có công trình nghiên cứu nào tiến hành tăng cường ảnh cho tập dữ liệu RAD-DAR. Trên cơ sở phân tích các vấn đề còn tồn tại, những vấn đề chính luận án xác định sẽ tập trung giải quyết bao gồm: 1) Nghiên cứu, đề xuất một cải tiến trong hàm mất mát Focal Loss áp dụng cho các mô hình mạng nơ-ron học sâu trong quá trình huấn luyện nhằm nâng cao xác suất nhận dạng đúng với mục tiêu Flycam trong tập dữ liệu RAD-DAR. 2) Nghiên cứu đề xuất bộ lọc nhiễu không gian thích nghi tự động thay đổi kích thước cửa sổ trượt đảm bảo khả năng lọc nhiễu và bảo tồn các vùng ảnh mang thông tin đặc trưng của mục tiêu. 3) Nghiên cứu, đề xuất bộ sinh dữ liệu giả lập ảnh mục tiêu ra đa của tập dữ liệu RAD-DAR theo cấu trúc mạng GAN. Hình 1.27 Mô hình RINet luận án đề xuất và các bước so sánh, đánh giá.
6 Luận án đề xuất một mô hình mạng nơ-ron học sâu RINet là tổng hợp của các giải pháp nâng cao chât lượng như: cấu trúc CNN phù hợp, điều chỉnh nhân trọng số hàm mất mát Focal Loss, áp dụng thuật toán lọc nhiễu và sử dụng mạng sinh đối nghịch GAN để tăng cường dữ liệu. Cấu trúc của mô hình đề xuất của luận án và các bước tiến hành so sánh đánh giá với các mô hình khác đã được công bố trên cùng tập dữ liệu được mô tả như trên hình 1.27 1.4. Kết luận chương 1 Chương 1 của luận án bao gồm các nội dung chính như sau: - Khảo sát, phân tích các dấu hiệu đặc trưng trong tín hiệu phản xạ mục tiêu ra đa làm cơ sở nhận dạng mục tiêu. - Phân tích, đánh giá các phương pháp nhận dạng mục tiêu ra đa: phương pháp truyền thống và phương pháp học sâu. - Khảo sát các tập dữ liệu ra đa gán nhãn cho bài toán nhận dạng mục tiêu theo phương pháp học sâu đã được công bố trên thế giới, trình bày tổng quan về tập dữ liệu RAD-DAR. - Khảo sát, phân tích tình hình nghiên cứu trong và ngoài nước bài toán tự động nhận dạng mục tiêu ra đa. Từ các kết quả đó, luận án đã đưa ra các vấn đề còn tồn tại và xác định những nội dung chính mà luận án sẽ tập trung giải quyết. Các đề xuất nâng cao chất lượng nhận dạng mục tiêu ra đa được trình bày tại Chương 2, 3, và 4 của luận án. CHƯƠNG 2. ĐỀ XUẤT MẠNG NƠ-RON HỌC SÂU RINET VÀ GIẢI PHÁP NHÂN TRỌNG SỐ HÀM MẤT MÁT FOCAL LOSS NÂNG CAO CHẤT LƯỢNG NHẬN DẠNG MỤC TIÊU 2.1. Đặt vấn đề Chương 2 luận án sẽ đề xuất hàm mất mát mới sử dụng trong quá trình huấn luyện mạng nơ-ron nhằm tăng xác suất nhận dạng đúng với mục tiêu Flycam so với các mục tiêu khác trong tập dữ liệu RAD-DAR. Hàm mất mát này là sự điều chỉnh của hàm mất mát Focal Loss. Luận án cũng đề xuất xây dựng mô hình mạng nơ-ron học sâu để tiến hành các bước thực nghiệm và kiểm chứng. Mô hình mạng nơ-ron học sâu này được xây dựng dựa trên việc khảo sát và đánh giá các cấu trúc CNN khác nhau trong một số mô hình đã được công bố trên cùng tập dữ liệu RAD-DAR. 2.2. Kỹ thuật học sâu ứng dụng cho bài toán nhận dạng mục tiêu ra đa Trình bày các kiến thức liên quan trong lĩnh vực học sâu, các tiêu chuẩn so sánh đánh giá các mô hình mạng nơ-ron và thông tin cấu hình phần mềm, phần cứng tiến hành cài đặt các thử nghiệm trong luận án này.
7 2.3. Đề xuất mô hình mạng nơ-ron học sâu nhận dạng mục tiêu ra đa trên ảnh cự ly – tần số Doppler của tập dữ liệu RAD-DAR 2.3.1. Đề xuất cấu trúc mô hình RINet Luận án đã đề xuất một mô hình học sâu nhận dạng mục tiêu trên tập dữ liệu RAD-DAR, gọi là mô hình RINet (Residual Iception Network). Hình 2.7 là minh họa cấu trúc của mô hình RINet đề xuất. Cấu trúc mô hình đề xuất là sự kết hợp của kết nối tắt Residual và Inception. Tầng trích xuất đặc trưng bao gồm các khối Residual-Inception (R-I Block), các khối này nối tiếp nhau. Số lượng các khối R-I Block trong mô hình đề xuất được xác định thông qua kết quả thực nghiệm. Mỗi khối R-I Block bao gồm 3 mô đun Residual-Inception (R-I Component) kết nối song song với nhau. Kết quả đầu ra của 3 mô đun này được hợp nhất ở lớp xếp chồng Concatnate. Mỗi mô đun R-I Component bao gồm 2 bộ tích chập song song. Số bộ lọc của các bộ tích chập là 32, kích thức bộ lọc của 2 nhánh tích chập tương ứng là 1*k và k*1 (bộ lọc 1 chiều). Kích thước bộ lọc k trong Mỗi mô đun R-I Component lần lượt là 3, 5, 7 giúp trích lọc thông tin đa dạng trên những vùng đặc trưng mục tiêu có kích thước khác nhau. Hình 2.7. Cấu trúc mô hình mạng RINet đề xuất 2.3.2. Đánh giá hiệu quả của cấu trúc CNN mô hình RINet Kết quả thực nghiệm so sánh mô hình RINet và các mô hình DopplerNet, CNN-32DC, RINN và MobileNetV2 ở trên hình 2.11. Mô hình RINet luận án đề xuất có hiệu năng tốt nhất với các tham số: kích thước mô hình 1,382 triệu tham số, độ chính xác 94,36% và thời gian dự đoán 7,6 ms.
8 Hình 2.11. So sánh chất lượng của mô hình đề xuất với các mô hình khác trên cùng tập dữ liệu. Luận án tiến hành so sánh các mô hình RINet với số lượng các khối R-I Block lần lượt là 1, 2, 3, 4, 5 như mô tả trên Bảng 2.3. Mô hình RINet có 1 khối R-I Block là tốt nhất với độ chính xác nhận dạng là 94,36%, kích thước mô hình là 1,382 triệu tham số, thời gian nhận dạng là 7,6 ms. Bảng 2.3: So sánh mô hình RINet số lượng các khối R-I Block khác nhau Số khối R-I Các tiêu chí so sánh Block mô Độ chính xác Kích thước (triệu Thời gian tính hình RINet (%) tham số) toán (ms) 1 94,36 1,382 7,6 2 94,55 1,409 10,8 3 94,61 1,436 15,6 4 94,57 1,465 21,19 5 94,59 1,494 33,18 2.4. Đề xuất nhân trọng số hàm mất mát Focal Loss nhằm nâng cao xác suất nhận dạng đúng mục tiêu Flycam 2.4.1. Hàm mất mát và phương pháp tối ưu Trình bày về vai trò của hàm mất mát trong quá trình huấn luyện mạng nơ-ron. 2.4.2. Hàm mất mát Cross Entropy Trình bày về hàm mất mát Cross Entropy. 2.4.3. Hàm mất mát Focal Loss Trình bày về hàm mất mát Focal Loss
9 2.4.4. Đề xuất nhân trọng số hàm mất mát Focal Loss Điều chỉnh hàm mất mát là một giải pháp để khắc phục tình trạng mất cân bằng dữ liệu và cũng là 1 phương pháp hiệu quả để nâng cao chất lượng nhận dạng mục tiêu ra đa của mô hình mạng nơ-ron. Với mục tiêu nâng cao xác suất nhận dạng đúng đối với lớp mục tiêu Flycam trong tập dữ liệu RAD-DAR, luận án đề xuất điều chỉnh hệ số  t trong công thức hàm mất mát Focal Loss thành biểu thức mô tả trong công thức (2.24). Hàm mất mát Focal Loss nhân trọng số luận án đề xuất sử dụng để huấn luyện mô hình RINet được mô tả ở công thức (2.25), ký hiệu là Weighted Focal Loss (WFL). wt t = N , (2.24) w t =1 t wt WFL( pt ) = − N (1 − pt ) log( pt ) , (2.25) w t =1 t 2.4.5. Đánh giá hiệu quả của việc nhân trọng số hàm mất mát Focal Loss Trong phần này luận án đã tiến hành cài đặt mô hình đề xuất RINet và sử dụng 3 hàm mất mát là hàm Cross Entropy, Focal Loss, và hàm Focal Loss nhân trọng số. Hàm Focal Loss nhân trọng số được khởi tạo tập giá trị ưu tiên [w1, w2, w3] tương ứng với 3 loại mục tiêu: ô tô, Flycam, người đi bộ là [1, 3, 1]. Tham số độ chính xác nhận dạng của từng mục tiêu và tham số độ chính xác trung bình được tính toán trên tập dữ liệu kiểm tra như mô tả trên bảng 2.4. Bảng 2.4: So sánh độ chính xác của mô hình RINet với các hàm mất mát khác nhau. Độ chính xác nhận dạng Hàm mất mát Trung bình Ô tô Người đi bộ Flycam Cross Entropy 94.36% 94.13% 95.20% 93.75% Focal Loss 95.87% 95.62% 96.58% 95.41% Focal Loss nhân 95.75% 94.11% 94.32% 98.83% trọng số Khi sử dụng hàm mất mát Focal Loss nhân trọng số, xác suất nhận dạng đúng mục tiêu Flycam là cao nhất đạt 98.83% tăng 5.08% so với hàm mất mát Cross Entropy và tăng 3.42% so với hàm mất mát Focal Loss. Trong khi đó, chỉ số nhận dạng chính xác trung bình cả 3 mục tiêu là 95.75 chỉ thấp hơn 0.12% so với kết quả khi sử dụng hàm mất mát Focal Loss.
10 2.5. Kết luận Chương 2 Tóm lại, những đóng góp chính trong chương 2 của luận án bao gồm: 1. Phân tích, so sánh, đánh giá các mô hình mạng nơ-ron khác nhau nhận dạng mục tiêu trên tập dữ liệu RAD-DAR. 2. Trên cơ sở so sánh các mô hình đó, luận án đề xuất một mô hình mạng nơ-ron học sâu RINet để nhận dạng mục tiêu ra đa trên ảnh cự ly – tần số Doppler trong bộ dữ liệu RAD-DAR. Mô hình RINet có tầng CNN kết hợp của cấu trúc Residual – Inception với 3 nhánh tích chập song song với kích thước các bộ lọc tương ứng là 3, 5,7, và sử dụng các bộ lọc một chiều. 3. Đề xuất hàm mất mát mới dựa trên sự điều chỉnh của hàm mất mát Focal Loss. Hàm mất mát này cho phép điều chỉnh hệ số ưu tiên đối với lớp mục tiêu quan trọng. Khi áp dụng hàm mất mát Focal Loss nhân trọng số để huấn luyện mô hình RINet, xác suất phát hiện đúng đối với mục tiêu Flycam cao so với 2 lớp mục tiêu còn lại. Kết quả nghiên cứu trong chương này đã được công bố tại công trình [CT1], [CT2], [CT3] trong danh mục các công trình đã công bố. CHƯƠNG 3. ĐỀ XUẤT GIẢI PHÁP LỌC NHIỄU NÂNG CAO CHẤT LƯỢNG NHẬN DẠNG MỤC TIÊU CỦA MẠNG NƠ-RON HỌC SÂU RINET 3.1. Đặt vấn đề Chương 3 của luận án nghiên cứu tác động của nhiễu đến chất lượng nhận dạng mục tiêu, phương pháp lọc nhiễu và đề xuất sử dụng bộ lọc không gian có điều chỉnh tự động kích thước cửa sổ trượt ASWNF để bảo tồn các đặc trưng sườn, cạnh của mục tiêu trong ảnh ra đa. Kết quả phần thực nghiệm cho thấy, sử dụng tập ảnh đã được loại nhiễu bởi bộ lọc đề xuất giúp nâng cao độ chính xác nhận dạng mục tiêu của các mạng nơ-ron. 3.2. Xây dựng bộ lọc nhiễu cho mô hình mạng nơ-ron RINet 3.2.1. Nhiễu trong ảnh dữ liệu ra đa Trình bày khái niệm về nhiễu trong ảnh mục tiêu ra đa và tác động của nhiễu đến quá trình nhận dạng mục tiêu của mạng nơ-ron. 3.2.2. Vị trí của bộ lọc nhiễu trong mô hình RINet Để làm giảm tác động của nhiễu trong ảnh mục tiêu ra đa đến chất lượng nhận dạng của mạng nơ-ron học sâu, luận án đề xuất áp dụng bộ lọc nhiễu trong mô hình RINet. Vị trí và vai trò của bộ lọc nhiễu được mô trong hình 3.3. Bộ lọc nhiễu được sử dụng cả trong quá trình huấn luyện mô hình và trong quá trình nhận dạng thực tế.
11 Hình 3.3 Vị trí, vai trò của bộ lọc nhiễu trong mô hình RINet 3.2.3. Nghiên cứu các giải pháp lọc nhiễu Để làm giảm tác động của nhiễu đến chất lượng nhận dạng mục tiêu ra đa, một số phương pháp lọc nhiễu phổ biến đã được áp dụng để tiến hành lọc nhiễu trong tín hiệu phản xạ về của ra đa. Trong đó, việc sử dụng các bộ lọc thích nghi để triệt nhiễu đã được chứng minh là một trong những phương pháp hiệu quả để triệt nhiễu trong ảnh dữ liệu ra đa. Hình 3.5 Lưu đồ thuật toán bộ lọc thích nghi, (a) lưu đồ thuật toán, (b) code chương trình phần mềm của bộ lọc Kuan. Bản chất của phương pháp lọc nhiễu trắng bằng bộ lọc thích nghi là việc di chuyển một cửa sổ trượt qua từng pixel trong ảnh và áp dụng phép tính toán bằng cách sử dụng các giá trị pixel trong cửa sổ trượt. Pixel trung tâm
12 sau đó được thay thế bằng giá trị được tính toán. Cửa sổ trượt được di chuyển dọc theo hình ảnh từng pixel một cho đến khi toàn bộ hình ảnh được quét qua. Quá trình này tạo ra hiệu ứng làm mịn và giảm cường độ của các điểm ảnh nhiễu. Trong nội dung luận án sẽ tiến hành xây dựng 3 bộ lọc Lee, Frost và Kuan để lọc nhiễu trong ảnh radar. Thuật toán của 3 bộ lọc mô tả tương ứng ở công thức (3.1), (3.5) và (3.8). Dout = LM + K *( P − LM ) C (3.1) (− B * S ) D =e (3.5) out K = var( x) / (z 2  n + (1 +  n ) var(x)) m 2 2 (3.8) 3.2.4. Các phương pháp bảo tồn vùng ảnh đặc trưng của bộ lọc nhiễu Dấu hiệu đặc trưng của mục tiêu ra đa trong mẫu dữ liệu trên miền cự ly – tần số Doppler được thể hiện ở các điểm ảnh ở biên, cạnh của các vùng ảnh mục tiêu. Vì vậy cần phải nghiên cứu và áp dụng các giải pháp nhằm bảo tồn các vùng ảnh đặc trưng này khi áp dụng các bộ lọc nhiễu. 3.2.5. Đề xuất bộ lọc thích nghi tự động điều chỉnh kích thước cửa sổ lọc cho mô hình RINet Để làm tăng hiệu quả lọc nhiễu trong ảnh đồng thời giảm tác động đến đặc trưng các sườn, cạnh và các vùng ảnh mục tiêu, luận án đề xuất giải pháp tự động điều chỉnh kích thước của cửa sổ trượt các bộ lọc nhiễu không gian thích nghi. Hình 3.12 mô tả nguyên lý hoạt động của giải pháp này, tùy theo khoảng cách từ trung tâm cửa sổ trượt lọc nhiễu đến các pixels cạnh mục tiêu, kích thước cửa sổ lọc sẽ được điều chỉnh theo xu hướng giảm dần khi bộ lọc di chuyển gần đến đến cạnh mục tiêu và ngược lại kích thước cửa sổ sẽ tăng dần khi cửa sổ lọc di chuyển ra xa vùng cạnh. Hình 3.12. Giải pháp tư động điều chỉnh kích thước cửa sổ trượt bộ lọc. Luận án đề xuất bộ lọc nhiễu tự động điều chỉnh kích thước của cửa sổ trượt (sau đây gọi tắt là ASWNF: Adaptive Size Window Noise Filter). Lưu đồ thuật toán của ASWNF luận án đề xuất được mô tả ở Hình 3.13. So với lưu đồ thuật toán của bộ lọc nhiễu không gian thích nghi nguyên bản, bộ lọc ASWNF bổ sung mô đun xác định sườn cạnh trong ảnh, mô đun cập nhật
13 kích thước cửa sổ trượt và mô đun xác định điều kiện sườn, cạnh ảnh trong cửa sổ trượt. Hình 3.13 Lưu đồ thuật toán bộ lọc ASWNF đề xuất. Với cơ chế làm việc của bộ lọc nhiễu ASWNF, tại những vùng ảnh không có mục tiêu, kích thước của của sổ trượt bộ lọc nhiễu sẽ lớn hơn giúp việc lọc nhiễu “sạch” hơn. Tại vùng ảnh mang thông tin mục tiêu, kích thước của cửa sổ trượt được điều chỉnh giảm giúp bảo tồn những đặc trưng mục tiêu trong các điểm ảnh đó. Hình 3.14. So sánh ảnh đầu bộ lọc ASWNF đề xuất Hình 3.14 thể hiện kết quả so sánh việc lọc nhiễu trên ảnh đầu ra của bộ lọc nhiễu ASWNF đề xuất và bộ lọc Lee. Trong đó, ảnh (a) là ảnh gốc chưa lọc nhiễu, ảnh (b) là kết qua đầu ra mô đun xác định sườn cạnh, ảnh (c) là ảnh đầu ra bộ lọc ASWNF đề xuất, ảnh (d) là ảnh đầu ra bộ lọc Lee cửa sổ 7*7. Ta thấy rằng, vùng ảnh mục tiêu trong ảnh mục tiêu ra đa đầu ra bộ lọc ASWNF được bảo tồn tốt hơn so với ảnh đầu ra bộ lọc Lee cửa sổ cố định 7*7.
14 3.3. Đánh giá hiệu quả của phương pháp đề xuất Hình 3.15 So sánh các ảnh đặc trưng trích xuất từ các lớp tích chập trong trường hợp ảnh đầu vào có nhiễu và không có nhiễu. Hình 3.15 thể hiện các ảnh đặc trưng đầu ra của tẩng tích chập mô hình RINet trong trường hợp ảnh ảnh mục tiêu ra đa chưa lọc nhiễu và ảnh đầu vào đã lọc nhiễu. Khi có nhiễu, ảnh đặc trưng đầu ra của lớp tích chập của mạng nơ-ron có các thành phần nhiễu. Cường độ nhiễu càng lớn, sự tác động của nhiễu đến kết luận nhận dạng mục tiêu càng cao làm giảm độ chính xác nhận dạng mục tiêu của mô hình mạng nơ-ron. Ngược lại, các ảnh đặc trưng của ảnh mục tiêu đã được lọc nhiễu “sạch” hơn làm tăng khả năng nhận dạng đúng mục tiêu. Luận án đã xây dựng quá trình thực nghiệm để đánh giá hiệu quả của phương pháp đề xuất bao gồm: - So sánh hiệu quả các bộ lọc Lee, Kuan và Frost; - So sánh bộ lọc ASWNF đề xuất và các bộ lọc khác. Bảng 3.1. Bảng so sánh kết quả nhận dạng mục tiêu của mô hình RINet trên các tập dữ liệu khác nhau Tập dữ liệu Độ chính xác (%) Sai số (%) Không lọc nhiễu 95,87 7,84 Bộ lọc Lee 98,17 4,08 Bộ lọc Kuan 98,06 4,13 Bộ lọc Frost 97,65 5,47 Bảng 3.1 là kết quả nhận dạng mục tiêu của mô hình RINet khi sử dụng bộ dữ liệu gốc và 3 bộ dữ liệu được lọc nhiễu bằng các bộ lọc Lee, Kuan và Frost. Bảng số liệu cho thấy, việc áp dụng các bộ lọc nhiễu tập dữ liệu mục tiêu ra đa giúp mô hình mạng nơ-ron cải thiện đáng kể chất lượng nhận dạng
15 mục tiêu. Trong đó, mô hình RINet đạt độ chính xác cao nhất (98,17%) và sai số thấp nhất (4,08%) khi sử dụng bộ lọc Lee. Luận án so kết quả nhận dạng của mô hình RINet trên các tập dữ liệu lọc nhiễu bởi bộ lọc Lee với các kích thước cửa sổ khác nhau là 3, 5, 7, 9 và bộ lọc ASWNF đề xuất. Kết quả thực nghiệm trên bảng 3.2 chỉ ra rằng áp dụng bộ lọc ASWNF đề xuất giúp mô hình RINet có kết quả nhận dạng mục tiêu tốt nhất: độ chính xác 98,95%, sai số 2,36%. Bảng 3.2. So sánh kết quả nhận dạng với dữ liệu đầu ra bộ lọc Lee với các kích thước cửa sổ khác nhau và bộ lọc ASWNF. Bộ lọc nhiễu Độ chính xác (%) Sai số (%) Bộ lọc Lee 3x3 98,17 4,08 Bộ lọc Lee 5x5 98,34 3,78 Bộ lọc Lee 7x7 98,57 2,61 Bộ lọc Lee 9x9 96,14 10,33 Bộ lọc nhiễu ASWNF 98,95 2,36 Để đánh giá hiệu quả của bộ lọc ASWNF, luận án cũng tiến hành so sánh độ chính xác nhận mục tiêu của các mô hình mạng nơ-ron IRNN, DopplerNet và CNN-32DC trên tập dữ liệu lọc nhiễu bởi bộ lọc ASWNF và tập dữ liệu gốc chưa lọc nhiễu. Bảng 3.3. So sánh kết quả nhận dạng mục tiêu của các mô hình mạng nơ- ron khác khi áp dụng bộ lọc nhiễu ASWNF Độ chính xác (%) Mô hình mạng nơ-ron Tập dữ liệu gốc Tập dữ liệu áp dụng bộ lọc ASWNF IRNN 94,34 97,08 DopplerNet 94,23 96,79 CNN-DC32 93,80 96,12 Các kết quả trên bảng 3.3 cũng cho thấy việc áp dụng bộ lọc nhiễu ASWNF giúp các mô hình mạng nơ-ron IRNN, DopplerNet và CNN-32DC cải thiện đáng kể độ chính xác nhận dạng mục tiêu. Cụ thể, độ chính xác nhận dạng mục tiêu của mô hình IRNN, DopplerNet và CNN-DC32 đã được cải thiện tương ứng 2,74%, 2,63% và 2,32%. Hình 3.19 là kết quả huấn luyện và kiểm tra của mô hình mạng nơ-ron RINet trên tập dữ liệu RAD-DAR đã được tiến hành lọc nhiễu theo giải pháp
16 ASWNF luận án đề xuất. Trong đó, Hình 3.19 a thể hiện biểu đồ chỉ số độ chính xác, hình 3.19 b là biểu đồ tham số sai số, và hình 3.19 c là ma trận so sánh thể hiện kết quả nhận dạng 3 mục tiêu: người đi bộ, xe ô tô và Flycam. Hình 3.19. Kết quả đánh giá quá trình huấn luyện và kiểm tra của mô hình RINet áp dụng bộ lọc nhiễu ASWNF đề xuất. 3.4. Kết luận Chương 3 Chương 3 của luận án đã tiến hành đánh giá tác động của nhiễu đến chất lượng nhận dạng mục tiêu ra đa của mạng nơ-ron học sâu. Thông qua quá trình nghiên cứu và phân tích các giải pháp lọc nhiễu khác nhau, luận án đã đề xuất một giải pháp lọc nhiễu sử dụng bộ lọc không gian thích nghi kích thước cửa sổ trượt tự động thay đổi ASWNF để tiến hành lọc nhiễu. Kết quả thực nghiệm chỉ ra rằng, các mạng nơ-ron học sâu huấn luyện trên tập dữ liệu đã lọc nhiễu của bộ lọc ASWNF đề xuất đều nâng cao độ chính xác nhận dạng mục tiêu. Trong đó, mô hình RINet đạt kết quả nhận dạng mục tiêu cao nhất là 98,95 % khi áp dụng bộ lọc ASWNF. CHƯƠNG 4. ĐỀ XUẤT PHƯƠNG PHÁP SINH ẢNH MỤC TIÊU RA ĐA SỬ DỤNG MẠNG SINH ĐỐI NGHỊCH GAN 4.1. Đặt vấn đề Chương 4 của luận án trình bày về các giải pháp tăng cường ảnh cho các tập dữ liệu ra đa và đề xuất xây dựng mô hình mạng nơ-ron có cấu trúc mạng sinh đối nghịch GAN để tăng cường dữ liệu ảnh cho tập dữ liệu ảnh mục tiêu ra đa trên miền cự ly - tần số Doppler RAD-DAR. Kết quả phân tích và thực nghiệm cho thấy tập ảnh tạo ra bởi mô hình luận án đề xuất có tính tương đồng cao so với tập ảnh gốc và giúp nâng cao độ chính xác nhận dạng mục tiêu của mô hình mạng nơ-ron. 4.2. Phương án đề xuất 4.2.1. Tổng quan bài toán tăng cường dữ liệu ảnh mục tiêu ra đa
17 Trình bày tổng quan giải pháp tăng cường dữ liệu ảnh mục tiêu ra đa nhằm nâng cao chất lượng nhận dạng mục tiêu của mô hình mạng nơ-ron. 4.2.2. Các giải pháp tăng cường dữ liệu ảnh mục tiêu ra đa Để tăng cường cho các tập dữ liệu ra đa, các nhà nghiên cứu thường áp dụng các phương pháp sau: - Phương pháp lật theo trục phương vị; - Phương pháp dịch theo trục cự ly; - Phương pháp dịch theo trục phương vị; - Phương pháp cắt chọn ngẫu nhiên; - Phương pháp điều chỉnh cường độ nhiễu và mức tín hiệu nền; - Sử dụng mạng nơ-ron sinh dữ liệu. 4.2.3. Đề xuất mô hình mạng sinh đối nghịch GAN để tăng cường dữ liệu cho cho tập dữ liệu RAD-DAR Hình 4.6. Sơ đồ tổng thể mạng GAN. Hình 4.7. Cấu trúc bộ sinh. Luận án xây dựng một mô hình mạng nơ-ron học sâu có cấu trúc mạng sinh đối nghịch GAN để tăng cường dữ liệu ảnh Range-Doppler của tập dữ liệu tập dataset RAD-DAR (Đặt tên mô hình là RDGenGAN). Đây là mô hình GAN đầu tiên được sử dụng để sinh các ảnh giả lập trên miền cự ly – tần số Doppler của tập dữ liệu RAD-DAR. Cấu trúc mô hình GAN bao gồm hai thành phần chính: bộ sinh (Generator) và bộ phân biệt (Discriminator)
18 như mô tả trên Hình 4.6. Cấu trúc bộ sinh và bộ phân biệt mô hình RDGenGAN được mô tả trên Hình 4.7 và 4.8. Hình 4.8. Cấu trúc bộ phân biệt. Để lựa chọn tham số tối ưu cho mô hình sinh dữ liệu đề xuất, trong quá trình huấn luyện mô hình RDGenGAN, luận án lưu lại các bộ tham số mô hình sau mỗi 5 chu kỳ huấn luyện (epoch). Các ảnh được tạo ra bởi bộ sinh cũng được lưu lại tương ứng phục vụ cho việc so sánh. Hình 4.9 là các tập hợp 4 ảnh đầu ra của bộ sinh dữ liệu sau số chu kỳ huấn luyện tương ứng là: 5, 10, 15, 20, 25 và 30. Hình 4.9. Ảnh đầu ra bộ sinh sau các chu kỳ huấn luyện khác nhau Các ảnh trên hình 4.9 chỉ ra rằng, chất lượng ảnh đầu ra của bộ sinh ảnh càng ngày càng tăng và giống với các ảnh gốc sau các chu kỳ huấn luyện mạng nơ-ron RDGenGAN. Ảnh dữ liệu đầu ra của bộ sinh với chu kỳ huấn luyện lớn hơn 20 có tính tương đồng cao so với ảnh dữ liệu gốc. Tuy nhiên, khi số Epochs lớn hơn 25, chất lượng ảnh đầu ra bộ sinh có xu hương giảm.