
Tóm tắt Luận án Tiến sĩ Kỹ thuật: Nghiên cứu bài toán tự động nhận dạng mục tiêu ra đa ứng dụng mạng nơ-ron học sâu
lượt xem 1
download

Tóm tắt Luận án Tiến sĩ Kỹ thuật "Nghiên cứu bài toán tự động nhận dạng mục tiêu ra đa ứng dụng mạng nơ-ron học sâu" được nghiên cứu với mục tiêu: Nghiên cứu đề xuất một số giải pháp nhằm nâng cao chất lượng nhận dạng mục tiêu ra đa của mô hình mạng nơron học sâu.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Tóm tắt Luận án Tiến sĩ Kỹ thuật: Nghiên cứu bài toán tự động nhận dạng mục tiêu ra đa ứng dụng mạng nơ-ron học sâu
- BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ QUỐC PHÒNG VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ NGUYỄN VĂN TRÀ NGHIÊN CỨU BÀI TOÁN TỰ ĐỘNG NHẬN DẠNG MỤC TIÊU RA ĐA ỨNG DỤNG MẠNG NƠ-RON HỌC SÂU Ngành: Kỹ thuật ra đa dẫn đường Mã số: 9 52 02 04 TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT HÀ NỘI - 2024
- CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ - BỘ QUỐC PHÒNG Người hướng dẫn khoa học: 1. TS. Vũ Chí Thanh 2. TS. Đoàn Văn Sáng Phản biện 1: GS.TS Bạch Gia Dương Đại học Quốc gia Hà Nội Phản biện 2: TSKH Đào Chí Thành Viện Hàn lâm Khoa học và Công nghệ Việt Nam Phản biện 3: PGS.TS Lê Vĩnh Hà Viện Khoa học và Công nghệ Quân sự Luận án được bảo vệ tại Hội đồng đánh giá luận án tiến sĩ cấp Viện, họp tại Viện Khoa học và Công nghệ quân sự. Vào hồi: giờ ngày tháng năm 2024 Có thể tìm hiểu luận án tại: - Thư viện Viện Khoa học và Công nghệ quân sự - Thư viện Quốc gia Việt Nam
- 1 MỞ ĐẦU 1. Tính cấp thiết của đề tài luận án Thực tiễn các cuộc xung đột vũ trang và chiến tranh gần đây cho thấy các bên tham chiến sử dụng đa dạng các chủng loại vũ khí đặc biệt là máy bay không người lái, xuồng không người lái và tên lửa hành trình, bom lượn, ... Các loại vũ khí này ngày càng thông minh, có tính sát thương cao. Khi đối phương dùng hỏa lực lớn, tấn công ồ ạt, cường độ cao thì phương pháp nhận dạng xác định thủ công dựa vào kinh nghiệm và năng lực của trắc thủ là không hiệu quả. Do đó, giải pháp tự động nhận dạng mục tiêu là một yêu cầu cấp bách. Áp dụng trí tuệ nhân tạo để giải quyết bài toán nhận dạng mục tiêu ra đa là một hướng tiếp cận phù hợp với xu hướng nghiên hiện nay trong lĩnh vực xử lý tín hiệu ra đa. Trong đó, nghiên cứu các giải pháp để khắc phục các khó khăn như: số lượng tập ảnh ra đa gán nhãn hạn chế, cường độ nhiễu trong ảnh cao, yêu cầu về kích thước mô hình và tốc độ tính toán của mạng nơ-ron nhằm nâng cao chất lượng nhận dạng mục tiêu là một nhiệm vụ quan trọng. Xuất phát từ những lý do trên, luận án lựa chọn đề tài nghiên cứu “Nghiên cứu bài toán tự động nhận dạng mục tiêu ra đa ứng dụng mạng nơ- ron học sâu”. Đây là vấn đề cấp thiết và có tính thời sự, ứng dụng cao, những kết quả của Luận án là tiền đề cho lĩnh vực nghiên cứu, xây dựng các mô đun phần mềm tự động nhận dạng mục tiêu để ứng dụng vào trong tuyến xử lý tín hiệu của các ra đa tại Việt Nam. 2. Mục tiêu nghiên cứu Mục tiêu nghiên cứu của luận án là nghiên cứu đề xuất một số giải pháp nhằm nâng cao chất lượng nhận dạng mục tiêu ra đa của mô hình mạng nơ- ron học sâu. 3. Đối tượng và phạm vi nghiên cứu Đối tượng nghiên cứu của luận án là các mô hình mạng nơ-ron học sâu và bài toán tự động nhận dạng mục tiêu ra đa. Phạm vi nghiên cứu của luận án là: - Nghiên cứu áp dụng các giải pháp nâng cao chất lượng nhận dạng mục tiêu ra đa ứng dụng mạng nơ-ron học sâu; - Luận án tập trung nghiên cứu nhận dạng 3 lớp mục tiêu Flycam, người đi bộ, ô tô và sử dụng bộ dữ liệu đã có sẵn được công bố trên tạp chí có uy tín. 4. Nội dung nghiên cứu Để đạt được các mục tiêu đề ra, luận án tập trung nghiên cứu một số nội dung chính như: Nghiên cứu lý thuyết nhận dạng mục ra đa; Khảo sát các
- 2 tập dữ liệu ra đa gán nhãn; Nghiên cứu, phân tích, đánh giá các mô hình học sâu và các kỹ thuật nhận dạng mục tiêu ra đa; Nghiên cứu các giải pháp nâng cao chất lượng nhận dạng mục tiêu của mạng nơ-ron học sâu. 5. Phương pháp nghiên cứu Kết hợp nghiên cứu lý thuyết , giải thích, mô tả toán học để xây dựng các mô hình, mô phỏng đánh giá các mô hình bằng phần mềm. Chứng minh hiệu quả các đề xuất bằng công cụ đánh giá của Framework Tensorflow, ngôn ngữ lập trình Python. 6. Ý nghĩa khoa học và ý nghĩa thực tiễn của luận án Ý nghĩa khoa học: Kết quả nghiên cứu của luận án góp phần hoàn thiện cơ sở lý thuyết bài toán nhận dạng mục tiêu ra đa ứng dụng trí tuệ nhân tạo. Ý nghĩa thực tiễn: Kết quả của các nghiên cứu trong luận án là cơ sở khoa học để xây dựng mô đun xử lý nhận dạng mục tiêu áp dụng vào thực tế. Luận án có thể là tài liệu tham khảo trong nghiên cứu khoa học, trong giảng dạy tại Học viện, Nhà trường, và các khóa huấn luyện chuyên ngành. 7. Bố cục của luận án Luận án được xây dựng bao gồm phần Mở đầu, 4 chương, và Kết luận. CHƯƠNG 1. NHẬN DẠNG MỤC TIÊU RA ĐA ỨNG DỤNG TRÍ TUỆ NHÂN TẠO, THIẾT LẬP BÀI TOÁN 1.1. Tổng quan bài toán nhận dạng mục tiêu ra 1.1.1. Giới thiệu bài toán Tự động nhận dạng mục tiêu ra đa (RATR: Radar automatic target recognition) là bài toán xác định kiểu loại của mục tiêu dựa trên những dấu hiệu đặc trưng được trích xuất từ tín hiệu phản xạ ra đa. 1.1.2. Các dấu hiệu nhận dạng Hiện nay, các nhà nghiên cứu tập trung vào 3 dấu hiệu đặc trưng cơ bản trong tín hiệu phản xạ về từ mục tiêu ra đa làm cơ sở nhận dạng. Cụ thể, ba dấu hiệu đặc trưng đó là: - Đặc trưng diện tích phản xạ hiệu dụng ra đa; - Đặc trưng chuyển động của mục tiêu thể hiện qua tham số tần số Doppler và micro-Doppler; - Đặc trưng về pha và đặc tính phân cực tín hiệu phản xạ về từ mục tiêu. 1.1.3. Các phương pháp nhận dạng mục tiêu ra đa Tùy theo cách thức trích xuất đặc trưng, nhận dạng mục tiêu ra đa có thể được chia thành hai phương pháp: phương pháp truyền thống và phương pháp học sâu.
- 3 Hình 1.12. Nhận dạng mục tiêu theo phương pháp truyền thống. - Phương pháp truyền thống đưa ra quyết định nhận dạng dựa vào việc thực hiện các thuật toán để tính toán độ tương đồng của dữ liệu mục tiêu thu được hiện tại với các mẫu mục tiêu ghi lưu trong bộ nhớ. - Nhận dạng theo phương pháp học sâu có thể chia thành 2 mức độ: + Mạng nơ-ron có chức năng phát hiện và nhận dạng: Trong trường hợp này, luồng xử lý phát hiện và nhận dạng là nối tiếp. Mạng nơ-ron phải đồng bộ về mặt thời gian, tốc độ tính toán với toàn bộ tuyến xử lý tín hiệu của ra đa. Sơ đồ chức năng của ra đa có mạng nơ-ron phát hiện và nhận dạng mục tiêu được mô tả trên Hình 1.15. Phương pháp này áp dụng phù hợp cho các ra đa cỡ nhỏ, tầm gần, số lượng mục tiêu bám bắt đồng thời bé. Hình 1.15 Mạng nơ-ron học sâu phát hiện và nhận dạng mục tiêu ra đa. + Mạng nơ-ron chỉ đảm nhận chức năng nhận dạng: Trong trường hợp này, thông tin mục tiêu nhận dạng được lựa chọn thủ công thông qua thao tác của trắc thủ ra đa trên màn hình HMI hoặc được lựa chọn tự động. Tuyến xử lý phát hiện ra đa và tuyến xử lý nhận dạng ra đa là song song, trong đó hệ thống xử lý nhận dạng là hệ thống xử lý trễ, không yêu cầu đồng bộ tốc với tuyến xử lý phát hiện. Phương pháp này phù hợp và có tính khả thi cao cho việc áp dụng vào thực tế các ra đa cảnh giới với tính năng phát hiện, bám bắt đồng thời nhiều mục tiêu. Sơ đồ chức năng của ra đa có mạng nơ- ron chỉ đảm nhiệm chức năng nhận dạng mục tiêu được mô tả trên Hình 1.17.
- 4 Hình 1.17. Mạng nơ-ron học sâu nhận dạng mục tiêu ra đa. Luận án lựa chọn hướng tiếp cận mạng nơ-ron học sâu chỉ đảm nhận chức năng nhận dạng mục tiêu để nghiên cứu. 1.1.4. Tập dữ liệu ra đa Trình bày thống kê các tập dữ liệu ra đa gán nhãn đã được công bố trên thế giới. Các tập dữ liệu này chủ yếu được xây dựng từ ra đa điều tần tuyến tính liên tục (FMCW: Frequency Modulated Continuous Wave) cự ly nhỏ trang bị trên hệ thống hỗ trợ lái tự động hoặc ảnh mục tiêu của ra đa tổng hợp mặt mở (SAR: synthetic aperture radar). Trong số các tập dữ liệu đã được công bố, tập dữ liệu RAD-DAR là tập hợp các mẫu mục tiêu ra đa trên miền cự ly – tần số Doppler được trích xuất từ ra đa FMCW cự ly hoạt động đến 3 km. Tập dữ liệu này phù hợp với định hướng nghiên cứu của luận án. Luận án sẽ sử dụng tập dữ liệu RAD-DAR để huấn luyện, đánh giá mô hình mạng nơ-ron và các giải pháp cải tiến đề xuất. 1.2. Tình hình nghiên cứu bài toán nâng cao chất lượng nhận dạng mục tiêu ra đa ứng dụng mạng nơ-ron học sâu 1.2.1. Tình hình nghiên cứu ngoài nước Trong những năm gần đây, đề xuất các giải pháp nâng cao độ chính xác của mô hình là hướng nghiên cứu chính trong lĩnh vực nhận dạng mục tiêu ra đa ứng dụng mạng nơ-ron học sâu. Các nghiên cứu chính để nâng cao độ chính xác mô hình mạng nơ-ron bao gồm: - Nghiên cứu các cấu trúc mạng nơ-ron tích chập phù hợp; - Nghiên cứu cải tiến hàm mất mát; - Nghiên cứu tăng cường dữ liệu; - Nghiên cứu tiền xử lý dữ liệu đầu vào. 1.2.2. Tình hình nghiên cứu trong nước
- 5 Vấn đề áp dụng trí tuệ nhân tạo vào tuyến xử lý tín hiệu đang bắt đầu được đẩy mạnh triển khai. Tuy nhiên, chưa có nhiều công trình nghiên cứu trong nước ở lĩnh vực này được công bố. Các kết quả công bố trong nước chỉ dừng ở mức độ nghiên cứu lý thuyết hoặc mô phỏng. 1.3. Đề xuất hướng nghiên cứu của luận án Luận án tổng hợp các kết quả nghiên cứu bài toán nhận dạng mục tiêu ra đa ứng dụng trí tuệ nhân tạo và đưa ra một số vấn đề còn tồn tại như: - Số lượng các tập dữ liệu ra đa gán nhãn đã được công bố là ít, đặc biệt là đối với các ra đa quân sự; - Còn ít các công trình nghiên cứu trong nước về lĩnh vực nhận dạng mục tiêu ra đa; - Vấn đề tăng xác suất nhận dạng đúng cho lớp mục tiêu quan trọng chưa được đề cập đến trong các công trình nghiên cứu; - Chưa có công trình nghiên cứu nào tiến hành giải quyết triệt để bài toán lọc nhiễu với yêu cầu bảo tồn các vùng ảnh đặc trưng mục tiêu; - Giải pháp tăng thêm số lượng ảnh cho tập dữ liệu ra đa ít được đề cập trong các công trình nghiên cứu. Chưa có công trình nghiên cứu nào tiến hành tăng cường ảnh cho tập dữ liệu RAD-DAR. Trên cơ sở phân tích các vấn đề còn tồn tại, những vấn đề chính luận án xác định sẽ tập trung giải quyết bao gồm: 1) Nghiên cứu, đề xuất một cải tiến trong hàm mất mát Focal Loss áp dụng cho các mô hình mạng nơ-ron học sâu trong quá trình huấn luyện nhằm nâng cao xác suất nhận dạng đúng với mục tiêu Flycam trong tập dữ liệu RAD-DAR. 2) Nghiên cứu đề xuất bộ lọc nhiễu không gian thích nghi tự động thay đổi kích thước cửa sổ trượt đảm bảo khả năng lọc nhiễu và bảo tồn các vùng ảnh mang thông tin đặc trưng của mục tiêu. 3) Nghiên cứu, đề xuất bộ sinh dữ liệu giả lập ảnh mục tiêu ra đa của tập dữ liệu RAD-DAR theo cấu trúc mạng GAN. Hình 1.27 Mô hình RINet luận án đề xuất và các bước so sánh, đánh giá.
- 6 Luận án đề xuất một mô hình mạng nơ-ron học sâu RINet là tổng hợp của các giải pháp nâng cao chât lượng như: cấu trúc CNN phù hợp, điều chỉnh nhân trọng số hàm mất mát Focal Loss, áp dụng thuật toán lọc nhiễu và sử dụng mạng sinh đối nghịch GAN để tăng cường dữ liệu. Cấu trúc của mô hình đề xuất của luận án và các bước tiến hành so sánh đánh giá với các mô hình khác đã được công bố trên cùng tập dữ liệu được mô tả như trên hình 1.27 1.4. Kết luận chương 1 Chương 1 của luận án bao gồm các nội dung chính như sau: - Khảo sát, phân tích các dấu hiệu đặc trưng trong tín hiệu phản xạ mục tiêu ra đa làm cơ sở nhận dạng mục tiêu. - Phân tích, đánh giá các phương pháp nhận dạng mục tiêu ra đa: phương pháp truyền thống và phương pháp học sâu. - Khảo sát các tập dữ liệu ra đa gán nhãn cho bài toán nhận dạng mục tiêu theo phương pháp học sâu đã được công bố trên thế giới, trình bày tổng quan về tập dữ liệu RAD-DAR. - Khảo sát, phân tích tình hình nghiên cứu trong và ngoài nước bài toán tự động nhận dạng mục tiêu ra đa. Từ các kết quả đó, luận án đã đưa ra các vấn đề còn tồn tại và xác định những nội dung chính mà luận án sẽ tập trung giải quyết. Các đề xuất nâng cao chất lượng nhận dạng mục tiêu ra đa được trình bày tại Chương 2, 3, và 4 của luận án. CHƯƠNG 2. ĐỀ XUẤT MẠNG NƠ-RON HỌC SÂU RINET VÀ GIẢI PHÁP NHÂN TRỌNG SỐ HÀM MẤT MÁT FOCAL LOSS NÂNG CAO CHẤT LƯỢNG NHẬN DẠNG MỤC TIÊU 2.1. Đặt vấn đề Chương 2 luận án sẽ đề xuất hàm mất mát mới sử dụng trong quá trình huấn luyện mạng nơ-ron nhằm tăng xác suất nhận dạng đúng với mục tiêu Flycam so với các mục tiêu khác trong tập dữ liệu RAD-DAR. Hàm mất mát này là sự điều chỉnh của hàm mất mát Focal Loss. Luận án cũng đề xuất xây dựng mô hình mạng nơ-ron học sâu để tiến hành các bước thực nghiệm và kiểm chứng. Mô hình mạng nơ-ron học sâu này được xây dựng dựa trên việc khảo sát và đánh giá các cấu trúc CNN khác nhau trong một số mô hình đã được công bố trên cùng tập dữ liệu RAD-DAR. 2.2. Kỹ thuật học sâu ứng dụng cho bài toán nhận dạng mục tiêu ra đa Trình bày các kiến thức liên quan trong lĩnh vực học sâu, các tiêu chuẩn so sánh đánh giá các mô hình mạng nơ-ron và thông tin cấu hình phần mềm, phần cứng tiến hành cài đặt các thử nghiệm trong luận án này.
- 7 2.3. Đề xuất mô hình mạng nơ-ron học sâu nhận dạng mục tiêu ra đa trên ảnh cự ly – tần số Doppler của tập dữ liệu RAD-DAR 2.3.1. Đề xuất cấu trúc mô hình RINet Luận án đã đề xuất một mô hình học sâu nhận dạng mục tiêu trên tập dữ liệu RAD-DAR, gọi là mô hình RINet (Residual Iception Network). Hình 2.7 là minh họa cấu trúc của mô hình RINet đề xuất. Cấu trúc mô hình đề xuất là sự kết hợp của kết nối tắt Residual và Inception. Tầng trích xuất đặc trưng bao gồm các khối Residual-Inception (R-I Block), các khối này nối tiếp nhau. Số lượng các khối R-I Block trong mô hình đề xuất được xác định thông qua kết quả thực nghiệm. Mỗi khối R-I Block bao gồm 3 mô đun Residual-Inception (R-I Component) kết nối song song với nhau. Kết quả đầu ra của 3 mô đun này được hợp nhất ở lớp xếp chồng Concatnate. Mỗi mô đun R-I Component bao gồm 2 bộ tích chập song song. Số bộ lọc của các bộ tích chập là 32, kích thức bộ lọc của 2 nhánh tích chập tương ứng là 1*k và k*1 (bộ lọc 1 chiều). Kích thước bộ lọc k trong Mỗi mô đun R-I Component lần lượt là 3, 5, 7 giúp trích lọc thông tin đa dạng trên những vùng đặc trưng mục tiêu có kích thước khác nhau. Hình 2.7. Cấu trúc mô hình mạng RINet đề xuất 2.3.2. Đánh giá hiệu quả của cấu trúc CNN mô hình RINet Kết quả thực nghiệm so sánh mô hình RINet và các mô hình DopplerNet, CNN-32DC, RINN và MobileNetV2 ở trên hình 2.11. Mô hình RINet luận án đề xuất có hiệu năng tốt nhất với các tham số: kích thước mô hình 1,382 triệu tham số, độ chính xác 94,36% và thời gian dự đoán 7,6 ms.
- 8 Hình 2.11. So sánh chất lượng của mô hình đề xuất với các mô hình khác trên cùng tập dữ liệu. Luận án tiến hành so sánh các mô hình RINet với số lượng các khối R-I Block lần lượt là 1, 2, 3, 4, 5 như mô tả trên Bảng 2.3. Mô hình RINet có 1 khối R-I Block là tốt nhất với độ chính xác nhận dạng là 94,36%, kích thước mô hình là 1,382 triệu tham số, thời gian nhận dạng là 7,6 ms. Bảng 2.3: So sánh mô hình RINet số lượng các khối R-I Block khác nhau Số khối R-I Các tiêu chí so sánh Block mô Độ chính xác Kích thước (triệu Thời gian tính hình RINet (%) tham số) toán (ms) 1 94,36 1,382 7,6 2 94,55 1,409 10,8 3 94,61 1,436 15,6 4 94,57 1,465 21,19 5 94,59 1,494 33,18 2.4. Đề xuất nhân trọng số hàm mất mát Focal Loss nhằm nâng cao xác suất nhận dạng đúng mục tiêu Flycam 2.4.1. Hàm mất mát và phương pháp tối ưu Trình bày về vai trò của hàm mất mát trong quá trình huấn luyện mạng nơ-ron. 2.4.2. Hàm mất mát Cross Entropy Trình bày về hàm mất mát Cross Entropy. 2.4.3. Hàm mất mát Focal Loss Trình bày về hàm mất mát Focal Loss
- 9 2.4.4. Đề xuất nhân trọng số hàm mất mát Focal Loss Điều chỉnh hàm mất mát là một giải pháp để khắc phục tình trạng mất cân bằng dữ liệu và cũng là 1 phương pháp hiệu quả để nâng cao chất lượng nhận dạng mục tiêu ra đa của mô hình mạng nơ-ron. Với mục tiêu nâng cao xác suất nhận dạng đúng đối với lớp mục tiêu Flycam trong tập dữ liệu RAD-DAR, luận án đề xuất điều chỉnh hệ số t trong công thức hàm mất mát Focal Loss thành biểu thức mô tả trong công thức (2.24). Hàm mất mát Focal Loss nhân trọng số luận án đề xuất sử dụng để huấn luyện mô hình RINet được mô tả ở công thức (2.25), ký hiệu là Weighted Focal Loss (WFL). wt t = N , (2.24) w t =1 t wt WFL( pt ) = − N (1 − pt ) log( pt ) , (2.25) w t =1 t 2.4.5. Đánh giá hiệu quả của việc nhân trọng số hàm mất mát Focal Loss Trong phần này luận án đã tiến hành cài đặt mô hình đề xuất RINet và sử dụng 3 hàm mất mát là hàm Cross Entropy, Focal Loss, và hàm Focal Loss nhân trọng số. Hàm Focal Loss nhân trọng số được khởi tạo tập giá trị ưu tiên [w1, w2, w3] tương ứng với 3 loại mục tiêu: ô tô, Flycam, người đi bộ là [1, 3, 1]. Tham số độ chính xác nhận dạng của từng mục tiêu và tham số độ chính xác trung bình được tính toán trên tập dữ liệu kiểm tra như mô tả trên bảng 2.4. Bảng 2.4: So sánh độ chính xác của mô hình RINet với các hàm mất mát khác nhau. Độ chính xác nhận dạng Hàm mất mát Trung bình Ô tô Người đi bộ Flycam Cross Entropy 94.36% 94.13% 95.20% 93.75% Focal Loss 95.87% 95.62% 96.58% 95.41% Focal Loss nhân 95.75% 94.11% 94.32% 98.83% trọng số Khi sử dụng hàm mất mát Focal Loss nhân trọng số, xác suất nhận dạng đúng mục tiêu Flycam là cao nhất đạt 98.83% tăng 5.08% so với hàm mất mát Cross Entropy và tăng 3.42% so với hàm mất mát Focal Loss. Trong khi đó, chỉ số nhận dạng chính xác trung bình cả 3 mục tiêu là 95.75 chỉ thấp hơn 0.12% so với kết quả khi sử dụng hàm mất mát Focal Loss.
- 10 2.5. Kết luận Chương 2 Tóm lại, những đóng góp chính trong chương 2 của luận án bao gồm: 1. Phân tích, so sánh, đánh giá các mô hình mạng nơ-ron khác nhau nhận dạng mục tiêu trên tập dữ liệu RAD-DAR. 2. Trên cơ sở so sánh các mô hình đó, luận án đề xuất một mô hình mạng nơ-ron học sâu RINet để nhận dạng mục tiêu ra đa trên ảnh cự ly – tần số Doppler trong bộ dữ liệu RAD-DAR. Mô hình RINet có tầng CNN kết hợp của cấu trúc Residual – Inception với 3 nhánh tích chập song song với kích thước các bộ lọc tương ứng là 3, 5,7, và sử dụng các bộ lọc một chiều. 3. Đề xuất hàm mất mát mới dựa trên sự điều chỉnh của hàm mất mát Focal Loss. Hàm mất mát này cho phép điều chỉnh hệ số ưu tiên đối với lớp mục tiêu quan trọng. Khi áp dụng hàm mất mát Focal Loss nhân trọng số để huấn luyện mô hình RINet, xác suất phát hiện đúng đối với mục tiêu Flycam cao so với 2 lớp mục tiêu còn lại. Kết quả nghiên cứu trong chương này đã được công bố tại công trình [CT1], [CT2], [CT3] trong danh mục các công trình đã công bố. CHƯƠNG 3. ĐỀ XUẤT GIẢI PHÁP LỌC NHIỄU NÂNG CAO CHẤT LƯỢNG NHẬN DẠNG MỤC TIÊU CỦA MẠNG NƠ-RON HỌC SÂU RINET 3.1. Đặt vấn đề Chương 3 của luận án nghiên cứu tác động của nhiễu đến chất lượng nhận dạng mục tiêu, phương pháp lọc nhiễu và đề xuất sử dụng bộ lọc không gian có điều chỉnh tự động kích thước cửa sổ trượt ASWNF để bảo tồn các đặc trưng sườn, cạnh của mục tiêu trong ảnh ra đa. Kết quả phần thực nghiệm cho thấy, sử dụng tập ảnh đã được loại nhiễu bởi bộ lọc đề xuất giúp nâng cao độ chính xác nhận dạng mục tiêu của các mạng nơ-ron. 3.2. Xây dựng bộ lọc nhiễu cho mô hình mạng nơ-ron RINet 3.2.1. Nhiễu trong ảnh dữ liệu ra đa Trình bày khái niệm về nhiễu trong ảnh mục tiêu ra đa và tác động của nhiễu đến quá trình nhận dạng mục tiêu của mạng nơ-ron. 3.2.2. Vị trí của bộ lọc nhiễu trong mô hình RINet Để làm giảm tác động của nhiễu trong ảnh mục tiêu ra đa đến chất lượng nhận dạng của mạng nơ-ron học sâu, luận án đề xuất áp dụng bộ lọc nhiễu trong mô hình RINet. Vị trí và vai trò của bộ lọc nhiễu được mô trong hình 3.3. Bộ lọc nhiễu được sử dụng cả trong quá trình huấn luyện mô hình và trong quá trình nhận dạng thực tế.
- 11 Hình 3.3 Vị trí, vai trò của bộ lọc nhiễu trong mô hình RINet 3.2.3. Nghiên cứu các giải pháp lọc nhiễu Để làm giảm tác động của nhiễu đến chất lượng nhận dạng mục tiêu ra đa, một số phương pháp lọc nhiễu phổ biến đã được áp dụng để tiến hành lọc nhiễu trong tín hiệu phản xạ về của ra đa. Trong đó, việc sử dụng các bộ lọc thích nghi để triệt nhiễu đã được chứng minh là một trong những phương pháp hiệu quả để triệt nhiễu trong ảnh dữ liệu ra đa. Hình 3.5 Lưu đồ thuật toán bộ lọc thích nghi, (a) lưu đồ thuật toán, (b) code chương trình phần mềm của bộ lọc Kuan. Bản chất của phương pháp lọc nhiễu trắng bằng bộ lọc thích nghi là việc di chuyển một cửa sổ trượt qua từng pixel trong ảnh và áp dụng phép tính toán bằng cách sử dụng các giá trị pixel trong cửa sổ trượt. Pixel trung tâm
- 12 sau đó được thay thế bằng giá trị được tính toán. Cửa sổ trượt được di chuyển dọc theo hình ảnh từng pixel một cho đến khi toàn bộ hình ảnh được quét qua. Quá trình này tạo ra hiệu ứng làm mịn và giảm cường độ của các điểm ảnh nhiễu. Trong nội dung luận án sẽ tiến hành xây dựng 3 bộ lọc Lee, Frost và Kuan để lọc nhiễu trong ảnh radar. Thuật toán của 3 bộ lọc mô tả tương ứng ở công thức (3.1), (3.5) và (3.8). Dout = LM + K *( P − LM ) C (3.1) (− B * S ) D =e (3.5) out K = var( x) / (z 2 n + (1 + n ) var(x)) m 2 2 (3.8) 3.2.4. Các phương pháp bảo tồn vùng ảnh đặc trưng của bộ lọc nhiễu Dấu hiệu đặc trưng của mục tiêu ra đa trong mẫu dữ liệu trên miền cự ly – tần số Doppler được thể hiện ở các điểm ảnh ở biên, cạnh của các vùng ảnh mục tiêu. Vì vậy cần phải nghiên cứu và áp dụng các giải pháp nhằm bảo tồn các vùng ảnh đặc trưng này khi áp dụng các bộ lọc nhiễu. 3.2.5. Đề xuất bộ lọc thích nghi tự động điều chỉnh kích thước cửa sổ lọc cho mô hình RINet Để làm tăng hiệu quả lọc nhiễu trong ảnh đồng thời giảm tác động đến đặc trưng các sườn, cạnh và các vùng ảnh mục tiêu, luận án đề xuất giải pháp tự động điều chỉnh kích thước của cửa sổ trượt các bộ lọc nhiễu không gian thích nghi. Hình 3.12 mô tả nguyên lý hoạt động của giải pháp này, tùy theo khoảng cách từ trung tâm cửa sổ trượt lọc nhiễu đến các pixels cạnh mục tiêu, kích thước cửa sổ lọc sẽ được điều chỉnh theo xu hướng giảm dần khi bộ lọc di chuyển gần đến đến cạnh mục tiêu và ngược lại kích thước cửa sổ sẽ tăng dần khi cửa sổ lọc di chuyển ra xa vùng cạnh. Hình 3.12. Giải pháp tư động điều chỉnh kích thước cửa sổ trượt bộ lọc. Luận án đề xuất bộ lọc nhiễu tự động điều chỉnh kích thước của cửa sổ trượt (sau đây gọi tắt là ASWNF: Adaptive Size Window Noise Filter). Lưu đồ thuật toán của ASWNF luận án đề xuất được mô tả ở Hình 3.13. So với lưu đồ thuật toán của bộ lọc nhiễu không gian thích nghi nguyên bản, bộ lọc ASWNF bổ sung mô đun xác định sườn cạnh trong ảnh, mô đun cập nhật
- 13 kích thước cửa sổ trượt và mô đun xác định điều kiện sườn, cạnh ảnh trong cửa sổ trượt. Hình 3.13 Lưu đồ thuật toán bộ lọc ASWNF đề xuất. Với cơ chế làm việc của bộ lọc nhiễu ASWNF, tại những vùng ảnh không có mục tiêu, kích thước của của sổ trượt bộ lọc nhiễu sẽ lớn hơn giúp việc lọc nhiễu “sạch” hơn. Tại vùng ảnh mang thông tin mục tiêu, kích thước của cửa sổ trượt được điều chỉnh giảm giúp bảo tồn những đặc trưng mục tiêu trong các điểm ảnh đó. Hình 3.14. So sánh ảnh đầu bộ lọc ASWNF đề xuất Hình 3.14 thể hiện kết quả so sánh việc lọc nhiễu trên ảnh đầu ra của bộ lọc nhiễu ASWNF đề xuất và bộ lọc Lee. Trong đó, ảnh (a) là ảnh gốc chưa lọc nhiễu, ảnh (b) là kết qua đầu ra mô đun xác định sườn cạnh, ảnh (c) là ảnh đầu ra bộ lọc ASWNF đề xuất, ảnh (d) là ảnh đầu ra bộ lọc Lee cửa sổ 7*7. Ta thấy rằng, vùng ảnh mục tiêu trong ảnh mục tiêu ra đa đầu ra bộ lọc ASWNF được bảo tồn tốt hơn so với ảnh đầu ra bộ lọc Lee cửa sổ cố định 7*7.
- 14 3.3. Đánh giá hiệu quả của phương pháp đề xuất Hình 3.15 So sánh các ảnh đặc trưng trích xuất từ các lớp tích chập trong trường hợp ảnh đầu vào có nhiễu và không có nhiễu. Hình 3.15 thể hiện các ảnh đặc trưng đầu ra của tẩng tích chập mô hình RINet trong trường hợp ảnh ảnh mục tiêu ra đa chưa lọc nhiễu và ảnh đầu vào đã lọc nhiễu. Khi có nhiễu, ảnh đặc trưng đầu ra của lớp tích chập của mạng nơ-ron có các thành phần nhiễu. Cường độ nhiễu càng lớn, sự tác động của nhiễu đến kết luận nhận dạng mục tiêu càng cao làm giảm độ chính xác nhận dạng mục tiêu của mô hình mạng nơ-ron. Ngược lại, các ảnh đặc trưng của ảnh mục tiêu đã được lọc nhiễu “sạch” hơn làm tăng khả năng nhận dạng đúng mục tiêu. Luận án đã xây dựng quá trình thực nghiệm để đánh giá hiệu quả của phương pháp đề xuất bao gồm: - So sánh hiệu quả các bộ lọc Lee, Kuan và Frost; - So sánh bộ lọc ASWNF đề xuất và các bộ lọc khác. Bảng 3.1. Bảng so sánh kết quả nhận dạng mục tiêu của mô hình RINet trên các tập dữ liệu khác nhau Tập dữ liệu Độ chính xác (%) Sai số (%) Không lọc nhiễu 95,87 7,84 Bộ lọc Lee 98,17 4,08 Bộ lọc Kuan 98,06 4,13 Bộ lọc Frost 97,65 5,47 Bảng 3.1 là kết quả nhận dạng mục tiêu của mô hình RINet khi sử dụng bộ dữ liệu gốc và 3 bộ dữ liệu được lọc nhiễu bằng các bộ lọc Lee, Kuan và Frost. Bảng số liệu cho thấy, việc áp dụng các bộ lọc nhiễu tập dữ liệu mục tiêu ra đa giúp mô hình mạng nơ-ron cải thiện đáng kể chất lượng nhận dạng
- 15 mục tiêu. Trong đó, mô hình RINet đạt độ chính xác cao nhất (98,17%) và sai số thấp nhất (4,08%) khi sử dụng bộ lọc Lee. Luận án so kết quả nhận dạng của mô hình RINet trên các tập dữ liệu lọc nhiễu bởi bộ lọc Lee với các kích thước cửa sổ khác nhau là 3, 5, 7, 9 và bộ lọc ASWNF đề xuất. Kết quả thực nghiệm trên bảng 3.2 chỉ ra rằng áp dụng bộ lọc ASWNF đề xuất giúp mô hình RINet có kết quả nhận dạng mục tiêu tốt nhất: độ chính xác 98,95%, sai số 2,36%. Bảng 3.2. So sánh kết quả nhận dạng với dữ liệu đầu ra bộ lọc Lee với các kích thước cửa sổ khác nhau và bộ lọc ASWNF. Bộ lọc nhiễu Độ chính xác (%) Sai số (%) Bộ lọc Lee 3x3 98,17 4,08 Bộ lọc Lee 5x5 98,34 3,78 Bộ lọc Lee 7x7 98,57 2,61 Bộ lọc Lee 9x9 96,14 10,33 Bộ lọc nhiễu ASWNF 98,95 2,36 Để đánh giá hiệu quả của bộ lọc ASWNF, luận án cũng tiến hành so sánh độ chính xác nhận mục tiêu của các mô hình mạng nơ-ron IRNN, DopplerNet và CNN-32DC trên tập dữ liệu lọc nhiễu bởi bộ lọc ASWNF và tập dữ liệu gốc chưa lọc nhiễu. Bảng 3.3. So sánh kết quả nhận dạng mục tiêu của các mô hình mạng nơ- ron khác khi áp dụng bộ lọc nhiễu ASWNF Độ chính xác (%) Mô hình mạng nơ-ron Tập dữ liệu gốc Tập dữ liệu áp dụng bộ lọc ASWNF IRNN 94,34 97,08 DopplerNet 94,23 96,79 CNN-DC32 93,80 96,12 Các kết quả trên bảng 3.3 cũng cho thấy việc áp dụng bộ lọc nhiễu ASWNF giúp các mô hình mạng nơ-ron IRNN, DopplerNet và CNN-32DC cải thiện đáng kể độ chính xác nhận dạng mục tiêu. Cụ thể, độ chính xác nhận dạng mục tiêu của mô hình IRNN, DopplerNet và CNN-DC32 đã được cải thiện tương ứng 2,74%, 2,63% và 2,32%. Hình 3.19 là kết quả huấn luyện và kiểm tra của mô hình mạng nơ-ron RINet trên tập dữ liệu RAD-DAR đã được tiến hành lọc nhiễu theo giải pháp
- 16 ASWNF luận án đề xuất. Trong đó, Hình 3.19 a thể hiện biểu đồ chỉ số độ chính xác, hình 3.19 b là biểu đồ tham số sai số, và hình 3.19 c là ma trận so sánh thể hiện kết quả nhận dạng 3 mục tiêu: người đi bộ, xe ô tô và Flycam. Hình 3.19. Kết quả đánh giá quá trình huấn luyện và kiểm tra của mô hình RINet áp dụng bộ lọc nhiễu ASWNF đề xuất. 3.4. Kết luận Chương 3 Chương 3 của luận án đã tiến hành đánh giá tác động của nhiễu đến chất lượng nhận dạng mục tiêu ra đa của mạng nơ-ron học sâu. Thông qua quá trình nghiên cứu và phân tích các giải pháp lọc nhiễu khác nhau, luận án đã đề xuất một giải pháp lọc nhiễu sử dụng bộ lọc không gian thích nghi kích thước cửa sổ trượt tự động thay đổi ASWNF để tiến hành lọc nhiễu. Kết quả thực nghiệm chỉ ra rằng, các mạng nơ-ron học sâu huấn luyện trên tập dữ liệu đã lọc nhiễu của bộ lọc ASWNF đề xuất đều nâng cao độ chính xác nhận dạng mục tiêu. Trong đó, mô hình RINet đạt kết quả nhận dạng mục tiêu cao nhất là 98,95 % khi áp dụng bộ lọc ASWNF. CHƯƠNG 4. ĐỀ XUẤT PHƯƠNG PHÁP SINH ẢNH MỤC TIÊU RA ĐA SỬ DỤNG MẠNG SINH ĐỐI NGHỊCH GAN 4.1. Đặt vấn đề Chương 4 của luận án trình bày về các giải pháp tăng cường ảnh cho các tập dữ liệu ra đa và đề xuất xây dựng mô hình mạng nơ-ron có cấu trúc mạng sinh đối nghịch GAN để tăng cường dữ liệu ảnh cho tập dữ liệu ảnh mục tiêu ra đa trên miền cự ly - tần số Doppler RAD-DAR. Kết quả phân tích và thực nghiệm cho thấy tập ảnh tạo ra bởi mô hình luận án đề xuất có tính tương đồng cao so với tập ảnh gốc và giúp nâng cao độ chính xác nhận dạng mục tiêu của mô hình mạng nơ-ron. 4.2. Phương án đề xuất 4.2.1. Tổng quan bài toán tăng cường dữ liệu ảnh mục tiêu ra đa
- 17 Trình bày tổng quan giải pháp tăng cường dữ liệu ảnh mục tiêu ra đa nhằm nâng cao chất lượng nhận dạng mục tiêu của mô hình mạng nơ-ron. 4.2.2. Các giải pháp tăng cường dữ liệu ảnh mục tiêu ra đa Để tăng cường cho các tập dữ liệu ra đa, các nhà nghiên cứu thường áp dụng các phương pháp sau: - Phương pháp lật theo trục phương vị; - Phương pháp dịch theo trục cự ly; - Phương pháp dịch theo trục phương vị; - Phương pháp cắt chọn ngẫu nhiên; - Phương pháp điều chỉnh cường độ nhiễu và mức tín hiệu nền; - Sử dụng mạng nơ-ron sinh dữ liệu. 4.2.3. Đề xuất mô hình mạng sinh đối nghịch GAN để tăng cường dữ liệu cho cho tập dữ liệu RAD-DAR Hình 4.6. Sơ đồ tổng thể mạng GAN. Hình 4.7. Cấu trúc bộ sinh. Luận án xây dựng một mô hình mạng nơ-ron học sâu có cấu trúc mạng sinh đối nghịch GAN để tăng cường dữ liệu ảnh Range-Doppler của tập dữ liệu tập dataset RAD-DAR (Đặt tên mô hình là RDGenGAN). Đây là mô hình GAN đầu tiên được sử dụng để sinh các ảnh giả lập trên miền cự ly – tần số Doppler của tập dữ liệu RAD-DAR. Cấu trúc mô hình GAN bao gồm hai thành phần chính: bộ sinh (Generator) và bộ phân biệt (Discriminator)
- 18 như mô tả trên Hình 4.6. Cấu trúc bộ sinh và bộ phân biệt mô hình RDGenGAN được mô tả trên Hình 4.7 và 4.8. Hình 4.8. Cấu trúc bộ phân biệt. Để lựa chọn tham số tối ưu cho mô hình sinh dữ liệu đề xuất, trong quá trình huấn luyện mô hình RDGenGAN, luận án lưu lại các bộ tham số mô hình sau mỗi 5 chu kỳ huấn luyện (epoch). Các ảnh được tạo ra bởi bộ sinh cũng được lưu lại tương ứng phục vụ cho việc so sánh. Hình 4.9 là các tập hợp 4 ảnh đầu ra của bộ sinh dữ liệu sau số chu kỳ huấn luyện tương ứng là: 5, 10, 15, 20, 25 và 30. Hình 4.9. Ảnh đầu ra bộ sinh sau các chu kỳ huấn luyện khác nhau Các ảnh trên hình 4.9 chỉ ra rằng, chất lượng ảnh đầu ra của bộ sinh ảnh càng ngày càng tăng và giống với các ảnh gốc sau các chu kỳ huấn luyện mạng nơ-ron RDGenGAN. Ảnh dữ liệu đầu ra của bộ sinh với chu kỳ huấn luyện lớn hơn 20 có tính tương đồng cao so với ảnh dữ liệu gốc. Tuy nhiên, khi số Epochs lớn hơn 25, chất lượng ảnh đầu ra bộ sinh có xu hương giảm.

CÓ THỂ BẠN MUỐN DOWNLOAD
-
Tóm tắt Luận án Tiến sĩ Kinh tế: Chiến lược Marketing đối với hàng mây tre đan xuất khẩu Việt Nam
27 p |
335 |
18
-
Tóm tắt Luận án Tiến sĩ Kinh tế: Thúc đẩy tăng trưởng bền vững về kinh tế ở vùng Đông Nam Bộ đến năm 2030
27 p |
387 |
17
-
Tóm tắt Luận án Tiến sĩ Luật học: Hợp đồng dịch vụ logistics theo pháp luật Việt Nam hiện nay
27 p |
439 |
17
-
Tóm tắt Luận án Tiến sĩ Y học: Nghiên cứu điều kiện lao động, sức khoẻ và bệnh tật của thuyền viên tàu viễn dương tại 2 công ty vận tải biển Việt Nam năm 2011 - 2012
14 p |
443 |
16
-
Tóm tắt Luận án Tiến sĩ Triết học: Giáo dục Tư tưởng Hồ Chí Minh về đạo đức cho sinh viên trường Đại học Cảnh sát nhân dân hiện nay
26 p |
302 |
12
-
Tóm tắt luận án Tiến sĩ: Nghiên cứu tối ưu các thông số hệ thống treo ô tô khách sử dụng tại Việt Nam
24 p |
308 |
12
-
Tóm tắt luận án Tiến sĩ Kỹ thuật: Nghiên cứu tính toán ứng suất trong nền đất các công trình giao thông
28 p |
370 |
11
-
Tóm tắt Luận án Tiến sĩ Kinh tế Quốc tế: Rào cản phi thuế quan của Hoa Kỳ đối với xuất khẩu hàng thủy sản Việt Nam
28 p |
328 |
9
-
Tóm tắt luận án Tiến sĩ Kinh tế: Phát triển kinh tế biển Kiên Giang trong tiến trình hội nhập kinh tế quốc tế
27 p |
254 |
8
-
Tóm tắt Luận án Tiến sĩ Xã hội học: Vai trò của các tổ chức chính trị xã hội cấp cơ sở trong việc đảm bảo an sinh xã hội cho cư dân nông thôn: Nghiên cứu trường hợp tại 2 xã
28 p |
296 |
8
-
Tóm tắt Luận án Tiến sĩ Luật học: Các tội xâm phạm tình dục trẻ em trên địa bàn miền Tây Nam bộ: Tình hình, nguyên nhân và phòng ngừa
27 p |
362 |
8
-
Tóm tắt luận án Tiến sĩ Kinh tế: Phản ứng của nhà đầu tư với thông báo đăng ký giao dịch cổ phiếu của người nội bộ, người liên quan và cổ đông lớn nước ngoài nghiên cứu trên thị trường chứng khoán Việt Nam
32 p |
323 |
6
-
Tóm tắt Luận án Tiến sĩ Luật học: Quản lý nhà nước đối với giảng viên các trường Đại học công lập ở Việt Nam hiện nay
26 p |
278 |
5
-
Tóm tắt luận án Tiến sĩ Kinh tế: Các yếu tố ảnh hưởng đến xuất khẩu đồ gỗ Việt Nam thông qua mô hình hấp dẫn thương mại
28 p |
161 |
4
-
Tóm tắt Luận án Tiến sĩ Ngôn ngữ học: Phương tiện biểu hiện nghĩa tình thái ở hành động hỏi tiếng Anh và tiếng Việt
27 p |
275 |
4
-
Tóm tắt Luận án Tiến sĩ Kỹ thuật: Nghiên cứu cơ sở khoa học và khả năng di chuyển của tôm càng xanh (M. rosenbergii) áp dụng cho đường di cư qua đập Phước Hòa
27 p |
151 |
4
-
Tóm tắt luận án Tiến sĩ Kinh tế: Các nhân tố ảnh hưởng đến cấu trúc kỳ hạn nợ phương pháp tiếp cận hồi quy phân vị và phân rã Oaxaca – Blinder
28 p |
176 |
3
-
Tóm tắt luận án Tiến sĩ Kinh tế: Phát triển sản xuất chè nguyên liệu bền vững trên địa bàn tỉnh Phú Thọ các nhân tố tác động đến việc công bố thông tin kế toán môi trường tại các doanh nghiệp nuôi trồng thủy sản Việt Nam
25 p |
319 |
2


Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn
