BỘ GIÁO DỤC VÀ ĐÀO TẠO<br />
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI<br />
<br />
PHẠM THỊ THANH THỦY<br />
<br />
NGHIÊN CỨU VÀ PHÁT TRIỂN CÁC KỸ THUẬT<br />
ĐỊNH VỊ VÀ ĐỊNH DANH KẾT HỢP THÔNG TIN<br />
HÌNH ẢNH VÀ WIFI<br />
<br />
Chuyên ngành: Khoa học Máy tính<br />
Mã số: 62480101<br />
<br />
TÓM TẮT LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH<br />
<br />
Hà Nội−2017<br />
<br />
Công trình được hoàn thành tại:<br />
Trường Đại học Bách khoa Hà Nội<br />
<br />
Người hướng dẫn khoa học:<br />
1. PGS. TS. Lê Thị Lan<br />
2. TS. Đào Trung Kiên<br />
<br />
Phản biện 1: PGS. TS. Ngô Quốc Tạo<br />
Phản biện 2: PGS. TS. Trần Đình Quế<br />
Phản biện 3: PGS. TS. Đỗ Năng Toàn<br />
<br />
Luận án sẽ được bảo vệ trước Hội đồng chấm luận án tiến sĩ<br />
cấp Trường họp tại Trường Đại học Bách khoa Hà Nội:<br />
<br />
Vào hồi..........giờ, ngày.......tháng.......năm.......<br />
<br />
Có thể tìm hiểu luận án tại thư viện:<br />
1. Thư viện Tạ Quang Bửu - Trường ĐHBK Hà Nội<br />
2. Thư viện Quốc gia Việt Nam<br />
<br />
MỞ ĐẦU<br />
Tính cấp thiết của luận án<br />
Công nghệ hiện đại đang làm thay đổi cuộc sống của con người ở nhiều phương<br />
diện khác nhau, trong đó đáng chú ý là cách thức con người tương tác với các sản phẩm<br />
công nghệ. Tương tác người-máy ngày càng trở nên tự nhiên và thân thiện hơn. Một<br />
khái niệm mới được hình thành từ sự thay đổi mang tính cách mạng này đó là Môi<br />
trường cảm thụ AmI (Ambient Intelligent). Mặc dù AmI đã được đề cập từ hơn mười<br />
năm trước và ngày càng có thêm nhiều nghiên cứu chuyên sâu về nó, tuy nhiên, việc<br />
phát triển và thực thi các hệ thống ứng dụng AmI vẫn còn mới mẻ. Có nhiều thách<br />
thức thực tế cần giải quyết trong từng lĩnh vực công nghệ hay các ứng dụng cụ thể có<br />
liên quan tới AmI [1].<br />
Trong nghiên cứu này, chúng tôi quan tâm tới thông tin ngữ cảnh về vị trí và danh<br />
tính của con người trong môi trường tòa nhà. Vị trí và danh tính là hai trong số các<br />
thuộc tính người dùng quan trọng cần được cảm thụ trong môi trường thông minh.<br />
Để có thể xác định vị trí người dùng (người dùng ở đâu trong môi trường) và danh<br />
tính người dùng (người dùng đó là ai), chúng ta cần giải quyết hai bài toán là định<br />
vị và định danh. Để giải quyết hai bài toán này, có thể sử dụng nhiều loại cảm biến<br />
khác nhau, như Ultra-Wideband (UWB), ultrasound, Radio-Frequency Identification<br />
(RFID), camera, WiFi, etc [15]. Tuy nhiên, không có một giải pháp công nghệ đơn lẻ<br />
nào là hoàn hảo trong mọi trường hợp. Do đó, bên cạnh việc phát triển các giải thuật<br />
tối ưu cho từng công nghệ, sử dụng kết hợp các giải pháp đang trở thành một xu hướng<br />
mới trong việc giải quyết bài toán định vị và định danh người dùng trong môi trường<br />
tòa nhà [19], [3], [14], [16]. Mục đích chính của kết hợp là nhằm phát huy được những<br />
ưu điểm của từng công nghệ cảm biến đơn lẻ, trong khi có thể hạn chế những nhược<br />
điểm của chúng. Trong bối cảnh này, nghiên cứu của chúng tôi tập trung giải quyết bài<br />
toán định vị và định danh người sử dụng kết hợp các công nghệ dựa trên cơ sở hình<br />
ảnh và WiFi.<br />
<br />
Các đóng góp của luận án<br />
Đóng góp thứ 1: Đề xuất mô hình hình suy hao cải tiến cho định vị người dùng<br />
<br />
dựa trên WiFi. Trong mô hình này, chúng tôi xem xét tới các ràng buộc vật cản<br />
trong môi trường tòa nhà. Từ đó, có thể mô hình hóa hiệu quả quan hệ giữa<br />
cường độ tín hiệu RSSI với khoảng cách từ thiết bị di động tới các AP lân cận.<br />
Phương pháp lấy dấu vân tay thông dụng cũng được áp dụng cho định vị WiFi,<br />
với một bản đồ vô tuyến mới được thiết lập nhằm tạo dữ liệu vân tay ổn định và<br />
<br />
1<br />
<br />
tin cậy cho định vị. Để đối sánh mẫu thử với dữ liệu vân tay, chúng tôi đề xuất<br />
áp dụng phương pháp KNN, trong đó có bổ sung thêm tham số λ nhằm phản<br />
ánh những thay đổi theo thời gian của dữ liệu dấu vân tay trong môi trường.<br />
Kết quả định vị dựa trên WiFi cho phép kích hoạt các tiến trình định vị tại các<br />
camera thuộc vùng kết quả định vị trả về từ hệ thống WiFi.<br />
Đóng góp thứ 2: Đề xuất các phương pháp hiệu quả cho khử bóng và phát<br />
<br />
hiện người nhằm cải thiện kết quả định vị sử dụng hình ảnh. Đối với khử bóng,<br />
chúng tôi đề xuất sử dụng kết hợp đặc trưng chromaticity và physical cùng với<br />
một sơ đồ kết hợp chỉ số dựa trên mật độ lân cận của phân bố bóng và không<br />
phải bóng ở từng điểm ảnh. Bước khử bóng được xem như bước tiền xử lý nhằm<br />
đạt hiệu quả phát hiện người tốt hơn. Trong bước phát hiện người, chúng tôi sử<br />
dụng kết hợp hai phương pháp trừ nền GMM thích nghi và bộ mô tả-phân lớp<br />
người HOG-SVM. Việc kết hợp này cho phép phát huy được ưu điểm tính toán<br />
nhanh của GMM thích nghi và độ chính xác phát hiện người của HOG-SVM.<br />
Ngoài ra, đối với bộ phát hiện HOG-SVM, chúng tôi xây dựng bộ mô tả HOG<br />
và huấn luyện SVM sử dụng cơ sở dữ liệu chúng tôi thu tại môi trường thực<br />
nghiệm, cùng với cơ sở dữ liệu chuẩn INRIA. Việc huấn luyện trên hai bộ cơ sở<br />
dữ liệu này giúp cải thiện hiệu quả phát hiện người sử dụng HOG-SVM trong<br />
môi trường xem xét.<br />
Đóng góp thứ 3: Áp dụng một bộ mô tả người mạnh dựa trên cơ sở diện mạo<br />
<br />
cho định danh lại người trong các mạng camera. Bộ mô tả được xây dựng trên<br />
từng vùng người được phát hiện. Ba đặc trưng hướng, màu và hình dạng được<br />
trích chọn ở 3 mức điểm ảnh, mẩu ảnh và toàn bộ ảnh vùng người được phát<br />
hiện, sau đó ba hàm nhân đối sánh được tạo ra từ các đặc trưng này. Bộ mô tả<br />
đề xuất đặc biệt hiệu quả đối với ngữ cảnh giám sát người sử dụng nhiều camera,<br />
trong đó tồn tại sự thay đổi đa dạng trong cùng một lớp đối tượng.<br />
Đóng góp thứ 4: Đề xuất một phương pháp kết hợp mới cho hệ thống định vị<br />
<br />
và định danh người đa phương thức kết hợp WiFi và camera. Bằng cách sử dụng<br />
các bước dự đoán và cập nhật trạng thái của bộ lọc Kalman, cùng với giải thuật<br />
gán tối ưu, phương pháp kết hợp đề xuất cho phép bảo lưu độ chính xác định vị<br />
cao của hệ thống định vị người dựa trên hình ảnh. Ngoài ra phương pháp kết hợp<br />
này cho phép theo vết người bằng định danh dựa trên thông tin định danh từ<br />
card WiFi của thiết bị cầm tay, cũng cho phép thực thi tốt hơn việc định danh<br />
lại người giữa các camera.<br />
Ngoài các đóng góp chính nêu trên, trong luận văn này, chúng tôi đề xuất phương<br />
pháp liên kết quỹ đạo người hiệu quả trong mạng camera. Các camera được triển khai<br />
trên một tầng của tòa nhà đều có chung trường quan sát là mặt sàn nơi đối tượng di<br />
<br />
2<br />
<br />
chuyển, do đó, từng cặp camera sẽ tạo thành một thị giác nổi trên một mặt sàn duy<br />
nhất. Sử dụng phương pháp hiệu chỉnh camera cho thị giác nổi, các quỹ đạo chuyển<br />
động của đối tượng trên ảnh thu nhận từ các camera khác nhau có thể chuyển đổi<br />
được thành các vị trí trên hệ tọa độ thế giới thực tương ứng trên một mặt phẳng sàn<br />
duy nhất đó. Ngoài ra, chúng tôi cũng đề xuất một hệ thống giám sát người tự động<br />
hoàn toàn trong môi trường tòa nhà. Hệ thống này phản ánh các bối cảnh giám sát<br />
thực tế ở hầu hết các tòa nhà. Hướng tới việc xây dựng một hệ thống giám sát như<br />
vậy, chúng tôi thực hiện một số thử nghiệm để chứng minh hiệu quả của các phương<br />
pháp đã công bố cho bài toán nhận dạng mặt người, định vị, định danh và định danh<br />
lại người trong một mạng camera.<br />
<br />
Cấu trúc của luận án<br />
Trong luận án này, chúng tôi phát triển các phương pháp định vị và định danh<br />
lại người và đánh giá chúng trong hệ thống kết hợp hình ảnh và WiFi. Luận án gồm 5<br />
chương, với phần giới thiệu mở đầu, phần cuối là kết luận và định hướng nghiên cứu<br />
tiếp theo:<br />
Mở đầu: Giới thiệu chung: tính cấp thiết và mục tiêu nghiên cứu của luận án;<br />
<br />
ngữ cảnh, các ràng buộc và thách thức khi giải quyết các bài toán đặt ra trong<br />
luận án; cấu trúc của luận án và các đóng góp của luận án.<br />
Chương 1: Các công trình có liên quan đến vấn đề nghiên cứu của luận án: định<br />
<br />
vị người dùng sử dụng hệ thống WiFi; định vị người sử dụng camera, định vị<br />
người sử dụng kết hợp hệ thống WiFi và camera; định danh lại người trong mạng<br />
camera.<br />
Chương 2: Giải pháp đề xuất và các đánh giá thử nghiệm cho định vị người dùng<br />
<br />
dựa trên WiFi.<br />
Chương 3: Đề xuất hệ thống định vị người sử dụng hình ảnh với 3 pha chính là<br />
<br />
phát hiện người, theo vết người và định vị người. Đề xuất một số cải tiến cho<br />
từng pha nhằm nâng cao hiệu quả của hệ thống định vị.<br />
Chương 4: Trong bối cảnh giám sát đa camera thời gian thực, các bài toán định<br />
<br />
danh người dựa trên mặt người và định danh lại dựa trên diện mạo người được<br />
đề xuất. Một bộ mô tả hiệu quả được áp dụng cho định danh lại người trong<br />
mạng camera.<br />
Chương 5: Giải pháp kết hợp thông tin WiFi và hình ảnh cho định vị, định danh<br />
<br />
và định danh lại người và các đánh giá thử nghiệm.<br />
Kết luận và định hướng nghiên cứu tiếp theo của luận án.<br />
<br />
3<br />
<br />