Cải tiến lược đồ Camshift trong Open CV

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:3

Thêm vào BST

Báo xấu

17
lượt xem 5
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết trình bày việc cải tiến lược đồ CamshiIt trong Open C9. Thuật toán này được phát triển từ thuật toán MeanshiIt, bao gồm thuật toán cơ sở MeanshiIt với thích ứng các bước thay đổi kích cỡ của vùng.

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: Cải tiến lược đồ Camshift trong Open CV

Hội nghị Quốc gia lần thứ 23 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2020) Cải tiến lược đồ Camshift trong Open CV Nguyễn Thị Trang1, ũ ăn Hiệu và Nguyễn Đức Toàn3 1 Trường Đại học Hạ Long 2 Khoa Công nghệ thông tin - Trường Đại học Công Nghiệp Hà Nội 3 Khoa Công nghệ thông tin - Trường Đại học Tài Nguyên và Môi Trường Hà Nội Email: nguyenthitrang.daihochalong@gmail.com, hieuvv@fit haui.edu.vn,ndtoan@hunre.edu.vn Abstract Trong bài báo này, chúng tôi cải tiến lược đồ chúng ta phát hiện sai do nhiễu gây ra ta có thể dùng Camshi t trong Open C . Thuật toán này được phát ngưỡng thích hợp. Nếu độ sai khác lớn hơn ngưỡng thì cho triển từ thuật toán Meanshi t, bao gồm thuật toán cơ sở ra giá trị bằng 1ngược lại cho ra giá trị không. Nếu ngưỡng Meanshi t với thích ứng các bước thay đ i kích c của quá lớn, pixel thuộc đối tượng có thể lẫn với nền, nếu vùng. Nh n là một hàm step đơn giản n m trong một bản đồ vỏ xác suất (skin probability). ỏ xác suất của ngưỡng quá nhỏ, thì sự thay đổi ánh sáng trong môi trường mỗi một điểm ảnh được tính toán dựa trên màu sắc b ng sẽ tạo ra nhiều pixel có giá trị 1, mà các điểm này lại không cách sử dụng một phương pháp gọi là Histogram phải là điểm thuộc đối tượng. Sau khi xử lý ngưỡng ta thu backpro ection. Màu sắc được đưa ra như Hue từ mô được ảnh nhị phân chỉ gồm các pixel với hai trạng thái 0 và hình màu HS . Trong bài báo này chúng tôi dùng thuật 1. Quá trình phân đoạn ảnh thành từng đối tượng riêng rẽ toán CamShi t đ được cải tiến trong Open C để dễ được thực hiện thông qua thuật toán đánh nhãn liên tiếp. dàng thích ứng với sự thay đ i ph n bố xác suất màu sắc Quá trình này sẽ tạo ra vô số đối tượng khác nhau, trong đó của mục tiêu theo d i. chỉ có một số đối tượng gần với đối tượng cần quan tâm. Một quá trình quét tiếp theo sẽ được thực hiện để loại bỏ các Keywords- Thuật toán Camshi t, thuật toán eanshi t, pen C , istogram đối tượng không hợp lý so với đối tượng mẫu. Việc còn lại là xác định vị trí trọng tâm của mục tiêu trên ảnh tương đối I. GI I THI U đơn giản, thông qua xác định momen bậc nhất. Kể từ nhân Nhận dạng mục tiêu di động là bước đầu tiên là một hàm step, Mean Shift ở mỗi một lần lặp thì chỉ đơn và quan trọng trong hệ robot tự động nhận dạng và tìm giản là giá trị trung bình x và y của vỏ xác suất đóng góp kiếm mục tiêu di động. Mục đích của quá trình này là trong vùng hiện tại. Điều này được xác định bằng cách chia thực hiện các phép xử lý ảnh để tìm kiếm đối tượng moment thứ nhất của vùng này cho moment thứ không ở cần quan tâm, xác định vị trí của nó trong mặt ph ng mỗi lần lặp và dịch chuyển vùng đến trọng tâm xác suất. ảnh hiện thời. Trong quá trình tìm kiếm ta chia tập hợp Sau khi Mean Shift hội tụ đến một vị trí (x,y), phạm vi của các pixel của mặt ph ng ảnh ra làm hai thành phần: vùng được cập nhật dựa trên giá trị hiện tại của moment thứ Hoặc là thuộc đối tượng hoặc là thuộc nền. Sau đây ta 0. Giá trị của bản cập nhật này có thể thay đổi, phạm vi sẽ xem xét việc tìm kiếm các pixel thuộc đối tượng tuyến tính của nó được giả định là tỉ lệ thuận với căn bậc 2 trong chuỗi ảnh thu về. của tổng của các khoản đóng góp xác suất của khu vực hiện Có rất nhiều cách để nhận dạng một đối tượng: khi biết tại (ví dụ. Moment thứ không). Chiều rộng và chiều dài tại trước chính xác đặc điểm của đối tượng cần nhận dạng thời điểm thứ i sẽ được tính thông qua giá trị tại thời điểm ta có thể áp đặt toàn bộ mô hình của đối tượng (màu thứ i-1, nghĩa là giá trị trước nên phương pháp chính được sắc, hình dáng) lên toàn bộ ảnh từ đó tìm ra vị trí của giới thiệu trong bài báo này là thuật toán Camshift. Thuật đối tượng trong ảnh. Phương pháp này có ưu điểm đơn toán này đặc biệt hiệu quả với ảnh thu được từ camera là giản, dễ thực hiện nhưng lại không hiệu quả trong thực ảnh màu và đối tượng cần phát hiện và bám có màu sắc đặc tế. Một phương pháp nhanh hơn, hiệu quả hơn và áp trưng riêng so với nền. dụng rất hiệu quả đối với ảnh đen trắng là phương II. C S TO N H C pháp so sánh.Phương pháp này dựa trên đặc điểm các pixel thuộc nền thì cường độ sáng ít thay đổi hoặc nếu thay đổi thì rất nhỏ còn các pixel thuộc đối tượng 2.1. Cơ sở toán h c của thuật toán Camshift. cường độ sáng thay đổi lớn. Như vậy một phép so sánh Thuật toán CamShift [8] được xuất phát và dựa giữa các pixel trong ảnh hiện thời với ảnh trước đó trên nền tảng của thuật toán MeanShift, do vậy việc tính được thực hiện.Nếu camera tĩnh, sự thay đổi ánh sáng trọng tâm của đối tượng và dịch chuyển cửa sổ tìm kiếm của môi trường rất nhỏ và nhiễu không đáng kể thì một (với kích thước cửa sổ cố định) sẽ thực hiện bằng MeanShift pixel thuộc nền nếu độ sai khác bằng 0 và ngược lại sẽ [6], dựa theo vết màu và moment ảnh. tưởng chính của thuộc đối tượng. Tuy nhiên trong thực tế các điều kiện CamShift là tính lại trọng tâm của đối tượng dựa vào frame trên khó có thể xảy ra, do đó để loại bỏ các điểm mà ảnh trước đó và kích thước của cửa sổ tìm kiếm được thay đổi động theo đối tượng. Nhân là một hàm step đơn giản ISBN: 978-604-80-5076-4 313
Hội nghị Quốc gia lần thứ 23 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2020) nằm trong một bản đồ vỏ xác suất (skin-probability). Tìm vị trí mục tiêu của ảnh với vị trí y0 với ảnh hiện tại Vỏ xác suất của mỗi một điểm ảnh được tính toán dựa trên màu sắc bằng cách sử dụng một phương pháp gọi đang xét: là Histogram backprojection. Màu sắc được đưa ra như p ( y0 ), q k 1... n Hue từ mô hình màu HSV. Kể từ nhân là một hàm step, Tính theo công thức: Mean Shift ở mỗi một lần lặp thì chỉ đơn giản là giá trị n trung bình x và y của vỏ xác suất đóng góp trong vùng p ( y0 ), q pk ( y0 )qn (1) hiện tại. Điều này được xác định bằng cách chia k moment thứ nhất của vùng này cho moment thứ không ở mỗi lần lặp và dịch chuyển vùng đến trọng tâm xác Bước 2: Tính tr ng số i suất. Sau khi Mean Shift hội tụ đến một vị trí (x,y), n phạm vi của vùng được cập nhật dựa trên giá trị hiện qk tại của moment thứ 0. Giá trị của bản cập nhật này có i (b( xi ).k ) (2) k 0 pk ( y0 ) thể thay đổi, phạm vi tuyến tính của nó được giả định là tỉ lệ thuận với căn bậc 2 của tổng của các khoản Bước 3: Tính vị trí tiếp theo đóng góp xác suất của khu vực hiện tại (ví dụ. Moment thứ không). Chiều rộng và chiều dài tại thời điểm thứ i n 2 sẽ được tính thông qua giá trị tại thời điểm thứ i-1, y0 xi xi i .g ( ) nghĩa là giá trị trước đó. i h Trong thuật toán CamShift, một bức ảnh về xác suất y1 2 (3) phân bố màu sắc của bức ảnh trong chuỗi video được n y0 xi tạo ra. Đầu tiên nó tạo ra một mẫu mô tả hue sử dụng i .g ( ) một biểu đồ màu sắc (color Histogram) và sử dụng i h không gian màu Hue Saturation Value (HSV) được tham chiếu từ không gian màu tiêu chu n RGB. Vì Bước 4: Tính vị trí ảnh ở vị trí mới phân bố màu sắc của các bức ảnh trong video thay đổi theo thời gian, nên thuật toán CamShift đã được sửa p1 ( y1 ) k 1... n đổi để dễ dàng thích ứng với sự thay đổi phân bố xác n suất màu sắc của mục tiêu nó theo dõi. 2.2 . Các bước thực thi thuật toán Camshift: p1 ( y1 ), q1 pk ( y1 )qn (4) Các bước thực thi thuật toán Camshift: k 0 B1: Chọn vị trí ban đầu của cửa sổ tìm kiếm. Bước 5: So sánh vị trí ảnh c và ảnh ở vị trí mới. Nếu: B2: Thuật toán Meanshift (lặp một hoặc nhiều lần), lưu moment thứ 0. n n B3: Kích cỡ của cửa sổ tìm kiếm được đặt bằng một p ( y0 ), q p k ( y0 ) q n p ( y1 ), q pk ( y ) qn hàm của moment thứ 0 vừa tìm được trong bước 2. k 1 1 k 1 B4: Lặp lại bước 2 và bước 3 cho đến khi hội tụ (nghĩa thì tính: là vị trí dịch chuyển nhỏ hơn ngưỡng thiết lập trước y1 y0 đó). y1 2.3. Thuật toán Camshift 2 Đầu tiên là một Histogram được tạo ra, Histogram này chứa các thuộc tính liên quan đến màu sắc. Sau khi tạo Bước 6: Kiểm tra ra histogram, tiếp theo tâm và kích cỡ của mục tiêu 2 được tính toán để theo dõi mục tiêu khi hình dạng và y0 xi kích cỡ của nó thay đổi. Tính xác suất phân bố mục h tiêu căn cứ vào Histogram nhận được. Dịch chuyển đến vị trí mới với mỗi khung hình vừa nhận được từ video. Camshift sẽ dịch chuyển đến vị trí mà nó ước Thỏa mãn: y1 y0 thì dừng lại. lượng trên đối tượng tập trung nhiều điểm sáng nhất Nếu: trong bức ảnh xác suất. 2 III. C I TI N LƯ C Đ CAMSHIFT TRONG y0 xi OPEN CV. h 3.2.1. Cải tiến lược đ Camshift Thỏa mãn: y1 y0 thì đặt y0 y1 Bước 1: Khởi tạo Sau đó tính: ISBN: 978-604-80-5076-4 314
Hội nghị Quốc gia lần thứ 23 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2020) n T I LI U THAM KH O qk i (b( xi ).k ) [1] A. Mittal and M. Paragios (2004). Motion Based Background k 0 pk ( y0 ) Subtraction using Adaptive Kernel Density Estimation. pp. 302- Cho đến khi thỏa mãn: 309. n 1 n 1 [2] Artner (2008). A Comparison of Mean Shift Tracking Methods. ( xi .g i ) Digital Media, Upper Austria University of Applied Sciences. i i [3] C. Zhang, Y. Qiao, E. Fallon, and C. u (2009). An improved k 0 y 0 camshift algorithm for target tracking in video surveillance. In Proceedings of 9th. IT and T Conference, number 12. 3.2.2. Đánh giá độ phức tạp của thuật toán [4] D. Beymer and Konolige K (2001). Tracking people from a Vị trí cần tìm được xác định như sau: mobile platform. In IJCAI-2001 Workshop on Reasoning with Uncertainty in Robotics. S arg max sp ( 0) [5] R. Lienhart, J. Maydt (2002). An Extended Set of aar like Với: Features for Rapid Object Detection. Intel Labs, Intel Corporation, Santa Clara, CA 95052, USA. p ( 0) p ( c 0) p ( s 0) [6] J. MacCormick and A. Blake (1999). A probabilistic Có thể dùng phương pháp vét cạn. Tuy nhiên sễ mất exclusion principle for track ing multiple objects. InProc. of 7th nhiều thời gian tính toán. Độ phức tạp của thuật toán International Conference on Computer Vision (ICCV), pages s 572 587. đề xuất là: O ( 2 ) với s là tổng thành phần của S. [7] Y. Freund, and R. Shapire (1995). A decision theoretic Thuật toán tìm vị trí generali ation of on line learning and an application to boosting. Proceedings of the Second European Conference on S' S s p ( cs 0 ) Computational Learning Theory. pp. 23-37. S arg max p ( c s 0 ) [8] Y.Cheng (1995). Mean Shift, Mode Seeking, and Clustering. s s' IEEE Transactions on Pattern Analysis and Machine Intelligence, Temp True vol. 17, no. 8. August. While (Temp ) do Sa Si S' S S Si là vùng liên thông S arg max S Sa p S S 0 Sr arg max S Sr p S S i là vùng liên thông S arg max S Sr p S S0 if p S S 0 p S S 0 and p S S 0 p S 0 then S S S 0 Else if p S S 0 p S 0 then S S -S 0 Else Temp False End if End hile IV. K T LU N Trong lược đồ đề xuất nếu khi tính sai vị trí thì bộ phận phát hiện và nhận dạng đối tượng sẽ liên tục tìm đối tượng trên ảnh (bước 3,4,5) cho đến khi phát hiện và giải thuật CamShift tiếp tục thực hiện cho đến khi tìm đúng vị trí cần thực hiện ở bước tiếp theo. Lược đồ cải tiến sẽ tìm vị trí mới bắt đầu từ vị trí trước đó và tính toán giá trị trọng tâm vừa tìm được. Lược đồ cải tiến đều có thư viện các hàm tính toán trong OpenCV. ISBN: 978-604-80-5076-4 315