intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu, xây dựng mô hình đánh giá, phát hiện hành vi bất thường dựa trên phân tích dữ liệu cảm biến trong điện thoại thông minh

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:50

5
lượt xem
2
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Mục tiêu nghiên cứu của đề tài "Nghiên cứu, xây dựng mô hình đánh giá, phát hiện hành vi bất thường dựa trên phân tích dữ liệu cảm biến trong điện thoại thông minh" này tập trung vào xây dựng mô hình nhằm phát hiện hành vi bất thường trong chuyển động thường ngày từ việc phân tích, sử dụng dữ liệu cảm biến điện thoại.

Chủ đề:
Lưu

Nội dung Text: Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu, xây dựng mô hình đánh giá, phát hiện hành vi bất thường dựa trên phân tích dữ liệu cảm biến trong điện thoại thông minh

  1. ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ──────── * ─────── PHÙNG QUANG LUYỆN NGHIÊN CỨU, XÂY DỰNG MÔ HÌNH ĐÁNH GIÁ, PHÁT HIỆN HÀNH VI BẤT THƯỜNG DỰA TRÊN PHÂN TÍCH DỮ LIỆU CẢM BIẾN TRONG ĐIỆN THOẠI THÔNG MINH LUẬN VĂN THẠC SĨ Ngành: Công nghệ thông tin HÀ NỘI – 2021
  2. ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ──────── * ─────── PHÙNG QUANG LUYỆN NGHIÊN CỨU, XÂY DỰNG MÔ HÌNH ĐÁNH GIÁ, PHÁT HIỆN HÀNH VI BẤT THƯỜNG DỰA TRÊN PHÂN TÍCH DỮ LIỆU CẢM BIẾN TRONG ĐIỆN THOẠI THÔNG MINH LUẬN VĂN THẠC SĨ NGÀNH: Công nghệ thông tin Cán bộ hướng dẫn: PGS. TS. NGUYỄN HÀ NAM HÀ NỘI – 2021 2
  3. LỜI CAM ĐOAN Với mục đích học tập, nghiên cứu để nâng cao kiến thức và trình độ chuyên môn nên chúng tôi đã làm luận văn này một cách nghiêm túc và hoàn toàn trung thực. Trong luận văn chúng tôi có sử dụng một số tài liệu tham khảo của một số tác giả và có chú thích, nêu ra trong phần tài liệu tham khảo ở cuối luận văn. Chúng tôi xin cam đoan và chịu trách nhiệm về nội dung và sự trung thực trong luận văn tốt nghiệp Thạc sĩ của mình. Hà Nội, ngày tháng 12 năm 2021 Phùng Quang Luyện 3
  4. LỜI CẢM ƠN Lời đầu tiên, tôi xin chân thành cảm ơn các thầy cô giáo trong trường Đại Học Công Nghệ - Đại học Quốc Gia Hà Nội, đặc biệt là các thầy cô của khoa Công Nghệ Thông Tin đã truyền đạt cho tôi những kiến thức, kinh nghiệm vô cùng quý báu trong suốt thời gian qua. Tôi xin gửi lời cảm ơn đến PGS.TS. Nguyễn Hà Nam - Viện nghiên cứu Cao cấp về Toán cùng nhóm nghiên cứu của thầy là thầy Nguyễn Đức Nhân, anh Lê Hồng Lam đã tận tình giúp đỡ, trực tiếp chỉ bảo và hướng dẫn trong suốt quá trình làm luận văn. Cuối cùng, tôi xin được cảm ơn đến gia đình, bạn bè đã động viên, đóng góp ý kiến và giúp đỡ trong quá trình học tập, nghiên cứu và hoàn thành luận văn. Do thời gian, kiến thức và kinh nghiệm của tôi còn hạn chế nên khóa luận không thể tránh khỏi những sai sót. Tôi hy vọng sẽ nhận được những ý kiến nhận xét, góp ý của các thầy cô giáo và các bạn để luận văn được hoàn hiện hơn. Luận văn này được hoàn thành dựa trên sự hỗ trợ của dự án QG.19.47 - Đại học Quốc gia Hà Nội (ĐHQGHN). Tôi xin chân thành cảm ơn! Hà Nội, ngày tháng 12 năm 2021 Phùng Quang Luyện 4
  5. MỤC LỤC LỜI CAM ĐOAN ................................................................................................. 3 LỜI CẢM ƠN....................................................................................................... 4 MỤC LỤC ............................................................................................................ 5 DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT .......................................... 7 DANH MỤC HÌNH VẼ ....................................................................................... 8 DANH MỤC BẢNG BIỂU .................................................................................. 9 MỞ ĐẦU ............................................................................................................ 10 CHƯƠNG 1: TỔNG QUAN VỀ NHẬN DẠNG HÀNH ĐỘNG ..................... 13 1.1. Giới thiệu ................................................................................................. 13 1.2. Khái niệm cơ bản về hành động, hành vi và hành vi bất thường ............ 13 1.3. Các phương pháp phát hiện hành vi bất thường ...................................... 15 1.4. Phương pháp đề xuất và nghiên cứu trong luận văn ............................... 17 1.5. Kết luận ................................................................................................... 18 CHƯƠNG 2: CƠ SỞ LÝ THUYẾT................................................................... 19 2.1. Giới thiệu ................................................................................................. 19 2.2. Tổng quan về Phân lớp ............................................................................ 20 2.2.1. Một số thuật toán phân lớp cơ bản ................................................... 20 2.2.2. Đánh giá mô hình phân lớp .............................................................. 24 2.3. Tổng quan về so khớp chuỗi ................................................................... 28 2.3.1. Giới thiệu .......................................................................................... 28 2.3.2. Một số thuật toán so khớp ................................................................ 30 2.4. Kết chương .............................................................................................. 32 CHƯƠNG 3: MÔ HÌNH PHÁT HIỆN HÀNH VI BẤT THƯỜNG ................. 33 3.1. Mô hình tổng quan .................................................................................. 33 3.1.1. Pha thứ nhất là tạo mô hình phát hiện hành động ............................ 34 3.1.2. Pha thứ hai là nhận dạng hành vi ..................................................... 38 3.2. Thực nghiệm và phân tích kết quả .......................................................... 39 3.2.1. Dữ liệu .............................................................................................. 39 5
  6. 3.2.2. Cấu hình hệ thống............................................................................. 40 3.2.3. Kết quả thực nghiệm ........................................................................ 40 3.3. Kết chương .............................................................................................. 45 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ......................................................... 47 TÀI LIỆU THAM KHẢO .................................................................................. 49 6
  7. DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Ký hiệu viết tắt Thuật ngữ đầy đủ Giải thích CNN Convolutional Neural Network Mạng nơ-ron tích chập RF Random Forest Thuật toán Rừng ngẫu nhiên SVM Support Vector Machine Thuận toán máy vector hỗ trợ HAR Human Action Recognitio Nhận dạng hành động của con người IOT Internet of Things Internet vạn vật KNN K-Nearest Neighbors Thuật toán K láng giềng gần nhất ACC Accelerometer Gia tốc kế GYRO Gyroscope Con quay hồi chuyển Mẫu mang nhãn dương bị FN False Negative phân lớp sai vào lớp âm Mẫu mang nhãn âm bị phân FP False Positive lớp sai vào lớp dương Mẫu mang nhãn âm được TN True Negative phân lớp đúng vào lớp âm Mẫu mang nhãn dương được TP True Positive phân lớp đúng vào lớp dương 7
  8. DANH MỤC HÌNH VẼ Hình 1.1 Hệ thống phát hiện hành động bằng phân tích hình ảnh từ camera .... 16 Hình 1.2 Mô hình phát hiện hành động sử dụng camera và sensor ................... 16 Hình 2.1 Mô hình phân lớp KNN ....................................................................... 22 Hình 2.2 Phân lớp theo không gian vector ......................................................... 23 Hình 2.3 Mô hình cây quyết định ....................................................................... 24 Hình 2.4 Cách tính giá trị độ đo đánh giá mô hình phân lớp ............................. 26 Hình 2.5 Đường cong ROC ................................................................................ 27 Hình 3.1 Mô hình tổng quan phát hiện hành vi bất thường ............................... 33 Hình 3.2 Dữ liệu ba trục X, Y, Z của cảm biến theo thời gian .......................... 35 Hình 3.3 Cửa sổ trượt dữ liệu ............................................................................. 36 Hình 3.4 Sơ đồ tổng quát nhận dạng từng hành động ........................................ 37 Hình 3.5 Dữ liệu theo trục thời gian của hành động phức ................................. 45 8
  9. DANH MỤC BẢNG BIỂU Bảng 3.1: Mô tả tính tỷ lệ so khớp giữa cửa sổ W và W’ .................................. 38 Bảng 3.2: Mô tả dữ liệu của các hành động con người ...................................... 40 Bảng 3.3: Kết quả phân lớp các hành động ........................................................ 42 Bảng 3.4: Tổng hợp Accuracy của các hành động theo độ dài cửa sổ W .......... 42 Bảng 3.5: Kết quả kiểm tra mô hình chạy với bộ dữ liệu bất thường ................ 43 Bảng 3.6: Kết quả kiểm tra mô hình chạy với bộ dữ liệu bình thường .............. 44 Bảng 3.7: Tỷ lệ đoán nhầm khi chỉ sử dụng bộ phân lớp theo cửa sổ W........... 44 9
  10. MỞ ĐẦU Lý do chọn đề tài Cũng như nhiều nước trên thế giới, tại Việt Nam đang chứng kiến sự gia tăng mạnh về dân số người cao tuổi cũng như tình trạng các bệnh lý điển hình của người cao tuổi như tim mạch, cao huyết áp... có thể dẫn tới đột quỵ và hậu quả kéo theo vô cùng nghiêm trọng. Vấn đề được đặt ra là làm thế nào chúng ta có thể phát hiện hành vi bất thường có thể gây nguy hiểm của người già nhằm thông báo hoặc cảnh báo. Đã có những nghiên cứu nhằm phát hiện hành vi như là hành vi ngã của người già để đưa ra cảnh báo như đề cập ở trên tuy nhiên chưa có nghiên cứu nào về nhận diện hành vi bất thường có thể xảy ra từ việc phân tích dữ liệu cảm biến chuyển động trên điện thoại thông minh. Hành vi bất thường được xem là hành vi gồm hoạt động hay mẫu hoạt động khác các hoạt động được chấp nhận bình thường. Trong phạm vi giới hạn của đề tài, hành vi bất thường trong chuyển động được xem bao gồm hoạt động ngã và các mẫu chuyển động bất thường có khả năng dẫn đến ngã. Một cách cụ thể, mô hình xây dựng sẽ xem xét đến không chỉ phát hiện ngã mà còn cả những hành vi di chuyển bất thường dẫn đến khả năng ngã để đưa ra cảnh báo phù hợp chứ không chỉ cảnh báo sau khi ngã đã xảy ra. Với mô hình ngăn chặn ngã thường gặp nhiều thách thức do cần phát hiện và nhận dạng được các mẫu hành vi có thể dẫn đến ngã. Để thực hiện được mục tiêu đặt ra đề tài sẽ cần giải quyết nhiều thách thức cụ thể từ việc thu thập dữ liệu cảm biến cho phù hợp đến xử lý và phân tích dữ liệu. Với mỗi bài toán cụ thể trong đề tài thì các phương pháp thực hiện cũng sẽ được thay đổi cho phù hợp để đạt được hiệu quả cao nhất. Dữ liệu thu thập sẽ được lấy từ các cảm biến chuyển động như gia tốc và con quay hồi chuyển, đây cũng là các cảm biến có mặt ở hầu hết tất cả các dòng điện thoại thông minh hiện nay. Một thách thức khác là nhận diện được đúng các mẫu hành vi bất thường liên quan đến ngã khi chỉ sử dụng dữ liệu cảm biến trên điện thoại thông minh. Có nhiều yếu tố tác động dẫn đến khả năng ngã và có thể được phân thành các yếu tố bên trong liên quan đến hành vi, trạng thái 10
  11. sức khỏe con người và các yếu tố bên ngoài liên quan đến môi trường. Việc nhận diện được càng nhiều các mối liên kết giữa các yếu tố này sẽ càng giúp xác định được rõ mức độ rủi ro dẫn đến ngã. Với chỉ dữ liệu thu từ các cảm biến chuyển động trên điện thoại thông minh thì yếu tố môi trường không được xác định sẽ tạo ra thách thức lớn để đánh giá được mức độ rủi ro ngã. Do vậy, việc cần thiết là phải xác định được rõ các pha đặc trưng trong dáng đi, qua đó xác định được các tham số đặc trưng cho từng pha và sự biến đổi các tham số đó theo thời gian ảnh hưởng đến khả năng ngã. Trong mô hình hệ thống nhận diện hành vi bất thường cũng cần xem xét các phương pháp trích xuất đặc trưng khác nhau: trích rút đặc trưng miền thời gian, trích rút đặc trưng miền tần số. Xác định được tập các đặc trưng tiêu biểu sẽ có vai trò vô cùng quan trọng cho phép thuật toán phân loại có thể nhận diện các mẫu hành vi bất thường với độ chính xác cao trong bối cảnh hoạt động sống hàng ngày tại nước ta Một trong những vấn đề cấp thiết đặt ra là dự đoán được hành vi bất thường so với hành động hằng ngày của con người. Và đó cũng là lý do chúng tôi quyết định chọn đề tài: “Nghiên cứu, xây dựng mô hình đánh giá, phát hiện hành vi bất thường dựa trên phân tích dữ liệu cảm biến trong điện thoại thông minh”. Mục tiêu của luận văn Mục tiêu nghiên cứu của đề tài này tập trung vào xây dựng mô hình nhằm phát hiện hành vi bất thường trong chuyển động thường ngày từ việc phân tích, sử dụng dữ liệu cảm biến điện thoại. Cấu trúc luận văn Luận văn có bố cục gồm 3 chương chính: Chương 1: Tổng quan về nhận dạng hành động Chương này giới thiệu tổng quan về bài toán, các hướng nghiên cứu tương tự hoặc trong cùng lĩnh vực. Đề xuất giải pháp và hướng nghiên cứu của luận văn. Chương 2: Cơ sở lý thuyết. 11
  12. Chương này giới thiệu về khai phá dữ liệu, các kĩ thuật khai phá dữ liệu cụ thể các là kỹ thuật phân lớp dữ liệu, lý thuyết tổng quan về so khớp dữ liệu, các phương pháp đánh giá hiệu quả và độ chính xác của thuật toán. Chương 3: Mô hình phát hiện hành vi bất thường Chương này sẽ trình bày việc áp dụng các mô hình phân lớp, kỹ thuật so khớp để phát hiện hành vi bất thường. Cuối cùng là một số kết luận và hướng phát triển trong tương lai. 12
  13. CHƯƠNG 1: TỔNG QUAN VỀ NHẬN DẠNG HÀNH ĐỘNG 1.1. Giới thiệu Phát hiện vận động bất thường của con người là lĩnh vực nhận được nhiều sự quan tâm của cộng đồng nghiên cứu vì đây là lĩnh vực có nhiều ý nghĩa trong thực tế như hỗ trợ cho người mất trí nhớ, theo dõi người bệnh đột quỵ, theo dõi chăm sóc người vận động bất thường v.v... Vận động bất thường được xem là các hoạt động mà con người không có chủ ý và thường gây ra những hậu quả xấu đối với chủ thể. Một người bị ngã trong khi đang làm việc nhà hoặc một cú trượt chân do đường trơn trượt là các ví dụ về vận động bất thường. Những vận động bất thường này khi xảy ra sẽ gây nguy hiểm cho con người (đặc biệt là người cao tuổi). Trong những trường hợp như vậy, nếu có một hệ thống phát hiện và đưa ra những cảnh báo hoặc tự động kết nối đến người trợ giúp sẽ hạn chế được các rủi ro cũng như giảm thiểu các hậu quả do vận động bất thường đến con người. Hơn nữa, với sự phát triển nhanh chóng của các thiết bị điện tử có cảm biến, kết nối vạn vật (IOT) ngày càng có sẵn trên thị trường với giá thành rẻ. Chính vì vậy trong nghiên cứu này chúng tôi tiếp cận bài toán phát hiện hành vi bất thường dựa trên cảm biến của điện thoại thông minh [1]. 1.2. Khái niệm cơ bản về hành động, hành vi và hành vi bất thường Hành động là việc làm cụ thể của con người nhằm mục đích nhất định. Hành vi (danh từ) là toàn bộ nói chung những phản ứng, các cư xử biểu hiện ra bên ngoài của một người trong một hoàn cảnh cụ thể. Hành vi bất thường của con người là những phản ứng hoặc cách cư xử khác với bình thường bị tác động bởi các yếu tố khách quan hoặc chủ quan trong cuộc sống thường ngày [2][3]. 13
  14. Việc nhận biết được các loại hành động, hành vi của con người là cơ sở để đánh giá hành vi đó là bình thường hoặc bất thường. Thông thường, các hành động được phân biệt dựa vào hai thay đổi cơ bản đó là thay đổi vận tốc và thay đổi hướng di chuyển. Từ đó, có thể đưa ra một số hành động thường gặp đó là hành động đi bộ, đứng, chạy bộ, nhảy, ngồi xuống, lên cầu thang, ngồi trên ghế, đứng lên, bước vào xe, bước ra xe với các tính chất và mức độ khác nhau. Trong hệ thống phân tích, việc định nghĩa và nhận dạng các hành động tùy thuộc vào mục đích, yêu cầu của từng bài toán, dựa trên đánh giá tính chất, mức độ của các hành động đó trong những hoàn cảnh, điều kiện cụ thể để giải quyết yêu cầu đặt ra. Với mục đích nghiên cứu của mình, luận văn này chỉ tập trung vào một số hành động cơ bản liên quan đến hoạt động thường ngày đó là: - Đứng: đứng với một vài cử động nhẹ nhàng - Đi bộ: đi bộ bình thường - Chạy bộ - Nhảy: nhảy liên tục - Lên cầu thang - Xuống cầu thang - Ngồi xuống - Ngồi trên ghế - Đứng lên: từ ngồi chuyển sang đứng - Bước vào xe ô tô - Ra khỏi xe ô tô Từ sự phân tích, đánh giá tính chất của mỗi hành động cơ bản này để phân tích, nhận dạng được hành vi bất thường ví dụ như hành động ngã. Sự bất thường của một hành vi có thể được hiểu là những phản ứng hay việc thực hiện hành động theo những trạng thái không bình thường khi có các yếu tố khách quan, chủ quan tác động đến đối tượng trong quá trình hoạt động. Việc nhận biết, phân biệt được loại hành động và hành vi bất thường là điều kiện cơ sở cho các hệ thống, ứng dụng vào những dịch vụ khác nhau nhằm 14
  15. thông tin, phản hồi, điều chỉnh hành động của cá nhân với các mục đích như giảm tránh những nguy cơ tiềm ẩn hoặc có thể hỗ trợ xây dựng, phát triển các hệ thống mô phỏng, giám sát, quản lý đặc biệt là trong y học về theo dõi, cảnh báo nguy hiểm có thể say ra đối với từng người. 1.3. Các phương pháp phát hiện hành vi bất thường Đã có rất nhiều nghiên cứu trong vấn đề nhận dạng hành động của con người (HAR) [4] trong đó các phương pháp nghiên cứu phát hiện hành vi bất thường thường được tiếp cận theo các phương pháp như: phân tích hình ảnh hoạt động của người bằng camera hay còn gọi thị giác máy (computer vision), phân tích dữ liệu cảm biến từ các bộ cảm biến được tích hợp vào môi trường hoặc vật dụng (pervasive sensing) và phân tích dữ liệu cảm biến từ các bộ cảm biến được đeo trên người (wearable sensing) hay là phân tích dữ liệu trên cảm biến của điện thoại thông minh. Trong giới hạn của luận văn chúng tôi xin trình bày một số phương pháp phổ biến và có kết quả khả quan: Hệ thống phát hiện hành động bằng phân tích hình ảnh từ camera. Theo nghiên cứu của nhóm tác giả Ricardo Espinosa, Hiram Ponce, Sebastián Gutiérrez [5] nhóm đã phân tích phát hiện hành động ngã bằng ứng dụng mạng Neural (CNN) phân tích hình ảnh từ nhiều camera khác nhau. Việc ứng dụng trí tuệ nhân tạo và thị giác máy tính trong việc nhận biết hành vi của con người đó chính là sử dụng kỹ thuật học sâu nhằm phân tích hình ảnh trong khung cửa sổ thời gian cố định, trích xuất các tính năng bằng phương pháp luồng quang học để thu được thông tin về chuyển động tương đối giữa hai hình ảnh liên tiếp. kết quả của nhóm nghiên cứu cũng rất khả quan cho kết quả nhận dạng hành động ngã với tỷ lệ chính xác là 95,64% với một mạng Neural đơn giản. 15
  16. Hình 1.1 Hệ thống phát hiện hành động bằng phân tích hình ảnh từ camera Một nghiên cứu khác đó là sự kết hợp của phân tích hình ảnh camera và các sensor khác nhau để phát hiện hành động [5]. Trong nghiên cứu này nhóm tác giả đã sử dụng 6 cảm biến đeo tại 6 vị trí khác nhau của con người kèm theo hình ảnh của 02 camera được bố trí cách sàn 1.82m cho khung nhìn rộng như hình trên. Nghiên cứu cho kết quả với độ chính xác là 82.47% (số hành động nhận dạng trong nghiên cứu bao gồm 5 hành động ngã, và 6 hoạt động bình thường). Hình 1.2 Mô hình phát hiện hành động sử dụng camera và sensor Một hướng nghiên cứu khác cũng được đưa ra đó là sử dụng cảm biến rung với khả năng phân biệt các hoạt động thông qua các rung động được sử dụng trong nghiên cứu của Alwan và cộng sự. Cảm biến này được thiết lập trên sàn để phát hiện ngã với tỷ lệ lên đến 100%. Rimminen và đồng sự [5] lại sử 16
  17. dụng cảm biến điện từ trong các tấm trải sàn để tạo ra hình ảnh của các vật thể chạm vào sàn nhà, qua đó có thể phát hiện ngã. Họ đạt được tỷ lệ phát hiện thành công lên đến 91%. Ngoài ra chúng tôi tham khảo một số hướng nghiên cứu phương pháp tiếp cận phát hiện hành động có liên quan sử dụng thiết bị đeo được khác như một số nghiên cứu của Adnan Nadeem và công sự [6] đã xây dựng tập dữ liệu sử dụng cảm biến đo lường quán tính và điện tâm đồ có thể đeo được để nhận dạng hoạt động, phát hiện ngã và hệ thống phát hiện bất thường về tim cơ bản. Yan Wang và cộng sự [7] đã thực hiện một cuộc khảo sát về phương thức cảm biến có thể đeo được trên cổ tay tập trung vào việc ghi nhận hoạt động chăm sóc sức khỏe của con người... Với các phương pháp trên chúng ta có thể thấy rằng các phương pháp nghiên cứu có chi phí triển khai cao, thiết lập trên một diện tích lớn trong môi trường theo dõi. Hai phương pháp đầu đều phụ thuộc vào việc phân tích dữ liệu hình ảnh hoặc kết hợp phân tích hình ảnh và dữ liệu cảm biến để nhận dạng hành động. Hạn chế của các phương pháp là có thể gây ra sự xâm lấn không gian riêng tư và việc phát hiện vận động bất thường thường bị giới hạn trong một phạm vi là vùng quan sát được của camera hoặc các cảm biến được tích hợp vào môi trường, số lượng thiết bị phải trang bị nhiều, các sensor đeo tại nhiều vị trí khác nhau của con người gây nên sự khó khăn trong triển khai thực tế… Mặt khác, các phương pháp trên tác giả và công sự nghiên cứu với giới hạn số lượng hành động nhận dạng, cũng như giới hạn hành vi bất thường nhận dạng được của hệ thống. 1.4. Phương pháp đề xuất và nghiên cứu trong luận văn Với cách tiếp cận sử dụng các cảm biến có thể thực hiện theo dõi hành vi người dùng liên tục trong một thời gian dài, các cảm biến cũng không gây ra cảm giác mất quyền riêng tư cho người dùng, ít chịu tác động của môi trường như ánh sáng, vật cản… Vì vậy, luận văn đã phát triển theo hướng nghiên cứu 17
  18. phát hiện hành vi bất thường bằng cách phân tích dữ liệu của cảm biến và cụ thể ở đây là cảm biến gia tốc của con quay hồi chuyển trên điện thoại thông minh. Với việc dữ liệu mẫu về hành vi bất thường là rất ít, mặt khác có rất nhiều hành vi mà chúng ta chưa tính toán tới vì vậy để nhận dạng chính xác hành vi bất thường đó là hành vi gì (ví dụ ngã khi đứng dậy), đây là một vấn đề rất khó khăn cho hướng nghiên cứu. Chính vì vậy luận văn đã đi theo một hướng khác đó là luận văn sẽ phát triển theo hướng phân tích hành vi bình thường của con người như chạy, nhảy, đi bộ, đứng, ngồi… từ hoạt động thường ngày hệ thống sẽ nhận dạng và khi không nhận dạng được hành động này thì hệ thống sẽ cảnh báo đó là hành vi bất thường. Để thực hiện nghiên cứu thì dữ liệu sẽ được thu thập từ dữ liệu cảm biến của điện thoại với các hành động bình thường được ghi lại nhãn của các hành động (các hành động ghi dữ liệu đó là “đứng, đi bộ, chạy bộ, nhảy, lên cầu thang, xuống cầu thang, ngồi xuống, ngồi trên ghế, đứng lên, bước vào xe ô tô, ra khỏi xe ô tô”). Thông qua các phương pháp học máy kết hợp khai phá dữ liệu, ứng dụng lý thuyết so khớp từ đó xây dựng mô hình phát hiện hành động (mô hình cụ thể của luận văn được mô tả chi tiết tại Chương 3 của luận văn này). 1.5. Kết luận Trong chương này, chúng tôi đã tìm hiểu, khảo sát bài toán và các nghiên cứu liên quan đến bài toán nhận dạng hành vi. Làm rõ một số khái niệm cơ bản về hành động, hành vi, hành vi bất thường trong cuộc sống của con người. Tìm hiểu phương pháp, kỹ thuật phân tích, nhận dạng hành vi, đặc biệt là hướng tiếp cận sử dụng dữ liệu cảm biến điện thoại thông minh thu được của người. 18
  19. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 2.1. Giới thiệu Để giải quyết bài toán đặt ra, luận văn sử dụng các phương pháp khai phá dữ liệu (data mining), kết hợp với các kỹ thuật phân tích để kết quả của mô hình đề xuất tối ưu. Khai phá dữ liệu là quá trình khám phá và phân tích khối lượng lớn dữ liệu để tìm ra các mẫu dữ liệu và quy tắc có ý nghĩa. Khai phá dữ liệu là một trong những lĩnh vực nghiên cứu khoa học dữ liệu, khai thác và sử dụng các dữ kiện, thông tin có giá trị từ dữ liệu để phục vụ đưa ra dự báo, quyết định trong tương lai. Các phương pháp khai phá dữ liệu bao gồm: Phân lớp (Classification): Là quá trình xử lý tìm kiếm một tập hợp các mô hình (hoặc chức năng) mô tả và phân biệt các lớp hoặc khái niệm dữ liệu, nhằm mục đích có thể sử dụng mô hình để dự đoán lớp của các đối tượng mà nhãn lớp chưa biết. Mô hình được xác định phụ thuộc vào việc thông tin dữ liệu huấn luyện. Dự đoán (Prediction): Dự đoán có thể được xem như việc xây dựng và sử dụng một mô hình để đánh giá loại của một đối tượng không được gắn nhãn hoặc để đánh giá giá trị hoặc phạm vi giá trị của một thuộc tính mà một đối tượng nhất định có khả năng có. Phân cụm (Clustering): Là một phương pháp mà trong đó nó mô tả dữ liệu theo một cách xác định hữu hạn các cụm để mô tả dữ liệu. Các đối tượng được phân cụm dựa trên nguyên tắc tối đa hóa sự tương đồng giữa các lớp và giảm thiểu sự tương tự giữa các lớp. Hồi quy (Regression): Là một phương pháp mô hình thống kê, trong đó dữ liệu thu được trước đó được sử dụng để dự đoán một đại lượng liên tục cho các quan sát mới. Bộ phân loại này còn được gọi là Bộ phân loại giá trị liên tục. Có hai loại mô hình hồi quy: Mô hình hồi quy tuyến tính và mô hình hồi quy nhiều tuyến tính. 19
  20. Mạng neural nhân tạo (Artificial Neural network): Là phương pháp hoặc mô hình dựa trên mạng nơron sinh học. Chúng được sử dụng để mô hình hóa mối quan hệ giữa đầu vào và đầu ra và được sử dụng để phân loại, phân tích hồi quy, xử lý dữ liệu. Ngoài ra còn một số phương pháp khác khai phá dữ liệu như dựa trên phương pháp phát hiện ngoại vi (Outlier Detection), thuật toán di truyền (Genetic Algorithm) v.v. Trong giới hạn của luận văn Chương 2 của luận văn sẽ đi tìm hiểu chi tiết một số phương pháp phân lớp dữ liệu, tìm hiểu độ đo nhằm đánh giá kết quả của các phương pháp, đồng thời giới thiệu về kỹ thuật so khớp dữ liệu để kết hợp với các bước phân lớp dữ liệu đưa ra đánh giá cũng như tăng hiệu quả của mô hình đề xuất. 2.2. Tổng quan về Phân lớp Như phần trên đã giới thiệu, phân lớp dữ liệu là một phương pháp chính của khai phá dữ liệu. Từ thực tế đặt ra với một cơ sở dữ liệu chúng ta có thể trích rút ra các quyết định phục vụ cho quyết định hay dự đoán xu hướng dựa trên phân lớp dữ liệu. Cụ thể trong luận văn sử dụng giải pháp phân lớp dữ liệu để nhận dạng hành động từ đó làm cơ sở phát hiện hành vi bất thường trong hoạt động hằng ngày của con người. 2.2.1. Một số thuật toán phân lớp cơ bản Trong mô hình phân lớp, thuật toán phân lớp giữ vai trò quan trọng, quyết định tới sự thành công của mô hình phân lớp. Do vậy, với mỗi tính chất của bài toán khác nhau thì việc tìm được một thuật toán phân lớp hiệu quả, chính xác và bảo đảm được tốc độ xử lý cũng như khả năng mở rộng là một vấn đề quyết định. Sau đây là một số các kỹ thuật phân lớp đã được ứng dụng phố biến: 2.2.1.1. Bộ phân lớp Bayesian (Bayesian classifier) Bộ phân lớp Bayes [8] là một giải thuật thuộc lớp giải thuật thống kê, nó dự đoán xác suất của một phần tử dữ liệu thuộc vào một lớp. Phân lớp Bayes 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2