intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Ứng dụng thuật toán phân loại cây quyết định J48 trong nhận dạng cảm xúc

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:3

11
lượt xem
2
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết Ứng dụng thuật toán phân loại cây quyết định J48 trong nhận dạng cảm xúc trình bày các nội dung: Nguyên lý của thuật toán cây quyết định; Xây dựng định dạng dữ liệu cây quyết định; Kết quả tương phản với Đại học Augsburg.

Chủ đề:
Lưu

Nội dung Text: Ứng dụng thuật toán phân loại cây quyết định J48 trong nhận dạng cảm xúc

  1. Journal of educational equipment: Applied research, Volume 2, Issue 305 (January 2024) ISSN 1859 - 0810 Ứng dụng thuật toán phân loại cây quyết định J48 trong nhận dạng cảm xúc Đào Việt Anh* *ThS. Công nghệ thông tin, Trường Đại học Hải Phòng Received: 03/01/2024; Accepted: 10/01/2024; Published: 16/01/2024 Abstract: Physiological signals are external expressions of emotions. Mood changes can be expressed by changes in physiological signals. Because these performances are not controlled by the individual's subjective consciousness, the conclusions will be more objective and correct. The method based on statistical features is difficult to describe the complex changes of physiological signals, so the J48 decision tree is used to train and identify the chaotic characteristics of physiological signals in article. It has many advantages in solving multi-class or classification problems, such as high accuracy, fast classification speed, and simple classification rules. The chaotic feature matrices include the extracted chaotic feature parameters, which are combined with the J48 decision tree classifier to recognize four different emotions. The results show that emotion recognition of physiological signals based on chaos theory is feasible. Keywords: Physiological signals, emotion recognition, chaos, decision trees 1. Đặt vấn đề thống nhận dạng cảm xúc dựa trên các tín hiệu sinh Có nhiều loại nhận dạng cảm xúc, bao gồm nhận lý. Dữ liệu thực nghiệm được sử dụng trong bài viết dạng cảm xúc của các tín hiệu sinh lý, cơ thể, khuôn này được lấy từ phòng thí nghiệm của trường đại học mặt và giọng nói [1]. Kết quả bị ảnh hưởng chủ TP.HCM Augsburg ở Đức quan bởi những cá nhân được thử nghiệm dễ bị tổn 2. Nội dung nghiên cứu thương, không thể quan sát được cảm xúc thực sự. 2.1. Lựa chọn bộ phân loại Tín hiệu sinh lý của người được kiểm tra không bị Trình phân loại được sử dụng để thay đổi ánh xạ cá nhân điều khiển chủ quan mà bị tác động bởi cảm hỗn loạn thành một danh mục nhất định, dựa trên bài xúc mà những dao động tâm trạng nhỏ cũng có thể toán phân tích cảm xúc của nhiều tín hiệu sinh lý có gây ra những thay đổi về tín hiệu sinh lý. Chúng ta có thể được chuyển thành bài toán phân loại trong nhận thể nghiên cứu các tín hiệu sinh lý ở những thông số dạng mẫu. đặc trưng nhất định để nhận biết dưới nhiều cảm xúc Nhiều vấn đề phân loại trong dữ liệu thực tế khác nhau. Nhiều tín hiệu sinh lý của phân tích tình thường không tuân theo phân phối chuẩn và không cảm được thực hiện bằng cách phân tích các tham số thể phân tách tuyến tính. Bộ phân loại tuyến tính đơn đặc trưng hoặc sự kết hợp của các tham số đặc trưng, giản thường sẽ mang lại sai số phân loại lớn hơn, khi tìm kiếm xem liệu có mối quan hệ ánh xạ tương ứng đó cần sử dụng bộ phân loại phi tuyến tính. Trình giữa chúng và các trạng thái cảm xúc khác nhau hay phân loại cây quyết định J48 phù hợp hơn với điều không. Tín hiệu sinh lý chứa nhiều thông tin. Thông kiện tập huấn luyện có lượng dữ liệu lớn hơn. Nó qua việc phân tích thông tin có thể hiểu rõ hơn về cơ có khả năng xử lý tốt dữ liệu mặc định và dữ liệu có chế bên trong của các hiện tượng sống khác nhau. nhiễu và có độ chính xác phân loại cao hơn. Ngoài Trong chẩn đoán lâm sàng điều trị bệnh và người ra, phù hợp với điều kiện việc phán đoán các yếu tố khuyết tật có thể được đào tạo phục hồi chức năng. tương đối ít hơn, đồng thời mối quan hệ logic kết Giáo sư Phòng thí nghiệm Truyền thông MIT hợp không phức tạp. Do dữ liệu lấy mẫu của các Picard[2]. Phòng thí nghiệm đại học Augsburg T tham số đặc tính hỗn loạn được sử dụng trong bài Đức[3], thu thập các đối tượng giống nhau trong bốn viết này nhiều hơn và dữ liệu riêng lẻ là mặc định tín hiệu sinh lý do âm nhạc gây ra dưới các trạng nên hệ số phán đoán của không gian ký tự về vectơ thái cảm xúc khác nhau(tín hiệu điện cơ、Tín hiệu đặc tính hỗn loạn ít hơn, mối quan hệ tổ hợp logic điện da và tín hiệu hô hấp).Năm 2004, KH Kim, SW không phức tạp, do đó, bộ phân loại cây quyết định Bang và SR Kim [4] của Hàn Quốc đã phát triển hệ J48 được sử dụng để phân loại các cảm xúc khác 65 Journal homepage: www.tapchithietbigiaoduc.vn
  2. Journal of educational equipment: Applied research, Volume 2, Issue 305 (January 2024) ISSN 1859 - 0810 nhau trong bài viết này. đưa ra trong bài viết này, có 100 trường hợp trong 2.2. Nguyên lý của thuật toán cây quyết định toàn bộ không gian trường hợp và có 25 trường hợp Cây quyết định [5] chia không gian đặc trưng cho mỗi cảm xúc(vui sướng、sự tức giận、sự sầu thành nhiều vùng, trong mỗi vùng, nếu một loại mẫu nảo、 vinh hạnh). Đường thẳng đứng gọi là thuộc chiếm ưu thế thì các mẫu đó có thể được đánh dấu tính, tương đương với các biến trong thống kê. Có bằng nhãn danh mục. năm thuộc tính trong hình, bốn thuộc tính đầu tiên Thuật toán C4.5[6] có thể khắc phục được nhược là thuộc tính số, tương ứng là số mũ Lyapunov tối điểm khi thuộc tính được chọn có xu hướng thuộc đa, thứ nguyên tương quan, entropy gần đúng và độ tính được chọn nhiều hơn,nó cũng có thể xử lý rời phức tạp của bốn tham số đặc tính hỗn loạn. Cái cuối rạc cho thuộc tính liên tục, nó cũng có thể xử lý dữ cùng là thuộc tính nhãn, đại diện cho từng thể hiện liệu chứa giá trị bị thiếu. Thuật toán C4.5 là thuật thuộc danh mục, cứ 25 mẫu có nhãn phân loại lần toán cốt lõi của cây quyết định J48 được sử dụng lượt là vui, giận, buồn, vui. Nếu giá trị bị thiếu là trong bài báo này. Có thể nói đây là việc triển khai thuộc tính số thay vì «?». Sắp xếp ma trận đặc trưng, thuật toán cây quyết định Weka C4.5 [7]. tạo bảng định dạng CSV đầu tiên. Sau đó dùng phần 2.3. Kết quả thí nghiệm và phân tích mềm Weka chuyển đổi thành bảng điện tử. Cuối 2.3.1. Xây dựng định dạng dữ liệu cây quyết định cùng lấy bảng dữ liệu về tín hiệu ECG, EMG, SC và RSP. Để có nhiều tín hiệu sinh lý xác định những cảm xúc khác nhau, ma trận nhầm lẫn được hiển thị trong Hình 3. Đối với cảm xúc giận dữ, mẫu phân loại đúng là 24, mẫu lỗi chia thành cảm xúc vui sướng là một. Đối với cảm xúc buồn, mẫu phân Hình 2.1. Định dạng dữ liệu của tín hiệu EC Hình 2.2. Ma trận nhầm lẫn loại đúng là 22, mẫu lỗi chia thành cảm xúc vui là Trước khi sử dụng cây quyết định J48 để phân loại một. Đối với cảm xúc vui sướng, mẫu phân loại đúng các cảm xúc khác nhau, trước hết xin giới thiệu về là 23, mẫu lỗi chia thành cảm xúc vui vẻ là một và định dạng dữ liệu sử dụng cây quyết định J48. Định mẫu lỗi chia thành cảm xúc buồn bã là một. Đối với dạng dữ liệu bao gồm tổng cộng 100 mẫu của ma trận cảm xúc vui vẻ, mẫu phân loại đúng là 25, không có đặc tính. Mỗi mẫu có 4 tham số đặc trưng hỗn loạn, mẫu nào sai. định dạng dữ liệu cấu trúc của cây quyết định J48 được thể hiện trên hình 2.1. Một đường ngang được gọi là một thể hiện trong hình này, tương đương với mẫu trong các khái niệm thống kê. Một phần các trường hợp được Hình 2.3. Cây quyết định các tín hiệu đa sinh lý 66 Journal homepage: www.tapchithietbigiaoduc.vn
  3. Journal of educational equipment: Applied research, Volume 2, Issue 305 (January 2024) ISSN 1859 - 0810 Hình 2.3 là cây quyết định nhận biết cảm xúc đối vui, giận và tỷ lệ nhận biết khác nhau lần lượt là với các tín hiệu đa sinh lý thuộc các cảm xúc khác 98% và 94%. Đối với tỷ lệ nhận biết nỗi buồn và nhau (vui, giận, buồn, vui). niềm vui là 87% và 86%. So sánh tỷ lệ nhận dạng Như được hiển thị trong Hình 2.3, nút gốc của cây với phòng thí nghiệm của trường đại học Augsburg, quyết định là đặc điểm hỗn loạn vốn là độ phức tạp chúng tôi nhận thấy việc nhận biết nỗi buồn và của tín hiệu RSP. Nó cho thấy mức độ thu được thông niềm vui đã đạt được kết quả tốt,Tỷ lệ nhận biết tin của các đặc tính hỗn loạn là tối đa. Dựa trên các nỗi buồn trong phòng thí nghiệm của trường đại giá trị khác nhau của thuộc tính chia thành hai, sau học Augsburg là 77,27%, nhưng trong bài báo này khi so sánh tốc độ thu được thông tin của kích thước là 87%. Tỷ lệ công nhận niềm vui của phòng thí còn lại đối với các đặc điểm hỗn loạn, lần lượt chọn nghiệm trường đại học Augsburg là 68,18%, nhưng các nút con cho đến khi hoàn thành việc phân loại tất trong bài báo này là 86%. cả các mẫu, do đó các nút lá thu được như vậy xa là Qua thực nghiệm mô phỏng, chúng tôi nhận thấy tinh khiết. độ chính xác của các tín hiệu đa sinh lý trên nhận 2.3.2. Kết quả tương phản với Đại học Augsburg biết cảm xúc khác nhau sẽ tốt hơn nhiều so với một Trong tài liệu [3], Johannes Eagner et đã sử dụng tín hiệu sinh lý đơn lẻ. Tỷ lệ nhận biết cảm xúc hưng dữ liệu tương tự trong bài viết của họ. Áp dụng phấn cao (vui, giận) cao hơn cảm xúc hưng phấn ANOVA, SFS, SBS và PCA để lựa chọn đặc trưng, thấp (buồn, vui). Đặc biệt tỷ lệ nhận biết cảm xúc vui sau đó xác định cảm xúc thông qua thuật toán LDF, sướng có thể đạt tới 98%. KNN, MLP. Kết quả kiểm tra cho ra những cảm xúc Tài liệu tham khảo khác nhau như bảng 2.1. 1. Ge Chen. The pulse signal in the emotional Bảng 2.1. Tỷ lệ nhận dạng tương phản với nhận dạng state recognition research: [A master’s degree thesis]. tín hiệu cảm xúc Chong Qing:Southwest university computer Sự application technology,2010. Phương Vui Sự sầu Vinh tức 2. Picard R.W., Healey J. Affective Wearable, In pháp sướng nảo hạnh giận Proceedings of the First International Symposium on Wearable Computers. Cambridge, 1997(l) : 231-240. LDF 77,27% 100% 72,73% 68,18% 3. Johannes Wagner, Jonghwa Kim, Elisabeth Andre. From Physiological Signals to Emotions: 15NN 72,73% 100% 77,27% 68,18% Implementing and Comparing Selected Methods MLP8 86,36% 100% 59,09% 68,18% for Feature Extraction and Classification. In IEEE International Conference on Multimedia & Expo Cây quyết 98% 94% 87% 86% (ICME 2005), 2005, 940-943. định J48 4. Kim K H, Bang S W,Kim S R. Emotion recognition system using short-term monitoring Có thể thấy trong bảng 2.1, nhận dạng cảm xúc of physiological signals. Med Biol Eng Compute, tín hiệu đa sinh lý dựa trên lý thuyết hỗn loạn đã đạt 2004,42:419-427. được kết quả tốt so với tỷ lệ nhận dạng cảm xúc đơn 5. Bian Zhao Qi,Zhang Xue Gong. Pattern lẻ. recognition. Bei Jing:Tsinghua Press,2000. 3. Kết luận 6. Quinlan J R.Induction of decision Kết quả thực nghiệm cho thấy cây quyết định cho tree.Machine Learning,1986, 1: 81-106. thấy hiệu quả phân loại tốt đối với nhiều loại phân 7. Quinlan J R.C4.5:Programs for Machine loại. Learning.Morgan Kauffman,1993. 1. Tín hiệu đa sinh lý để xác định các cảm xúc 67 Journal homepage: www.tapchithietbigiaoduc.vn
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
649=>1