Tóm tắt Luận án Tiến sĩ Toán học: Một số phương pháp phân cụm mờ theo nhóm cho bài toán dữ liệu đa nguồn, nhiều đặc trưng
lượt xem 1
download
Tóm tắt Luận án Tiến sĩ Toán học "Một số phương pháp phân cụm mờ theo nhóm cho bài toán dữ liệu đa nguồn, nhiều đặc trưng" được nghiên cứu với mục tiêu: Nghiên cứu phát triển các thuật toán phân cụm mờ, luận án tập trung cải tiến để đưa ra một số giải pháp bao gồm: Cải tiến nâng cao hiệu suất của đồng phân cụm mờ dữ liệu nhiều đặc trưng, đề xuất các mô hình, thuật toán phân cụm mờ theo nhóm tiếp cận theo hướng ứng dụng phân tích dữ liệu đa nguồn.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Tóm tắt Luận án Tiến sĩ Toán học: Một số phương pháp phân cụm mờ theo nhóm cho bài toán dữ liệu đa nguồn, nhiều đặc trưng
- BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ QUỐC PHÒNG VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ LÊ THỊ CẨM BÌNH MỘT SỐ PHƯƠNG PHÁP PHÂN CỤM MỜ THEO NHÓM CHO BÀI TOÁN DỮ LIỆU ĐA NGUỒN, NHIỀU ĐẶC TRƯNG Ngành: Cơ sở toán học cho tin học Mã số: 9 46 01 10 TÓM TẮT LUẬN ÁN TIẾN SĨ TOÁN HỌC HÀ NỘI- 2023
- CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ - BỘ QUỐC PHÒNG Người hướng dẫn khoa học: 1. PGS.TS. Ngô Thành Long 2. TS. Lê Xuân Đức Phản biện 1: PGS.TS Nguyễn Long Giang Viện Hàn lâm Khoa học và Công nghệ Việt Nam Phản biện 2: PGS. TS Nguyễn Hoàng Phương Đại học Thăng Long Phản biện 3: TS Đỗ Việt Bình Viện Khoa học và Công nghệ Quân sự Luận án được bảo vệ tại Hội đồng đánh giá luận án tiến sĩ cấp Viện, họp tại Viện KH-CNQS vào hồi giờ ngày tháng năm 20.... Có thể tìm hiểu luận án tại: - Thư viện Viện Khoa học và Công nghệ quân sự - Thư viện Quốc gia Việt Nam
- 1 MỞ ĐẦU 1. Tính cấp thiết của đề tài luận án Tốc độ phát triển của khoa học công nghệ đã phát sinh một lượng dữ liệu ngày càng lớn và phức tạp. Trong số đó, dữ liệu được thu thập từ nhiều nguồn khác nhau hoặc có nhiều đặc trưng có những đặc điểm rất khác biệt so với dữ liệu truyền thống. Các nguồn dữ liệu này cung cấp các thông tin hữu ích nếu được khai thác một cách hiệu quả. Hiện nay phân cụm dữ liệu là một trong những kỹ thuật quan trọng trong lĩnh vực khai phá dữ liệu, được sử dụng rộng rãi trong nhiều ứng dụng. Tuy nhiên, các kỹ thuật phân cụm chủ yếu được áp dụng đối với dữ liệu đơn nguồn, ít đặc trưng. Vì vậy, vấn đề nghiên cứu và hoàn thiện kỹ thuật phân cụm phù hợp cho dữ liệu đa nguồn và nhiều đặc trưng luôn là bài toán cần thiết và có phạm vi ảnh hưởng mạnh mẽ, có ý nghĩa khoa học và thực tiễn. 2. Mục tiêu nghiên cứu Trên cơ sở nghiên cứu phát triển các thuật toán phân cụm mờ, luận án tập trung cải tiến để đưa ra một số giải pháp bao gồm: Cải tiến nâng cao hiệu suất của đồng phân cụm mờ dữ liệu nhiều đặc trưng, đề xuất các mô hình, thuật toán phân cụm mờ theo nhóm tiếp cận theo hướng ứng dụng phân tích dữ liệu đa nguồn. 3. Đối tượng và phạm vi nghiên cứu Đối tượng nghiên cứu Luận án tập trung vào đối tượng nghiên cứu là mở rộng các thuật toán phân cụm mờ thích nghi với dữ liệu đa nguồn và dữ liệu có nhiều đặc trưng. Trong đó tập trung vào nghiên cứu kỹ thuật đồng phân cụm mờ cùng các kỹ thuật phân cụm mờ theo nhóm để cải tiến nâng cao hiệu suất phân cụm. Phạm vi nghiên cứu Phạm vi nghiên cứu của luận án tập trung nghiên cứu bao gồm: Các thuật toán phân cụm mờ, đồng phân cụm mờ, mô hình phân cụm mờ theo nhóm đối với dữ liệu đa nguồn, nhiều đặc trưng. 4. Nội dung nghiên cứu - Nghiên cứu tổng quan và cơ sở toán học của các mô hình, thuật toán phân cụm mờ được sử dụng trong luận án.
- 2 - Nghiên cứu phát triển và đề xuất một vài thuật toán phân cụm dữ liệu tiếp cận theo hướng ứng dụng phân tích dữ liệu đa nguồn, nhiều đặc trưng. - Nghiên cứu phát triển và đề xuất một vài mô hình phân cụm mờ theo nhóm tiếp cận theo hướng ứng dụng phân tích dữ liệu đa nguồn. 5. Phương pháp nghiên cứu Căn cứ vào mục tiêu của luận án là tập trung nghiên cứu tổng quan và đề xuất một vài mô hình, thuật toán phân cụm mờ theo nhóm. Do đó, phương pháp nghiên cứu của luận án là thực hiện nghiên cứu lý thuyết, triển khai thực nghiệm và đánh giá kết quả. Cụ thể là: - Trên cơ sở lý thuyết về các thuật toán phân cụm mờ và mô hình phân cụm mờ theo nhóm hiện có đề xuất một số mô hình, thuật toán phân cụm mờ theo nhóm cải tiến theo hướng tiếp cận ứng dụng phân tích dữ liệu đa nguồn, nhiều đặc trưng. - Mô phỏng thực nghiệm trên máy tính sử dụng các bộ dữ liệu mẫu chuẩn, dữ liệu thực và các chỉ số đánh giá chất lượng cụm dữ liệu nhằm minh họa các kết quả thực nghiệm để so sánh và khẳng định tính đúng đắn của các thuật toán đã được đề xuất trong luận án. - Kết hợp giữa tài liệu và hướng dẫn của giáo viên, tự nghiên cứu tìm kiếm tài liệu và trao đổi kết quả với nhóm nghiên cứu. Từng bước công bố các kết quả nghiên cứu, thực nghiệm trên các tạp chí quy định thông qua các Hội thảo, các tạp chí trong nước và nước ngoài. Tiếp thu đầy đủ những thành tựu mới trong nước và trên thế giới để mở rộng và ứng dụng trong luận án. 6. Ý nghĩa khoa học và thực tiễn Ý nghĩa khoa học Luận án đề xuất các phương pháp góp phần nâng cao chất lượng dựa trên các kỹ thuật phân cụm mờ và mô hình phân cụm mờ theo nhóm cho bài toán dữ liệu đa nguồn, nhiều đặc trưng được chứng minh là phân cụm dữ liệu tốt hơn. Ý nghĩa thực tiễn Kết quả của luận án góp phần hoàn thiện các giải pháp nâng cao hiệu quả các bài toán phân cụm dữ liệu đa nguồn, dữ liệu đa biến có kích thước và số đặc trưng lớn trong các ứng dụng thực tế, đáp ứng nhu cầu trong lĩnh vực phân cụm dữ liệu đa dạng hiện nay.
- 3 7. Bố cục của luận án Ngoài các phần mở đầu, kết luận, danh mục các công trình khoa học đã công bố của tác giả, danh mục tài liệu tham khảo, luận án có bố cục chính gồm ba chương như sau: Chương 1: Trình bày tổng quan về phân cụm dữ liệu và khái quát các vấn đề nghiên cứu liên quan đến luận án bao gồm: Dữ liệu đa nguồn, dữ liệu nhiều đặc trưng, thuật toán đồng phân cụm mờ, thuật toán tối ưu bầy đàn PSO, thuật toán đồng phân cụm mờ, thuật toán phân cụm mờ theo nhóm và tri thức ẩn trong phân cụm dữ liệu, một số công trình nghiên cứu liên quan đến luận án. Chương 2: Trình bày hai đề xuất bao gồm: Mô hình giải pháp tâm cụm tối ưu cho thuật toán đồng phân cụm mờ cải tiến và thuật toán phân cụm mờ theo nhóm tiếp cận theo hướng phân tích dữ liệu đa nguồn. Chương 3: Đề xuất mô hình phân cụm mờ theo nhóm tiếp cận theo hướng phân tích dữ liệu đa nguồn, gọi là mô hình cải tiến phân cụm mờ theo nhóm đa hàm mục tiêu.
- 4 CHƯƠNG 1 TỔNG QUAN VỀ PHÂN CỤM DỮ LIỆU 1.1. Giới thiệu chung về phân cụm dữ liệu 1.1.1. Định nghĩa Định nghĩa 1.1. Cho 𝐽 = 𝐽(𝑋, 𝐶, 𝑑, 𝑈, 𝑉, 𝐺) là hàm mục tiêu tối ưu cực tiểu của một kỹ thuật phân cụm, trong đó: 𝑋 = {𝑥1 , 𝑥2 , … , 𝑥 𝑁 }là tập dữ liệu đầu vào với N là số đối tượng dữ liệu. C là số cụm dữ liệu của X, 𝑋 = {𝑋1 , 𝑋2 , . . . , 𝑋 𝑐 , . . . , 𝑋 𝐶 }. d là phương pháp đo khoảng cách trong phân cụm, 𝑑 𝑐𝑖 = ‖𝑥 𝑖 − 𝑔 𝑐 ‖ là khoảng cách giữa đối tượng dữ liệu thứ i với tâm cụm c. 𝐶 𝑈 = [𝑢 𝑐𝑖 ] 𝑁𝑥𝐶 là ma trận hàm mục tiêu, uci với 𝑢 𝑐𝑖 ∈ [0,1]và ∑ 𝑐=1 𝑢 𝑐𝑖 = 1 , ∀𝑖 là độ thuộc của đối tượng dữ liệu thứ i với tâm cụm c. 𝑉 = [𝑣 𝑐𝑗 ] 𝐶 𝐾 là ma trận hàm thuộc đặc trưng vcj với 𝑣 𝑐𝑗 ∈ [0,1] và 𝐶 ∑ 𝑐=1 𝑣 𝑐𝑗 = 1 , ∀𝑗 là độ thuộc của đặc trưng dữ liệu j với tâm cụm c. 𝐺 = {𝑔1 , 𝑔2 , . . . , 𝑔 𝐶 } là tập tâm cụm. Cơ chế làm việc chung của các thuật toán phân cụm có thể được mô tả bởi hai bước hoạt động cơ bản như sau: (1) chọn ngẫu nhiên các cụm ban đầu và (2) tối ưu hóa lặp đi lặp lại các cụm cho đến khi đạt được giải pháp tối ưu [54]. 1.1.2. Phân cụm mờ Dựa vào mối quan hệ của từng đối tượng dữ liệu với các cụm, các thuật toán phân cụm được chia thành các thuật toán phân cụm rõ và phân cụm mờ. Trong phân cụm rõ, một đối tượng dữ liệu chỉ được gán cho một cụm. K-mean là một trong những thuật toán phân cụm rõ đơn giản nhất được sử dụng để giải quyết các bài toán phân cụm phổ biến. Trong phân cụm mờ, các đối tượng dữ liệu được gán cho mọi cụm với độ thuộc khác nhau. Gần đây, một số kỹ thuật phân cụm mờ giả thuyết tồn tại khái niệm độ thuộc mờ để thu nhận các vấn đề không rõ ràng tốt hơn các kỹ thuật phân cụm truyền thống. Do vậy, các thuật toán phân cụm mờ thường đạt được chất lượng cụm tốt hơn so với một số thuật toán phân cụm rõ. Chẳng hạn, J.C. Bezdek et al. đã thiết kế the fuzzy c-means (FCM) clustering bằng cách đề xuất khái niệm cụm lấp chồng và độ thuộc mờ.
- 5 Kết quả thực nghiệm đã chứng tỏ FCM đạt được hiệu suất tốt hơn kỹ thuật phân cụm rõ K-mean. 1.1.3. Phương pháp đánh giá trong phân cụm Hiện nay, có rất nhiều chỉ số ước lượng cụm, mỗi chỉ số phù hợp với một loại bài toán phân cụm khác nhau, và rất ít chỉ số phù hợp cho tất cả các bài toán phân cụm. Các độ đo chất lượng phân cụm được phân thành 3 loại là: Đánh giá trong (internal evaluation), đánh giá ngoài (external evaluation) và đánh giá quan hệ (relative evalution) [94]. Trong phần này sẽ trình bày một số chỉ số đánh giá được sử dụng cho các thuật toán phân cụm được giới thiệu trong luận án như: Chỉ số đánh giá độ chính xác phân cụm (Acc) [23], Chỉ số Precision (Pre) và Recall (Rec) [10], Chỉ số F1-score [32], Chỉ số PC [4], Chỉ số DBI [12], IQI [98]. 1.2. Cơ sở toán học của luận án 1.2.1. Thuật toán tối ưu bầy đàn Thuật toán PSO bao gồm 2 thành phần chính là tập các phần tử X và hàm định lượng giải pháp f của bầy đàn. Giải pháp tối ưu của thuật toán PSO tương ứng với phần tử đạt được hàm f tốt nhất trong bầy đàn. Trong mô hình FCoC, mỗi phần tử của bầy đàn tương ứng với một phương án tâm cụm. Phần tử tiềm năng nhất tương ứng với phương án tâm cụm phù hợp nhất. Các bước của thuật toán PSO đối với bài toán đồng phân cụm mờ được mô tả trong thuật toán 1.2. Thuật toán 1.2: Thuật toán Tối ưu bầy đàn PSO Đầu vào: Bầy đàn S và các tham số Np, c1, c2, w, Pso, Pso_max. (𝑡) Đầu ra: Vị trí tốt nhất 𝑋Bes𝑡 tương ứng giá trị ước lượng 𝑓 𝑚𝑖𝑛 = 𝑚𝑖𝑛(𝑓(𝑋)). (𝑡) (𝑡) 1. Khởi tạo: Bầy đàn ngẫu nhiên (X, A, 𝑋 𝐵𝑒𝑠𝑡 và 𝑋 𝐵𝑒𝑠𝑡_𝑖 ). 2. =0. 3. LOOP 4. For i=1 to Np do //Lặp đối với từng phần tử (𝜏) (𝜏) 5. Tính 𝑓𝑖 = 𝑓(𝑋 𝑖 ) theo công thức (1.18);// Ước lượng giải pháp mới
- 6 (𝜏) 6. if 𝑓𝑖 ≤ 𝑓 𝐵𝑒𝑠𝑡 _ then 𝑖 (𝜏) (𝜏) (𝜏) 7. 𝑋 𝐵𝑒𝑠𝑡_𝑖 = 𝑋 𝑖 ; 𝑓 𝐵𝑒𝑠𝑡 _ = 𝑓𝑖 ;// Lưu giải pháp tiềm năng của phần tử i 𝑖 8. end if (𝜏) 9. if 𝑓 𝐵𝑒𝑠𝑡_𝑖 ≤ 𝑓𝑖 then (𝜏) (𝜏) (𝜏) 10. 𝑋 𝐵𝑒𝑠𝑡 = 𝑋 𝐵𝑒𝑠𝑡_𝑖 ;𝑓 𝑚𝑖𝑛 𝐵𝑒𝑠𝑡_𝑖 ; // Lưu giải pháp tiềm năng của bầy đàn. 11. end if (𝜏) 12. Cập nhật vận tốc 𝐴 𝑖 theo công thức (1.16); (𝜏) 13. Cập nhật vị trí 𝑋 𝑖 theo công thức (1.17); 14. End For 15. =+1; 16. UNTIL ((| 𝑓 (𝜏) (𝑃) − 𝑓 (𝜏−1) (𝑃)| ≤ 𝜀 𝑃𝑠𝑜 ) hoặc ( = Pso_max)) Thuật toán PSO gồm một vòng lặp chính. Trong đó các phần tử di chuyển trong không gian K chiều với tốc độ ngẫu nhiên về phía vị trí tiềm năng nhất của mình (dòng lệnh số 7, 12 và 13). Ví trí tiềm năng nhất của bầy (𝑡) đàn 𝑋 𝐵𝑒𝑠𝑡 được lựa chọn từ các vị trí tiềm năng cục bộ của từng phần tử (𝑡) trong bầy đàn 𝑋 𝐵𝑒𝑠𝑡_𝑖 (dòng lệnh số 7 và 10). Như vậy, sau mỗi vòng lặp, (𝑡) PSO thu được giải pháp tương ứng với vị trí tiềm năng nhất 𝑋 𝐵𝑒𝑠𝑡 . Thuật toán PSO kết thúc khi thỏa mãn điều kiện dừng| 𝑓 (𝜏) (𝑃) − 𝑓 (𝜏−1) (𝑃)| ≤ 𝜀 𝑃𝑠𝑜 hoặc khi đạt được số lần tìm kiếm tối đa ( = Pso_max). 1.2.2. Thuật toán đồng phân cụm mờ Đồng phân cụm mờ (FCoC) là một thuật toán cải tiến của thuật toán phân cụm mờ (FCM). FCoC được coi là phù hợp hơn và có thể thay thế FCM trong phân tích dữ liệu nhiều đặc trưng, kích thước lớn. Hàm mục tiêu của thuật toán đồng phân cụm mờ JFCoC biểu diễn bởi công thức: 𝐶 𝑁 𝐾 𝐶 𝑁 𝐽 𝐹𝐶𝑜𝐶 (𝑈, 𝑉, 𝐺) = ∑ 𝑐=1 ∑ 𝑖=1 ∑ 𝑗=1 𝑢 𝑐𝑖 𝑣 𝑐𝑗 𝑑 𝑐𝑖𝑗 + 𝑇 𝑢 ∑ 𝑐=1 ∑ 𝑖=1 𝑢 𝑐𝑖 log 𝑢 𝑐𝑖 + 𝐶 𝐾 𝑇 𝑣 ∑ 𝑐=1 ∑ 𝑗=1 𝑣 𝑐𝑗 log 𝑣 𝑐𝑗 (1.20)
- 7 Để đạt được kết quả phân cụm tối ưu, hàm mục tiêu JFCoC được tối thiểu bởi điều kiện ràng buộc sau: 𝐶 ∑ 𝑐=1 𝑢 𝑐𝑖 = 1, 𝑢 𝑐𝑖 ∈ [0,1], ∀𝑖 = 1, 𝑁 𝐾 ∑ 𝑗=1 𝑣 𝑐𝑗 = 1 , 𝑣 𝑐𝑗 ∈ [0,1], ∀𝑐 = 1, 𝐶 (1.21) Thuật toán 1.3. Thuật toán đồng phân cụm mờ FCoC ̅̅̅̅̅ Đầu vào: Tập dữ liệu 𝑋 = {𝑥 𝑖 , 𝑥 𝑖 ∈ ℝ 𝐾 , 𝑖 = 1, 𝑁}, số cụm C, các tham số mờ 𝑇 𝑢 , 𝑇 𝑣 , εFCoC, số vòng lặp tối đa τmax. Đầu ra: Các cụm kết quả. 1. Khởi tạo ma trận hàm thuộc U=[uci]. 2. τ=1. 3. DO 4.. Cập nhật gcj sử dụng công thức (1.25). 5.. Tính toán dcij sử dụng công thức (1.22). 6. Cập nhật vcj sử dụng công thức (1.24). 7. Cập nhật uci sử dụng công thức (1.23). 8. τ=τ+1. 9. UNTIL ((𝑀𝑎𝑥(|𝑢 𝑐𝑖 [𝜏] − 𝑢 𝑐𝑖 [𝜏 − 1]|) ≤ 𝜀 𝐹𝐶𝑜𝐶 ) hoặc (≥max)). 1.2.3. Mô hình phân cụm mờ theo nhóm Sự khác biệt giữa mô hình phân cụm theo nhóm với các mô hình phân cụm đơn ở chỗ mô hình phân cụm theo nhóm bao gồm nhiều mô đun phân cụm hoạt động song song. Các kết quả phân cụm của các mô đun phân cụm được tổng hợp thành một kết quả phân cụm toàn cục. Trong mô hình phân cụm theo nhóm, xét một tập dữ liệu X bao gồm N đối tượng dữ liệu và M thuật toán phân cụm khác nhau hoặc một thuật toán với M bộ tham số khác nhau. M mô đun phân cụm cơ sở được hình thành bằng cách cài đặt M thuật toán phân cụm với M tập dữ liệu cục bộ tương ứng để nhóm mỗi tập dữ liệu cục bộ thành C cụm khác nhau. Kết quả phân cụm của M mô đun phân cụm cơ sở 𝜋1 , 𝜋2 , … , 𝜋 𝑀 được kết hợp bởi hàm đồng thuận để nhận được kết quả toàn cục P*. Mô hình phân cụm theo nhóm được mô tả trong Hình 1.1.
- 8 X1 Phân cụm X1 1 Dữ liệu X X2 Phân cụm X2 2 Phân cụm * đồng thuận XM Phân cụm XM M Hình 1.2 Mô hình phân cụm theo nhóm truyền thống Trong đó: Phân cụm cơ sở là một mô đun phân cụm trong các mô hình phân cụm theo nhóm. Trong đó xảy ra quá trình phân cụm một tập dữ liệu cục bộ sử dụng một kỹ thuật phân cụm và các tham số tương ứng. Phân cụm đồng thuận phân cụm theo nhóm là một trong những thành phần chính của mô hình phân cụm theo nhóm, trong đó xảy ra quá trình hợp nhất các kết quả đến từ các phân cụm cơ sở thành kết quả phân cụm toàn cục của mô hình phân cụm theo nhóm. 1.2.4. Tri thức ẩn trong phân cụm dữ liệu Tri thức ẩn trong học máy là những thông tin hữu ích ẩn chứa hoặc chưa được sử dụng trong các thành phần cơ bản của các mô hình học máy. Tri thức ẩn trong các mô hình phân cụm theo nhóm là những thông tin hữu ích ẩn chữa trong các tập dữ liệu cục bộ và các hàm mục tiêu của các thuật toán phân cụm trong các phân cụm cơ sở. Tri thức ẩn trong dữ liệu bao gồm thông tin liên quan đến dữ liệu như phân loại nguồn dữ liệu đầu vào (chắc chắn hay không chắc chắn, nhiều đặc trưng hay ít đặc trưng, v.v.). Tri thức ẩn trong các kỹ thuật phân cụm bao gồm phân loại hàm mục tiêu được sử dụng trong các mô đun phân cụm cơ sở. 1.2.5. Dữ liệu đa nguồn Dữ liệu đa nguồn là dữ liệu không đồng nhất được thu thập từ nhiều trạm thu được đặt trong các môi trường khác nhau. Dữ liệu đa nguồn không được tổng hợp thành một bộ chung mà sẽ được lưu trữ dưới dạng các bộ dữ liệu khác nhau. Dữ liệu đa nguồn thường phức tạp, không đồng nhất, động, phân tán và rất lớn. Vì vậy, một kỹ thuật phân cụm đơn lẻ không thể đạt được hiệu suất tốt nhất
- 9 mà phải triển khai theo các mô hình tổ hợp các kỹ thuật phân cụm khác nhau. Mỗi kỹ thuật vận dụng khả năng riêng biệt để xử lý các bộ dữ liệu con phù hợp. Ví dụ ảnh viễn thám là loại dữ liệu đa nguồn. Các bộ dữ liệu ảnh viễn thám đơn đang được sử dụng hiện nay thực ra được thu từ nhiều cảm biến khác nhau về vùng quan sát, dải phổ quan sát. Dữ liệu thu được từ các cảm biến khác nhau có thể có nhiễu, không chắc chắn do ảnh hưởng thời tiết, khí hậu trong vùng mà nó quan sát sau đó được tiền xử lý và tổng hợp thành một bộ dữ liệu có cùng định dạng và cấu trúc. 1.2.6. Dữ liệu nhiều đặc trưng Mục này trình bày đặc điểm và một số công trình liên quan đến phân cụm dữ liệu nhiều đặc trưng. Dựa trên các đánh giá tổng quan, luận án đề xuất việc ứng dụng thuật toán đồng phân cụm dữ liệu kết hợp với thuật toán tối ưu bầy đàn cải tiến để phân tích dữ liệu nhiều đặc trưng. 1.3. Kết luận chương 1 Chương 1 đã trình bày nội dung tổng quan về phân cụm dữ liệu, dữ liệu nhiều đặc trưng và dữ liệu đa nguồn. chương 1 cũng đã tập trung khảo sát một số phương pháp đánh giá và các cơ sở toán học phục vụ cho việc phát triển luận án, đồng thời đi vào phân tích, đánh giá khái quát về tình hình nghiên cứu của các ứng dụng phân cụm có liên quan để đưa ra một số vấn đề còn tồn tại. Từ đó đưa ra hướng nghiên cứu phù hợp cho luận án. Một số nội dung phân tích tổng quan được công bố ở công trình số [CT1], [CT5], [CT6] trong danh mục các công trình khoa học đã công bố của luận án.
- 10 CHƯƠNG 2 MỘT SỐ CẢI TIẾN KỸ THUẬT PHÂN CỤM DỮ LIỆU 2.1. Đề xuất thuật toán đồng phân cụm mờ sử dụng PSO tối ưu tâm cụm với lớp bài toán dữ liệu nhiều đặc trưng 2.1.1. Mô hình toán học tối ưu bầy đàn MPSO Định nghĩa 2.1. Mô hình toán học tổng quát của PSO viết tắt là MPSO được ký hiệu là , được biểu diễn theo biểu thức toán học dưới đây: 𝛴 = {𝛺, 𝐼, 𝐽, 𝑆, 𝑂} (2.1) Trong đó gồm có 5 thành phần: là không gian hoạt động của các phần tử trong bầy đàn, I là dữ liệu đầu vào, J là hàm mục tiêu kỹ thuật xử lý dữ liệu, S là nhóm các phần tử trong bầy đàn và O là giải pháp tối ưu như kết quả đầu ra của bầy đàn. 2.1.2. Mô hình tâm cụm tối ưu OCM Mục này trình bày mô hình OCM được hình thành bằng cách thay thế các thành phần của MPSO bởi các thành phần của thuật toán đồng phân cụm mờ. (𝜏) Thuật toán tính hàm mục tiêu 𝑓 𝑚 được mô tả trong Thuật toán 2.1. (𝝉) Thuật toán 2.1. Thuật toán tính hàm mục tiêu 𝒇 𝒎 Đầu vào: Tập dữ liệu 𝑋 = {𝑥 𝑖 , 𝑥 𝑖 ∈ ℝ 𝐾 }, 𝑖 = 1, 𝑁, số cụm C, các hệ số mờ 𝑇 𝑢 , 𝑇 𝑣 . (𝜏) Đầu ra: Giá trị của hàm mục tiêu 𝑓 𝑚 . (𝜏) (𝜏) 1. Cập nhật 𝑐 𝑐𝑗 từ 𝐶 𝑚 . (𝜏) 2. Tính 𝑑 𝑐𝑖 sử dụng công thức (1.2). (𝜏) 3. Tính 𝑢 𝑐𝑖 sử dụng công thức (1.3). (𝜏) (𝜏) 4. Tính 𝑑 𝑐𝑖𝑗 sử dụng công thức (2.9a) với xij và 𝑐 𝑐𝑗 . (𝜏) (𝜏) (𝜏) 5. Tính 𝑣 𝑐𝑗 sử dụng công thức (2.9c) với 𝑢 𝑐𝑖 = 𝑢 𝑐𝑖 và 𝑐 𝑐𝑗 = 𝑐 𝑐𝑗 . (𝜏) (𝜏) (𝜏) 6. Tính lại 𝑢 𝑐𝑖 sử dụng công thức (2.9b) với 𝑣 𝑐𝑗 = 𝑣 𝑐𝑗 và 𝑐 𝑐𝑗 = 𝑐 𝑐𝑗 . (𝜏) (𝜏) (𝜏) 7. Tính lại 𝑣 𝑐𝑗 sử dụng công thức (2.9c) với 𝑢 𝑐𝑖 = 𝑢 𝑐𝑖 và 𝑐 𝑐𝑗 = 𝑐 𝑐𝑗 .
- 11 (𝜏) (𝜏) (𝜏) (𝜏) 8. Tính 𝐽 𝑚 sử dụng công thức (2.9) với 𝑢 𝑐𝑖 = 𝑢 𝑐𝑖 ,𝑣 𝑐𝑗 = 𝑣 𝑐𝑗 và 𝑐 𝑐𝑗 = 𝑐 𝑐𝑗 . (𝜏) (𝜏) 9. Trả về 𝑓 𝑚 = 1/𝐽 𝑚 . Dựa trên cấu trúc của mô hình OCM đã được mô tả ở trên, thuật toán của OCM được trình bày như sau: Thuật toán 2.2. Thuật toán OCM Đầu vào: Tập dữ liệu 𝑋 = {𝑥 𝑖 , 𝑥 𝑖 ∈ ℝ 𝐾 }, 𝑖 = 1, 𝑁, số cụm C, hệ số mờ 𝑇 𝑢, 𝑇𝑣. Đầu ra: Giải pháp tâm cụm tối ưu 𝑂 𝐶 = 𝐶 𝐺𝐵 = {𝐶 𝐺𝐵−1 , 𝐶 𝐺𝐵−2 , . . . , 𝐶 𝐺𝐵−𝐺 },𝐶 𝐺𝐵−𝑐 ∈ ℝ 𝐾 , 𝑐 = 1, 𝐶 1. Khởi tạo bầy đàn 𝛴 𝐶 = {𝛺 𝐶 , 𝑋 𝐶 , 𝐽 𝐶 , 𝑆 𝐶 , 𝑂 𝐶 },M, C, N, . 2. Khởi tạo =0. 3. Di chuyển =+1. 4. Lặp song song: For {Pm, 𝑚 = 1, 𝑀, c = 1, 𝐶, 𝑖 = 1, 𝑁, 𝑗 = 1, 𝐾} (𝜏) (𝜏) 5. Xác định vận tốc 𝐴 𝑚 = {𝑎 𝑚𝑐𝑗 } sử dụng công thức (2.10b). 𝐶×𝐾 (𝜏) (𝜏) 6. Cập nhật vị trí 𝐶 𝑚 = {𝑐 𝑚𝑐𝑗 } sử dụng công thức (2.10c). 𝐶×𝐾 (𝜏) 7. Tính 𝑓 𝑚 sử dụng thuật toán 2.1. 8. Cập nhật PPB sử dụng quy tắc RPB: Công thức (2.12). 9. Kết thúc lặp song song End For {Pm, m=M}. 10. Cập nhật PPB sử dụng quy tắc RGB: Công thức (2.13). 11. Kết thúc tìm kiếm sử dụng quy tắc Rs: Công thức (2.14). 12. Trả về PGB= {AGB, CGB} Thuật toán FCOCM bao gồm ba giai đoạn chính: i) Thuật toán OCM (thuật toán 2.2) được sử dụng để tìm giải pháp tâm cụm tối ưu 𝐶 𝐺𝐵 = {𝑐 𝐺𝐵−𝑐𝑗 } 𝐶×𝐾 , 𝑐 = 1, 𝐶, 𝑗 = 1, 𝐾.
- 12 (0) ii) Khởi tạo tâm cụm từ giải pháp tâm cụm tối ưu nhận được 𝑐 𝑐𝑗 = 𝑐 𝐺𝐵−𝑐𝑗 , 𝑐 = 1, 𝐶, 𝑗 = 1, 𝐾. iii)Thuật toán đồng phân cụm được sử dụng để tìm kết quả phân cụm với tâm cụm khởi tạo ngẫu nhiên. Thuật toán FCOCM được mô tả trong Thuật toán 2.3. Thuật toán 2.3. Thuật toán FCOCM Đầu vào: Tập dữ liệu 𝑋 = {𝑥 𝑖 , 𝑥 𝑖 ∈ ℝ 𝐾 }, 𝑖 = 1, 𝑁, số cụm C, 𝑇 𝑢 , 𝑇 𝑣 . Đầu ra: Tâm cụm và phân bố của các đối tượng trong từng cụm. 1. Tìm giải pháp tâm cụm tối ưu 𝐶 𝐺𝐵 = {𝑐 𝐺𝐵−𝑐𝑗 } 𝐶×𝐾 , 𝑐 = 1, 𝐶, 𝑗 = 1, 𝐾 sử dụng Thuật toán 2.2. 2. Khởi tạo tâm cụm (0) 𝐺 = {𝑔 𝑐𝑗 } , 𝑐 = 1, 𝐶, 𝑗 = 1, 𝐾}. 𝐶×𝐾 (0) 3. Cập nhật tâm cụm khởi tạo G=CGB: 𝑔 𝑐𝑗 = 𝑐 𝐺𝐵−𝑐𝑗 , 𝑐 = 1, 𝐶, 𝑗 = 1, 𝐾; (0) 4. Khởi tạo các hàm thuộc 𝑈 (0) = {𝑢 𝑐𝑖 } , 𝑐 = 1, 𝐶, 𝑖 = 1, 𝑁 ) sử dụng 𝐶×𝑁 công thức (2.9b). (0) 5. Khởi tạo ngẫu nhiên hàm thuộc 𝑉 (0) = {𝑣 𝑐𝑗 } , 𝑐 = 1, 𝐶, 𝑗 = 1, 𝐾; 𝐶×𝐾 6. Khởi tạo =0. 7. DO (𝜏) 8. Tính toán 𝑑 𝑐𝑖𝑗 sử dụng công thức (2.9a). (𝜏) 9. Cập nhật 𝑣 𝑐𝑗 sử dụng công thức (2.9c). (𝜏) 10. Cập nhật 𝑢 𝑐𝑖 sử dụng công thức (2.9b). 11. =+1; (𝜏) (𝜏−1) 12. WHILE (𝑚𝑎𝑥 (|𝑢 𝑐𝑖 − 𝑢 𝑐𝑖 |) ≤ 𝜀) hoặc (𝜏 ≥ 𝜏 𝑚𝑎𝑥 ). 13. Trả về kết quả đồng phân cụm. Độ phức tạp tính toán của FCOCM là O(MNCKτ).
- 13 Trong đó, M là số phần tử của bầy đàn, N là kích thước tập dữ liệu, G là số cụm và K là số đặc trưng của dữ liệu. 2.1.3. Kết quả thực nghiệm Phần thực nghiệm đã tiến hành phân cụm trên các tập dữ liệu nhiều đặc trưng để chứng minh tiềm năng của phương pháp được đề xuất. Kết quả cho thấy thuật toán FCOCM luôn có hiệu suất tốt hơn so với các thuật toán khác. Tuy nhiên, FCOCM chỉ cho kết quả tốt nhất đối với tập dữ liệu kích thước lớn, có nhiều đặc trưng, dữ liệu không chắc chắn và không phù hợp với dữ liệu đa nguồn. Trong mục tiếp theo, luận án trình bày một đề xuất sử dụng thuật toán đồng phân cụm mờ cải tiến để phân cụm dữ liệu đa nguồn. Nội dung chính của mục 2.1 được công bố ở công trình [CT2] trong danh mục các khoa học đã công bố. 2.2. Thuật toán đồng phân cụm mờ dữ liệu đa nguồn MSFCoC 2.2.1. Mô hình toán học của MSFCoC MSFCoC dựa trên ý tưởng chia sẻ thông tin trong phân tích dữ liệu đa nguồn nhằm tăng khả năng và hiệu suất của các thuật toán đồng phân cụm. Bên cạnh việc bổ sung thông tin trọng số và tích hợp entropy hàm thuộc đặc trưng cho từng nguồn dữ liệu, MSFCoC chia sẻ thông tin các hàm thuộc đối tượng và hàm thuộc đặc trưng giữa các nguồn dữ liệu. Thuật toán FCoC được sửa đổi để phù hợp để phân tích dữ liệu đa nguồn bằng cách nhân bản thuật toán theo số lượng nguồn dữ liệu. Mô hình toán học của MSFCoC dựa trên cơ sở của thuật toán FCoC và dữ liệu đầu vào đa nguồn. Hàm mục tiêu FCoC được sửa đổi cho phù hợp với dữ liệu đa nguồn bằng cách nhân bản FCoC theo M nguồn dữ liệu cục bộ tương ứng. Đồng thời bổ sung cơ chế trao đổi thông tin hữu ích giữa các phân cụm cơ sở. Hàm mục tiêu của thuật toán MSFCoC được biểu diễn như sau: = 𝑓(𝑋, 𝑈, 𝑉, 𝐺, 𝑀, 𝑇, 𝜂, 𝐸, 𝛥, 𝑅) 𝐶 𝑁𝑚 𝐷𝑚 𝐽 𝑀𝑆𝐹𝐶𝑜𝐶 { 𝑀 (∑ 𝑐=1 ∑ 𝑖=1 ∑ 𝑗=1 𝑢 𝑐𝑖,𝑚 𝑣 𝑐𝑗,𝑚 𝑑 𝑐𝑖𝑗,𝑚 + 𝑇 𝑢,𝑚 𝐸 𝑢,𝑚 + 𝑇 𝑣,𝑚 𝐸 𝑣,𝑚 ) =∑ 𝑚=1 +𝜂 𝑢 𝛥 𝑢 + 𝜂 𝑣 𝛥 𝑣 (2.15) Trong đó: i) X là tập dữ liệu đa nguồn 𝑋 = {𝑋1 , 𝑋2 , . . . , 𝑋 𝑀 },
- 14 ii) 𝑈 = {𝑈1 , 𝑈2 , . . . , 𝑈 𝑚 , . . . , 𝑈 𝑀 }, 𝑈 𝑚 = [𝑢 𝑐𝑖,𝑚 ] 𝐶 𝑁 là ma trận hàm thuộc đối tượng mờ, iii) 𝑉 = {𝑉1 , 𝑉2 , . . . , 𝑉 𝑚 , . . . , 𝑉 𝑀 }, 𝑉 𝑚 = [𝑣 𝑐𝑗,𝑚 ] 𝐶 𝐾 là ma trận hàm thuộc đặc trưng mờ, iv) G là tập tâm cụm đa nguồn 𝐺 = {𝐺1 , 𝐺2 , . . . , 𝐺 𝑚 , . . . , 𝐺 𝑀 }, v) M là số nguồn dữ liệu, vi) T là hệ số mờ, vii) 𝜂 = {𝜂1 , 𝜂2 }là tập hệ số đại diện cho loại dữ liệu đa nguồn (đa khung nhìn hay đa không gian con) của dữ liệu đầu vào X, viii) 𝑅 = {𝑅1 , 𝑅2 }là bộ quy tắc xác định loại dữ liệu đa nguồn 𝜂 = {𝜂1 , 𝜂2 }, ix) E= {Eu,m, Ev,m} là entropy của hàm thuộc (đối tượng hoặc đặc trưng), x) = {u,m, v,m} là các tham số tính theo công thức (2.24) và (2.25). 2.2.2. Xử lý dữ liệu và khởi tạo tham số Để giải hàm mục tiêu, các tham số P, U, T, cần được khởi tạo. Ngoài ra, do tập dữ liệu đầu vào được tổng hợp từ nhiều nguồn khác nhau nên thường có giới hạn trọng số đặc trưng khác nhau. Do đó dữ liệu đầu vào cần được chuẩn hóa trước khi tiến hành phân tích tổng thể. 2.2.3. Chia sẻ tri thức trong phân cụm dữ liệu đa nguồn Mục này xem xét chia sẻ tri thức bằng cách xác định mô đun phân cụm cơ sở tiềm năng sau đó chia sẻ các tham số của mô đun phân cụm cơ sở đó cho các mô đun phân cụm cơ sở còn lại. Do đó giúp khám phá và khai thác tri thức hữu ích trong các phân cụm cơ sở trong quá trình học để cải thiện chất lượng phân cụm tổng thể cho thuật toán phân cụm đa nguồn đề xuất. 2.2.4. Phương pháp tính toán điều kiện dừng Trong các thuật toán phân cụm đa nguồn, mức độ thay đổi của các mô đun phân cụm cơ sở thường không giống nhau. MSFCoC đã xem xét sự ổn định của tất cả các mô đun phân cụm cơ sở bằng phương pháp tính trung bình các hàm thuộc đôi tượng của các mô đun phân cụm cơ sở. 2.2.5. Thuật toán MSFCoC
- 15 Sơ đồ thuật toán MSFCoC bao gồm các tiến trình lặp học các hàm thuộc được minh họa trong thuật toán 2.4. Thuật toán 2.4. Thuật toán MSFCoC Đầu vào: Tập dữ liệu M nguồn 𝑋 𝑚 = {𝑥 𝑖𝑚 , 𝑥 𝑖𝑚 ∈ ℝ 𝐷 𝑚 }, 𝑖 = 1, 𝑁 𝑚 , số cụm C. Đầu ra: Kết quả phân cụm. 1. Khởi tạo tham số 𝑇 𝑢 , 𝑇 𝑣 , 𝜂 𝑢 , 𝜂 𝑣 , 𝜀, , số vòng lặp tối đa τmax. 2. Khởi tạo 𝑈 𝑚 = [𝑢 𝑐𝑖,𝑚 ] 𝐶×𝑁 . 3. Sử dụng quy tắc R1 và R2 để xác định dữ liệu đa khung nhìn và dữ liệu đa không gian con. 4. τ=1. 5. REPEAT 6. Cập nhật pcj,m sử dụng công thức (2.21). 7. Tính toán dcij,m sử dụng công thức (2.20). 8. Cập nhật vcj,m sử dụng công thức (2.19). 9. Cập nhật uci,m sử dụng công thức (2.17). 10. Nếu (u 0) cập nhật ̅ 𝑢 𝑐𝑖 sử dụng công thức (2.31). 11. Nếu (v 0) cập nhật 𝑣̅ 𝑐𝑗 sử dụng công thức (2.32). 12. τ=τ+1. 13. UNTIL (|‖𝑈(𝜏)‖ − ‖𝑈(𝜏 − 1)‖| < 𝜀) hoặc (𝜏 ≥ 𝜏 𝑚𝑎𝑥 ) Độ phức tạp tính toán của MSFCoC là O(MNCKτ). Trong đó, M là số nguồn dữ liệu, N số đối tượng dữ liệu, C là số cụm, K là tổng số đặc trưng dữ liệu, τ là số vòng lặp. 2.2.6. Kết quả thực nghiệm Luận án đã tiến hành các thực nghiệm phân cụm trên các tập dữ liệu nhiều đặc trưng để chứng minh tiềm năng của phương pháp được đề xuất. Kết quả thực nghiệm MSFCoC không chỉ đạt được hiệu suất tốt hơn mà còn đạt được chất lượng ổn định hơn các thuật toán khác theo các chỉ số đánh giá chất lượng
- 16 cụm. Nội dung chính của mục 2.3 được công bố ở công trình số [CT5] trong danh mục các công trình khoa học đã công bố. 2.3. Kết luận Chương 2 Nội dung của chương 2 đã trình bày hai đóng góp mới bao gồm: Thứ nhất, đề xuất mô hình toán học tổng quát của thuật toán PSO kết hợp với mô hình tìm tâm cụm tối ưu. Theo nghiên cứu thực nghiệm phân cụm, việc mô hình hóa toán học cho các thuật toán đa năng như PSO bằng các ký hiệu và ngôn ngữ toán học làm cho việc cài đặt trở nên dễ dàng hơn. Việc mô hình hóa thuật toán PSO bằng mô hình MPSO, giải pháp tìm tâm cụm khởi tạo cho thuật toán FCoC bằng mô hình OCM và biểu diễn lại thuật toán đồng phân cụm mờ lai ghép PSO bằng mô hình OCM để đạt được thuật toán FCOCM [CT2] rõ ràng hơn. Thực nghiệm trên các bộ dữ liệu nhiều đặc trưng và kích thước lớn cho thấy hiệu quả của thuật toán FCOCM so với một số thuật toán phân cụm tiên tiến khác. Thứ hai, đề xuất một thuật toán phân cụm dữ liệu đa nguồn mới MSFCoC [CT5] là kết quả của quá trình nghiên cứu từ thuật toán phân cụm dữ liệu đa khung nhìn MvFCoC [CT4]. Để thích ứng với phân tích dữ liệu đa nguồn, hàm mục tiêu phân cụm mới được tạo bằng cách tích hợp nhiều hàm mục tiêu đồng phân cụm mờ đơn lẻ tương ứng với tập dữ liệu cục bộ của dữ liệu đa nguồn đầu vào. Thuật toán phân cụm dữ liệu đa nguồn mới được hình thành dựa trên thuật toán phân cụm mờ đơn ban đầu. Mỗi thuật toán đồng phân cụm mờ đơn được gọi là phân cụm cơ sở. Hiệu suất của phân cụm dữ liệu đa nguồn được cải thiện bằng cách tối ưu hóa đồng thời các phân cụm cơ sở dựa trên chiến lược đánh giá tiềm năng và chia sẻ thông tin giữa các phân cụm cơ sở. Các kết quả thử nghiệm cho thấy thuật toán MSFCoC đạt hiệu suất chính xác, ổn định và có thể mở rộng hơn trong phân tích dữ liệu có số đặc trưng lớn. Tuy nhiên, các thực nghiệm mới chỉ chứng minh một số kết quả ban đầu trên các ứng dụng dữ liệu kích thước khá lớn và có nhiều đặc trưng. Trong khi các ứng dụng thực thì dữ liệu có thể lên đến hàng triệu bản ghi và đòi hỏi các kỹ thuật phân cụm chính xác, ổn định, có thể mở rộng hơn. Do đó, cần có các nghiên cứu bổ sung để đưa ra cơ chế cải thiện chất lượng phân cụm, độ ổn định cho thuật toán MSFCoC. Nội dung chính của chương này được công bố trong các công trình số [CT2], [CT4], [CT5] trong danh mục các công trình đã được công bố.
- 17 CHƯƠNG 3 MÔ HÌNH CẢI TIẾN PHÂN CỤM MỜ THEO NHÓM ĐA HÀM MỤC TIÊU 3.1. Mô hình toán học của FOMOCE Định nghĩa 3.1. Mô hình phân cụm theo nhóm đa hàm mục tiêu mờ được ký hiệu là 𝛺, được đặc tính bởi dữ liệu đến từ M nguồn thu khác nhau S1, S2, …, SM. Dữ liệu được đi qua bộ lọc Q để phân loại nguồn dữ liệu. Các phân cụm cơ sở 𝛱 = {𝛱1 , 𝛱2 , … , 𝛱 𝑀 }được liên kết bởi các kỹ thuật phân cụm mờ xử lý song song L. Một kỹ thuật phân cụm F được sử dụng để đồng thuận các kết quả phân cụm từ các phân cụm cơ sở và đánh giá chất lượng phân cụm để đưa ra kết quả phân cụm toàn cục X của M nguồn dữ liệu. Mô hình 𝛺 𝑀 được biểu diễn bởi biểu thức (3.1) dưới đây: 𝛺 𝑀 = {𝑆, 𝑄, 𝛱, 𝐿, 𝐹, 𝑋, 𝑉 } (3.1) Trong đó, i) Dữ liệu đầu vào đa nguồn: 𝑆 = {𝑆1 , 𝑆2 , … , 𝑆 𝑀 } ii) Mô đun phân loại dữ liệu Q iii) Bộ phân cụm cơ sở , iv) Mô đun liên kết phân cụm cơ sở L, v) Hàm tổng hợp kết quả phân cụm cơ sở: 𝐹 vi) Hàm kết quả phân cụm đồng thuận 𝑋 vii) Mô đun đánh giá chất lượng cụm V S1 X1 Liên kết Phân cụm Phân loại Phân cụm Đánh giá chất S2 phân cụm đồng thuận X2 nguồn vào Q cơ sở F lượng cụm V L SM XC Hình 3.1 Sơ đồ mô đun hóa mô hình FOMOCE Từ biểu thức (3.1) và hình 3.1 cho thấy sự khác biệt giữa mô hình FOMOCE với các mô hình phân cụm theo nhóm truyền thống ở cấu trúc dữ liệu đầu vào là đa nguồn, dữ liệu được đi qua bộ lọc và phân loại, phân cụm cơ sở sử dụng các hàm mục tiêu khác nhau, và có sự hiện diện của thành phần liên kết tri thức L giữa các phân cụm cơ sở.
- 18 Sơ đồ mô hình FOMOCE được mô tả bởi Hình 3.2 dưới đây. Tâp dữ liệu M nguồn S1 S2 SM Xác định f1 Xác định f2 Xác định fM Xác định A1 Xác định A2 Xác định AM 1 2 M O1 O2 OM Tính I1 Tính I2 Tính IM Link 1 Link 2 Link M Linking function L sai sai sai Dừng 1? Dừng 2? Dừng M? đúng đúng đúng O1 O2 OM F V Kết quả phân cụm Hình 3.2 Sơ đồ mô hình phân cụm theo nhóm FOMOCE
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Tóm tắt Luận án Tiến sĩ Kinh tế: An ninh tài chính cho thị trường tài chính Việt Nam trong điều kiện hội nhập kinh tế quốc tế
25 p | 303 | 51
-
Tóm tắt Luận án Tiến sĩ Giáo dục học: Phát triển tư duy vật lý cho học sinh thông qua phương pháp mô hình với sự hỗ trợ của máy tính trong dạy học chương động lực học chất điểm vật lý lớp 10 trung học phổ thông
219 p | 288 | 35
-
Tóm tắt Luận án Tiến sĩ Kinh tế: Chiến lược Marketing đối với hàng mây tre đan xuất khẩu Việt Nam
27 p | 179 | 18
-
Tóm tắt Luận án Tiến sĩ Luật học: Hợp đồng dịch vụ logistics theo pháp luật Việt Nam hiện nay
27 p | 266 | 17
-
Tóm tắt Luận án Tiến sĩ Y học: Nghiên cứu điều kiện lao động, sức khoẻ và bệnh tật của thuyền viên tàu viễn dương tại 2 công ty vận tải biển Việt Nam năm 2011 - 2012
14 p | 269 | 16
-
Tóm tắt Luận án Tiến sĩ Triết học: Giáo dục Tư tưởng Hồ Chí Minh về đạo đức cho sinh viên trường Đại học Cảnh sát nhân dân hiện nay
26 p | 154 | 12
-
Tóm tắt luận án Tiến sĩ Kỹ thuật: Nghiên cứu tính toán ứng suất trong nền đất các công trình giao thông
28 p | 222 | 11
-
Tóm tắt Luận án Tiến sĩ Kinh tế Quốc tế: Rào cản phi thuế quan của Hoa Kỳ đối với xuất khẩu hàng thủy sản Việt Nam
28 p | 175 | 9
-
Tóm tắt luận án Tiến sĩ Kinh tế: Phát triển kinh tế biển Kiên Giang trong tiến trình hội nhập kinh tế quốc tế
27 p | 53 | 8
-
Tóm tắt Luận án Tiến sĩ Luật học: Các tội xâm phạm tình dục trẻ em trên địa bàn miền Tây Nam bộ: Tình hình, nguyên nhân và phòng ngừa
27 p | 198 | 8
-
Tóm tắt Luận án Tiến sĩ Xã hội học: Vai trò của các tổ chức chính trị xã hội cấp cơ sở trong việc đảm bảo an sinh xã hội cho cư dân nông thôn: Nghiên cứu trường hợp tại 2 xã
28 p | 148 | 7
-
Tóm tắt luận án Tiến sĩ Kinh tế: Phản ứng của nhà đầu tư với thông báo đăng ký giao dịch cổ phiếu của người nội bộ, người liên quan và cổ đông lớn nước ngoài nghiên cứu trên thị trường chứng khoán Việt Nam
32 p | 183 | 6
-
Tóm tắt Luận án Tiến sĩ Luật học: Quản lý nhà nước đối với giảng viên các trường Đại học công lập ở Việt Nam hiện nay
26 p | 135 | 5
-
Tóm tắt luận án Tiến sĩ Kinh tế: Các yếu tố ảnh hưởng đến xuất khẩu đồ gỗ Việt Nam thông qua mô hình hấp dẫn thương mại
28 p | 16 | 4
-
Tóm tắt Luận án Tiến sĩ Ngôn ngữ học: Phương tiện biểu hiện nghĩa tình thái ở hành động hỏi tiếng Anh và tiếng Việt
27 p | 119 | 4
-
Tóm tắt Luận án Tiến sĩ Kỹ thuật: Nghiên cứu cơ sở khoa học và khả năng di chuyển của tôm càng xanh (M. rosenbergii) áp dụng cho đường di cư qua đập Phước Hòa
27 p | 8 | 4
-
Tóm tắt luận án Tiến sĩ Kinh tế: Các nhân tố ảnh hưởng đến cấu trúc kỳ hạn nợ phương pháp tiếp cận hồi quy phân vị và phân rã Oaxaca – Blinder
28 p | 27 | 3
-
Tóm tắt luận án Tiến sĩ Kinh tế: Phát triển sản xuất chè nguyên liệu bền vững trên địa bàn tỉnh Phú Thọ các nhân tố tác động đến việc công bố thông tin kế toán môi trường tại các doanh nghiệp nuôi trồng thủy sản Việt Nam
25 p | 170 | 2
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn