Bài giảng Khai phá dữ liệu: SOM (self organizing maps) - Văn Thế Thành

Bài giảng "Khai phá dữ liệu: SOM (self organizing maps)" trình bày các kiến thức về SOM, định nghĩa SOM, cấu trúc SOM, giải mã thuật toán SOM, khoảng cách láng giềng và tốc độ học,... Mời các bạn cùng tham khảo nội dung chi tiết.

Chủ đề:

thangnamvoiva20

Tích hợp hệ thống thông tin

KHAI THÁC DỮ LIỆU

SOM (SELF ORGANIZING MAPS) Kohonen

24/05/2016

GIỚI THIỆU

 Mạng nơron nhân tạo này lần đầu tiên được giới thiệu bởi Kohonen vào năm 1982, nó được biết đến như là ánh xạ đặc trưng tự tổ chức (SOM).

 Mạng nơron Kohonen (hay nơron tự tổ chức) mô hình hóa cách hoạt động bộ não của con người, mặc dù nó khá đơn giản. Chúng ta có thể nhận được một số ý tưởng cách bộ não lưu trữ hình ảnh và cách nó nhận dạng các hình ảnh.

 Kỹ thuật SOM đã được áp dụng thành công trong một số lĩnh vực như nhận dạng, phân cụm dữ liệu, dự đoán chuỗi và khai phá dữ liệu,... Mẫu được nhận dạng có thể là ảnh, âm thanh hoặc văn bản,...

24/05/2016

ĐỊNH NGHĨA

 Mạng noron SOM là mạng có khả năng sử dụng những kinh nghiệm của quá khứ để thích ứng với những biến đổi của môi trường (không dự báo trước). Loại mạng này thuộc nhóm hệ học, thích nghi không cần có tín hiệu chỉ đạo từ bên ngoài.

24/05/2016

CẤU TRÚC SOM

24/05/2016

THUẬT TOÁN SOM TỔNG QUÁT

 Training: số k cụm k, và CSDL có n đối tượng

1. Xác định cấu trúc tầng ra. 2. Huấn luyện trọng số kết nối giữa intput và output 3. Xác định công thức cập nhật trọng số. 4. Khoảng cách trong kiến trúc mạng được thay đổi và

cập nhật trong các lần lặp.

5. Tốc độ học biến đổi trong quá trình huấn luyện. Kiểm thử: 1. Giá trị kiểm thử sử dụng bộ trọng số của huấn luyện

24/05/2016

MÃ GIẢ THUẬT TOÁN SOM

 Xác định số đầu ra của mạng.  Khởi tạo trọng số kết nối thường [-1,1]  LL=1;  While (LL == true)

1. Chọn lần lượt vecto đầu vào il 2. Dùng công thức tính khoảng cách Euclide đến từng vecto

trọng số của từng node ra.

3. Chọn vecto trọng số wj có giá trị nhỏ nhất ở bước 2. 4. Cập nhật vecto trọng số wj theo công thức:

Wj(t+1) = Wj(t) + (t)(Xi – Wj(t))

5. Tăng LL End While

24/05/2016

Ví dụ

Huấn luyện mạng SOM dựa trên khoảng cách Euclide bình phương để phân thành 02 cụm với dữ liệu huấn luyện như sau:

X1 = (1, 1, 0, 0) X2 = (0, 0, 0, 1) X3 = (1, 0, 0, 0) X4 = (0, 0, 1, 1) Vector trọng số kết nối W1 = (0.2, 0.6, 0.5, 0.9); W2 = (0.8, 0.4, 0.7, 0.3) Hệ số học (t) = 0.6 Công thức cập nhật trọng số Wj(t+1) = Wj(t) + (t)(Xi – Wj(t))