Mạng nơron truyền thẳng và ứng dụng trong dự báo dữ liệu

Chia sẻ: Nguyen Thi Ngoc Hoa | Ngày: | Loại File: PDF | Số trang:0

0
316
lượt xem
174
download

Mạng nơron truyền thẳng và ứng dụng trong dự báo dữ liệu

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Mạng nơron nhân tạo xuất phát từ việc mô phỏng hoạt động của bộ não con người. Mạng nơron là các mô hình tính toán chứa các đơn vị xử lý có khả năng truyền thông với nhau bằng cách gửi các tín hiệu đến lẫn nhau thông qua các liên kết có trọng số. Có khả năng thích nghi, nghĩa là “học từ các mẫu” thay vì “lập trình”. Các ứng dụng của mạng nơron:  Phân loại: tín hiệu radar; xem xét các mẫu bệnh,…...

Chủ đề:
Lưu

Nội dung Text: Mạng nơron truyền thẳng và ứng dụng trong dự báo dữ liệu

  1. Mạng nơron truyền thẳng và ứng dụng trong dự báo dữ liệu LUẬN VĂN THẠC SĨ KHOA HỌC Giáo viên hướng dẫn TS. Lê Hải Khôi Người thực hiện Trần Đức Minh
  2. Nội dung 1. Giới thiệu. 2. Các khái niệm cơ bản về mạng nơron. 3. Mạng nơron truyền thẳng. 4. Thu thập, Phân tích và xử lý dữ liệu. 5. Chương trình dự báo dữ liệu. 6. Kết luận 2
  3. 1. Giới thiệu  Mạng nơron nhân tạo xuất phát từ việc mô phỏng hoạt động của bộ não con người.  Mạng nơron là các mô hình tính toán chứa các đơn vị xử lý có khả năng truyền thông với nhau bằng cách gửi các tín hiệu đến lẫn nhau thông qua các liên kết có trọng số.  Có khả năng thích nghi, nghĩa là “học từ các mẫu” thay vì “lập trình”.  Các ứng dụng của mạng nơron:  Phân loại: tín hiệu radar; xem xét các mẫu bệnh,…  Giảm nhiễu: tiếng nói, ảnh tĩnh bị nhiễu,…  Dự đoán/Dự báo : lượng sử dụng, thị trường, dự đoán lượng bán,… 3
  4. 2. Các khái niệm cơ bản về mạng nơron: Mạng nơron có các đặc trưng sau:  Tập các đơn vị xử lý.  Một mức kích hoạt cho mỗi đơn vị. x0 w θj j0 j  Các liên kết giữa các đơn vị. x1 wj1 aj zj Σ g(aj)  Luật lan truyền. wjn ... xn n  Các hàm chuyển. a   w x  j ji i j zj  g (aj ) i 1  Các đầu vào ngoài dữ liệu (độ lệch - bias).  Phương pháp thu thập thông tin - Luật học.  Môi trường trong đó hệ thống có thể hoạt động. 4
  5. 3. Mạng nơron truyền thẳng 3.1. Cấu trúc cơ bản bias bias • Bao gồm một số lớp (1 lớp vào, 1 hay x0 h0 nhiều lớp ẩn và 1 lớp ra). x1 y1 h1 • Mỗi lớp có một số các đơn vị. x2 y2 • Mỗi đơn vị nhận đầu vào từ các đơn h2 … … … vị ở lớp trước đó và gửi các tín hiệu xl yn này đến các đơn vị ở lớp kế tiếp. hm Input Layer w(1)ij (2 ) Hidden Layer w jk Output Layer • Đầu ra được biểu diễn bởi một hàm tường minh của các trọng số và độ lệch. Đơn vị ẩn: l l aj   w (1) x ji i hj  g (aj )  g ( w(1) jixi ) i 0 i 0 Đơn vị đầu ra: m l yk  g 2( ak )  g 2( w g ( w(1) jixi )) m ( 2) ak   w ( 2) h kj j kj j 0 i 0 j 0 5
  6. 3.2. Khả năng thể hiện  Các mạng không có các lớp ẩn chỉ có khả năng giải quyết các bài toán khả phân tuyến tính.  Các mạng nơron với một lớp ẩn có thể xấp xỉ khá tốt bất kỳ một ánh xạ hàm nào từ không gian hữu hạn một chiều sang một không gian khác.  Các mạng nơron với 2 lớp ẩn có khả năng thể hiện một đường phân chia hay xấp xỉ một ánh xạ mịn bất kỳ tới một độ chính xác bất kỳ. 6
  7. 3.3. Huấn luyện bằng thuật toán lan truyền ngược: • Đây là phương pháp thông dụng nhất để huấn luyện cho các mạng nơron truyền thẳng nhiều lớp. • Có thể áp dụng cho các mạng truyền thẳng với các hàm chuyển và các hàm lỗi khả vi. Bước 1: Lan truyền xuôi đầu vào qua mạng: a0 = p am+1 = fm+1 (Wm+1 am + bm+1), với m = 0, 1, ..., M – 1. a = aM Bước 2: Lan truyền độ nhậy cảm (lỗi) ngược lại qua mạng: M  m M   s  2 F n M t  a  , trong đó s  F n m W m1  s m1 , với m = M – 1, ..., 2, 1. m T Bước 3: Cuối cùng, các trọng số và độ lệch được cập nhật bởi công thức sau:  W m k  1  W m k    s m a m 1  T b m k  1  b m k    s m Sử dụng bước đà: ∆Wm(k) = ∆Wm(k - 1) – (1 - ) sm (am – 1) T, ∆bm(k) = ∆bm(k - 1) - (1 - ) sm . 7
  8. 4. Thu thập, Phân tích và Xử lý dữ liệu Xác định yêu cầu về dữ liệu - Dữ liệu nào có liên quan trực tiếp đến bài toán. - Dữ liệu nào có thể không liên quan. Phân tích sơ bộ dữ liệu (Thống kê và Trực quan hóa) Thu thập, phân tích dữ liệu Kiểm tra tính hợp lệ của dữ liệu Phân hoạch dữ liệu (Huấn luyện/Kiểm tra/Kiểm định) Biến đổi Tiền xử lý Điều chỉnh giá trị về khoảng (0,1) hoặc (-1,1) dữ liệu Áp dụng một hàm toán học cho các giá trị (chẳng hạn hàm logarit hay bình phương) Mã hóa các biến số / Trích chọn đặc trưng. Mạng nơron Phân loại Dự báo, … Hậu xử lý dữ liệu Tùy thuộc vào ứng dụng và quá trình tiền xử lý. 8
  9. 5. Chương trình Dự báo dữ liệu Bài toán dự báo lượng sử dụng khí ga 9
  10. 5.1. Mục tiêu Dự đoán lượng sử dụng hàng giờ trong 1 đến 5 ngày cho các công ty cung cấp ga để:  Đáp ứng được nhu cầu trong tương lai  Tối thiểu chi phí điều hành  Lập kế hoạch dự trữ. 5.2. Các nhân tố ảnh hưởng Các điều kiện thời tiết: nhiệt độ, tốc độ gió, ... Thời gian: giờ, ngày trong tuần, tháng, ngày cuối tuần. Thông tin kinh tế: giá ga, giá dầu, … 10
  11. 5.3. Mô hình dự báo 1) Dữ liệu thô Ngày Gio Nhiet do Gio Su dung 02-08-1998 00 37 3 1168 02-08-1998 01 37 9 1213 02-08-1998 02 37 6 1316 02-08-1998 03 37 3 1417 02-08-1998 04 37 3 1534 02-08-1998 05 37 5 1680 02-08-1998 06 36 5 1819 02-08-1998 07 34 6 1967 2) Dữ liệu sau xử lý sơ bộ 6 hiệu ứng Nhiet do 37 Gio 3 Gio trong Ngay 00 Ngay tuan 6 Cuoi tuan 1 Thang 1 Su dung 1168 1. 1. Nhiệt độ Nhiệt độ 37 9 01 6 1 1 1213 2. 2. Tốc độ gió Tốc độ gió 37 6 02 6 1 1 1316 37 3 03 6 1 1 1417 3. 3. Giờ trong ngày Giờ trong ngày 37 37 3 5 04 05 6 6 1 1 1 1 1534 1680 4. 4. Ngày trong tuần Ngày trong tuần 36 5 06 6 1 1 1819 5. 5. Cuối tuần Cuối tuần 34 6 07 6 1 1 1967 6. 6. Tháng trong năm Tháng trong năm 11
  12. 5.3. Mô hình dự báo (tiếp) 3) Cấu trúc mạng bias bias Nhiệt độ Gió Giờ Lượng Ngày tuần Sử dụng … Cuối tuần Tháng Lớp vào Lớp ẩn Lớp ra Hàm chuyển của các đơn vị ẩn sử dụng hàm sigmoid Hàm chuyển của các đơn vị ẩn sử dụng hàm sigmoid Hàm chuyển cho lớp ra là hàm đồng nhất g(x) = xx Hàm chuyển cho lớp ra là hàm đồng nhất g(x) = 12
  13. 5.4. Các đặc trưng của hệ thống • Tìm ra số tối ưu các đơn vị trong lớp ẩn • Đánh giá ảnh hưởng của hệ số học và hệ số bước đà • Đánh giá được khả năng tổng quát hóa của mạng trong khi huấn luyện • Dự báo dữ liệu tương lai 13
  14. 5.4. Các đặc trưng của hệ thống (tiếp) 1) Xác định các tham số cho hệ thống 14
  15. 5.4. Các đặc trưng của hệ thống (tiếp) 3) Huấn luyện mạng và kiểm tra khả năng tổng quát hóa 15
  16. 5.4. Các đặc trưng của hệ thống (tiếp) 4) Dự báo tương lai 16
  17. 5.5. Phân tích kết quả  Mạng được huấn luyện tốt có khả năng dự báo chính xác đến 90%.  Hệ số học và hệ số bước đà có ảnh hưởng rất nhiều đến thời gian huấn luyện của mạng.  Đối với đơn vị lớp ra, hàm chuyển sử dụng là sigmoid hay hàm đồng nhất không có khác biệt đáng kể.  Tùy thuộc vào độ phức tạp của bài toán, chương trình có thời gian huấn luyện, số đơn vị sử dụng trong lớp ẩn khác nhau. Để chọn lựa được cấu trúc tối ưu, có thể áp dụng phương pháp Thử-sai (Trial-and-errors). … 17
  18. 5.6. Các bước thực hiện Dưới đây là các bước chính khi thực hiện thiết kế và thực thi mạng nơron cho bài toán dự báo: 1. Chọn lựa các biến. 2. Thu thập dữ liệu. 3. Tiền xử lý dữ liệu. 4. Phân chia tập dữ liệu thành các tập: huấn luyện, kiểm tra, kiểm định. 5. Xác định cấu trúc mạng:  số lớp ẩn.  số nơron trong các lớp ẩn.  số nơron đầu ra.  các hàm chuyển. 6. Xác định tiêu chuẩn đánh giá (hàm lỗi). 7. Huấn luyện mạng. 8. Thực thi trong thực tế. Trong khi thực hiện, không nhất thiết phải theo thứ tự các bước mà có thể quay lại các bước trước đó, đặc biệt là ở bước Huấn luyện và Lựa chọn các biến tham gia đầu vào. 18
  19. 6. Kết luận 1) Mạng nơron là các bộ xấp xỉ đa năng. Chúng có lợi điểm so với các cách tiếp cận truyền thống: không yêu cầu dữ liệu phải đầy đủ. 2) Chương trình Dự báo được xây dựng và áp dụng thử nghiệm cho dữ liệu lượng sử dụng khí ga (lấy trên Internet) có khả năng dự báo rất tốt. 3) Các mô hình tương tự có thể xây dựng cho các bài toán dự báo khác như: điện, nước, dự đoán thị trường, chứng khoán, lưu lượng giao thông, lượng bán của các sản phẩm,… chừng nào những mối liên hệ giữa các đầu vào và đầu ra được xác định bằng thực tế và lý thuyết. 4) Các thuật toán cải tiến có thể áp dụng để tăng cường hiệu năng của mạng. 19
  20. XIN CẢM ƠN! XIN CẢM ƠN! 20

CÓ THỂ BẠN MUỐN DOWNLOAD

Đồng bộ tài khoản