Luận văn Nghiên cứu ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

LỜI CAM ĐOAN

Tôi xin cam đoan luận văn này là công trình do tôi tổng hợp và nghiên cứu.

Trong luận văn có sử dụng một số tài liệu tham khảo như đã nêu trong phần tài

liệu tham khảo.

Tác giả luận văn

Nguyễn Việt Hùng

LỜI NÓI ĐẦU

Trong hệ thống điều khiển hiện đại, có rất nhiều phương pháp điều khiển

đảm bảo được tốt chất lượng điều khiển. Trong điều khiển tự động, để điều khiển

chính xác đối tượng khi chưa biết rõ được thông số, trước tiên ta phải hiểu rõ đối

tượng đó. Đặc biệt đối với các đối tượng phi tuyến ta cần nhận dạng được đặc tính

vào-ra của nó để đảm bảo tạo ra tín hiệu điều khiển thích nghi được lựa chọn chính

xác hơn. Ngày nay trên thế giới người ta dựa vào cấu trúc mạng nơron sinh vật để

làm mạng nơron nhân tạo áp dụng vào các ngành khoa học kỹ thuật. Mạng nơron

được ứng dụng ở nhiều lĩnh vực. Mong muốn của chúng ta là nhân tạo hóa các thiết

bị, đặc biệt trong lĩnh vực máy tính, điều khiển và rôbôt vận dụng những đặc tính

trội của nơron thần kinh.

Trong thời gian của khoá học cao học, chuyên ngành Tự động hoá tại trường

Đại học Kỹ thuật Công nghiệp Thái Nguyên, được sự tạo điều kiện giúp đỡ của nhà

trường và Tiến sĩ Phạm Hữu Đức Dục em đã lựa chọn đề tài của mình là:

“Nghiên cứu ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu”.

Trong quá trình thực hiện đề tài, được sự hướng dẫn nhiệt tình của Tiến sĩ

Phạm Hữu Đức Dục, sự giúp đỡ của bạn bè cùng với sự nỗ lực, cố gắng của bản

thân đến nay bản luận văn của em đã hoàn thành.

Dù đã có nhiều cố gắng, xong bản luận văn vẫn không tránh khỏi những thiếu

sót và hạn chế, em rất mong nhận được sự góp ý của các thầy để bản luận văn của

em được hoàn thiện hơn.

Em xin trân trọng cảm ơn!

Học viên

Nguyễn Việt Hùng

MỤC LỤC

Trang

Lời cam đoan.

Mục lục

Danh mục các ký hiệu, các chữ viết tắt.

Danh mục các hình vẽ, đồ thị

1

PHẦN MỞ ĐẦU.

6

Chương I- TÔNG QUAN VỀ MẠNG NƠRON NHÂN TẠO.

6

6

1.1. Lịch sử phát triển của mạng nơ ron nhân tạo.

6

1.1.1 Mô hình nơron sinh học

1.1.1.1 Chức năng, tổ chức và hoạt động của bộ não con người.

9 10

1.1.1.2 Mạng nơron sinh học

11

1.1.3. Lịch sử phát triển của mạng nơron nhân tạo

12

1.1.2. Mạng nơ ron nhân tạo.

12

1.1.4. Các tính chất của mạng nơron nhân tạo

14

1.2. Cấu tạo mạng noron.

16

1.3. Cấu trúc mạng noron.

18

1.4. Phương thức làm việc của mạng nơron.

23

1.5. Các luật học

23

1.6. Mạng nơron truyền thẳng và mạng nơron hồi quy.

23

1.6.1. Mạng nơron truyền thẳng.

23

1.6.1.1. Mạng một lớp nơron.

24

1.6.1.2. Mạng nhiều lớp nơron.

25

1.6.2. Mạng nơron hồi quy.

25

1.6.2.1. Mạng hồi quy không hoàn toàn

27

1.6.2.2. Mạng các dãy của Jordan

yi

1.6.2.3. Mạng hồi quy đơn giản

28

31

1.7. Các ứng dụng của mạng nơron

32

1.8. Công nghệ phần cứng sử dụng mạng nơron.

33

1.9. So sánh khả năng của mạng nơron với mạch lôgic:

1.10. KẾT LUÂN CHƯƠNG I

34 Chương II: CÁC PHƯƠNG PHÁP ỨNG DỤNG MẠNG NƠRON TRONG

NHẬN DẠNG

2.1 Khái quát chung 2.1.1 Đặt vấn đề 2.1.2. Định nghĩa 2.1.3. Sơ lược về sự phát triển của các phương pháp nhận dạng

2.2. Các phương pháp nhận dạng 2.2.1. Nhận dạng On-line.

2.2.1.1.Phương pháp lặp bình phương cực tiểu 2.2.1.2.Phương pháp xấp xỉ ngẫu nhiên 2.2.1.3. Phương pháp lọc Kalman mở rộng

2.2.2. Nhận dạng off-line

2.2.2.1. Phương pháp xấp xỉ vi phân 2.2.2.2 Phương pháp gradient 2.2.2.3. Phương pháp tìm kiếm trực tiếp 2.2.2.4. Phương pháp tựa tuyến tính 2.2.2.5. Phương pháp sử dụng hàm nhạy

34 34 35 36 37 38 38 39 40 42 43 44 45 46 47 47 48 52 53 54 55 57 57 59 61

2.2.3. Nhận dạng theo thời gian thực 2.3. Mô tả toán học của đối tượng ở rời rạc 2.4. Nhận dang hệ thống sử dụng mạng nơron 2.4.1. Mô hình nhận dạng kiểu truyền thẳng 2.4.2 Mô hình song song 2.4.3 Mô hình nối tiếp - song song 2.4.4. Mô hình ngược trực tiếp

2.5. Tính gần đúng hàm số dùng mạng nơron. 2.6. Mô hình mạng nơron trong nhận dạng. 2.7. KẾT LUÂN CHƯƠNG II

62

Chương III: ỨNG DỤNG MẠNG NƠRON ELMAN NHẬN DẠNG VỊ TRÍ RÔBÔT HAI KHÂU 3.1. Mạng nơron Elman:

62 62 64 64 64

3.1.1. Cấu trúc mạng Elman 3.1.2. Giá trị đầu vào của các tham số. 3.1.3. Huấn luyện

3.2.1. Phân tích chọn mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

64 66

3.2. Động học rôbốt hai khâu

67

3.2.2. Động học rôbốt hai khâu

3.3. Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

67 69

3.3.1. Thiết lập sơ đồ nhận dạng

89

3.3.2. Quá trình nhận dạng

90

3.4. KẾT LUÂN CHƯƠNG III 3.5. KẾT LUẬN CHUNG VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI

1 Phần mở đầu

PHẦN MỞ ĐẦU

1. Tính cấp thiết của đề tài:

Nước ta đang bước vào thời kỳ Công nghiệp hóa- hiện đại hóa đất nước.

Tự động hóa là một nhu cầu cấp bách để tăng năng suất lao động, nâng cao chất

lượng sản phẩm, cải thiện điều kiện làm việc của người lao động thúc đẩy sự

phát triển của nền kinh tế.

Trong các ngành công nghiệp tự động hoá giữ một vai trò quan trọng nó cho

phép tự động hoá các quá trình sản xuất. Nhận dạng hệ thống là một trong những

công việc đầu tiên phải thực hiện khi giải quyết một bài toán điều khiển tự động,

nó quyết định chất lượng và hiệu quả của công việc điều khiển hệ thống về sau.

Tuy ra đời muộn nhưng nhận dạng đã phát triển rất nhanh và đã có những thành

tựu vượt bậc. Nguyên nhân của sự phát triển vượt bậc đó một phần từ yêu cầu

thực tế, song có lẽ phần chính là nhờ có những hỗ trợ tích cực của các ngành

khoa học có liên quan như tin học, lý thuyết điều khiển mờ và mạng nơron.

Để điều khiển chính xác đối tượng khi chưa biết rõ được thông số, trước tiên ta

phải hiểu rõ đối tượng đó. Đối với đối tượng là phi tuyến như rô bôt hai khâu, ta

cần nhận dạng đặc tính vào - ra của nó để đảm bảo tạo tín hiệu điều khiển thích

nghi được lựa chọn chính xác hơn. Hiện nay thường sử dụng logic mờ ( Fuzzy

Logic ), mạng nơron ( Neural Network) và mạng nơron mờ ( Fuzzy Neural

Network) để nhận dạng và điều khiển thích nghi đối tượng có thông số thay đổi.

Trong chương trình khoá học Cao học chuyên ngành Tự động hoá tại trường Đại

học Kỹ thuật Công nghiệp Thái Nguyên, được sự tạo điều khiện giúp đỡ của nhà

trường và Tiến sĩ Phạm Hữu Đức Dục, em đã lựa chọn đề tài tốt nghiệp của

mình là :“ Nghiên cứu ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu”.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

2 Phần mở đầu

2. Ý nghĩa khoa học và thực tiễn của đề tài.

a. Ý nghĩa khoa học: Với đề tài ứng dụng mạng nơron Elman nhận dạng vị trí rô bôt hai khâu. Sau khi đã nhận dạng được đối tượng ta có thể thay thế gần đúng mô hình vị trí rô bôt hai khâu bằng một mạng nơron Elman.

b.Ý nghĩa thực tiễn: Từ các thông số mô phỏng của mạng nơron, ta có thể tính toán được tín hiệu điều khiển nhằm điều khiển thích nghi rôbôt hai khâu. 3. Mục đích của đề tài Để điều chỉnh được chính xác một đối tượng, trước tiên ta phải hiểu rõ tất cả các thông số của đối tượng đó. Đối với đối tượng có thông số tải thay đổi như vị trí rô bôt 2 khâu, ta cần nhận dạng đặc tính vào - ra của nó để bảo đảm tạo ra được tín hiệu điều khiển thích nghi được chính xác hơn. Đề tài này nghiên cứu một ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt 2 khâu. Sơ đồ hình 1 mô tả một mô hình điều chỉnh thích nghi rôbôt hai khâu theo mô hình mẫu.

ym

e2

Mô hình mẫu

-ymh

xd

Khoá K

Rôbôt hai khâu

u

Bộ điều khiển

Khoá K

e2 • 2e •• 2e

y

Mạng nơron nhận dạng

ymh

e1

Hình 1. Sơ đồ khối điều khiển thích nghi rôbôt hai khâu

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

3 Phần mở đầu

Sơ đồ điều khiển thực hiện theo 2 giai đoạn sau đây:

- Giai đoạn 1:

Sử dụng mạng nơron nhận dạng vị trí rôbôt hai khâu. Khi đó các khóa K

mở. Căn cứ vào sai lệch e1 giữa tín hiệu ra của rôbôt là y và tín hiệu ra của

mạng nơron nhận dạng là ymh, mạng nơron tiến hành “HỌC” để nhận dạng đặc

tính đầu ra y của rô bôt hai khâu, sao cho tín hiệu ra của mạng nơron nhận dạng

.

e

−= y

y

ymh bám theo được tín hiệu ra y của rôbôt hai khâu. Với

mh

1

- Giai đoạn 2: Căn cứ vào kết quả nhận dạng ta có được một mạng nơron

có thể thay thế gần đúng rôbôt hai khâu, từ đó tiến hành điều khiển thích nghi rô

bôt hai khâu theo mô hình mẫu. Các khoá K đóng. Dựa vào bộ thông số sai lệch

(e2,

) giữa tín hiệu đầu ra của mô hình mẫu ym và tín hiệu đầu ra của

,...

• •• e,e 2

2

mạng nơron nhận dạng ymh, bộ điều khiển thực hiện các luật học thích nghi tạo ra

tín hiệu điều khiển u với mục đích làm cho tín hiệu đầu ra y mh của mạng nơron

nhận dạng bám theo được tín hiệu đầu ra của mô hình mẫu ym. Với

=

e

y

y

là đạo hàm các cấp của sai lệch e2.

,...

• •• e,e 2

2

2

m

mh

Phần này sử dụng các luật học điều khiển thích nghi vị trí rôbôt hai khâu

sẽ được thực hiện ở các công trình khoa học cấp cao hơn.

4. Đối tượng và phạm vi nghiên cứu của đề tài:

Trong khuôn khổ của luận văn Thạc sĩ Kỹ thuật, với thời gian nghiên cứu có

hạn, luận văn này chỉ đi sâu nghiên cứu ứng dụng mạng nơron nhận dạng vị trí

rô bôt hai khâu (đã trình bày ở giai đoạn 1 tại sơ đồ hình 1). Luận văn này cũng

giới hạn phạm vi nghiên cứu: sử dụng mạng nơron Elman đóng vai trò là mạng

nơron nhận dạng và đối tượng cần nhận dạng là vị trí rôbôt hai khâu.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

4 Phần mở đầu

Phần mở đầu

Chương 1. Tổng quan về mạng nơron nhân tạo.

Phân tích tổng quan về mạng nơron bao gồm: phần lịch sử phát triển, kết

cấu của mạng các nơron, ứng dụng của chúng...

Chương 2. Các phương pháp ứng dụng mạng nơron trong nhận dạng.

Chương 2 tập trung trình bày các phươn g pháp ứng dụng mô hình

mạng nơron trong nhận dạng .

Chương 3. Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu.

+ Tổng quan về mạng Elman

+ Phân tích chọn mạng nơron Elman tiến hành nhận dạng vị trí rôbôt hai

khâu

y(k)

x(h)

Rôbôt hai khâu ( Mô hình tính toán vị trí)

^

+

y (k)

Mạng nơron Elman

-

e(k)

Luật học của mạng nơron Elman

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Hình 2. Mô hình nhận dạng vị trí rôbôt hai khâu

5 Phần mở đầu

+ Động học rôbôt hai khâu

+ Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

+ Để thấy rõ hơn ưu điểm của việc sử dụng mạng nơron Elman trong nhận

dạng vị trí rôbôt hai khâu tiến hành so sánh cấu trúc và khả năng nhận dạng

của mạng nơron Elman với mạng nơron truyền thẳng khi chúng cùng được

sử dụng nhận dạng vị trí rôbôt hai khâu.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

6 Chương I: Tổng quan về mạng nơron nhân tạo

CHƯƠNG I

TỔNG QUAN VỀ MẠNG NƠRON NHÂN TẠO

1.1. Cở sở về mạng nơron

1.1.1 Mô hình nơron sinh học

1.1.1.1 Chức năng, tổ chức và hoạt động của bộ não con người.

Bộ não con người có chức năng hết sức quan trọng trong đời sống của con

người. Nó gần như kiểm soát mọi hành vi của con người từ hoạt động cơ bắp đơn

giản đến những hoạt động phức tạp như học tập, nhớ, suy luận, tư duy, sáng tạo….

Bộ não người được hình thành từ sự liên kết của khoảng 1011 phần tử (tế bào), trong đó có khoảng 1010 phần tử là nơron, số còn lại khoảng 9x1010 phần tử là

các tế bào thần kinh đệm và chúng có nhiệm vụ phục vụ cũng như hỗ trợ cho các

nơron. Thông thường một bộ não trung bình cân nặng khoảng 1,5 Kg và có thể tích là 235 cm3. Cho đến nay người ta vẫn chưa thực sự biết rõ c ấu tạo chi tiết của bộ

não. Tuy vậy về đại thể thì cấu tạo bộ não được chia ra thành nhiều vùng khác nhau.

Mỗi vùng có thể kiểm soát một hay nhiều hoạt động của con người.

* Các đặc tính của não người:

- Tính phân lớp: Các vùng của bộ não được phân thành các lớp, thông tin được

xử lý theo các tầng.

- Tính mô đun: Các vùng của bộ nhớ được phân thành các mô đun được mã

hoá bằng các định nghĩa mối quan hệ tích hợp giữa các tín hiệu vào qua các giác

quan và các tín hiệu ra.

- Mối liên kết: Liên kết giữa các lớp dẫn đến các dữ liệu dùng chung xem như

các liên hệ phản hồi khi truyền tín hiệu.

- Sử lý phân tán các tín hiệu vào: Các tín hiệu vào được truyền qua nhiều kênh

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

thông tin khác nhau, được xử lý bằng các phương pháp đặc biệt.

7 Chương I: Tổng quan về mạng nơron nhân tạo

Bộ não có cấu trúc nhiều lớp: Lớp bên ngoài thường thấy là các nếp nhăn, là

lớp có cấu tạo phức tạp nhất. Đây là nơi kiểm soát và phát sinh các hành động phức

tạp như nghe, nhìn, tư duy…

Tín hiệu thu, nhận ở các dạng xung điện – màng membrane: mỗi tế bào thần kinh có một màng, có nhiệm v ụ giữ cho các chất nuôi tế bào không tràn ra ngoài. Do đó các phần tử nội bào và ngoại bào không bằng nhau, giữa chúng có dung dịch muối lỏng làm cho chúng bị phân rã ra thành các nguyên tử âm và dương ra khỏi tế bào bằng với lực hút chúng vào trong tế bào.

Điện thế màng là phần tử quan trọng trong quá trình truyền tin của hệ thần

kinh. Khi thay đổi khả năng thẩm thấu ion của màng thì điện thế màng của tế bào bị

thay đổi và tiến tới một ngưỡng nào đó, đồng thời sinh ra dòng điện. Dòng điện này

gây ra phản ứ ng kích thích làm thay đổi khả năng thẩm thấu ion của tế bào tiếp

theo.

* Xử lý thông tin trong não bộ:

Thông tin được tiếp nhận từ các giác quan và chuyển vào các tế bào thần kinh

vận động vào các tế bào cơ. Mỗi tế bào thần kinh tiếp nhận thông tin, điện thế sẽ

tăng trong thần kinh cảm giác, ý nghĩa dòng điện đó được giải mã và lưu ở thần

kinh trung ương, kết quả xử lý thông tin được gửi đến các tế bào cơ.

Các tế bào thần kinh đưa các tín hiệu giống nhau, do đó không thể phân biệt

được đó là của loài động vật nguyên thuỷ hay của một giáo sư. Các khớp thần kinh

chỉ cho các tín hiệu phù hợp qua chúng, còn lại các tín hiệu khác bị cản lại. Lượng

tín hiệu được biến đổi gọi là cường độ khớp thần kinh đó chính là trọng số của

nơron trong mạng nơron nhân tạo.

Tại sao việc nghiên cứu về mạng thần kinh lại có tầm quan trọng lớn lao. Có

thể trả lời ngắn gọn là sự giống nhau của các tín hiệu của các tế bào thần kinh đơn

lẻ. Do dó chức năng thực sự của bộ não không phụ thuộc vào vai trò của một tế bào

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

thần kinh đơn, mà phụ thuộc vào toàn bộ các tế bào thần kinh hay các tế bào thần

8 Chương I: Tổng quan về mạng nơron nhân tạo

kinh liên kết với nhau thành một mạng thần kinh hay một mạng nơron ( Neural

Networks)

Hoạt động của bộ não nói riêng và của hệ thần kinh nói chung đã được con

người quan tâm nghiên cứu từ lâu nhưng cho đến nay người t a vẫn chưa hiểu rõ

thực sự về hoạt động của bộ não và hệ thần kinh. Đặc biệt là trong các hoạt động

liên quan đến trí óc như suy nghĩ, nhớ, sáng tạo…Tuy thế cho đến nay người ta

cũng có những hiểu biết căn bản về hoạt động cấp thấp của não.

Mỗi nơron liên kết với khoảng 104 nơron khác cho đến khi hoạt động thì bộ

não hoạt động một cách tổng lực và đạt hiệu quả cao. Nói một cách khác là các

phần tử của não bộ hoạt động một cách song song và tương tác hết sức tinh vi phức

tạp và hiệu quả hoạt động thường rất cao, nhất là trong các vấn để phức tạp. Về tốc

độ xử lý của bộ não người rất nhanh mặc dù tốc độ xử lý của mỗi nơron (có thể xem

như phần tử xử lý hay phần tử tính) là rất chậm so với xử lý của các cổng logic silicon trong các chip vi xử lý ( 103 giây so với 1010 giây)

* Hoạt động của cả hệ thống thần kinh bao gồm não bộ và các giác quan như

sau:

- Trước hết con người bị kích thích bởi giác quan từ bên ngoài hoặc trong cơ

thể. Sự kích thích đó được biến thành các xung điện bởi chính giác quan tiếp nhận

kích thích. Những tín hiệu này được chuyển về trung ương thần kinh là não bộ để

xử lý. Trong thực tế não bộ liên tục nhận thông tin xử lý, đánh giá và so sánh với

thông tin lưu trữ để đưa ra quyết định thích đáng.

- Những mệnh lệnh cần thiết được phát sinh và gửi đến bộ phận thi hành thích hợp

như các cơ tay, chân… Những bộ phận thi hành biến những xung điện thành dữ liệu

xuất của hệ thống.

* Tóm lại : Bộ não người có chức năng hết sức quan trọng đối với đời sống của con

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

người. Cấu tạo của nó rất phức tạp, tinh vi bởi được tạo thành từ mạng nơron có

9 Chương I: Tổng quan về mạng nơron nhân tạo

hàng chục tỉ tế bào với mức độ liên kết giữa các nơron là rất cao. Hơn nữa nó còn

được phân chia thành các vùng và các lớp khác nhau. Bộ não hoạt động dựa trên cơ

chế hoạt động song song của các nơron tạo nên nó

1.1.1.2 Mạng nơron sinh học

Mạng nơron bao gồm vô số các nơron được liên kết truyền thông với nhau

Axôn

Axôn được nối với rễ đầu vào của nơron 2

trong mạng. Hình 1.1 là một phần của mạng nơron bao gồm hai nơron.

Rễ đầu ra

Rễ đầu ra của nơron 1 được nối với axôn

Nhân

Hình 1.1. Mạng nơron đơn giản gồm 2 nơron

Một nơron bao gồm các thành phần cơ bản: Thân nơron được giới hạn trong một màng membran và trong cùng là nhân, từ

thân nơron còn có rất nhiều đường rẽ nhánh gọi là rễ.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Đường liên lạc liên kết nơron này với nơron khác được gọi là axôn, trên axôn có các đường rẽ nhánh. Nơron có thể liên kết với các nơron khác qua các rễ. Chính vì sự liên kết đa dạng như vậy nên mạng nơron có độ liên kết cao.

10 Chương I: Tổng quan về mạng nơron nhân tạo

Các rễ của nơron được chia thành hai loại: loại nhận thông tin từ nơron khác

qua axôn, mà ta sẽ gọi là rễ đầu vào và loại đưa thông tin qua axôn tới các nơron

khác gọi là rễ đầu ra.

Một nơron có thể có nhiều rễ đầu vào, nhưng chỉ có một rễ đầu ra. Như thế,

nếu xem nơron như một khâu điều khiển thì đó chính là khâu có nhiều đầu vào, một

đầu ra.

Quá trình hoạt động của một nơron là một quá trình điện hoá tự nhiên. Ở trạng

thái cân bằng (trạng thái tĩnh) điện áp của màng membran khoảng -75mV. Khi có

tác động bên ngoài vào nơron (mức điện áp khoảng 35mV), trong tế bào nơron xảy

ra hàng loạt các phản ứng hoá học tạo thành lực tác động làm nơron bị kích hoạt.

Thế năng sinh ra khi nơron ở trạng thái bị kích thích hoàn toàn này chỉ tồn tại

khoảng vài mili giây sau đó nơron lại trở về trạng thái cân bằng cũ, thế năng này

được truyền vào mạng qua axôn và có khả năng kích thích hoặc kìm hãm tự nhiên

các nơron khác trong mạn g. Một nơron sẽ ở trạng thái kích thích khi tại đầu vào

xuất hiện một tín hiệu tác động vượt qua ngưỡng cân bằng của nơron.

Một tính chất cơ bản của mạng nơron sinh học là các đáp ứng theo kích thích có khả

năng thay đổi theo thời gian. Các đáp ứng có thể tăng lên, giảm đi hoặc hoàn toàn

biến mất. Qua các nhánh axôn liên kết tế bào nơron này với tế bào nơron khác, sự

thay đổi trạng thái của một nơron cũng kéo theo sự thay đổi trạng thái của những

nơron khác dẫn đến sự thay đổi của toàn bộ mạng nơron. Việc t hay đổi trạng thái

của mạng nơron có thể thực hiện qua một quá trình dạy hoặc do khả năng học tự

nhiên

1.1.2 Mạng nơron nhân tạo

Sự thay thế những tính chất này bằng một mô hình toán học tương đương được gọi

là mạng nơron nhân tạo. Mạng nơron nhân tạo có thể được chế tạo bằng nhiều cách

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

khác nhau vì vậy trong thực tế tồn tại rất nhiều kiểu mạng nơron nhân tạo.

11 Chương I: Tổng quan về mạng nơron nhân tạo

P1

w1

a

p2

n

f

w2

b

: : :

pm

wm

1

Hình 1.2. Nơron nhiều đầu vào

Hình 1.2. Biểu diễn một nơron nhân tạo đơn giản bao gồm m đầu vào và một đầu ra.

Đứng về mặt hệ thống một nơron là một hệ thống MISO quen thuộc với nhiều đầu vào và một đầu ra. Cấu trúc của một nơron gồm một bộ tổng và một hàm truyền f(n).

Quan hệ giữa các đầu vào và ra của một nơron được biểu diễn bằng phương

[

]

(1.1)

=+ b

*

p

...

p

=+ b

+ bWp

n

w 1 w 2 .

wp k k

p 1

2

m

m = ∑ = k 1

: w m

      

      

trình toán học như sau:

a = f(n), trong đó f là hàm chuyển đổi, w là trọng số và b là tham số bù.

1.1.3. Lịch sử phát triển của mạng nơron nhân tạo

Mạng nơron nhân tạo đã có một lịch sử lâu dài. Năm 1943, McCulloch và Pitts

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

đã đưa ra khả năng liên kết và một số liên kết cơ bản, của mạng nơron. Năm 194 9,

12 Chương I: Tổng quan về mạng nơron nhân tạo

Hebb đã đưa ra các luật thích nghi trong mạng nơron. Năm 1958, Rosenblatt đưa ra

cấu trúc Perception. Năm 1969, Minsky và Papert phân tích sự đúng đắn của

Perception, họ đã chứng minh các tính chất và chỉ rõ các giới hạn của một số mô

hình. Năm 1976, Grossberg dựa vào tính chất sinh học đã đưa ra một số cấu trúc

của hệ động học phi tuyến với các tính chất mới. Năm 1982, Hoppfield đã đưa ra

mạng học phi tuyến với các tính chất mới. Năm 1982, Rumelhart đưa ra mô hình

song song (Parallel Distributer Processing-PDS) và một số kết quả và thuật toán.

Thuật toán học lan truyền ngược (Back Propagation learning rule) được Rumelhart,

Hinton, Williams (1986) đề xuất luyện mạng nơron nhiều lớp. Những năm gần đây,

nhiều tác giả đã đề xuất nhiều loại cấu trúc mạng nơron mới. Mạng nơron được ứng

dụng trong nhiều lĩnh vực kinh tế, kỹ thuật, khoa học vũ trụ (Hecht - Nielsen,

1988).

1.1.4. Các tính chất của mạng nơron nhân tạo

- Là hệ phi tuyến: Mạng nơron có khả năng to lớn trong lĩnh vực nhận dạng và

điều khiển các đối tượng phi tuyến.

- Là hệ xử lý song song: Mạng nơron có cấu trúc song song, do đó có tốc độ

tính toán rất cao, rất phù hợp với lĩnh vực nhận dạng và điều khiển.

- Là hệ học và thích nghi: Mạng được luyện từ các số liệu quá khứ, có khả

năng tự chỉnh khi số liệu đầu vào bị mất, có thể điều khiển on-line.

- Là hệ nhiều biến, là hệ nhiều đầu vào, nhiều đầu ra (Many Input Many

Output - MIMO), rất tiện dùng khi điều khiển đối tượng có nhiều biến số.

1.2. Cấu tạo mạng noron.

Dựa trên những phương pháp xây dựng mạng noron ta có thể coi mạng nơron như

một hệ MISO truyền đạt và xử lý tín hiệu. Đặc tính truyền đạt của noron phần lớn là

đặc tính truyền đạt tĩnh, chỉ khi có khâu đáp ứng chức năng kiểu BSB thì lúc đó

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

noron có đặc tính động. Trong mọi trường hợp do đặc tính phi tuyến của khâu tạo

13 Chương I: Tổng quan về mạng nơron nhân tạo

chức năng ra kết hợp và/hoặc với đặc tính phi tuyến của khâu tạo chức năng đáp

ứng mà noron là một hệ có tính phi tuyến mạnh.

Liên kết đầu vào và đầu ra của nhiều nơron với nhau ta được một mạng nơron. Việc

ghép nối các nơron có thể theo một nguyên tắc bất kỳ nào đó, vì về nguyên tắc một

nơron là một hệ MISO. Từ đó có thể phân biệt các loại nơron khác nhau như các

loại nơron mà các đầu vào nhận thông tin từ môi trường bên ngoài với các loại

nơron mà các đầu vào được nối với các nơron khác trong mạng. Các nơron mà đầu

vào giữ chức năng nhận thông tin từ môi trường bên ngoài đóng chức năng “đầu

vào” của mạng. Cũng tương tự như vậy một nơron có một đầu ra, đầu ra của nơron

này có thể là đầu vào của nhiều nơron khác hoặc có thể đưa ra m ôi trường bên

ngoài. Những nơron có đầu ra đưa tín hiệu vào môi trường bên ngoài được gọi là

“đầu ra” của mạng. Như vậy một mạng nơron cũng có chức năng của một hệ truyền

đạt và xử lý tín hiệu từ đầu vào đến đầu ra của mạng. Các nơron trong một mạng

thường được chọn cùng một loại, chúng được phân biệt với nhau qua các vectơ hàm

trong lượng ở đầu vào wi j.

Nguyên lý cấu tạo của một mạng nơron bao gồm nhiều lớp, mỗi lớp bao gồm nhiều

nơron có cùng một chức năng trong mạng. Trên hình 1.3 là mô hình của một mạng

nơron ba lớp với 9 nơron. Mạng có 3 đầu vào x 1, x2, x3 và 2 đầu ra y 1, y2. Các tín

hiệu đầu vào được đưa đến 3 nơron đầu vào, 3 nơron này làm thành lớp đầu vào của

mạng (input layer). Các nơron trong lớp này gọi là nơron đầu vào. Đầu ra của các

nơron này được đưa đến đầu vào của bốn nơron tiếp theo, bốn nơron này không trực

tiếp tiếp xúc với môi trường xung quanh và làm thành lớp trung gian trong mạng

(hidden layer). Các nơron trong lớp này có tên là nơron nội hay nơron bị tre. Đầu ra

của các nơron này được đưa đến hai nơron đưa tín hiệu ra môi trường bên ngoài.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Các nơron trong lớp đầu ra này có tên là nơron đầu ra (output layer).

14 Chương I: Tổng quan về mạng nơron nhân tạo

y1

x1 w1 x2

y2

x3

Hình 1.3

Mạng noron 3 lớp

1.3. Cấu trúc mạng noron.

Nelson và Illingworth (1991) đã đưa ra một số loại cấu trúc của mạng nơron

như hình 1.4. Nơron được vẽ là các vòng tròn xem như một tế bào thần kinh, chúng

có các mối liên hệ đến các nơron khác nhờ các trọng số, lập thành các ma trận trọng

số tương ứng.

Mỗi một nơron có thể phối hợp với các nơron khác tạo thành một lớp qua các

trọng số. Mạng một lớp truyền thẳng (Single - Layer Feedforward Network) như

hình 1.5a.

Có thể nối vài lớp nơron với nhau tạo thành mạng nhiều lớp truyền thẳng

(Multi layer - Layer Feedforward Network) như h ình 1.5d.

W11

y1

y1

Wm,m

y2

y2

x1 x2

x1 w1 x2

y3

ym

xm

Wm,m

x3

Lớp nơron thực hiện tiếp nhận các tín hiệu vào gọi là lớp vào (Input Layer).

b)

a)

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

15 Chương I: Tổng quan về mạng nơron nhân tạo

Wm,m

y1

x1 wm x2

y1 wm 1y2

x1 wm1 x2

y2

xm

Wm,m

ym

y3

x3

d)

c)

x1 w1 x2

y1 wm y2

xm

ym

y1 y2 ym

x1 x2 xm

f)

e)

Hình 1.4

Sơ đồ cấu trúc các loại mạng nơron.

Lớp nơron thực hiện đưa tín hiệu ra gọi là lớp ra (Output Layer).

Giữa hai lớp nơron vào và ra có một hoặc nhiều lớp nơron không liên hệ trực

tiếp với môi trường bên ngoài được gọi là các lớp ẩn (Hidden Layer). Mạng nơron

truyền thẳng nhiều lớp có thể có một hoặc nhiều lớp nơron ẩn.

Mạng nơron được gọi là liên kết đầy đủ nếu từng đầu ra của mỗi lớp được liên

kết với đủ các nơron ở các lớp tiếp theo.

Hai loại mạng nơron một lớp và nhiều lớp được gọi là truyền thẳng

(Feedforward Network) nếu đầu ra của mỗi nơron được nối với các đầu vào của các

nơron cùng lớp đó hoặc đầu vào c ủa các nơron của các lớp trước đó. Trong mạng

không tồn tại bất kỳ một mạch hồi tiếp nào kể cả hồi tiếp nội lẫn hồi tiếp từ đầu ra

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

trở về đầu vào.

16 Chương I: Tổng quan về mạng nơron nhân tạo

Mạng nơron bao gồm một hay nhiều lớp trung gian gọi là mạng MLP

(Multilayer perceptrons Networks).

Mạng nơron phản hồi mà đầu ra của mỗi nơron được quay trở lại nối với đầu

vào của các nơron cùng lớp đó được gọi là mạng Lateral (hình 1.5f).

Mạng nơron phản hồi có thể thực hiện đóng vòng được gọi là mạng nơron hồi

quy (Recurrent Networks).

Hình 1.5b chỉ ra một mạng nơron hồi quy đơn giản nhất chỉ có một nơron liên

hệ phản hồi với chính nó.

Hình 1.5c mạng nơron một lớp hồi quy với chính nó và các nơron khác.

Hình 1.5e là mạng nơron nhiều lớp hồi quy.

1.4. Phương thức làm việc của mạng nơron.

Phương thức làm việc của một mạng nơron nhân tạo có thể chia làm 2 giai đoạn:

- Tự tái tạo ( reproduction )

- Giai đoạn học ( learning phase )

Ở một mạng nơron có cấu trúc bền vững có nghĩa là vectơ hàm trọng lượng đầu

vào, khâu tạo đáp ứng và khâu tạo tín hiệu đầu ra đều cố định không bị thay đổi về

mặt cấu trúc cũng như tham số thì mạng có một quá trình truyền đạt xác định chắc

chắn, tĩnh hoặc động phụ thuộc vào cấu tạo của các nơron trong mạng. Ở đầu vào

của mạng xuất hiện thông tin thì đầu ra cũng xuất hiện một đáp ứng tương ứng. Đối

với mạng nơron có quá trình truyền đạt tĩnh, đáp ứng đầu ra xuất hiện ngay sau khi

đầu vào nhận được thông tin, còn đối với mạng nơron có quá trình truyền đạt động

thì phải sau một thời gian quá độ ở đầu ra của mạng nơron mới xuất hiện đáp ứng.

Xuất phát từ quan điểm mọi đáp ứng của các nơron đều tiền định tự nhiên, có nghĩa

là khi xuất hiện các kích thích ở đầu vào của mạng ở các thời điểm khác nhau các

giá trị như nhau thì đáp ứng ở đầu ra ở các thời điểm tương ứng cũng hoàn toàn

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

giống nhau. Quá trình làm việc như vậy của một mạng nơron được gọi là quá trình

17 Chương I: Tổng quan về mạng nơron nhân tạo

tái diễn ( reproduction phase ). Khi đó thông tin ở đầu vào mạng lưu giữ thông tin

đó và dựa trên các tri thức của mình đưa ra các đáp ứng ở đầu ra phù hợp với lượng

thông tin thu được từ đầu vào.

Mạng nơron khi mới hình thành còn chưa có tri thức, tri thức của mạng hình thành

dần sau một quá trìmh học. Mạng nơron được dạy bằng cách đưa vào đầu vào

những kích thích và hình thành những đáp ứng tương ứng, những đáp ứng phù hợp

với từng loại kích thích sẽ được lưu giữ, giai đoạn này được gọi là giai đoạn học của

mạng. Khi đã hình thành tri thức mạng có thể giải quyết các vấn đề cụ thể một cách

đúng đắn. Đó có thể là những vấn đề ứng dụng rất khác nhau, được giải quyết chủ

yếu dựa trên sự tổ chức hợp nhất giữa các thông tin đầu vào của mạng và các đáp

ứng đầu ra:

- Nhiêm vụ của một mạng liên kết là hoàn chỉnh hoặc hiệu chỉnh các thông tin thu

thập được không đầy đủ hoặc bị tác động nhiễu. Mạng nơron kiểu này được ứng

dụng trong lĩnh vực hoàn thiện mẫu, mà một trong lĩnh vực cụ thể đó là nhận dạng

chữ viết.

- Nhiệm vụ tổng quát của mạng nơron là lưu giữ tác động thông tin. Dạng thông tin

lưu giữ đó chính là quan hệ giữa các thông tin đầu vào của mạng và các đáp ứng

đầu ra tương ứng, để khi có một kích thích bất kỳ tác động vào mạng, mạng có khả

năng suy diễn và đưa ra một đáp ứng phù hợp. Đó chính là chức năng nhận dạng

theo mẫu của mạng nơron. Để thực hiện chức năng này mạng nơron đóng vai trò

như một bộ phận tổ chức các nhóm thông tin đầu vào và tương ứng với mỗi nhóm là

một đáp ứng đầu ra phù hợp. Như vậy một nhóm bao gồm một loại thông tin đầu

vào và một đáp ứng ra. Các nhóm có thể hình thành trong quá trình học và cũng có

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

thể hình thành không trong quá trình học.

18 Chương I: Tổng quan về mạng nơron nhân tạo

Trong lĩnh vực ứng dụng, mạng nơron có khả năng tạo ra các đáp ứng đầu ra dựa

trên thông tin thu thập vào của mạng, điều đó có nghĩa là ứng với một thông tin xác

định ở đầu vào của mạng cung cấp một đáp ứng tương ứng xác định ở đầu ra. Nhìn

trên quan điểm lý thuyết hệ thống, mạng nơron được coi như một bộ xấp xỉ thông

tin, thiết bị này có khả năng cung cấp một quá trình xử lý mong muốn một cách

chính xác. Mục đích của quá trình học là tạo ra một tri thức cho mạng thông qua rèn

luyện. Nguyên tắc học được thực hiện cho mạng mà cấu trúc của mạng cũng như

các phần tử nơron cố định, chính là thay đổi giá trị của các phần tử trong vectơ hàm

trọng lượng, vectơ ghép nối giữa các phần tử nơron trong mạng. Các phần tử này

xác như bài toán yêu cầu. Như vậy, học chính là quá trình giả bài toán tối ưu tham số.

được chọn sao cho quá trình truyền đạt mong muốn được xấp xỉ một cách đủ chính

1.5. Các luật học

Thông thường mạng nơron được điều chỉnh hoặc được huấn luyện để hướng

các đầu vào riêng biệt đến đích ở đầu ra. Cấu trúc huấn luyện mạng được chỉ ra trên

cơ sở so sánh giữa đầu ra với đầu vào cho tới khi đầu ra phù hợp với đích. Những

Đích

Vào

So sánh

Hàm trọng (weights) giữa các nơron

Điều chỉnh

cặp vào/đích (input/ taget) được dùng để giám sát cho sự huấn luyện mạng.

Hình 1.5. Cấu trúc huấn luyện mạng

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

19 Chương I: Tổng quan về mạng nơron nhân tạo

Để có được một cặp số vào/ra ở đó mỗi giá trị vào được gửi đến mạng và giá

trị ra tương ứng được thực hiện bằng mạng là sự xem xét và so sánh với giá trị

mong muốn. Bình thường tồn tại một sai số bởi lẽ giá trị mong muốn không hoàn

toàn phù hợp với giá trị thực. Sau mỗi lần chạy ta có tổng bình phương của tất cả

các sai số. Sai số này được sử dụng để xác định các hàm trọng mới.

Sau mỗi lần chạy hàm trọng của mạng được sửa đổi với đặc tính tốt hơn tương

ứng với đặc tính mong muốn. Từng cặp giá trị vào / ra phải được kiểm tra và trọng

lượng được điều chỉnh một vài lần. Sự thay đổi các hàm trọng của mạng được dừng

lại nếu tổng các bình phương sai số nhỏ hơn một giá trị đặt trước hoặc đã đặt đủ

một số lần chạy xác định ( trong trường hợp mạng có thể không thoả mãn yêu cầu

đặt ra do sai lệch còn cao). Có hai kiểu học:

- Học thông số (Paramater Learning): Tìm ra biểu thức cập nhật các thông số

về trọng số cập nhật kết nối giữa các nơron.

- Học cấu trúc (Structure Learning): Trọng tâm là sự biến đổi cấu trúc của

mạng nơron gồm số lượng nút (node) và các mẫu liên kết.

Có hai loại học: Thực hiện đồng thời và không đồng thời.

Chúng ta tập trung vào phần học thông số.

Giả sử ma trận trọng số bao gồm tất cả các phần tử thích ứng của mạng nơron.

Nhiệm vụ của việc học thông số là bằng cách nào đó, tìm được ma trận chính xác

mong muốn từ ma trận giả thiết ban đầu với cấu trúc của mạng nơron có sẵn. Để

làm được việc đó, mạng nơron sử dụng các trọng số điều chỉnh, với nhiều phương

pháp học khác nhau có thể tính toán gần đúng ma trận W cần tìm đặc trưng cho

mạng. Có ba phương pháp học:

* Học có giám sát (Supervised Learning)

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Là quá trình học có giám sát (Hình 1.6), ở mỗi thời điểm thứ i khi đưa tín hiệu vào xi mạng nơron, tương ứng sẽ có các đáp ứng mong muốn di của đầu ra cho

20 Chương I: Tổng quan về mạng nơron nhân tạo

trước ở thời điểm đó. Hay nói cách khác, trong quá trình học có giám sát, mạng

nơron được cung cấp liên tục các cặp số liệu mong muốn vào - ra ở từng thời điểm (x1, d1), (x2, d2), ... , (xk, dk) , ... khi cho đầu vào thực của mạng là x k tương ứng sẽ có tín hiệu đầu ra cũng được lặp lại là d k giống như mong muốn. Kết quả của quá

trình học có giám sát là tạo được một hộp đen có đầu vào là véctơ tín hiệu vào x sẽ

y

x

y

đưa ra được câu trả lời đúng d.

Mạng nơron

Mạng nơron

x

d

e

Hình 1.6 Hình 1.7

Máy phát tín hiệ

Mô hình học có giám sát Mô hình học không có giám sát

và học củng cố

Để đạt được kết quả mong muốn trên, khi đưa vào tín hiệu xk, thông thường sẽ có sai lệch ek giữa tín hiệu đầu ra thực yk và tín hiệu đầu ra mong muốn dk. Sai lệch

đó sẽ được truyền ngược tới đầu vào để điều chỉnh thông số mạng nơron là ma trận

trọng số W ... Quá trình cứ thế tiếp diễn sao cho sai lệch giữa tín hiệu ra mong

muốn và tín hiệu ra thực tế trong phạm vi cho phép, kết quả ta nhận được ma trận

trọng số W với các phần tử wịj đã được điều chỉnh phù hợp với đặc điểm của đối

tượng hay hàm số mạng nơron cần học.

* Học củng cố (Reinforcement Learning)

Tín hiệu có thể được đưa tín hiệu d từ bên ngoài môi trường (Hình 1.6), nhưng

tín hiệu này có thể không được đưa đầy đủ, mà có thể chỉ đưa đại diện một bit để có

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

tính chất kiểm tra quá trình đúng hay sai. Tín hiệu đó được gọi là tín hiệu củng cố

21 Chương I: Tổng quan về mạng nơron nhân tạo

(Reinforcement Signal). Phương pháp học củng cố chỉ là một trường hợp của

phương pháp học có giám sát, bởi vì nó cũng có nhận tín hiệu chỉ đạo (giáo viên)

phản hồi từ môi trường. Chỉ khác là tín hiệu củng cố chỉ có tính ước lượng hơn là để

dạy. Có nghĩa là chỉ có thể nói là tốt hay xấu cho một số tín hiệu đầu ra cá biệt. Tín

hiệu giám sát bên ngoài d thường được tiến hành bởi các tín hiệu ước lượng để tạo

thông tin tín hiệu ước lượng cho mạng nơron điều chỉnh trọng số với hy vọng sự

ước lượng đó mang lại sự tốt đẹp cho quá trình tính toán. Học củng cố còn được gọi

là học với sự ước lượng (Learning With a Critic).

* Học không có giám sát (Unsupervised Learning)

Trong trường hợp này, hoàn toàn không có tín hiệu ở bên ngoài (Hình 1.7).

Giá trị mục tiêu điều khiển không được cung cấp và không được tăng cường. Mạng

phải khám phá các mẫu, các nét đặc trưng, tính cân đối, tính tương quan. Trong khi

khám phá các đặc trưng khác, mạng nơron đã trải qua việc tự thay đổi thông số, vấn

đề đó còn gọi là tự tổ chức (Self - Organizing).

Hình 1.8 mô tả cấu trúc chung của quá trình học của ba phương pháp học đã

được nêu trên. Trong đó tín hiệu vào x j, j = 1, 2, 3 ..., m, có thể được lấy từ đầu ra

của các nơron khác hoặc có thể được lấy từ bên ngoài. Chú ý rằng thông số ngưỡng

θi có thể được bao trong việc học như là một trọng số thứ m: wi,m của tín hiệu vào

có giá trị xm= -1. Tín hiệu mong muốn di có sẵn chỉ trong phương pháp học có giám

sát hoặc củng cố (với d i là tín hiệu học củng cố). Từ hai phương pháp học trên.

Trọng số của nơron thứ i được thay đổi tuỳ theo tín hiệu ở đầu vào mà nó thu nhận,

giá trị đầu ra của nó. Trong phương pháp học không giám sát sự thay đổi trọng số

chỉ dựa trên cơ sở các giá trị đầu vào và đầu ra. Dạng tổng quát của luật học trọng

số của mạng nơron cho biết là gia số của véc tơ wi là ∆wi tỷ lệ với tín hiệu học r và

tín hiệu đầu vào x(t):

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

(1.2) ∆wi(t) = η.r.x(t)

22 Chương I: Tổng quan về mạng nơron nhân tạo

x1

Wi1

x2

Nơron thứ i

Wi2

xj Wi2

y

Wij

Wi,m-1

∆wi

X

Máy phát tín hiệu học

d

Wi,m-1 = θ

,m = θ

xm-1 xm= -1

η

r

wi

Hình 1.8. Sơ đồ cấu trúc chung của quá trình học

η là một số dương còn gọi là hằng số học, xác định tốc độ học.

(1.3) r là tín hiệu học: r = fr (wi , x , di).

Từ (1.2) là biểu thức chung để tính số gia của trọng số, ta thấy véc tơ trọng số wi = (wi1, wi2, ... , wim)T có gia số với tỷ lệ của tín hiệu vào x và tín hiệu học r. Từ

các biểu thức trên ta có véc tơ trọng số ở thời điểm (t+1) được tính là:

(1.4) wi (t+1) = wi(t) + η fr (wi(t), x(t), di(t) x (t)

Với chỉ số trên là thời điểm tính toán. Phương trình liên quan đến sự thay đổi

trọng số trong mạng nơron rời rạc (Discrete - Time) và tương ứng với sự thay đổi

)t(

η=

trọng số trong mạng nơron liên tục theo biểu thức:

)t(rx

dw i dt

(1.5)

Vấn đề quan trọng trong việc phân biệt luật học cập nhật trọng số có giám sát

hay không có giám sát là tín hiệu học r như thế nào để thay đổi hoặc cập nhật trọng

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

số có trọng mạng nơron.

23 Chương I: Tổng quan về mạng nơron nhân tạo

1.6. Mạng nơron truyền thẳng và mạng nơron hồi quy.

1.6.1. Mạng nơron truyền thẳng.

W11

y1

Wm,m

y2

x1 x2

xm

ym

Wm,m

1.6.1.1. Mạng một lớp nơron.

Hình 1.9

Mạng nơron truyền thẳng một lớp.

Một lớp nơron là một nhóm các nơron mà chúng cùng nhận một số tín hiệu

vào đồng thời (Hình 1.9).

Trong ma trận trọng số w, các dòng thể hiện trọng số của mỗi nơron, mỗi dòng

thứ j có thể đặt nhãn như một véc tơ wj của nơron thứ j gồm m trọng số wji

wj = (wj1 ; wj2, ..., wjm) (1.6) Các trọng số trong cùng một cột thứ j ( j = 1, 2, ... , n) đồng thời nhận cùng

một tín hiệu vào xj.

x1 wm1 x2

y1 wm y2

xm

ym

Tại cùng một thời điểm, véc tơ đầu vào x = (x1, x2...xj…, xm) có thể là một nguồn bên ngoài là cảm biến hoặc thiết bị đo lường đưa tới mạng. Tới khi toàn bộ ma trận trọng số wji được các định tương ứng với véc tơ đầu vào X thì các tích số wjixi cũng được tính toán. 1.6.1.2. Mạng nhiều lớp nơron.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Hình 1.10. Mạng nơron truyền thẳng nhiều lớp.

24 Chương I: Tổng quan về mạng nơron nhân tạo

Trong mạng nơron truyền thẳng nhiều lớp (Hình 1.10) trong đó các lớp được

phân chia thành 3 loại sau đây:

- Lớp vào: Là lớp nơron đầu tiên nhận các tín hiệu vào xi của véc tơ tín hiệu

vào x. Mỗi tín hiệu x i của tín hiệu vào sẽ được đưa đến tất cả các nơron của lớp

nơron đầu tiên, chúng được phân phối trên các trọng số có số lượng đúng bằng số

nơron của lớp này. Thông thường, các nơron đầu vào không làm biến đổi các tín

hiệu vào xi, tức là chúng không có các trọng số hoặc không có các loại hàm chuyển

đổi nào, chúng chỉ đóng vai trò phân phối các tín hiệu và không đóng vai trò sửa đổi

chúng.

- Lớp ẩn: Là lớp nơron dưới lớp vào, chúng không trực tiếp liên hệ với thế

giới bên ngoài như các lớp nơron vào và ra.

- Lớp ra: Là lớp nơron tạo các tín hiệu ra cuối cùng.

1.6.2. Mạng nơron hồi quy.

Mạng nơron hồi quy (Recurrent Neural Networks) còn được gọi là mạng phản

hồi (Feedback Networks) là loại mạng tự liên kết thành các vòng và liên kết hồi quy

giữa các nơron. Mạng nơron hồi quy có trọng số liên kết đối xứng như mạng

Hopfield luôn hội tụ về trạng thái ổn định (Hopfild, 1982). Mạng liên kết 2 chiều

(Bidirectional Associative Memory - BAM) là mạng thuộc nhóm mạng nơron hồi

quy gồm hai lớp nơron liên kết tay đôi, trong đó đảm bảo nơron của cùng một lớp

không liên kết với nhau, cũng hội tụ về trạng thái ổn định (Kosko, 1986). Nghiên

cứu mạng nơron hồi quy có trọng số liên kết không đối xứng sẽ gặp nhiều phức tạp

hơn so với mạng truyền thẳng (Feedforward Networks) và mạng hồi quy đối xứng

(Symmetrich Recurrent Neural Networks). Mạng nơron hồi quy có khả năng về

nhận mẫu, nhận dạng các hàm phi tuyến, dự báo ... Một ưu điểm khác của mạng

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

nơron hồi quy là chỉ cần mạng nhỏ hơn về cấu trúc cũng có khả năng như mạng

25 Chương I: Tổng quan về mạng nơron nhân tạo

truyền thẳng có cấu trúc lớn hơn. Nó khắc phục được giả thiết truyền thống của

mạng nơron là coi mạng có số nơron đủ lớn. Gồm 2 loại:

1.6.2.1. Mạng hồi quy không hoàn toàn (Partially Recurrent Networks).

Là mạng đó dựa trên cơ sở mạng lan truyền ngược (Back - Propagation) với

cấu trúc hồi quy. Cấu trúc của mạng hồi quy không hoàn toàn phần lớn là cấu trúc

truyền thẳng nhưng có cả sự chọn lựa cho một bộ phận có cấu trúc hồi quy. Trong

nhiều trường hợp , trọng số của cấu trúc hồi quy được duy trì không đổi, như vậy

luật học lan truyền ngược BP có thể được dễ dàng sử dụng. Các mạng đó đươc gọi

là mạng dãy (Sequential Networks) và các nút nhận tín hiệu hồi quy được gọi là

các phần tử Context (Context Units). Trong c ác mạng loại này, sự truyền thẳng

được xảy ra rất nhanh hoặc không phụ thuộc vào thời gian, trong khi đó tín hiệu hồi

quy được thực hiện có tính thời gian. Từ đó, tại thời điểm t phần tử năm trong phạm

vi Context Units có tín hiệu vào từ một phần mạng ở th ời điểm (t-1). Vì vậy, bộ

phận nằm trong phạm vi nhớ được một số dữ liệu của quá khứ từ kết quả biến đổi ở

thời điểm t. Do vậy, trạng thái của mạng nguyên thuỷ của các mẫu phụ thuộc vào

các trạng thái đó cũng như dòng thông tin đầu vào. Mạng có thể nhận m ẫu

(Recognice) dãy dựa vào tình trạng cuối cùng của dãy và có thể dự báo tiếp theo

cho tín hiệu của dãy theo thời gian. Từ đó, mạng hồi quy không hoàn toàn về cơ bản

là mạng truyền thẳng, liên kết hồi quy có thể đi từ các nút ở các lớp ra hoặc lớp ẩn.

1.6.2.2. Mạng các dãy của Jordan (Jordan Sequential Netwoks)

Hình 1.11a là cấu trúc chung của mạng Jordan, hình 1.11b là một dạng của

mạng Jordan. Mạng đầu vào của mạng gồm tín hiệu phản hồi đầu ra vào lớp

Context kết hợp với tín hiệu vào ở trạng thái sau đó. Nói cách khác, lớp Context sao

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

chụp tín hiệu ra của thời điểm trước đó qua con đường phản hồi với trọng số đơn vị.

26 Chương I: Tổng quan về mạng nơron nhân tạo

yi

Lớp ra

Lớp ẩn

Lớp ra Lớp Context Ci

xi

Hình 1.11 a Hình 1.11b

Hình 1.11

Sơ đồ cấu trúc của mạng Jordan

Mối tự liên kết (Selt - Connection) trong lớp Context Ci hàm hoạt hoá của phần tử

thuộc lớp Context có dạng:

ci (t) = - α ci (t) + yi (t)

yi là tín hiệu ra; α là cường độ của mối tự liên kết 0 < α < 1.

t

− st

− (α

)

e

Nghiệm của phương trình vi phân trên có dạng:

0

yi(s)ds ci (t) = ci (0)e - αt + ∫

Nếu yi cố định, ci sẽ giảm theo luật hàm mũ. Viết ở dạng rời rạc, thay đổi của

phần tử lớp Context được viết:

ci (t+1) = (1- α)ci (t) + yi(t)

Nếu coi các phân tử lớp Context là các tín hiệu vào, ta có thể dùng luật Back-

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Propagation để luyện mạng.

27 Chương I: Tổng quan về mạng nơron nhân tạo

yi

1.6.2.3. Mạng hồi quy đơn giản (Simple Recurrent Networks)

Elman (1990) đã đề xuất cấu trúc mạng

Lớp ra

hồi quy đơn giản (SRN). Liên kết phản hồi

được lấy từ lớp ẩn đi tới lớp Context

Lớp ra

(hình 1.12). Mạng đầu v ào được coi có 2

Lớp ra Lớp Context

xi

phần: đầu vào thực và của lớp Context.

Hình 1.12

Sơ đồ cấu trúc mạng nơron

hồi quy đơn giản

1.6.2.4.Mạng hồi quy hoàn toàn (Fully Recurrent Netwoks)

Một trong những loại mạng nơron hồi quy đầu tiên được Gossberg (1969c,

1982a) xây dựng để học và biểu diễn các mẫu bất kỳ. Loại mạng này đã được xây

dựng theo mẫu Instar - Outstar. Loại mạng hồi quy hoàn toàn (Fully Recurrent

Networks), hay còn gọi là Sequential Competivive Avalanche Field (SCAF), có tác

dụng nhận số lượng mẫu nhiều hơn, đã được Hecht - Nielsen (1986); Freeman và

Skapura (1991) xây dựng. North (1988) đã áp dụng mạng một lớp avalanche trong

việc nhận dạng chữ ký của 7 thuyền nhân.

Mạng RBP được áp dụng trong một số lĩnh vực như: hoàn thiện mẫu

(Almeldam 1987), nhận dạng ảnh (Krishnapuram và Chen, 1993) và điều khiển

rôbôt (Barhen, 1989). Elman (1991) đã luyện mạng SPN để nhận dạng chữ viết ở

dạng câu đơn giản gồm 2 đến 3 từ. Jodouin (1993) cũng đã trình bày một số

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

phương pháp và thành quả ứng dụng SPN. Mozer (1989) đã đề xuất một số mạng

28 Chương I: Tổng quan về mạng nơron nhân tạo

hồi quy khác, được gọi là mạng lan truyền ngược hội tụ (Focused Back - Propgation

Networks). Trong loại mạng này, các lớp và bản thân mỗi phần từ của lớp đều có

liên hệ ngược với bản thân chúng. Watrous và Shastri (1987), Morgan và Scofield

(1991) cũng đã đề xuất một vài dạng mạng hồi quy.

Với mạng hồi quy hoàn toàn (Fully Recurent Networks, hình thành quan điểm

thực hiện và luyện mạng hồi quy là hình thành mạng hồi quy từ mạng truyền thẳng

nhiều lớp được xây dựng từ một lớp cho mỗi bước tính. Khái niệm này gọi là lan

truyền ngược theo thời gian (Back Propagation Through Time-BPTT) (Rumelhart,

1986a,b) phù hợp khi quan tâm đến các dãy với độ lớn T là nhỏ. Nó đã được sử

dụng học cho máy ghi cho nhiệm vụ thực hiện cho các dãy (Rumelhart, 1986b). Nó

có khả năng áp dụng cho điều khiển thích nghi (Miller, 1990).

1.7. Các ứng dụng của mạng nơron

Các ứng dụng cụ thể của mạng nơron có thể tóm tắt như sau:

* Lĩnh vực vũ trụ hàng không

- Ứng dụng nhiều trong kỹ thuật bay không người lái

- Mô phỏng đường bay

- Hệ thống điều khiển máy bay, nâng cao khả năng bay tự động.

- Mô hình hoá các bộ phận của máy bay…

* Điều khiển tự động

- Hệ thống hướng dẫn ô tô điều khiển tự động.

- Cho phép phân tích phạm vi hoạt động…

* Ngân hàng:

- Kiểm tra đọc văn kiện

- Định giá thẻ tín dụng…

* Trong hình sự:

- Phát hiện và so sánh dấu vân tay.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

- Nhận biết tiếng nói.

29 Chương I: Tổng quan về mạng nơron nhân tạo

* Quốc phòng:

- Điều khiển tên lửa, các thiết bị bay.

- Hệ thống định vị như sonar, radar.

* Trong y học:

- Phân tích và phát hiện tế bào ung thư.

- Lưu giữ thời gian nằm và ra viện của bệnh nhân,…

* Trong đầu tư:

- Đánh giá mức độ mạo hiểm của việc đầu tư.

* Trong sản xuất:

- Kiểm tra theo dõi quá trình sản xuất.

- Thử nghiệm phân tích, phân loại sản phẩm.

- Dự báo, lên kế hoạch và điều khiển qúa trình sản xuất,…

* Trong địa chất: Phát hiện khoáng sản,dầu khí, kim loại, vàng,…

* Rôbôt: Hệ thống nghe nhìn, điều khiển,….

* Lĩnh vực điện:

- Dự báo phụ tải.

- Chế tạo chip trong các mạch tích hợp, chip phân tích.

- Phương pháp điều khiển, điều khiển động cơ…

Ngoài ra còn có ứng dụng trong lĩnh vực : Công nghệ giải trí, công nghiệp, bảo

hiểm,…

Ngày nay cùng với sự phát triển mạnh mẽ của khoa học và kỹ thuật, là khả

năng tính toán và xử lý ngày càng mạnh của máy tính, nhờ đó các phương pháp lý

thuyết đã nghiên cứu được ứng dụng rộng rãi như lôgíc mờ, đặc biệt là mạng nơron.

Trong lĩnh vực điều khiển tự động, mạng nơron được ứng dụng để giải quyết hai bài

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

toán cơ bản sau:

30 Chương I: Tổng quan về mạng nơron nhân tạo

+ Nhận dạng đối tượng. Các đối tượng ở đây với đặc tính có thể là động học

tuyến tính, phi tuyến tĩnh hoặc động học và phi tuyến.

+ Thiết kế bộ điều khiển nơron.

Theo lý thuyết đã chứng minh mạng nơron là một bộ xấp xỉ đa năng, có thể

dùng làm một mô hình toán học thay thế đối tượng với sai lệch cho trước nào đó.

Đây là cơ sở để ta có thể ứng dụng m ạng nơron để nhận dạng các đối tượng. Ta sẽ

tiến hành nhận dạng lần lượt các đối tượng động học tuyến tính, đối tượng phi tuyến

tĩnh và đối tượng động học và phi tuyến.

Khả năng xấp xỉ đa năng của mạng nhiều lớp tạo ra một sự lựa chọn ưa thích

cho việc mô hình hoá các đối tượng phi tuyến và thực hiện các bộ điều khiển phi

tuyến đa năng. Mạng nơron được ứng dụng trong điều khiển tự động với ba bài

toán sau:

+ Điều khiển tiên đoán mô hình: Model Predictive Control (MPC).

+ Điều khiển tuyến tính hoá phản hồi: NARMA-L2(Feedback Linearization)

Control.

+ Điều khiển theo mô hình mẫu: Model Reference Control.

Dùng mạng nơron để thiết kế bộ điều khiển phải thực hiện theo trình tự hai

bước cơ bản sau: bước 1 là nhận dạng đối tượng và bước 2 là thiết kế bộ điều khiển

nơron.

Trong bước nhận dạng đối tượng, phải xây dựng một mô hình mạng nơron

thay thế cho đối tượng cần được điều khiển. Ở bước thiết kế bộ điều khiển nơron,

sử dụng mô hình mạng nơron của đối tượng để huấn luyện bộ điều khiển. Cả ba bài

toán trên đều giống nhau ở bước nhận dạng, tuy nhiên ở bước thiết kế điều khiển thì

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

khác nhau đối với mỗi bài toán.

31 Chương I: Tổng quan về mạng nơron nhân tạo

Đối với bài toán điều khiển tiên đoán, mô hình đối tượng được dùng để tiên

đoán đầu ra tương lai của đối tượng và sử dụng một thuật toán tối ưu chọn tín hiệu

đầu vào làm tối ưu chỉ tiêu tương lai.

Với bài toán tuyến tính hoá phản hồi, bộ điều khiển đơn giản là sự sắp xếp lại

mô hình đối tượng.

Với bài toán điều khiển theo mô hình mẫu, bộ điều khiển là một mạng nơron

được huấn luyện để điều khiển một đối tượng bám theo một mô hình mẫu. Một mô

hình mạng nơron của đối tượng được sử dụng để hỗ trợ trong việc huấn luyện bộ

điều khiển.

1.8. Công nghệ phần cứng sử dụng mạng nơron.

Mạng nơron nhân tạo được dùng để xây dựng các chip mang lại nhiều lợi ích với

bản chất cấu trúc phân bố song song của sự gia công thông tin như các nơron sinh

học (Ramacher and Ruckert 1991; Shanchz - Sinencio and Lau 1992), chip nơron

có thể được sử dụng làm các bộ đồng xử lý (Coprocessor) trong các máy tính thông

thường và trong việc tính toán.

Trong phần cứng, mạng nơron có thể sử dụng vào nhiều lĩnh vực. Mạng nơron

có thể sử dụng với các chức năng như các phần tử analog hoặc digital thay thế cho

các phần tử điện tử thông thường. Các loại chip analog có một tiềm năng to lớn về

sử lý tốc độ cao và kinh tế hơn với chip digital cùng loại, các chip digital cũng có

các ưu điểm là có độ chính xác cao hơn và dễ chế tạo.

Ở phần tử analog, các trọng số liên kết mã hoá được với các phần tử điện trở,

điện cảm và điện dung. Các mức của các nút hoạt hoá (cường độ của tín hiệu) được

đặc trưng bằng các đại lượng dòng và áp. Ví dụ như lưới silic (Silicon Retina)

(Mead 1989) là một dạng chip analog có thể cạnh tranh được với lưới sinh học

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

(Biological Retina).

32 Chương I: Tổng quan về mạng nơron nhân tạo

Công nghệ digital có thể áp dụng để thiết kế các chip nơron. Vấn đề này được

Hammerstrom và Means (1990) đề cập đến. Khả năng khác là xung học (Pulse -

Trains) là đặc trưng cho trọng số và cường độ tín hiệu (Caudill 1991). Xung học

phản ánh tương xứng với tần suất hoặc khả năng của nơron hoạt hoá, tái tạo điều

biến tần xuất quan sát được như của mạng nơron sinh học. Phép nhân của 2 xung

học là tương đương với phép AND trong mạch logic, phép cộng của 2 xung học là

tương đương với phép OR trong mạch lôgic.

Trong hướng của thuật học, có được một vài chọn lọc. Các trọng số trong một

chip nơron cần cố định trước như ở chip ROM (Read - Only Memory), bộ nhó có

thể chương trình hoá PROM (Programmable ROM), bộ nhớ có thể xoá và lập trình

được (Erasable PROM), hoặc bộ nhớ đọc/ ghi RAM (Random Access Memory).

Mạng nơron mở ra một hướng cải tiến quan trọng về công nghệ. Với ưu điểm

nổi bật của mạng nơron là khả năng truyền tín hiệu ở các chip nơron ở dạng song

song do đó tốc độ truyền tín hiệu rất cao, đặc trưng này không có ở các chip điện tử

truyền thống.

1.9. So sánh khả năng của mạng nơron với mạch lôgic:

- Mạng nơron dùng ở cả các dạng mức (0, 1), (-1, +1) ở dạng liên tục như hàm

chuyển đổi sigmoid và dạng phi tuyến. Do đó, phần tử lôgic chỉ là một trường hợp

riêng của mạng nơron.

- Khả năng lập trình được của mạng nơron rất tốt, thay vì phương pháp lắp ráp

phần cứng không lập trình được của mạng lôgic.

- Đặc trưng ưu điểm cơ bản của mạng nơron là tính truyền song song làm tăng

tốc độ tính toán

- Ngay ở một phần tử nơron, cũng có thể được coi là một hệ điều khiển trong

mạch vì nó có đầy đủ các thành phần: ngưỡng, tín hiệu vào - ra, phản hồi, bộ tổng.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Trong khi đó mạch lôgic chỉ là một phần tử, hoặc một mạch điện, một mạch điện tử.

33 Chương I: Tổng quan về mạng nơron nhân tạo

1.10. Kết luận chương I

* Qua phân tích của mô hình mạng nơron ta thấy chúng có các tính chất sau đây:

- Là hệ phi tuyến

- Là hệ xử lý song song.

- Là hệ học và thích nghi: Mạng được luyện từ các số liệu quá khứ, có khả

năng tự chỉnh khi số liệu đầu vào bị mất.

- Là hệ nhiều biến, nhiều đầu vào, nhiều đầu ra (MIMO) rất tiện dùng khi điều

khiển đối tượng có nhiều biến số.

* So sánh mạng nơron truyền thẳng nhiều lớp và mạng nơron hồi quy nhiều lớp

ta thấy về cấu trúc mạng nơron truyền thẳng nhiều lớp đơn giản hơn so với mạng

nơron hồi quy nhiều lớp vì mạng nơron hồi quy nhiều lớp có thêm các liên kết

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

phản hồi.

34 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

CHƯƠNG II

CÁC PHƯƠNG PHÁP ỨNG DỤNG MẠNG NƠRON TRONG

NHẬN DẠNG

2.1 Khái quát chung.

2.1.1 Đặt vấn đề.

w(t)

e(t)

y(t)

u(t)

Xét một bài toán điều khiển theo nguyên tắc phản hồi như trên Hình 2.1.

Bộ điều khiển

Đối tượng điều khiển

-

Đo lường

Hình 2.1. Điều khiển theo nguyên tắc phản hồi đầu ra

Muốn tổng hợp được bộ điều khiển cho đối tượng hệ kín có được chất lượng

như mong muốn thì trước tiên phải hiểu biết về đối tượng, tức là cần phải có một

mô hình toán học mô tả đối tượng. Không thể điều khiển đối tượng khi không hiểu

biết hoặc hiểu sai lệch về nó. Kết quả tổng hợp bộ điều khiển phụ thuộc rất nhiều

vào mô hình mô tả đối tượng. Mô hình càng chính xác, hiệu suất công việc càng

cao.

Việc xây dựng mô hình cho đối tượng được gọi là mô hình hóa. Người ta

thường phân chia các phương pháp mô hình hóa ra làm hai loại:

- Phương pháp lý thuyết.

- Phương pháp thực nghiệm.

Phương pháp lý thuyết là phương pháp thiết lập mô hình dựa trên các định luật

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

có sẵn về quan hệ vật lý bên trong và quan hệ giao tiếp với môi trường bên

35 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

ngoài của đối tượng. Các quan hệ này được mô tả theo quy luật lý – hóa, quy luật

cân bằng,... dưới dạng những phương trình toán học.

Trong các trường hợp mà ở đó sự hiểu biết về những quy luật giao tiếp bên

trong đối tượng cũng về mối quan hệ giữa đối tượng với môi trường bên ngoài

không được đầy đủ để có thể xây dựng được một mô hình hoàn chỉnh, nhưng ít nhất

từ đó có thể cho biết các thông tin ban đầu về dạng mô hình thì tiếp theo người ta

phải áp dụng phương pháp thực nghiệm để hoàn thiện nốt việc xây dựng mô hình

đối tượng trên cơ sở quan sát tín hiệu vào u(t) và ra y(t) của đối tượng sao cho mô

hình thu được bằng phương pháp thực nghiệm thỏa mãn các yêu cầu của phương

pháp lý thuyết đề ra. Phương pháp thực nghiệm đó được gọi là nhận dạng hệ thống

điều khiển.

Như vậy khái niệm nhận dạng hệ thống điều khiển được hiểu là sự bổ xung

cho việc mô hình hóa đối tượng mà ở đó lượng thông tin ban đầu về đối tượng điều

khiển không đầy đủ.

2.1.2. Định nghĩa.

Nhận dạng hệ thống là xây dựng mô hình toán học của hệ (cấu trúc – tham số)

dựa trên các dữ liệu thực nghiệm đo được. Quá trình nhận dạng là quá trình hiệu

chỉnh các tham số của mô hình sao cho tín hiệu ra của mô hình tiến tới tín hiệu đo

được của hệ thống.

Khái niệm về bài toán nhận dạng được Zadeh định nghĩa vào năm 1962 với hai

điểm cơ bản sau:

- Nhận dạng là phương pháp thực nghiệm nhằm xác định một mô hình cụ thể

trong lớp các mô hình thích hợp trên cơ sở quan sát các tín hiệu vào ra.

- Mô hình tìm được phải có sai số với đối tượng là nhỏ nhất.

Theo định nghĩa này thì những bài toán nhận dạng sẽ phải được phân biệt với

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

nhau ở ba điểm chính, đó là:

36 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

- Lớp mô hình thích hợp. Chẳng hạn lớp các mô hình tuyến tính không có cấu

trúc (không biết bậc của mô hình) hoặc có cấu trúc, lớp các loại mô hình lưỡng

tuyến tính.

- Loại tín hiệu quan sát được (tiền định/ngẫu nhiên).

- Phương thức mô tả sai lệch giữa mô hình thực và đối tượng.

2.1.3. Sơ lược về sự phát triển của các phương pháp nhận dạng.

Sự phát triển của nhận dạng trong lĩnh vực điều khiển tự động từ những năm

1960 trở lại đây có thể có thể chia thành ba giai đoạn phát triển như sau:

- Giai đoạn 1:

(Khoảng 1960-1975) được đánh dấu bằng nhận dạng các mô hình không tham

số cho đối tượng điều khiển tuyến tính mà trọng tâm là thiết lập hàm trọng hay đặc

tính tần biên – pha dưới dạng một dãy giá trị (phức). Kiến thức lý thuyết cần thiết

cho giai đoạ n này phần lớn được xây dựng trên cơ sở lý thuyết hàm phức và phân

tích phổ tín hiệu.

- Giai đoạn 2:

Được đặc trưng bởi sự ra đời của lớp mô hình liên tục hoặc rời rạc có tham số

và được gọi là giai đoạn nhận dạng tham số mô hình. Thông tin lý thuyết ở đây đủ

để người ta có thể lựa chọn được bậc (hay cấu trúc) cho mô hình liên tục hay rời

rạc. Nhiệm vụ của nhận dạng trong giai đoạn này là xác định giá trị các tham số của

mô hình đó với hướng nghiên cứu tập trung là xét tính hội tụ các phương pháp và

ảnh hưởng của nhiễu vào kết quả.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

- Giai đoạn 3:

37 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

(Khoảng 1990 đến nay) được đánh dấu bằng nhận dạng mô hình động học liên

tục phi tuyến và nhận dạng mô hình tham số cho hệ nhiều chiều. Dần dần trong giai

đoạn này người ta cũng chuyển hướng đi vào nhận dạng các hệ thống suy biến.

2.2. Các phương pháp nhận dạng

Các phương pháp nhận dạng được phân loại theo các phương pháp như sau:

* Phân loại dựa trên cơ sở các phần tử hệ thống:

+ Phân loại theo hệ thống nhận dạng S.

+ Phân loại theo tín hiệu vào u

+ Phân loại theo tiêu chuẩn nhận dạng

* Phân loại theo phương pháp cập nhật dữ liệu của hệ thống:

+ Phương pháp nhận dạng đệ quy

Thông số nhận dạng được tính toán trực tiếp theo mỗi thời điểm. Nghĩa là

(t+1) được xác nếu có giá trị θ (t) được cập nhật tại thời điểm t, thì giá trị của θ

(t). Phương pháp nhận dạng đệ quy có đặc trưng sau: định từ θ

- Là bộ phận chính của hệ thống thích nghi.

- Đòi hỏi cần có bộ nhớ.

- Thuật toán có thể được thay đổi dễ dàng.

- Tại bước tính toán đầu tiên có thể tìm được ra lỗi của thuật toán khi hệ

thống có sự thay đổi thông số đủ lớn.

Có 2 loại nhận dạng đệ quy:

- Nhận dạng On-line

- Nhận dạng theo thời gian thực

+ Nhận dạng off-line

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

*Phương pháp nhận dạng không tham số và nhận dạng tham số

38 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

- Nhận dạng không tham số: là phương pháp nhận dạng mà mô hình để nhận

dạng là các đường cong quá độ hoặc các hàm và véc tơ tham số không nhất thiết

phải có kích thước hữu hạn. Nhận dạng không tham số thường dùng các phương

pháp như: phân tích hàm quá độ h(t), phân tích tần số, phân tích hàm tương quan,

phân tích phổ...

- Nhận dạng tham số từ mô hình AR, MA, ARMA.... Người ta đưa vào hệ

thống tín hiệu vào xác định u(t) sau đó đo tín hiệu ra y(t). Người ta mô tả hệ thống

bằng một mô hình tham số và dùng phương pháp bình phương tối thiểu để hiệu

chỉnh sao cho đánh giá của véc tơ tham số trùng với véc tơ tín hiệu ra của hệ thống.

Phương pháp này thường dùng nhận dạng các hệ phức tạp, khi đó đối tượng được

coi là “hộp đen”, vì vậy phương pháp nhận dạng có tên là nhận dạng “hộp đen”.

2.2.1. Nhận dạng On-line.

Trong phương pháp nhận dạng đệ quy nếu không cần đòi hỏi dữ liệu vào - ra

đầy đủ ở mỗi thời điểm thì được gọi là phương pháp nhận dạng on-line.

Nhận dạng on-line vì thế được xem như là phương pháp dễ thực hiện cho

việc tính toán. Nhận dạng on-line được sử dụng trong nhiều lĩnh vực như: nhận

dạng thích nghi, học thích nghi, lọc phi tuyến...

Trong chế độ on-line, mô hình phải thật đơn giản, số các thông số chọn đủ nhỏ

và cấu trúc mô hình tuyến tính theo thông số. Thuật toán nhận dạng on-line được

xây dựng sao cho trên mỗi bước tính không cần xử lý lại toàn bộ chuỗi quan sát, có

nghĩa là sử dụng lại quá trình lặp. Nhận dạng thông số hệ thống on-line có một số

phương pháp sau:

2.2.1.1.Phương pháp lặp bình phương cực tiểu.

Φ=

+

Hệ thống có thể mô tả bằng hệ phương trình sai phân tuyến tính theo thông

( kx

( ) ( ) kPk

( )kw

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

(2.1) số hoặc điều khiển như sau: ) + 1

39 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

=

Φ

Φ=

(2.2)

( )kv ( ) + kx )k,u,x (

Trong đó: ( ) kz ( ) k

=

+

+

Φ−

) 1

T

T

T

=

Sơ đồ nhận dạng có tính đến hệ số trọng cho các quan sát trong quá khứ theo

( kPˆ ( kP

( ) ( kPˆk ( ) k

(2.3)

]1 ) ] 1 −τ∆+ e

τ∆ T

=

e

) Φ− 1 )1−

(2.4) luật hàm exponent: ( ) kPˆ ( ) kK ( ) kP

[ ) ( ) ( kxkK 1 [ ( ) ( ) ( ) Φ− Φ kPk k 1 ] ( [ ( ) ( ) Φ kKI kPk

Trong đó: ∆T: là khoảng cách giữa hai quan sát.

τ: là thời gia đặc trưng cho khoảng ảnh hưởng tiếp tục của

quan sát lên quá trình ước lượng.

2.2.1.2.Phương pháp xấp xỉ ngẫu nhiên.

+

=

+

J

Thuật toán có dạng sau:

. 50

( kPˆ

) 1

( ) kPˆ

( ) p∆ρ k

(2.5)

2

Trong đó ρ(k) là véc tơ thông số hiệu chỉnh thỏa mãn các điều kiện sau:

( ) ∞= k

( ) ∞< k

( ) ρ k

0≥

ρ∑

ρ∑ ; k

=0k

=0

=

+

+

=

+

;

J ) 1

( 2 ke ( kx

)1 ) 1

( +Φ− k

) ( )kPˆ 1

+

=

+

( ke

( ) Φρ+ k

( ) kPˆ

) 1

) 1

( +Φ− k

(2.6) Như vậy (2.23) có thể viết dưới dạng: ( kPˆ

[ ( ) ( kxk

]kPˆ ) ( ) 1

Thuật toán xấp xỉ ngẫu nhiên đơn giản hơn thuật toán lặp bình phương cực

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

tiểu, tuy nhiên kém chính xác hơn.

40 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

2.2.1.3. Phương pháp lọc Kalman mở rộng.

Lọc Kalman là thuật toán xử lý thông tin sử dụng đầy đủ thông tin tiên

nghiệm (cấu trúc, thông số, các đặc trưng thống kê của nhiễu trạng thái và nhiễu

+

+

+

=

quan sát, các dữ liệu về điều kiện ban đầu...). Nếu trạng thái hóa véc tơ thông số

( ) kP, 1

) 1

[ ( kx

]T ) 1

P(k+1)=P(k), ta có véc tơ trạng thái mở rộng: ( ky

và như vậy bộ lọc Kalman mở rộng có thể được sử dụng để xác định đồng thời

+

+

trạng thái và thông số.

) 1

( )

( )kw

1

=

+

(2.7)

] [ ( ) ( ) ( ) Φ= k,kP,ku,kxk [ ( ) ( ) ( ) ( )kv k,kP,ku,kxh

]

2

(2.8) Giả sử hệ có động học: ( kx ( ) kz

Trong đó:

=

(2.9)

( ) } { 0=jwE ; } ( ) { ( ) jw,kwcov

{ } ( ) 0=jvE ( ) ( )j δ k

kv v

(2.10)

=

+

+

κ+

+

+

+

+

+

k

Nếu biết cấu trúc Φ và h và các thông số mô hình P 1, P2 thì bộ lọc Kalman cho

1

1

( ) ku,k

( ) ) k,kP, 1

)

( k

{ ) ( kz 1

) 1

[ ( kxˆh

] }1

2

(2.11) kết quả lọc: ( ( ) kxˆ kxˆ 1

+

Φ=

k

trong đó dự báo

1

( kxˆ

)

( )

( )

]k,kP,ku,kxˆk [ ( ) ( )

1

T

Φ∂

Φ∂

(2.12)

( )

]

]

1

1

+

=

+

k

1

)

( )kV

( ) kV x

( kV x

w

[ ( ) ( ) k,kP,ku,kxˆ ( ) kxˆ ∂

[ ( ) ( ) k,kP,ku,kxˆ ( ) kxˆ ∂

Ma trận hiệp phương sai của sai số dự báo thỏa mãn phương trình: ( )

(2.13)

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Ma trận hiệp phương sai của sai số lọc thỏa mãn phương trình:

41 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

T

+

+

( ) ,

] 1

[ ( ∂ kuh

+

+

)

) =+ 1

1

1

*

( ) − kVk

k

( kV x

( kV x

x

+ 1 + 1

( ) ˆ,1 kx ( ∂ ˆ kx

) , kkPk 2 ) k

+

+

( ) ,

[ ( ∂ kuh

+

)

[

*

/1

*

k

] 1 ( kV x

T

+

+

+

− 1

1

] 1

[ ( ∂ ˆ kxh

+

+

*

) ] 1

*

( kV x

+

+

1

[ ( ∂ ˆ kxh

+

(2.14)

*

1

).

k

] 1 ( kV x

( ) ˆ,1 kx ( ∂ ˆ kx ) ( , kuk ( ∂ + ˆ 1 kx ) ( + , kuk ( ∂ + ˆ kx

) + 1 , kkPk 2 ) + 1 k ( ) ) ,1 , kkP 2 ) k ) ( ) ,1 , kkP 2 ) k

1

+

+

+

1

] 1

1

2

+

+

=

+

( kK

) 1

) 1

( − kV

)1

( kV x

x

+

k

1

( ) ku,k ( kxˆ ∂

( ) ) k,kP, 1 )

Hệ số Kalman được tính bằng biểu thức sau: [ ( kxˆh ∂ (2.15)

xˆ =

=

Các điều kiện ban đầu:

( ) 0

V x

V x

{ }0xE

( )0

và (2.16)

Do các véc tơ thông số P 1(k), P2(k) thay đổi theo thời gian chưa biết trước

nên cần thiết nhận dạng thông số cùng với trạng thái. Tuy nhiên phải giả thiết rằng

+

+

=

+

=

+

( ky

) 1

P1(k) và P2(k) trong khoảng thời gian đủ ngắn là không đổi (có nghĩa là đối tượng

+

[ ( ) ( ) k,ku,kx ( ) kP 1 ( ) kP 2

( kx ( kP 1 ( kP 2

(2.17)

    

]     

Φ    

)  1  )  1  ) 1 

    

gần dừng). Khi đó véc tơ mở rộng có thể viết dưới dạng sau: ( )  kw   0  0 

Sử dụng thuật toán (2.11) đến (2.16) đánh giá đồng thời thông số và trạng

thái hệ thống với véc tơ trạng thái mở rộng (2.17).

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Phương pháp trên chỉ có hiệu quả khi tính phi tuyến thấp.

42 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

2.2.2. Nhận dạng off-line

Trong quá trình điều khiển các đối tượng động lực cần phải giải quyết bài toán

nhận dạng thông số mô hình hệ động lực. Hiện nay có hai hướng cơ bản mô tả toán

học các đối tượng động lực:

- Mô hình hàm truyền

- Mô hình không gian trạng thái

Loại mô hình hàm truyền phù hợp với giai đoạn đầu phát triển lý thuyết điều

khiển và hướng đến các hệ tuyến tính dừng.

Loại mô hình không gian trạng thái tổng quát hơn và có thể hướng đến lớp

đối tượng rộng hơn như hệ phi tuyến, dừng và không dừng.

Quan điểm không gian trạng thái tỏ ra rất hiệu quả trong các nghiên cứu khoa

học và trong thiết kế các hệ động lực phức tạp.

Mục tiêu bài toán nhận dạng không nằm ngoài việc đảm bảo hiệu quả điều

khiển. Tuy nhiên bài toán nhận dạng có thể có ý nghĩa độc lập. Trong trường hợp

này đòi hỏi độ chính xác của các ước lượng thông số nhận được.

Xét bài toán nhận dạng off-line mô hình với cấu trúc cho trước như sau:

* Bài toán nhận dạng thông số off-line:

Quan sát được các véc tơ z(t) bao gồm véc tơ trạng thái với nhiễu tác động v(t)

và đầu vào u(t) như sau:

(2.18) Z(t)=h[x(t), u(t), v(t), P2(t), t],

=

Ở đây P2(t) là các thông số chưa biết của hệ thống.

( )

( )

( )

]t,tP,tw,tu,txf [

( )  tx

1

Véc tơ trạng thái của hệ được mô tả bởi phương trình: ( ) (2.19)

Trong đó w(t) là véc tơ nhiễu tác động từ bên ngoài. Cần xác định thông số mô

hình đảm bảo cực trị một tiêu chuẩn nhận dạng. Sơ đồ tổng quát có dạng biểu diễn

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

ở Hình 2.2:

43 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

V(t)

X(t)

u(t)

( )⋅

( ) tx

= f

Z(t)

( )⋅= h

Z

w(t)

P(t)

Hình 2.2. Sơ đồ tổng quát nhận dạng thông số mô hình

Véc tơ thông số P(t)=[P 1(t),P2(t)] có thể ch ứa các hệ số của phương trình vi

phân, phương trình quan sát và đồng thời có thể có các đặc trưng thống kê của

nhiễu v(t), w(t).

2.2.2.1. Phương pháp xấp xỉ vi phân.

Nếu lấy vi phân giá trị các biến tại các thời điểm, thì có thể xây dựng hệ

phương trình tuyến tính được giải bằng các phương pháp bình phương cực tiểu đối

( )tu),t(x),t(x 

là các hàm đã biết thì phương trình (2.19) với véc tơ cần tìm P. Nếu

có thể viết dưới dạng:

=

(2.20)

P1 . . .Pm

( )itxˆ . . . )itxˆ (

Ma trận A trong có hàm phi truyến x và u, ti, t1, ….tk

)itxˆ

trong đó ( là ước lượng của x(ti) được tính theo phương trình mô hình.

1

T

T

=

Phương pháp bình phương cực tiểu cho kết quả sau:

[ ] ( )txAAA

1

(2.21)

Phương pháp xấp xỉ vi phân thuận tiện nhưng có một số nhược điểm sau:

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

- Phải có đạo hàm của x(t) theo thời gian.

44 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

- Khi có nhiễu tác động thì kết quả nhận được là xấp xỉ trung bình bình

mà không phải là x(t). phương đến ( )tx

- Khi không đo được toàn bộ véc tơ trạng thái thì phương pháp trên không

được dùng.

2.2.2.2 Phương pháp gradient.

Giả thiết rằng mô hình phi tuyến (2.18) và (2.19) được biểu diễn dưới dạng rời

rạc. Cần xác định véc tơ thông số P sao cho x(t) với độ chính xác cho trước phù hợp

với z(t) dưới tác động của điều khiển u(t).

k

=

J

So sánh x(t) với z(t) ta có thể dẫn đến tiêu chuẩn sai số J bao gồm hiệu các đầu

( tz

[ ( txH

i

i

=

i

0

(2.22) ra của mô hình và đối tượng (hệ thống): ] ) )

Trong đó H là hàm và thường được chọn dưới dạng tổng bình phương các

thành phần véc tơ sai số. Cấu trúc hệ nhận dạng theo phương pháp gradie nt như

x(t)

hình 2.3.

Đối tượng

Tiêu chuẩn nhận dạng J

Mô hình

= h

( )⋅

( )⋅= f

( ) tx

z

Chỉnh thông số

u(t)

Tính toán gradient

Hình 2.3. Nhận dạng theo phương pháp gradient

Thuật toán nhận dạng Gradient như sau:

+ Cho các giá trị ban đầu P0.

+ Giải các phương trình sai phân hoặc vi phân và xác định được J.

ipJ ∂∂

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

. + Cho pi=pi0+∆ và giải cũng các phương trình đó, xác định được

45 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

+ Thông tin nhận được về hướng gradient được sử dụng tùy theo từng trường

hợp để xây dựng thuật toán tìm véc tơ thông số P.

Thuật toán gradient lặp đơn giản nhất để xác định thông số P, là phương pháp

hạ nhanh nhất. Hướng của phương pháp hạ nhanh nhất ngược với hướng gradient và

ở điểm ban đầu trùng với hướng trong đó tiêu chuẩn sai số giảm nhanh nhất được

(

)

(

k

1k

∆+

P

P

P

mô tả bằng véc tơ:

]T

) =+ [ ∆∆=∆ p,p

P

,...,

∆ p

1

2

m

2

1 2

m

−=∆

(2.23)

p

C

i

= 1j

∂ J ∂ p

∂ J ∂ p

i

j

   

   

   

   

∂ J

(2.24) Trong đó:

∂ jp

∆+

,...,

p

,...,

p

,...,

p

,...,

p

)

)

j

m

j

m

( p,pJ 1

2

( p,pJ 1

2

∂ J

=

thường được xấp xỉ như sau: Lưu ý rằng

∂ p

j

(2.25)

Hằng số C trong phương trình (2.24) xác định bước thay đổi véc tơ thông số

min

( + ∗ PCPJ

) =∆

C

theo hướng gradient. Nếu cho C quá lớn thì tiêu chuẩn sai số nhận dạng J thực tế

cũng có thể rất lớn. Ngược lại chọn C quá nhỏ thì tốc độ hội tụ có thể quá chậm. Vì vậy cần chọn C = C* tối ưu theo nghĩa cực tiểu theo hướng ngược với gradient: ]PCPJ [ ) ( ∆+ Để tìm C* có thể sử dụng các phương pháp tối ưu thông thường.

2.2.2.3. Phương pháp tìm kiếm trực tiếp

Phương pháp này không yêu cầu biết trước các giá trị đạo hàm (sai phân) như

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

các phương pháp gradient và xấp xỉ đạo hàm. Mặc dù phương pháp tìm kiếm hội tụ

46 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

chậm hơn so với các phương pháp khác nhưng trên thực tế được sử dụng khá nhiều

do tính đơn giản và dễ sử dụng của nó.

Bản chất của phương pháp dựa trên giả thiết rằng độ lệch của véc tơ thông số

ở những bước tìm kiếm đúng đắn trước đó có thể dẫn đến những thành công ở bước

sau.

Đầu tiên chọn giá trị ban đầu của véc tơ thông số và tính toán hàm mục tiêu

tìm kiếm J(0). Sau đó tiến hành xem xét (với bước tính toán cho trước) các hướng

+

+

k

k

) 1

) 1

) 1

)

α+

=

p

p

p

phù hợp với tất cả các thành phần của véc tơ thông số. Nếu J(k) < J(0) thì chọn lại

( + k im

( i

( ic

[ p

(2.26) giá trị ban đầu mới và dịch chuyển “sơ đồ” tính toán sang tọa độ gốc mới và lặp lại chu trình tìm kiếm cho tới khi tìm được giá trị cực tiểu J*. ( i

]k (k+1) là các tọa độ gốc mới và cũ.

(k+1), pic

trong đó: pim

α ≥ 1 là hệ số khuếch đại.

2.2.2.4. Phương pháp tựa tuyến tính

Phương pháp tựa tuyến tính kết hợp với phương pháp bình phương cực tiểu có

thể nhận dạng véc tơ thông số chính xác hơn khi biết các giá trị xấp xỉ của nó.

=

=

x

x

Giả sử hệ được mô tả bằng phương trình sau:

( )  tx

( ) 0

]t,P,u,xf [

0

, (2.27)

Nếu tuyến tính hóa vế phải biểu thức (2.27) qua chuỗi Taylor thì có thể tìm P

m,...,

i

=

p

p

đơn giản bằng phương pháp bình phương cực tiểu ở trên. Tuy nhiên cần bổ xung

21= ,

i

i

0=ip

0

; ; một hệ phương trình đánh giá thông số cho (2.27) như sau: ( ) 0

T

=

x

,...,

p,p,x

p,...

v

]m

[ x,x 1

2

1

2

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Như vậy mô hình đánh giá (2.27) được mở rộng với:

47 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

U

,...,

0

2

T =

f

,...,

0

,u v (

]0 ) ,...,

(

(2.28)

2

,...,

p,p,x

,...,

p

v

m

[ T = u,u ,..., 1 [ ) ( t,u,xf,t,u,xf 1 [ x,x 10

20

0

x = 0

10

20

) ,t,u,xf v ]0

]0

Ta có thể dùng phương pháp xấp xỉ vi phân ở những bước đầu tiên của thuật

toán tựa tuyến tính.

2.2.2.5. Phương pháp sử dụng hàm nhạy.

Đây là phương pháp trực giác cho phép xác định thông số tương đối chính xác.

∂ x

Giả sử hệ có dạng (2.27). Hàm ma trận nhạy của đầu ra hệ thống được xác định

∂ p

∆ p

∆ x

j

i

λ≈

ij

bằng: (2.29)

x

p

i

j

hoặc:

∂ 2

x

∂ f

∂ x

∂ f

=

+

Kết hợp (2.24) và (2.27) có thể viết:

∂∂ tp

∂ x

∂ p

∂ p

∂ x

∂ f

∂ f

0

=λ

T +λ

λ

=

(2.30)

( ) 0

∂ x

∂ p

∂ p

, (2.31)

Lấy tích phân (2.31) nhận được λ phục vụ cho quá trình nhận dạng.

2.2.3. Nhận dạng theo thời gian thực.

Trong phương pháp nhận dạng đệ quy nếu thông số của mô hình có đầy đủ

cho mỗi thời điểm được quan sát theo thời gian thực, gọi là phương pháp nhận dạng

theo thời gian thực. Nó được sử dụng cho nhận dạng thông số hệ thống biến đổi

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

chậm thời gian. Để xác định thông số θ(t+1) trên cơ sở N cặp tín hiệu vào- ra, phải

48 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

thực hiện liên tiếp thủ tục nhận dạng dữ liệu tín hiệu vào- ra với bậc phù hợp. Thuật

toán có dạng:

(2.32) (t+1)=θ(t)+ Γ (t) .e(t).

θ Với e(t) là sai lệch tại thời điểm t; Γ (t) là số phụ thuộc vào đối tượng nhận

dạng tại thời điểm t.

Phương pháp nhận dạng đối tượng theo đặc tính vào- ra, là điểm mạnh về

ứng dụng của mạng nơron. Sử dụng mạng nơron để nhận dạng đối tượng có nhiều

ưu điểm hơn so với phương pháp nhận dạng truyền thống vì:

Mạng nơron là hệ học và thích nghi có khả năng học on-line từ các số liệu

quá khứ, do đó kết quả nhận dạng có thể đạt được độ chính xác rất cao. Mạng nơron

là hệ xử lý song song do đó tốc độ tính toán cao, mà các phương pháp nhận dạng

truyền thống khó có thể đạt được. Mặt khác mạng nơron là hệ MIMO (Many Input,

Many Output), do đó rất tiện dùng khi nhận dạng cho đối tượng nhiều biến. Tóm lại

bản chất "HỌC" mạng nơron có một trong những ứng dụng rất đặc trưng đó là nhận

dạng đối tượng căn cứ vào đăc tính vào- ra của nó.

2.3. Mô tả toán học của đối tượng ở rời rạc

=

Phương trình không gian trạng thái của đối tượng được biểu diễn ở dạng

)t(dx dt

[x(t), u(t)]; (2.33)

y(t)=[x(t)]; Trong đó: x(t) =[x1(t), x2(t),....,xn(t)]T; u(t) =[u1(t), u2(t),.... ,un(t)]T; y(t) =[y1(t), y2(t),....,yn(t)]T.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Tương ứng với hệ có p đầu vào, m đầu ra có bậc n với u i(t) là các đầu vào, xi(t) là các biến trạng thái và y i(t) là các đầu ra của hệ. φ vectơ bậc RnxRp và ψ bậc

49 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

Rm . Vectơ x(t) biểu thị trạng thái của hệ thống theo thời gian t và được xác định tại

thời điểm t0 < t và đầu vào u được định nghĩa trong khoảng [t0, t]. đầu ra y(t) là hàm

phụ thuộc trạng thái x(t). Phương trình trạng thái viết ở dạng rời rạc:

x(k+1) = φ [x(k), u(k)];

y(k) = ψ [x(k)]; (2.34)

Trong đó: u(.), x(.), y(.) là các biế n ở dạng rời rạc. Nếu (2.34) là dạng tuyến

tính ta được:

x(k+1) = Ax(k) + Bu(k);

y(k) = Cx(k); (2.35)

Với A, B, C là các ma trận tương ứng cấp (n×n), (n×p), (m×n).

* Đối tượng tuyến tính

Cho đối tượng tuyến tính bất biến thời gian với thông số chưa biết, đối với hệ

một đầu vào, một đầu ra (Single Input, Sing Output - SISO) để điều khiển và quan

− 1n yp (k+1)= ∑ α

j u(k-j) (2.36)

− 1m i yp(k-i) + ∑ β = 0j

= 1i

sát đối tượng, ma trận A, B và C của đối tượng ở dạng rời rạc được cho ở dạng:

Trong đó αi, βj là các hằng số chưa biết; m ≤ n.

Tín hiệu ra y p(k+1) là tổ hợp tuyến tính của các giá trị quá khứ của cả tín

hiệu đầu vào u(k-j) (j = 0, 1, 2,...., m-1) và tín hiệu đầu ra yp(k-i) (i=1,2,...,n1).

* Đối tượng phi tuyến

Có 4 dạng đối tượng phi tuyến rời rạc biểu diễn như sau:

− 1n yp (k+1)= ∑ α

i yp(k- i) +g[u(k),[u(k-1),..., [u(k- m+1)]; (2.37)

= 1i

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

- Dạng 1:

50 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

yp(k+1) phụ thuộc tuyến tính vào giá trị quá khứ yp(k-1)(i=0,1,..., n-1) và phụ thuộc

yp(k+1)

yp(k)

Z-1

u(k)

yp(k)

Z-1

u(k-1)

g(.)

Z-1

yp(k-1)

Z-1

τα

u(k-m+1)

Z-1

yp(k-n+1)

- Dạng 2:

phi tuyến vào giá trị quá khứ đầu vào u(k),..., u(k- m+1).

m

− 1

iβ u(k-i) (2.38)

yp (k+1)= f[yp(k), yp(k-1),..., yp(k-n+1)] + ∑

=

j

0

u(k)

yp(k)

yp(k+1)))

Z-1

yp(k)

Z-1

Z-1

u(k-1)

yp(k-1)

τβ

f(.)

Z-1

Z-1

yp(k-n+1)

u(k-m+1)

Hình 2.4. Mô hình dạng 1

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Hình2.5. Mô hình dạng 2

51 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

yp (k+1) phụ thuộc tuyến tính vào giá trị quá khứ đầu vào u(k-i) (i=o,1,...m-1),

phụ thuộc phi tuyến vào giá trị quá khứ ra yp (k),..., yp (k- n+1).

- Dạng 3:

yp (k+1)= f[yp(k), yp(k-1),..., yp(k-n+1)] +g[u(k),u(k-1),..., u(k- m+1)]; (2.39)

yp(k)

yp(k+1)

Z-1

u(k)

u(k)

yp(k)

Z-1

Z-1

u(k-1)

yp(k-1)

f(.)

g(.)

Z-1

Z-1

u(k-m+1)

yp(k-n+1)

yp (k+1) phụ thuộc phi tuyến vào các giá trị quá khứ đầu vào u(k),...,u(k-

m+1)], phụ thuộc phi tuyến vào giá trị quá khứ ra yp (k), yp (k-1),...., yp (k-n+1)

- Dạng 4:

yp (k+1)= f[yp(k), yp(k-1),..., yp(k-n+1)] ; u(k), u(k-1),..., u(k- m+1)]; (2.40)

yp (k+1) phụ thuộc phi tuyến vào giá trị đầu ra quá khứ và phụ thuộc các

giá trị đầu vào cùng các giá trị quá khứ của nó. Với u(k), y p(k) là các cặp tín

hiệu vào- ra của đối tượng tại thời điểm k; m≤n.

Các phi tuyến f(.), g(.) chưa biết của đối tượng, cần được tính toán gần

đúng bởi mạng Nơron có độ chính xác mong muốn. Số lượng các lớp, số nơron ở

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Hình 2.6. Mô hình dạng 3

52 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

mỗi lớp và các mối liên kết giữa các noron mỗi lớp với nhau của mạng noron

nhận dạng được chọn cần phù hợp với độ chính xác và đặc tính vào- ra của hàm

phi tuyến tương ứng của đối tượng đã cho.

yp(k)

Z-1

yp(k-1)

Z-1

yp(k)

f(.)

yp(k-n+1)

yp(k+1)

Z-1

u(k)

Z-1

u(k-1)

Z-1

u(k-m+1))

Hình 2.7. Mô hình dạng 4

2.4. Nhận dang hệ thống sử dụng mạng nơron

Như vậy nhận dạng hệ thống cần hai giai đoạn đó là lựa chọn mô hình và

tối ưu tham số. Đối với mạng nơron dựa vào nhận dạng lựa chọn số nút ẩn, số

lớp ẩn (cấu trúc của mạng) tương đương với mô hình lựa chọn. Mạng có thể

được huấn luyện theo kiểu giám sát với thuật toán lan truyền ngược, dựa vào luật

học sai số hiệu chỉnh. Tín hiệu sai số được lan truyền ngược qua mạng. Thuật

toán lan truyền ngược sử dụng phương pháp giảm gradient để xác định các trọng

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

53 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

của mạng vì vậy tương đương với tối ưu tham số. Mạng nơron được huấn luyện

để xấp xỉ mối quan hệ giữa các biến.

Mạng nơron được huấn luyện để tối thiểu hàm năng lượng sai số. Mạng

được huấn luyện để tối thiểu sai số bình phương giữa đầu ra của mạng và đầu

vào hệ thống, xác định một hàm truyền ngược. Trong kiểu nhận dạng này đầu ra

của mạng hội tụ về đầu vào hệ sau khi huần luyện, và vì vậy mạng đặc trưng cho

hàm truyền ngược của hệ. Phương pháp nhận dạng khác cần phải hướng đầu ra

hệ thống tới đầu ra của mạng. Trong kiểu này mạng đặc trưng cho hàm truyền

thẳng của hệ thống.

Giả sử các hàm phi tuyến để mô tả hệ thuộc lớp hàm đã biết trong phạm vi

quan tâm thì cấu trúc của mô hình nhận dạng phải phù hợp với hệ thống. Với giả

thiết các ma trận trọng của mạng nơron trong mô hình nhận dạng tồn tại, cùng

các điều kiện ban đầu thì cả hệ thống và mô hình có cùng lượng ra với bất kỳ

lượng vào xác định. Do đó quá trình nhận dạng thực chất là điều chỉnh tham số

của mạng nơron dựa vào sai lệch giữa các giá trị đầu ra của hệ thống và của mô

hình. Sau đây ta đưa ra một số mô hình mà nó đảm bảo tính hội tụ c ủa các tham

số cần nhận dạng tới các giá trị mong muốn.

2.4.1. Mô hình nhận dạng kiểu truyền thẳng (Forward Modelling)

Mạng Nơron

∧ y

_

p e

u Nhiễu + yP

Đối tượng

Hình 2.8. Mô hình nhận dạng kiểu truyền thẳng

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

54 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

Mạng nơron nhận dạng nối song song với đối tượng, sai lệch e giữa đầu ra của

đối tượng yp và đầu ra của mạng nơron

∧ y p được sử dụng làm tín hiệu học sửa

trọng số cho mạng.

2.4.2 Mô hình song song

- Với đối tượng tuyến tính:

+−

(2.41)

k(u)k(

);j

i

∧ py (k+1)=

)ik(y)k( p

j

∧ − 1n ∑ α = 1i

∧ − 1m β ∑ = 0j

Trong đó:

(i=0,1,...,n-1);

(j=0,1,...,m-1);

py (k+1) là các thông số

∧ α )k(i

∧ β )k(j

nhận dạng của (2.36).

- Với đối tượng phi tuyến:

+ Dạng 1:

+−

+

(2.42)

),...,

)]1mk(u

i

∧ py (k+1)=

− 1k(u),k(u[g)ik(y. p

∧ − 1n ∑ α = 1i

+ Dạng 2:

+−

+

(2.43)

),...,

∧ )]1nk(y

− );ik(u

∧∧ ∧ 1k(y,y[f p

p

∧ py (k+1) =

i

p

∧1m − β ∑ = 0j

+ Dạng 3:

+−

+

u(k-m+1)] ; (2.44)

),...,

∧ )]1nk(y

∧ py (k+1) =

∧∧ ∧ 1k(y,y[f p

p

p

+ Dạng 4:

+−

; u(k),...,u(k- m+1) ] (2.45)

∧∧ 1k(y),k(y[f

),...,

∧ )]1nk(y

∧ py (k+1) =

p

p

p

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

55 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

yP(k+1)

+

f

z-1

+

α0

+

u(k)

-

e(k+1)

z-1

e

α1

+

+

N

( + k

)1

+ ∧ y P

z-1

+

+

α0

z-1

α1

Hình 2.9. Mô hình nhận dạng kiểu song song

Hình 2.9 là mô hình nhận dạng kiểu song song. Ở đây mô hình nhận dạng đặt

song song với mẫu. Việc nhận dạng ở đây là ước lượng các tham số

iˆα cũng như

lệch e(k) giữa lượng ra của mô hình

và lượng ra thực yp(k).

các trọng của mạng nơron sử dụng thuật toán lan truyền ngược động dựa vào sai ( )kyˆ p

Trong cấu trúc này, vấn đề ổn định của hệ nhận dạng sử dụng mạng nơron như

đã nói chưa đảm bảo chắc chắn và chưa được chứng minh. Vì vậy khi sử dụng

mô hình song song sẽ không đảm bảo chắc chắn rằng các tham số sẽ hội tụ hoặc

là sai lệch đầu ra sẽ tiến tới không.

2.4.3 Mô hình nối tiếp - song song

- Đối tượng tuyến tính:

+−

(2.46)

k(u)k(

);j

i

∧ py (k+1)=

)ik(y)k( p

j

∧ − 1n ∑ α = 1i

∧ − 1m β ∑ = 0j

- Đối tượng phi tuyến

+ Dạng 1:

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

z-1

α1

56 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

+−

+

(2.47)

),...,

∧ )]1nk(y

− );ik(u

∧ py (k+1) =

∧∧ ∧ 1k(y,y[f p

p

p

i

∧1m − β ∑ = 0j

+ Dạng 2:

+−

+

(2.48)

),...,

∧ )]1nk(y

− );ik(u

∧ py (k+1) =

∧∧ ∧ 1k(y,y[f p

p

p

i

∧1m − β ∑ = 0j

+ Dạng 3:

+

,...,u(k-m+1)]

),...,

∧ )1k(u),k(u[g

∧ py (k+1) =

∧ − 1k(y,y[f p

+− )]1nk(y p

p

(2.49)

+ Dạng 4:

; u(k),u(k-1),...,u(k- m+1)]

∧ 1k(y),k(y[f

),...,

∧ py (k+1) =

p

+− )]1nk(y p

p

( 2.50)

f

+

yP(k+1 )

z-1

-

α0

e(k+ 1)

e(k+1)

+

u(k)

z-1

e

+

+

α1

N

+ e

1+ )

k(y P

z-1

+

α0

+

z-1

+

α1

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Hình 2.10. Mô hình nhận dạng kiểu nối tiếp - song song

57 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

Hình 2.10 là mô hình nhận dạng nối tiếp - song song. Nó có nhiều ưu điểm

hơn mô hình song song. Có tốc độ hội tụ cao, từ giả thiết hệ ổn định BIBO nên

tất cả các tín hiệu của quá trình nhận dạng (như các tín hiệu vào của mạng

nơron) cũng bị giới hạn. Trong mô hình không tồn tại mạch vòng phản hồi,

nhưng có thể dùng thuật toán lan truyền ngược để điều chỉnh các tham số của hệ

để làm giảm các phép tính toán. Kết thúc quá trình sẽ dẫn tới sai số đầu ra tiến

=

( )kyˆ

. Mô hình nhận dạng nối tiếp – song song

tới giá trị rất nhỏ, vì vậy

( ) ky p

p

có thể thay thế bằng mô hình song song mà không ảnh hưởng lớn. Mô hình nối

tiếp – song song được chú trọng hơn trong nghiên cứu.

2.4.4. Mô hình ngược trực tiếp (Direct Inverse Modelling)

Tín hiệu ra của đối tượng yp là tín hiệu vào của mạng nơron. Tín hiệu ra

của mạng được so sánh với tín hiệu đặt ở đầu vào và sai lệch e được sử dụng là

tín hiệu luyện mạng nơron hình 2.11.

r

Đối tượng

Mạng nơron

u - yP

+

e

Hình 2.11. Mô hình nhận dạng ngược trực tiếp.

2.5. Tính gần đúng hàm số dùng mạng nơron.

Theo định lý Weierstrass có thể sử dụng các đa thức trong các sơ đồ khác

nhau để tính toán gần đúng với độ chính xác tùy ý các hàm liên tục. Đã có một

số kết quả về việc sử dụng mạng nơron truyền thẳng nhiều lớp có một hay nhiều

lớp ẩn, với a(,) dạng sigmoid để tính toán gần đúng các hàm liên tục. Có thể thay thế hàm f(x) liên tục thuộc Rn bằng mạng nơron đủ rộng :

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

58 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

f(x) ≅

= WTa(VTx)+ e

(2.51)

^ )x(f

Với W, V là véc tơ trọng số của tầng vào và các tầng ẩn của mạng nơron;

=

^ )x(f

e

)x(f

Sai lệch:

Định nghĩa 1: Hàm

gọi là hàm mục tiêu của mạng nơron để mô tả

^ )x(f

đối tượng f(x) nếu thỏa mãn điều kiện e = 0 với mọi x thuộc Rn .

đực gọi là hàm mục tiêu gần đúng của mạng nơron nếu thỏa

- Hàm

^ )x(f

mãn điều kiện e ≤ ε với mọi x thuộc Rn; ε là sai số cho phép.

Định nghĩa 2: Các véc tơ N, W, V thuộc Rn được gọi là số nơron và trọng

số lý tưởng của mạng nơron nếu thỏa mãn hàm mục tiêu

.

^ )x(f

ĐỊNH LÝ :

Cho ϕ(x) là hàm số đơn điệu, liên tục . Cho S thuộc Rn và

^ 1x(f

,....,

)xn

các giá trị thực trong S. Cho ε >0. Sẽ tồn tại các số nguyên dương N và các hằng số thuộc Rn là: ci, θi (i=1,2,…,N); wij(i=1,2,…,N;j=1,2,…,N) sao cho :

θ−

(2.52)

^ 1x(f

,....,

)xn

ac i

xw ij

j

i

N = ∑ = 1i

N ∑ = 1j

   

   

ε≤

Thỏa mãn:

xx(f

,...,

,...,

21

)x n

x,x(f 1

2

)x n

Mạng (2.52) có 1 lớp ẩn, kết quả tương tự cho mạng nhiều lớp ẩn.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

59 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

2.6. Mô hình mạng nơron trong nhận dạng.

Giả thiết rằng mạng nơron đủ rộng để có thể biểu diễn hàm số với độ

chính xác cần thiết. 4 loại mô hình sau đây được dùng để nhận dạng và điều khiển hệ phi tuyến, trong đó N, N1, N2 là các mạng nơron. W(z) có dạng: W(z) = z-d

- Khâu trễ d bước:

d

− 1

iz

- Tổng hạn chế trong thời gian d: W(z) = ∑ α = 1i

+

z

a

- Hàm hữu tỉ:

W(z) =

2

+

+

z

bz

c

+ Mô hình 1 (Hình 2.12):

Tín hiệu ra: y=W(z).v=W(z).N(u)

=

= W(z)

∂ )t(e ∂ ijw

∂ )t(y ∂ ijw

∂ v ∂ ijw

wij- trọng số ; v - tín hiệu ra của mạng N;

Sai lệch:

e(t) = y(t) – yd(t)

+ Mô hình 2: (Hình 2.13) y = N1 v = Nl( W(z).N2 u)

i

=

Với mạng N2 ta có:

∂ v 1 ∂ w

∑ 1

∂ )t(y ∂ ijw

ij

∂ y ∂ v 1

là trọng số của mạng N1; v là tín hiệu vào của mạng N1.

wij

+ Mô hình 3 (Hình 2.14):

y = N v = N(u + W(z) y)

=

+

∂ f ∂ x

∂ x ∂ ijw

∂ f ∂ ijw

∂ f ∂ ijw

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

60 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

=

+

=

W(z)

+

∂ ]v[N ∂ v

∂ ]v[N ∂ v

∂ ]v[N ∂ ijw

∂ ]v[N ∂ ijw

∂ v ∂ ijw

∂ y ∂ ijw

∂ f ∂ ijw

là tổng các đạo hàm;

là các ma trận Jacobian.

∂ ]v[N ∂ v

∂ ]v[N ∂ jw

∂ ijw∂

+ Mô hình 4 (Hình 2.15): y = N1 v = N1[ N2u + W(z) y]

Mô hình giống như mô hình 2.15 nhưng phía trước có thêm mạng nơron N2, nhưng không làm ảnh hưởng đến sự tính toán xác định các t hông số của mạng N1:

+

=

=

=

)z(W

]v[N1 ∂ ∂ v

]v[N1 ∂ ∂ v

]v[N1 ∂ ∂ v

2 ∂ ]u[N ∂ w

∂ y ∂ w

∂ y ∂ ijw

∂ v ∂ ijw

ij

ij

   

   

y

u

v

u u

v

W(z)

N2

N1

N

W(z)

Hình 2.12. Mô hình 1 Hình 2.13. Mô hình 2

v

y

u

+

+

y

v

u

N1

N2

N

+

+

W(z)

W(z)

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Hình 2.15. Mô hình 4 Hình 2.14. Mô hình 3

61 Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng

2.7. KẾT LUẬN CHƯƠNG II

* chương II đã trình bày tóm tắt một số phương pháp ứng dụng mạng nơron

để nhận dạng đối tượng. Kểt quả đạt được của các phương pháp trên đã được sử

dụng trong thực tế nhưng còn ở hạn chế ở các đối tượng có tính phi tuyến thấp.

Nổi lên hai phương pháp nhận dạng on -line và nhận dạng off -line. Trong đó

phương pháp nhận dạng off- line có nhiều ưu điểm, nó có thể sử dụng đồng thời

tất cả các dữ liệu. Nhận dạng off- line sử dụng khi cần thiết phải sử lý rất nhiều

tín hiệu cùng một lúc.

* Phương pháp sử dụng mạng nơron nhận dạng đối tượng theo đặc tính vào -

ra, là điểm mạnh về ứng dụng của mạng nơron. Sử dụng mạng nơron để nhận

dạng đối tượng có nhiều ưu điểm hơn so với phương pháp nhận dạng truyền

thống. Hạn chế của các phương pháp nhận dạng truyền thống là: thời gian xử lý

chậm, không có cấu trúc xử lý song song, không có khả năng học và ghi nhớ.

Mạng nơron là hệ học và thích nghi có khả năng học on-line hoặc off-line

từ các số liệu quá khứ, do đó kết quả nhận dạng có thể đạt được độ chính xác rất

cao. Mạng nơron là hệ xử lý song song do đó tốc độ tính toán cao, mà các

phương pháp nhận dạng truyền thống khó có thể đạt được. Mặt khác mạng noron

là hệ MIMO, do đó rất tiện dùng khi nhận dạng cho đối tượng nhiều biến.

Với bản chất "HỌC" mạng noron có một trong những ứng dụng rất đặc trưng đó

là nhận dạng đối tượng căn cứ vào đặc tính vào - ra của nó. Trong đó mạng

nơron truyền thẳng nhiều lớp cấu tạo đơn giản và có luật học lan truyền ngược

rất nổi tiếng tương đối dễ thực hiện và có hiệu quả cao phù hợp với thực hiện

quá trình học cho các đối tượng tuyến tính, mạng nơron hồi quy nhiều lớp có

thêm các liên kết phản hồi do đó số lượng thông số cần điều chỉnh trong quá

trình học nhiều hơn do đó thời gian học bị kéo dài phù hợp với thực hiện quá

trình học cho các đối tượng phi tuyến.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

62 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

CHƯƠNG III ỨNG DỤNG MẠNG NƠRON ELMAN NHẬN DẠNG

VỊ TRÍ RÔBÔT HAI KHÂU

3.1. Mạng nơron Elman: 3.1.1. Cấu trúc mạng Elman

Mạng nơron Elman là một phần của mạng nơron hồi qui, nó được phát minh

bởi Elman ( Elman 1990) thông thường là mạng hai lớp với các thông tin phản

hồi từ đầu ra của lớp thứ nhất tới đầu vào. Đường hồi tiếp này cho phép mạng

Elman phát hiện và tạo ra những mẫu thời gian khác nhau. Điều đó có nghĩa là

sau khi huấn luyện mối quan hệ giữa đầu vào hiện tại và và các lớp bên trong là

quá trình đưa ra đầu ra và miêu tả có liên quan đến những thông tin cũ bên trong.

Sơ đồ cấu trúc mạng Elman như hình 3.1

Hình 3.1. Sơ đồ cấu trúc mạng Elman

Mạng Elman có các nơron tansig trong lớp ẩn và những nơron purelin ở lớp ra.

Sự kết hợp này là rất đặc biệt vì trong mạng hai lớp với những hàm truyền này

có thể tạo ra bất kỳ hàm nào với độ chính xác tuỳ ý. Yêu cầu duy nhất là lớp ẩn

phải có đủ số nơron. Số nơron trong lớp ẩn càng nhiều thì mạng càng mô tả

chính xác nhưng cũng phức tạp hơn. Hình 3.2 là lược đồ mạng Elman với đầu

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

vào x1 ÷ xn và hai lớp, lớp ẩn và lớp ra. Chúng ta có thể sử dụng chức năng thay

63 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

thế cho mỗi lớp. Một vài chức năng có giới hạn đầu ra nên ta cần chọn chức

năng phù hợp.

Mạng elman khác với mạng hai lớp thông thường trong đó lớp thứ nhất có liên

kết phản hồi. Hình 3.2 là lược đồ mạng Elman

Hình 3.2. Lược đồ mạng Elman

Sự trễ trong liên kết này lưu trữ trị số từ bước nhảy trước, nó có thể được sử

dụng trong bước nhảy hiện tại.

a1(k) = f1 (IW1,1x + LW1,1a1(k -1) + b1 (3.1)

Trong đó:

IW1,1 : là kích thước ma trận thông số vào của lớp phản hồi X là m x1 kích thước ma trận của các đầu vào LW1,1 : là R x R kích thước ma trận thông số hiện tại

a1(k -1) : là đầu ra của lớp hồi qui tại bước nhảy thứ ( k – 1) b1 : là trọng số của lớp hồi qui f1 : là chức năng chuyển đổi của lớp hồi qui a1(k) : là đầu ra của lớp hồi qui ở bước nhảy k Với R nơron lớp hồi qui có thể có một R x1 ma trận của a1(k) a2(k) = f2 ( LW2,1a1(k) + b2) Trong đó:

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

LW2,1: Là S xR kích thước ma trận thông số từ lớp hồi qui tới lớp ra.

64 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

b2 : là những trọng số của lớp ra f2: là sự chuyển chức năng của lớp ra a2: là đầu ra của lớp ra

Với S nơron lớp ra có thể có S x 1 ma trận của a2(k).

3.1.2. Giá trị đầu vào của các tham số.

Quá trình này gồm sự ước lượng của các tham số IW, LW, b

Nếu mạng nơron có 3 đầu vào, 2 nơron ở lớp hồi qui và một nơron ở lớp

ra. Ta sẽ cho giá trị đầu vào tham số: IW {1,1}, LW{1,1}, LW{2,1},

b{1}, b{2}.

3.1.3. Huấn luyện

N

2

=

)

E

g

ytt

Huấn luyện lấy nền tảng trên sự giảm xuống tối thiểu của sai lệch

mau

mau

2 e mau

1 = ∑ N

1 N

=

mau

( 1

(3.2)

Trong đó :

yttmau và gmau là đầu ra và đầu vào hiện tại của những mẫu N Ta tiếp tục tính toán hệ số LW2,1, b1, b2, IW1,1 LW2,1 là giá trị lưu trữ ban đầu và không thay đổi trong khi huấn luyện

Sự giảm đến mức tối thiểu sai lệch được thực hiện bởi sự lặp lại trên cơ

sở thuật toán Gradient

3.2. Động học rôbôt hai khâu

3.2.1. Phân tích chọn mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

Đặc điểm cơ bản của đối tượng phi tuyến là có một số thông số không những

phụ thuộc vào thời gian mà còn phụ thuộc vào các giá trị của bản thân nó và các

thông số khác ở những trạng thái trước đó. Ngoài ra còn có đặc điểm là có sự tồn

tại của các điều kiện bờ của bộ các thông số, do đó có các vùng điều khiển được

và vùng không điều khiển được. Với cách hiểu đó [8] cho rằng không có đối

tượng phi tuyến có bộ thông số ở dạng tường minh mà chỉ biết được bộ thông số

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

đầy đủ của nó ở một thời điểm, thông thường là ở thời điểm ban đầu. Do đó để

65 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

nâng cao chất lượng điều khiển cho đối tượng phi tuyến, đặc biệt đối với đối

tượng nhiều vào - nhiều ra (MIMO) cần thực hiện quá trình nhận dạng chúng

trước khi thực hiện các giải pháp điều khiển. Sau quá trình này, phần tử phi

tuyến sẽ được thay thế bởi một mô hình nhận dạng dễ tiếp cận hơn cùng với các

điều kiện bờ cho trước. Đây là một quá trình gặp nhiều khó khăn vì đối tượng

phi tuyến thường rất đa dạng và phức tạp.

Mạng nơron được xây dựng mô phỏng theo cấu trúc bộ não con người, có cấu

trúc nhiều vào - nhiều ra. Mỗi mạng nơron lại có một luật học tương ứng hữu

hiệu, có khả năng học bộ dữ liệu của đối tượng MIMO phi tuyến cần nhận dạng

với độ chính xác rất cao. Khi nhận dạng đối tượng MIMO phi tuyến, [11] đã chỉ

ra rằng nên sử dụng mạng nơron hồi quy vì khi đó sẽ có được nhiều ưu điểm về:

độ chính xác cao hơn, số lượng chu kỳ học ít hơn và cấu trúc của mạng bao gồm

số lượng nút có trong mạng cùng với số lớp của nó sẽ nhỏ hơn so với khi sử

dụng mạng nơron truyền thẳng.

Vị trí rôbôt hai khâu là đối tượng MIMO có tính phi tuyến mạnh. Hiện đã có

nhiều công trình đề cập đến sử dụng các giải pháp thông minh để nhận dạng đối

tượng này, nhưng chúng lại có nhược điểm là phải cần sử dụng nhiều mạng

nơron, hoặc nếu chỉ sử dụng một mạng nơron thì chỉ nhận dạng được một phần

trong bộ các thông số đặc trưng của vị trí rôbôt hai khâu [3].Ta có thể sử dụng

mạng nơron Elman, thuộc nhóm các mạng nơron hồi quy, thực hiện nhận dạng vị

trí rôbôt hai khâu. Ưu điểm của giải pháp này là chỉ cần sử dụng một mạng

nơron Elman sẽ có thể nhận dạng được đối tượng MIMO có tính phi tuyến mạnh

nói trên. Một ưu điểm khác của giải pháp này là có thể nhận dạng được vị trí

rôbôt hai khâu ở dạng “hộp đen” với chú ý thực hiện xác định bộ dữ liệu vào - ra

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

bằng phương pháp đo lường trực tiếp.

66 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

3.2.2. Động học rôbôt hai khâu

+

+

+

. . q2(qhH 1

2

2

22

12

22

1

2

12

=

+

Theo [3] phương trình động học vào - ra rôbôt hai khâu có dạng như sau:

τ 1 τ

H 22 − H

H H

1 −

  

  

  

  

21

11

2

   

HH 11

22

HH 12

21

.. q 1 .. q

    

    

2

+

. . q2(qhH 1

2

2

     

     

21

. . 2 − gHgHqhH)q 1 12 . 2 1

. + gHgHqhH)q 11

121

11

2

      

=

+

+

+

+

+

+

+

+

H

I

lm

l

ll.2

cos(

q

l

ll.2

cos(

q

)];

11

I 1

2

2c1

2

21

2

2 1c1

2 l[m 12

2 2c

2 l[m)] 13

2 2

=

H

(3.3)

22

2 2 + lmlm 23 22

=

=

+

+

+

H

H

cos(

q

cos(

q

)];

12

21

ll. 21

2

ll. 21

2

2 l[m 22

2 l[m)] 23

sin(

;

2c12= llmh

)q 2

=

+

+

+

cos(

l[gm)q

cos(

q

cos(

q

)];

glmg 1c1

1

2

1

)q 2

l 1

1

1

2c

=

+

g

lm

g

cos(

q

;

2

2c2

)q 2

1

;

Sơ đồ động học rôbôt hai khâu được minh hoạ ở hình 3.3.

Trong đó: q1, q2 là vị trí của khâu thứ nhất và thứ hai; τ1, τ2 là mômen điều

khiển khâu thứ nhất và thứ hai; m1, m2 là khối lượng khâu thứ nhất và thứ hai; l1,

l2 là độ dài của khâu thứ nhất và thứ hai; lc1, lc2 là độ dài từ điểm nối khâu thứ

nhất và khâu thứ hai đến trọng tâm của các khâu đó; I1, I2 là mômen quán tính

3m

2 I,m

2

1l

2q 2cl

2l

1cl

11 I,m

X

1q

khâu thứ nhất và thứ hai; m3 là khối lượng phụ tải; g là gia tốc trọng trường.

Y

Hình 3.3. Sơ đồ động học rôbôt hai khâu

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

67 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

3.3. Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

3.3.1. Thiết lập sơ đồ nhận dạng

.

.

=

+

τ

,

)m,q,

.. q

Theo [3] và từ phương trình động học vào ra rôbôt hai khâu biến đổi ta được:

(u)m,q,q,q,q(f 1

3

2

1

τ 11

2

3

2

2

1

1

.

=

τ

+

.. q

f

,

(3.4)

2

3

1

τ 1

2

)m,q, 2 3

2

1

+

+

+

22

22

1

2

2 . . q2(qhH 1

2

=

(.)

f1

(3.5)

12 −

. (u)m,q,q,q,q( 2 2 . 2 1 HH 12

. − gHgHqhH)q 12 2 HH 11

22

21

22

=

(.)

1u

τ− −

τ H 1 HH 11

22

H 2 12 HH 12

21

+

121

2

21

=

(.)

2f

. . . . 2 + gHgHqhH)q q2(qhH 11 11 2 1 2 1 − HH HH 11 12

21

22

=

(.)

2u

với:

+τ 121 −

− H HH 11

22

τ H 211 HH 12

21

.

3m thay đổi nhưng thông thường đã biết trước, nên có thể không coi

Phụ tải

=

τ

τ

τ

u

),k(

− ),1k(

− ),2k(

),k(

− ),1k(

)

nó là biến số. Biến đổi (3.4), (3.5) ra dạng rời rạc có:

2

1

2

τ 1

2

2

τ 1

2

+

=

τ

τ

τ

f

u

),k(

− ),1k(

− ),2k(

),k(

− ),1k(

( )2k(q),1k(q),2k(q),1k(q f 1d1 ( )2k(q),1k(q),2k(q),1k(q

+ )

) )2k( − ) )2k( −

(3.6) )k(q 1

2

2

( τ 1d1 ( τ 1d2

1

)k(q 2

1d2

τ 1

2

2

τ 1

2

− )2k(q

(3.7)

− , )1k(q

i

)k(q i

i

)k(

− )1k(

− )2k(

trong đó: , là vị trí của các khâu thứ i (i=1, 2) tại các thời

τ i

τ i

τ i

f

u(.),

(.)

điểm lấy mẫu thứ k, k-1, k-2; , , là mômen quay của các

id

id

khâu thứ i (i=1, 2) tại các thời điểm lấy mẫu thứ k, k-1, k-2; là biến

f

đổi ở dạng rời rạc

(.)u(.), i

i

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

(i=1, 2). của

68 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

Viết lại (3.6), (3.7) có quan hệ vào - ra của vị trí rôbôt hai khâu ở dạng rời

f

u

(.)

rạc:

(.), −

k

k

k

k

k

k

),2

),1

),2

(

(

),1

(

),2

(

(

),1

(

)2

)

(3.8)

kq ( 2

kq ( 2

τ 1

τ ), 1

τ 1

τ 2

τ ), 2

τ 2

= =

d 1 ),1 u

2

)( kq 2

(.), −

=

),2

),1

),2

(

(

),1

(

),2

(

(

),1

(

)2

) (3.9)

2 ),1

k

k

k

k

k

k

( kq 2

( kq 2

τ 1

τ ), 1

τ 1

τ 2

τ ), 2

τ 2

( F d d 1 1 ( kqF ( d 1 1 ( F f d d 2 ( ( kqF d 2 1

) kq ( 1 ) (.) d ( kq 1

(.)

= kq )( 1

F id

)k(q i

với là phép biểu diễn cho các đại lưọng ở dạng rời rạc (i=1, 2).

)k(2q),k(1q

Như vậy mỗi thành phần đều phụ thuộc vào bộ thông số đầu vào

gồm 10 thành phần theo hai biểu thức (3.8), (3.9). Do đó sử dụng mạng nơron

)k(2q),k(1q

cần chọn lớp vào có tới 10 nút thực hiện nhận dạng thành phần

tương ứng với các đầu vào là 10 thành phần nói trên. Khi đó mạng nơron nhận

dạng có nhược điểm là có cấu trúc rất phức tạp, vì lớp vào có quá nhiều nút. Vấn

đề đặt ra là cần chọn được một mạng nơron Elman nhận dạng vị trí rôbôt hai

khâu có cấu trúc hợp lý với số nút ở mỗi lớp là nhỏ nhất nhưng vẫn đảm bảo sai

lệch của quá trình nhận dạng trong phạm vi cho phép.

Sử dụng sơ đồ nhận dạng song song trình bày ở hình 3.4 cho ứng dụng mạng

nơron Elman nhận dạng vị trí rôbôt hai khâu. Trong đó bộ các thông số đầu vào

∧ ∧ )k(q),k(q

được đưa đến lớp vào của mạng nơron Elman. Sai lệch giữa vị trí thực q 1(k),

1

2

của rôbôt là: q2(k) và vị trí tính toán của quá trình nhận dạng

= )k(q)k(e i

i

∧ )k(q i

(với i=1,2).

∧ ∧ )k(q),k(q

Các sai lệch ei(k) được tham gia vào luật học của mạng Elman để điều chỉnh các

1

2

thông số học của quá trình nhận dạng sao cho luôn bám theo được

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

các giá trị thực q1(k), q2(k) tương ứng.

69 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

)(1 kq

. . .

Mô hình vị trí rôbôt hai khâu

)(2 kq

+ -

+ -

. . .

∧ )k(1q

∧ )(2 kq

Mạng nơron Elman

. . .

e2(k)

e1(k)

Bộ thông số đầu vào

Luật học

Hình 3.4. Sơ đồ ứng dụng mạng nơron Elman nhận dạng rôbôt hai khâu

3.3.2. Quá trình nhận dạng

Thực hiện qua ba giai đoạn: Tìm bộ dữ liệu vào-ra, giai đoạn học, giai đoạn

kiểm tra.

* Tính toán bộ dữ liệu vào-ra của vị trí rôbôt hai khâu

Về nguyên tắc khi sử dụng sơ đồ nhận dạng song song như hình 3-4, mạng

nơron Elman có thể nhận dạng được vị trí rôbôt hai khâu khi biết được bộ dữ

liệu vào-ra. Có thể xác định bộ dữ liệu vào-ra dạng (3.8), (3.9) theo hai phương

pháp: Khi rôbôt hai khâu không biết thông số (dạng hộp đen), thực hiện xác định

bộ thông số vào-ra bằng phương pháp đo lường trực tiếp trên cơ cấu rôbôt hai

khâu thực; Trường hợp rôbôt hai khâu đã biết thông số thực hiện bằng phương

pháp mô phỏng để xác định bộ dữ liệu vào-ra này. Sau đây trình bày quá trình

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

nhận dạng với điều kiện đã biết được các thông số của rôbôt hai khâu để xác

70 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

định ưu điểm của mạng Elman so với mạng nơron truyền thẳng nhiều lớp khi

chúng được sử dụng để nhận dạng vị trí rôbôt hai khâu.

Thực hiện mô phỏng với các giá trị ban đầu của các thông số của rôbôt hai khâu lc2=0.5m; I1=0.2kgm2; lc1=0.5m; l1=1m; l2=1m;

),k(1τ

)k(2τ

có dạng [3]: m1=1kg; m2=1kg; I2=0.2kgm2. Với m 3 cho ở đồ thị hình 3-14 và điều kiện

ngẫu nhiên trong khoảng [-100, 100] (Nm) (các đồ thị hình 3-16, và 3- 17).

Sơ đồ mô phỏng g1, g2, H11, H12, H22, h trên matlab/ simulink như sau:

Hình 3.5. Sơ đồ mô phỏng g1 trên matlab/ simulink

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

71 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

Hình 3.6. Sơ đồ mô phỏng g2 trên matlab/ simulink

Hình 3.7. Sơ đồ mô phỏng h trên matlab/ simulink

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

72 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

Hình 3.8. Sơ đồ mô phỏng H11 trên matlab/simulink

Hình 3.9. Sơ đồ mô phỏng H22 trên matlab/ simulink

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

73 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

Hình 3.10. Sơ đồ mô phỏng H12 trên matlab/simulink

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

74 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

Hình 3.11. Mô hình tính toán dữ liệu vào-ra của vị trí rôbôt hai khâu trên matlab/simulink

τ

τ

τ

Sử dụng thủ tục Subsystem trong Matlab/Simulink được hình 3.12 là mô hình tính toán dữ liệu vào-ra của vị trí rôbôt hai khâu. Sau bước này sẽ nhận được bộ dữ liệu quan hệ vào-ra của vị trí rôbôt hai khâu. Mỗi bộ dữ liệu gồm 10 giá trị là: − ),1k(

− )]2k(

− ),2k(

− ),1k(

),k(

),k(

),1

),2

[

),2

),1

kq ( 1

kq ( 2

kq ( 1

kq ( 2

τ 1

τ 1

τ 1

2

2

2

)]k(q),k(q[

1

2

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

ứng với hai giá trị đầu ra là .

75 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

q1

to1

input1

To Workspace2

To Workspace

In1

q1

output1

Random Number

In2

q2

output2

Random Number1

q2

to2

Subsystem

To Workspace3

input2

To Workspace1

Hình 3.12 Mô hình tính toán dữ liệu vào-ra của vị trí rôbôt hai khâu sau khi sử dụng Subsystem

* Kết quả mô phỏng được cho trong bảng 3.1.

q1

q2

u1

u2

f1

f2

τ1

τ2

(rad)

(rad)

(rad)

(rad)

(rad)

(rad)

(N.m)

(N.m)

1.1650

0.2605

0.0000

0.0000

0

0

0

0

0.6268

0.1402

0.0000

0.0000

-0.0000

-0.0000

-0.0000

-0.0000

0.0751

0.0168

0.0000

0.0000

-0.0000

-0.0000

-0.0000

-0.0000

0.3516

0.0786

0.0000

0.0000

-0.0000

-0.0000

-0.0000

-0.0000

-0.6965

-0.1557

-0.0000

-0.0000

-0.0003

-0.0003

-0.0003

-0.0003

1.6961

0.3793

0.0000

0.0000

-0.0079

-0.0071

-0.0078

-0.0067

0.0591

0.0132

0.0000

0.0000

-0.0751

-0.0691

-0.0767

-0.0769

1.7971

0.4018

0.0000

0.0000

-0.2121

-0.1980

-0.2178

-0.2260

0.2641

0.0590

0.0000

0.0000

-0.4192

-0.3972

-0.4324

-0.4585

0.8717

0.1949

0.0000

0.0000

-0.6941

-0.6635

-0.7190

-0.7734

-1.4462

-0.3234

-0.0000

-0.0000

-1.0279

-0.9759

-1.0687

-1.1451

-0.7012

-0.1568

-0.0000

-0.0000

-1.3057

-1.2125

-1.3556

-1.4216

1.2460

0.2786

0.0000

0.0000

-1.4865

-1.3398

-1.5348

-1.5615

-0.6390

-0.1429

-0.0000

-0.0000

-1.6280

-1.3745

-1.6809

-1.6181

0.5774

0.1291

0.0000

0.0000

-1.7070

-1.2791

-1.7703

-1.5534

-0.3600

-0.0805

-0.0000

-0.0000

-1.7523

-1.1021

-1.8246

-1.4052

-0.1356

-0.0303

-0.0000

-0.0000

-1.7865

-0.7367

-1.8738

-1.0859

-1.3493

-0.3017

-0.0000

-0.0000

-1.7983

-0.1692

-1.9036

-0.5751

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

76 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

-1.2704

-0.2841

-0.0000

-0.0000

-1.7924

0.4292

-1.9138

-0.0232

0.9846

0.2202

0.0000

-0.0000

-1.7778

0.9992

-1.9139

0.5172

-0.0449

-0.0100

-0.0000

0.0000

-1.7716

1.1348

-1.9114

0.6470

-0.7989

-0.1786

-0.0000

0.0000

-1.7627

1.2626

-1.9062

0.7684

-0.7652

-0.1711

-0.0000

0.0000

-1.7474

1.3946

-1.8956

0.8942

0.8617

0.1927

0.0000

-0.0000

-1.7344

1.4503

-1.8857

0.9481

-0.0562

-0.0126

-0.0000

0.0000

-1.7305

1.4581

-1.8824

0.9557

0.5135

0.1148

0.0000

-0.0000

-1.7261

1.4620

-1.8785

0.9593

0.3967

0.0887

0.0000

-0.0000

-1.7190

1.4613

-1.8717

0.9582

0.7562

0.1691

0.0000

-0.0000

-1.7114

1.4578

-1.8642

0.9541

0.4005

0.0896

0.0000

-0.0000

-1.6997

1.4510

-1.8526

0.9463

-1.3414

-0.2999

-0.0000

0.0000

-1.6760

1.4353

-1.8289

0.9286

0.3750

0.0839

0.0000

-0.0000

-1.6150

1.3913

-1.7682

0.8801

1.1252

0.2516

0.0000

-0.0000

-1.4491

1.2618

-1.6038

0.7400

0.7286

0.1629

0.0000

-0.0000

-1.0784

0.9455

-1.2344

0.3930

-2.3775

-0.5316

-0.0000

-0.0000

-0.5827

0.4649

-0.7393

-0.1431

-0.2738

-0.0612

-0.0000

-0.0000

-0.1508

-0.0567

-0.3062

-0.7095

-0.3229

-0.0722

-0.0000

-0.0000

0.2029

-0.6516

0.0517

-1.3318

0.3180

0.0711

0.0000

0.0000

0.3207

-0.9301

0.1717

-1.6202

-0.5112

-0.1143

-0.0000

-0.0000

0.4137

-1.2411

0.2669

-1.9412

-0.0020

-0.0005

-0.0000

-0.0000

0.4374

-1.3737

0.2914

-2.0775

1.6065

0.3592

0.0000

0.0000

0.4415

-1.4131

0.2958

-2.1179

0.8476

0.1895

0.0000

0.0000

0.4430

-1.4364

0.2974

-2.1417

0.2681

0.0599

0.0000

0.0000

0.4433

-1.4480

0.2977

-2.1537

-0.9235

-0.2065

-0.0000

-0.0000

0.4432

-1.4604

0.2975

-2.1665

-0.0705

-0.0158

-0.0000

-0.0000

0.4431

-1.4619

0.2974

-2.1681

0.1479

0.0331

0.0000

0.0000

0.4429

-1.4635

0.2973

-2.1697

-0.5571

-0.1246

-0.0000

-0.0000

0.4429

-1.4641

0.2972

-2.1703

-0.3367

-0.0753

-0.0000

-0.0000

0.4428

-1.4641

0.2972

-2.1704

0.4152

0.0928

0.0000

0.0000

0.4428

-1.4642

0.2972

-2.1705

1.5578

0.3483

0.0000

0.0000

0.4428

-1.4642

0.2972

-2.1705

-2.4443

-0.5466

-0.0000

-0.0000

0.4428

-1.4642

0.2972

-2.1705

-1.0982

-0.2456

-0.0000

-0.0000

0.4428

-1.4642

0.2972

-2.1705

1.1226

0.2510

0.0000

0.0000

0.4428

-1.4642

0.2972

-2.1705

0.5817

0.1301

0.0000

0.0000

0.4428

-1.4642

0.2972

-2.1705

-0.2714

-0.0607

-0.0000

-0.0000

0.4428

-1.4642

0.2972

-2.1705

0.4142

0.0926

0.0000

0.0000

0.4428

-1.4642

0.2972

-2.1705

-0.9778

-0.2186

-0.0000

-0.0000

0.4428

-1.4642

0.2972

-2.1705

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

77 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

-1.0215

-0.2284

-0.0000

-0.0000

0.4428

-1.4642

0.2972

-2.1705

0.3177

0.0710

0.0000

0.0000

0.4428

-1.4642

0.2972

-2.1705

1.5161

0.3390

0.0010

0.0001

0.4428

-1.4642

0.2972

-2.1705

0.7494

0.1676

0.0018

0.0003

0.4428

-1.4642

0.2972

-2.1705

-0.5077

-0.1135

-0.0050

-0.0007

0.4428

-1.4642

0.2972

-2.1705

0.8853

0.1980

0.0352

0.0052

0.4428

-1.4642

0.2972

-2.1705

-0.2481

-0.0555

-0.0277

-0.0040

0.4428

-1.4642

0.2972

-2.1705

-0.7262

-0.1624

-0.2378

-0.0348

0.4428

-1.4642

0.2972

-2.1705

-0.4450

-0.0995

-0.3938

-0.0577

0.4428

-1.4642

0.2972

-2.1705

-0.6129

-0.1371

-1.3199

-0.1933

0.4428

-1.4642

0.2972

-2.1705

-0.2091

-0.0468

-2.1292

-0.3118

0.4428

-1.4642

0.2972

-2.1705

0.5621

0.1257

-9.1987

-1.3469

0.4428

-1.4642

0.2972

-2.1705

-1.0639

-0.2379

4.9504

0.7248

0.4428

-1.4642

0.2972

-2.1705

0.3516

0.0786

-0.7590

-0.1111

0.4428

-1.4642

0.2972

-2.1705

1.1330

0.2533

-1.0984

-0.1608

0.4428

-1.4642

0.2972

-2.1705

0.1500

0.0335

-0.0584

-0.0085

0.4428

-1.4642

0.2972

-2.1705

0.7031

0.1572

-0.1277

-0.0187

0.4428

-1.4642

0.2972

-2.1705

-0.0524

-0.0117

0.0037

0.0005

0.4428

-1.4642

0.2972

-2.1705

2.0185

0.4513

-0.0647

-0.0095

0.4428

-1.4642

0.2972

-2.1705

0.9242

0.2066

-0.0119

-0.0017

0.4428

-1.4642

0.2972

-2.1705

-1.8141

-0.4056

0.0116

0.0017

0.4428

-1.4642

0.2972

-2.1705

0.0350

0.0078

-0.0001

-0.0000

0.4428

-1.4642

0.2972

-2.1705

-1.8079

-0.4043

0.0025

0.0004

0.4428

-1.4642

0.2972

-2.1705

1.0282

0.2299

-0.0006

-0.0001

0.4428

-1.4642

0.2972

-2.1705

0.3946

0.0882

-0.0001

-0.0000

0.4428

-1.4642

0.2972

-2.1705

0.6394

0.1430

-0.0001

-0.0000

0.4428

-1.4642

0.2972

-2.1705

0.8742

0.1955

-0.0000

-0.0000

0.4428

-1.4642

0.2972

-2.1705

1.7524

0.3918

-0.0000

-0.0000

0.4428

-1.4642

0.2972

-2.1705

-0.3201

-0.0716

0.0000

0.0000

0.4428

-1.4642

0.2972

-2.1705

-0.1374

-0.0307

0.0000

0.0000

0.4428

-1.4642

0.2972

-2.1705

0.6158

0.1377

-0.0000

-0.0000

0.4428

-1.4642

0.2972

-2.1705

0.9779

0.2187

-0.0000

-0.0000

0.4428

-1.4642

0.2972

-2.1705

-1.1153

-0.2494

0.0000

0.0000

0.4428

-1.4642

0.2972

-2.1705

-0.5500

-0.1230

0.0000

0.0000

0.4428

-1.4642

0.2972

-2.1705

0.0399

0.0089

-0.0000

-0.0000

0.4428

-1.4642

0.2972

-2.1705

-2.4828

-0.5552

0.0000

0.0000

0.4428

-1.4642

0.2972

-2.1705

1.1587

0.2591

-0.0000

-0.0000

0.4428

-1.4643

0.2971

-2.1705

-1.0263

-0.2295

0.0000

0.0000

0.4428

-1.4643

0.2971

-2.1706

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

78 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

1.1535

0.2579

-0.0000

-0.0000

0.4428

-1.4644

0.2971

-2.1707

-0.7865

-0.1759

0.0000

0.0000

0.4428

-1.4646

0.2971

-2.1709

0.6348

0.1419

-0.0000

-0.0000

0.4427

-1.4651

0.2971

-2.1713

0.8204

0.1834

-0.0000

-0.0000

0.4427

-1.4660

0.2970

-2.1723

-0.1760

-0.0394

0.0000

0.0000

0.4426

-1.4680

0.2970

-2.1743

0.5625

0.1258

-0.0000

-0.0000

0.4427

-1.4718

0.2971

-2.1782

-0.1274

-0.0285

0.0000

0.0000

0.4432

-1.4812

0.2978

-2.1876

0.5542

0.1239

-0.0000

-0.0000

0.4450

-1.4989

0.3000

-2.2054

-1.0973

-0.2454

0.0000

0.0000

0.4517

-1.5392

0.3076

-2.2458

-0.7313

-0.1635

0.0000

0.0000

0.4700

-1.6135

0.3276

-2.3207

1.4047

0.3141

-0.0000

-0.0000

0.5130

-1.7403

0.3729

-2.4496

-0.6202

-0.1387

0.0000

0.0000

0.6242

-1.9906

0.4905

-2.7032

0.2371

0.0530

-0.0000

-0.0000

0.8510

-2.3917

0.7301

-3.1085

-1.5868

-0.3548

0.0000

0.0000

1.2003

-2.9104

1.0965

-3.6344

-0.4015

-0.0898

0.0000

0.0000

1.5571

-3.4025

1.4668

-4.1360

-0.7707

-0.1723

0.0000

0.0000

1.9092

-3.8951

1.8274

-4.6415

-0.2627

-0.0587

0.0000

0.0000

2.2478

-4.4105

2.1720

-5.1718

0.9765

0.2183

-0.0000

-0.0000

2.5679

-4.9625

2.4961

-5.7403

0.9778

0.2186

-0.0000

-0.0000

2.8659

-5.5621

2.7993

-6.3552

1.1700

0.2616

-0.0000

-0.0000

3.1412

-6.2158

3.0826

-7.0209

0.1593

0.0356

-0.0000

-0.0000

3.3965

-6.9244

3.3489

-7.7382

0.4995

0.1117

-0.0000

-0.0000

3.6375

-7.6800

3.6024

-8.5008

-1.0554

-0.2360

0.0000

0.0000

3.8710

-8.4672

3.8490

-9.2944

-0.4507

-0.1008

0.0000

0.0000

4.1029

-9.2705

4.0936

-10.1044

1.2704

0.2841

-0.0000

-0.0000

4.3375

-10.0810

4.3397

-10.9224

0.8987

0.2010

-0.0000

-0.0000

4.5758

-10.8986

4.5901

-11.7471

0.4387

0.0981

-0.0000

-0.0000

4.8179

-11.7223

4.8457

-12.5767

-1.2473

-0.2789

0.0000

0.0000

5.0631

-12.5468

5.1052

-13.4065

0.3247

0.0726

-0.0000

-0.0000

5.3108

-13.3630

5.3669

-14.2282

0.3901

0.0872

-0.0000

-0.0000

5.5601

-14.1608

5.6295

-15.0321

-0.4051

-0.0906

0.0000

0.0000

5.8090

-14.9345

5.8921

-15.8116

0.2923

0.0654

-0.0000

-0.0000

6.0560

-15.6869

6.1529

-16.5697

2.5659

0.5738

-0.0000

-0.0000

6.2996

-16.4309

6.4102

-17.3196

-0.4578

-0.1024

0.0000

0.0000

6.5388

-17.1831

6.6643

-18.0767

-1.6108

-0.3602

0.0000

0.0000

6.7746

-17.9510

6.9158

-18.8488

-2.6695

-0.5969

0.0000

0.0000

7.0099

-18.7274

7.1661

-19.6302

-0.7597

-0.1699

0.0000

0.0000

7.2482

-19.4948

7.4177

-20.4039

-0.6747

-0.1509

0.0000

0.0000

7.4918

-20.2338

7.6734

-21.1503

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

79 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

-1.1717

-0.2620

0.0000

0.0000

7.7416

-20.9342

7.9348

-21.8584

2.0329

0.4546

-0.0000

-0.0000

7.9964

-21.6007

8.2007

-22.5332

0.9685

0.2166

-0.0000

-0.0000

8.2537

-22.2538

8.4692

-23.1943

0.6703

0.1499

-0.0000

-0.0000

8.5103

-22.9203

8.7381

-23.8682

0.4201

0.0939

-0.0000

-0.0000

8.7637

-23.6231

9.0042

-24.5780

-2.8728

-0.6424

0.0000

0.0000

8.8391

-23.8435

9.0834

-24.8004

Bảng 3.1. Kết quả các đầu vào- ra

• Giai đoạn học

Mạng nơron Elman thuộc loại mạng hồi quy không hoàn toàn. Phần lớn các nút

trong mạng có cấu trúc truyền thẳng, nhưng có một số nút có cấu trúc hồi quy

gọi là các nút context [10]. Mạng có 4 lớp: lớp vào, lớp ẩn, lớp context và lớp ra

∧ )k(2q

∧ )k(q1

Lớp ra

w3

-1

-1

o_h

b3

(hình 3.13).

. . .

Lớp ẩn

b2

w1

z-1

-1

-1

w2

z-1

o_c

Lớp vào

x1(k)

. . .

xM(k)

. . . Lớp context

Hình 3.13. Sơ đồ cấu trúc của mạng nơron Elman

Các nút cấu trúc truyền thẳng tín hiệu lan truyền từ lớp vào đến lớp ra không phụ

thuộc thời gian. Các nút ở lớp context (bôi đen) có tín hiệu hồi quy phụ thuộc

thời gian. Tại thời điểm thứ k nút ở lớp context có tín hiệu vào là tín hiệu phản

hồi của các nút thuộc lớp ẩn ở thời điểm thứ (k-1), tức là nhớ được dữ liệu quá

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

khứ từ kết quả biến đổi ở thời điểm thứ k, nên tín hiệu đầu ra không những phụ

80 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

thuộc vào các tín hiệu đầu vào mà còn phụ thuộc trạng thái mạng ở các thời điểm

trước đó. Giả thiết lớp vào có M nút, lớp ẩn và lớp context đều có R nút, lớp ra

=

]T

]T

x =

,...,

x

h_o

,...,

h_o

có N nút. Do đó tín hiệu vào có dạng

[ x,x 1

2

M

[ h_o,h_o 1

2

R

)k(2τ

=

]T

c_o

,...,

c_o

; tín hiệu r a của lớp ẩn ;tín

[ c_o,c_o 1

2

R

T

=

∧ q

,...,

∧ q

; tín hiệu ra của mạng là hiệu ra của lớp context

∧∧ q,q 1

2

N

  

  

; các ma trận trọng số w1, w2, w3 tương ứng có kích thước

=

=

=

+

∧ ))k(h_o.3w(g)k(q

)1k(h_o)k(c_o

)k(h_o

))k(x.2w)k(c_o.1w(f

là: RxR, RxM, NxR.

; ; ;

=

(k),

)k(q

k(

),...,

]T

là đầu ra mong muốn của mạng tại bước tính thứ k.

f(.) và g(.) là các hàm chuyển đổi tương ứng ở các dạng tanghypecbolic, tuyến

2q

)k(q N

[ q 1

2

=

E

− ))k(q)k(q(

tính;

i

i

1 2

T ∑ = 1k

N ∑ = 1i

Sai lệch có dạng:

Theo phương pháp hạ gradient, từ E xác định được các ma trận trọng số w1,

w2, w3

qua các biểu thức cập nhật sự thay đổi của các ma trận trọng số tương ứng như

3w

sau.

)k(h_o. j

ij

o δλ= i3

∆ 2w

)1k(x.

(i=1, 2, ..., N; j=1, 2, ..., R)

jq

q

h δλ= j2

λ=

δ

1w

(

(j=1, 2, ..., R; q=1, 2, ..., M)

)3w. ij

1

jL

o i

∂ )k(h_o ∂ 1w

N ∑ = 1i

jL

δ 'f)3w(

(.)

=

'f

(.)

j

ij

)1k(h_o(.) L

j

)k(q i

i

(j=1, 2, ..., R; L=1, 2, ..., R)

∧ 'g)k(q i

h =δ j

o i

o =δ i

∂ )k(h_o ∂ 1w

   

   

jL

N ∑ = 1i

λλλ

,

,

(.)

; ; .

= ; 1

'g i

1

2

3

g(.) là hàm chuyển đổi dạng tuyến tính nên là các hệ số

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

học.

81 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

Thực hiện giai đoạn học cần chọn các giá trị M, R, N là số nút ở các lớp của

mạng nơron Elman sao cho giá trị sai lệch E trong phạm vi cho phép. Kết quả

mô phỏng trên Matlab chọn được mạng nơron Elman có cấu trúc (6x10x(10)x2)

=

τ

,

,

,

)k(x

− k(q)1k(q[

− k(q)1k(q)2

, )2

, )k(

T )]k(

với số nút lớp vào là M=6, tức là khi đó lớp vào chỉ cần có 6 nút tương ứng đưa

1

1

2

2

τ 1

2

6 tín hiệu vào lớp đầu vào là

q =

]T

thay vì 10 tín hiệu (tại (3.8), (3.9)); số nút lớp ẩn và lớp context là R=10; vì tín

[ 21 qq

hiệu ra cần nhận dạng là nên số nút lớp r a là N = 2. Thực hiện học

trong 7.000 chu kỳ đạt được E=1.52736.10 -6. đồ thị kết quả giai đoạn học được

biểu diễn từ đồ thị hình 3.15 đến hình 3.21 gồm: sai lệch E (hình 3.15), mômen

∧ τ1 (hình 3.16), đồ thị mômen τ2 (hình 3.17), đồ thị q 1(nét đứt) và đồ thị 1q

(nét

∧ liền) (hình 3.18), đồ thị q2(nét đứt) và 2q

(nét liền) (hình 3.19), đồ thị không gian

∧ 3 chiều mô tả quan hệ của 3 đại lượng (τ1, m3, 1q

∧ ) (hình 3.20), (τ2, m3, 2q

)

3

2.5

2

1.5

1

0.5

0

10

20

30

40

50

60

70

80

90

100

(hình 3.21).

Hình 3.14. Đồ thị khối lượng của tải m3

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

82 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

Performance is 1.52736e-006, Goal is 0

1 10

0 10

-1

10

-2

l

10

i

i

-3

10

e u B - g n n a r T

-4

10

-5

10

-6

10

12000

10000

8000

4000

2000

0

6000 12000 Epochs

100

80

60

40

20

0

-20

-40

-60

-80

-100

0

10

20

30

40

50

60

70

80

90

100

Hình 3.15. Đồ thị sai lệch E giai đoạn học

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Hình 3.16. Đồ thị mômen τ1 giai đoạn học

83 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

100

80

60

40

20

0

-20

-40

-60

-80

-100

0

10

20

30

40

50

60

70

80

90

100

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0

-0.1

0

10

20

30

40

50

60

70

80

90

100

Hình 3.17. Đồ thị mômen τ2 giai đoạn học

(nét liền)

∧ Hình 3.18. Đồ thị q1(nét đứt) và đồ thị 1q

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

giai đoạn học

84 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

0

-0.5

-1

-1.5

-2

-2.5

-3

-3.5

100

90

80

70

60

50

40

30

20

10

0

(nét liền)

∧ Hình 3.19. Đồ thị q2(nét đứt) và đồ thị 2q

0.8

0.6

0.4

0.2

0

-0.2 3

100

2

50

0

1

-50

0

-100

giai đoạn học

)

∧ Hình 3.20. Đồ thị 3 chiều mô tả quan hệ(τ1,m3, 1q giai đoạn học

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

85 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

0

-1

-2

-3

-4 3

100

2

50

0

1

-50

0

-100

)

∧ Hình 3.21. Đồ thị 3 chiều mô tả quan hệ(τ2,m3, 2q giai đoạn học

T

-

-

-

-

- -

-

- - -

- -

-

- -

=

1w

- -

- -

-

-

- - -

-

-

-

0.4982 0.2072 0.3524 0.6272 0.2273 0.1109 0.3786 0.2333 0.2767 0.6656

0.6215 0.3056 0.0174 0.2531 0.0745 0.2061 0.1194 0.0026 0.4592 0.1478

- - -

0.1288 0.1913 0.5143 0.2505 0.4433 0.5638 0.8584 0.1220 0.4222 0.3182

-

0.2092 0.1371 0.0169 0.5715 0.1546 0.6607 0.6794 0.0992 0.2004 0.0346

0.4126 0.2411 0.4879 0.1037 0.7002 0.6920 0.0830 0.1812 0.0572 0.1510

- - - -

0.0724 0.5011 0.2978 0.4795 0.1055 0.6174 0.3088 0.5740 0.6539 0.5026

0.5519 0.1642 0.6172 0.2224 0.2568 0.1304 0.4577 0.5092 0.5256 0.4213

0.2197 0.0996 0.4088 0.6658 0.6163 0.3285 0.2190 0.3393 0.3049 0.6080

0.2427 0.1477 0.3176 0.7203 0.3909 0.5827 0.2812 0.4542 0.1419 0.1491

- -

-    -  -  -      

0.1375  0.0836  0.0191  0.5612  0.3053  0.0170  0.5681  0.4007  0.0330  0.5996  

T

-

-

-

- -

-

-

=

2w

- - - -

- - -

-

- - -

0.0189 0.0617 0.0167 0.0297 0.0424 0.0249

- - - - - -

0.0107 0.0220 0.0147 0.0102 0.0086 0.0068

0.0309 0.0595 0.0299 0.0188 0.0263 0.0074

0.0751 0.0044 0.3076 0.3010 0.0021 0.0068

0.0274 0.0510 0.0889 0.0442 0.0039 0.0038

0.0575 0.0669 0.1713 0.2115 0.0062 0.0019

- 0.0994 0.0090 0.2176 0.2311 0.0010 0.0044

- -

- - - -

0.0615 0.0220 0.0454 0.0121 0.0211 0.0296

0.0145 0.0499 0.0157 0.1001 0.0339 0.0176

-     -  -  

0.0492  0.6202  0.0496  0.0731  0.0302  0.0451  

T

-

-

w

3

8094 .0 0.4379

5684 .0 0.6057

-

- -

0.0096 0.0789

0.5170 0.9144

0.7134 0.0367

-

0.8974 0.7812

0.6750 0.4937

-

0.2549 0.0643

0.7337 0.0772

- -

0.3224 0.0815

= 

 

]T

1.2399

0.4853

0.2839

0.1747

-

0.2980

-

0.8867

-

1.1911

1.5907

[ 1.6466 [ -

0.4233

.0

2181

0.8601 ]T

b = 2 b = 3

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Kết quả các ma trận bias và trọng số trong giai đoạn học như sau:

86 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

* Giai đoạn kiểm tra

τ

),k(

)k(

Với cấu trúc và bộ thông số của mạng nơron Elman (6x10x(10)x2) đã tìm

τ 1

2

được trong giai đoạn học, thực hiện giai đoạn kiểm tra với mômen ở

=

=

τ

π )k02.0

99

cos(

sin(

π )k1.0

dạng:

τ )k(1

)k(2

99 Mô phỏng trên Matlab, đồ thị kết quả trong giai đoạn kiểm tra biểu diễn từ hình 3.22 đến hình 3.27 gồm: đồ thị mômen τ1 (hình 3.22), mômen τ2 (hình

; .

∧ 2q

∧ 3.23), đồ thị q1(nét đứt) và 1q liền) (hình 3.25), đồ thị không gian 3 chiều mô tả quan hệ của 3 đại lượng(τ1,

(nét (nét liền) (hình 3.24), đồ thị q2(nét đứt) và

∧ m3, 1q

∧ ) (hình 3.26) và (τ2, m3, 2q

100

80

60

40

20

0

-20

-40

-60

-80

-100

0

10

20

30

40

50

60

70

80

90

100

) (hình 3.27).

100

80

60

40

20

0

-20

-40

-60

-80

-100

80

90

100

0

10

20

30

40

50

60

70

Hình 3.22. Đồ thị mômen τ1 giai đoạn kiểm tra

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Hình 3.23. Đồ thị mômen τ2 giai đoạn kiểm tra

87 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

0.35

0.3

0.25

0.2

0.15

0.1

0.05

0

-0.05

-0.1

-0.15

100

90

80

70

60

50

40

30

20

10

0

(nét liền)

∧ Hình 3.24. Đồ thị q1(nét đứt) và đồ thị 1q

giai đoạn kiểm tra

0.15

0.1

0.05

0

-0.05

-0.1

-0.15

-0.2

0

10

20

30

40

50

60

70

80

90

100

(nét liền)

∧ Hình 3.25. Đồ thị q2(nét đứt) và đồ thị 2q

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

giai đoạn kiểm tra

88 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

8

6

4

2

0

-2 3

100

2

50

0

1

-50

0

-100

)

∧ Hình 3.26. Đồ thị 3 chiều mô tả quan hệ(τ1,m3, 1q giai đoạn kiểm tra

1

0

-1

-2

-3

-4 3

100

2

50

0

1

-50

0

-100

)

∧ Hình 3.27. Đồ thị 3 chiều mô tả quan hệ(τ2,m3, 2q giai đoạn kiểm tra

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

89 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

Từ kết quả mô phỏng nhận thấy với cấu trúc và bộ thông số học của mạng

nơron Elman (6x10x(10)x2) trong giai đo ạn học, các tín hiệu đầu ra tính toán của

∧ mạng 1q

∧ , 2q

đã bám theo được vị trí thực của rôbôt hai khâu là q1, q2 trong cả hai

giai đoạn học và kiểm tra với sai lệch E rất nhỏ, nên mạng nơron Elman nói trên

đã nhận dạng được vị trí rôbôt hai khâu. Để thấy rõ được ưu điểm của giải pháp

này, thực hiện so sánh với giải pháp sử dụng mạng nơron truyền thẳng

(4x5x10x2) [3] theo bảng số liệu sau đây.

Bảng số liệu so sánh

Loại mạng Cấu trúc Sai lệch E

Số lượng mạng

(6x10x(10)x2) Số chu kỳ học 7.000 1.52736.10-6 1

5584

4x5x10x2 2.99983.10-6 Cần ít nhất 2 mạng nơron

Mạng nơron Elman Mạng nơron truyền thẳng nhiều lớp [3]

3.4. KẾT LUẬN CHƯƠNG III

Mạng nơron Elman (6x10x(10)x2) với bộ thông số tìm được trong giai đoạn

học đã nhận dạng được đối tượng MIMO phi tuyến phức tạp là vị trí rôbôt hai

khâu với sai lệch học rất nhỏ, với số lượng chu kỳ học không nhiều và cấu trúc

của mạng nơron Elman không quá phức tạp. Ứng dụng mạng nơron Elman nhận

dạng vị trí rôbôt hai khâu là giải pháp mới có ưu điểm so với mạng nơron truyền

thẳng nhiều lớp là chỉ cần sử dụng một mạng nơron Elman (6x10x(10)x2) đã

nhận dạng được vị trí rôbôt hai khâu với sai lệch học nhỏ hơn. Giải pháp này

cũng góp phần khẳng định được rằng nên sử dụng mạng nơron Elman trong bài

toán nhận dạng đối tượng phi tuyến vì khi đó sẽ có được nhiều ưu điểm hơn so

với trường hợp sử dụng mạng nơron truyền thẳng nhiều lớp. Giải pháp này cũng

có thể được áp dụng khi rôbôt hai khâu ở dạng “hộp đen” không biết trước thông

số với chú ý thực hiện xác định bộ dữ liệu vào-ra bằng phương pháp đo lường

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

trực tiếp trên cơ cấu rôbôt hai khâu thực.

90 Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu

3.5. KẾT LUẬN CHUNG VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI

3.5.1. Kết luận

- Luận văn đã hoàn thành những yêu cầu đặt ra là khảo sát về phương pháp

ứng dụng mạng nơron Elman nhận dạng đối tượng phi tuyến có thông số thay

đổi là vị trí rôbôt hai khâu.

3.5.2. Các đóng góp chính và hướng phát triển của đề tài nghiên cứu:

- Luận văn đã tổng hợp được các tài liệu về mạng nơron và các ứng dụng

của nó để có cái nhìn tổng quan về kết cấu, các luật học và các phương pháp ứng

dụng mạng nơron trong nhận dạng.

- Bằng phương pháp phân tích, so sánh về cấu trúc, các luật học và khả

năng ứng dụng thực tiễn của các loại mạng nơron, luận văn này đã chọn mạng

nơron Elman là mạng có nhiều ưu điểm về cấu trúc và luật học để tập trung

nghiên cứu ứng dụng nó trong bài toán nhận dạng vị trí rôbôt hai khâu.

- Do thời gian nghiên cứu có hạn trong khuôn khổ luận văn này mới chỉ tìm

hiểu được giai đoạn 1 bài toán là: ứng dụng mạng nơron Elman để nhận dạng đối

tượng, giai đoạn thứ 2 của bài toán là:

+ Giải quyết bài toán vừa nhận dạng vừa điều khiển (on – line).

+ Nghiên cứu các thuật toán tăng tốc độ học của mạng nơron.

Vì vậy luận văn này là một hướng nghiên cứu mở, có thể phát triển tiếp

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

tục hướng nghiên cứu này ở các công trình khoa học cấp cao hơn.

Gi¶i thÝch ký hiÖu, c«ng thøc ______________________________________________________________

Gi¶i thÝch ký hiÖu, c«ng thøc

STT

Ký hiÖu

DiÔn gi¶i

1 2

neti (t) yj

3

ui (t)

Tæng träng lượng C¸c ®Çu ra cña c¸c n¬ron C¸c ®Çu vµo tõ bªn ngoµi t­¬ng øng víi träng sè Wij vµW* ik Ng­ìng cña n¬ron thø i.

Hµm chuyÓn ®æi

Ma trËn träng sè

TÝn hiÖu häc

C¸c biÕn tr¹ng th¸i

θi a(.) Wij r xi(t) yi(t)

C¸c ®Çu ra cña hÖ

C¸c biÕn ë d¹ng rêi r¹c

C¸c h»ng sè ch­a biÕt

(i=0,1,...,n-1);

12

4 5 6 7 8 9 10 u(.), x(.), y(.) 11 αi, βj ∧ α )k(i ∧ β )k(j ∧ py (k+1)

C¸c th«ng sè nhËn d¹ng (j=0,1,...,m1);

Gia sè cña vÐc t¬ wi TÝn hiÖu ®Çu vµo:

H»ng sè häc

C¸c ma trËn t­¬ng øng cÊp (n×n), (n×p), (m×n)

13 ∆wi 14 x(t) 15 η 16 A, B, C 17 x(k) 18 y(k)

19 e(k)

Vect¬ mÉu ®Çu vµo

20 qbij

______________________________________________________________ Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Vect¬ mÉu ®Çu ra TÝn hiÖu sai lÖch gi÷a bé mÉu ®Çu ra d(k) vµ tÝn hiÖu ra thùc tÕ y(k) Bias cña mçi n¬ron

Gi¶i thÝch ký hiÖu, c«ng thøc ______________________________________________________________

STT

Ký hiÖu

DiÔn gi¶i

Kích thước ma trận thông số vào của lớp phản

21 IW1,1

hồi

Kích thước ma trận của các đầu vào

22 X 23 LW1,1

24 a1(k -1)

Kích thước ma trận thông số hiện tại

Đầu ra của lớp hồi qui tại bước nhảy thứ ( k – 1)

Bias của lớp ra

Sự chuyển chức năng của lớp ra

Đầu ra của lớp ra

Đầu ra hiện tại của những mẫu N Đầu vào hiện tại của những mẫu N Bias của lớp hồi qui

Chức năng chuyển đổi của lớp hồi qui

25 b2 26 f2 27 a2 28 yttmau 29 gmau 30 b1 31 f1 32 a1(k)

33 LW2,1

Đầu ra của lớp hồi qui ở bước nhảy k

Kích thước ma trận thông số từ lớp hồi qui tới lớp ra. Vị trí khâu thứ i

Mômen điều khiển khâu thứ i rôbôt hai khâu

34 qi 35 τi 36 li

37 lci

Độ dài của khâu thứ i rôbôt hai khâu

Độ dài từ điểm nối khâu thứ i đến trọng tâm của khâu đó

Mômen quán tính khâu thứ i

Khối lượng phụ tải

38 Ii 39 m3 40 g

______________________________________________________________ Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Gia tốc trọng trường

Danh môc c¸c h×nh vÏ, ®å thÞ ______________________________________________________________

Danh môc c¸c h×nh vÏ, ®å thÞ

STT Ký hiÖu

DiÔn gi¶i tªn h×nh vÏ

Hình 1

1

Hình 2.

2

Sơ đồ khối điều khiển thích nghi rôbôt hai khâu

Mô hình nhận dạng vị trí rôbôt hai khâu

Mạng nơron đơn giản gồm 2 nơron

Nơron nhiều đầu vào

Hình 1.1 Hình 1.2 Hình 1.3 Hình 1.4

Mạng noron 3 lớp

3 4 5 6

Hình 1.5.

Cấu trúc huấn luyện mạng

Sơ đồ cấu trúc các loại mạng nơron.

Mô hình học có giám sát và học củng cố

Mô hình học không có giám sát

Sơ đồ cấu trúc chung của quá trình học

Sơ đồ cấu trúc của mạng Jordan

Sơ đồ cấu trúc mạng nơron hồi quy đơn giản

Sơ đồ tổng quát nhận dạng thông số mô hình

Điều khiển theo nguyên tắc phản hồi đầu ra

Nhận dạng theo phương pháp gradient

Mô hình dạng 1

Mô hình dạng 2

Mô hình dạng 3

Mô hình dạng 4

Mô hình nhận dạng kiểu song song

7 8 Hình 1.6 Hình 1.7 9 10 Hình 1.8 11 Hình 1.9 Mạng nơron truyền thẳng một lớp. 12 Hình 1.10 Mạng nơron truyền thẳng nhiều lớp 13 Hình 1.11 14 Hình 1.12 15 Hình 2.1 16 Hình 2.2 17 Hình 2.3 18 Hình 2.4 19 Hình2.5 20 Hình 2.6 21 Hình 2.7 22 Hình 2.8 23 Hình 2.9 24 Hình 2.10 Mô hình nhận dạng kiểu nối tiếp - song song 25 Hình 2.11 Mô hình nhận dạng ngược trực tiếp.

______________________________________________________________ Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Mô hình nhận dạng kiểu truyền thẳng

Danh môc c¸c h×nh vÏ, ®å thÞ ______________________________________________________________

STT Ký hiÖu

DiÔn gi¶i tªn h×nh vÏ

Sơ đồ cấu trúc mạng Elman

Lược đồ mạng Elman

Sơ đồ ứng dụng mạng nơron Elman nhận dạng rôbôt hai khâu

Sơ đồ động học rôbôt hai khâu

Sơ đồ mô phỏng g1 trên matlab/ simulink

26 Hình 2.12 Mô hình 1 27 Hình 2.13 Mô hình 2 28 Hình 2.14 Mô hình 3 29 Hình 2.15 Mô hình 4 30 Hình 3.1 31 Hình 3.2 32 Hình 3.3 33 Hình 3.4 34 Hình 3.5 35 Hình 3.6

Sơ đồ mô phỏng g2 trên matlab/ simulink

36 Hình 3.7

Sơ đồ mô phỏng h trên matlab/ simulink

37 Hình 3.8

Sơ đồ mô phỏng H11 trên matlab/simulink

Sơ đồ mô phỏng H22 trên matlab/ simulink

38 Hình 3.9 39 Hình 3.10

Sơ đồ mô phỏng H12 trên matlab/simulink

40 Hình 3.11

Mô hình tính toán dữ liệu vào-ra của vị trí rôbôt hai khâu

trên matlab/simulink

41 Hình 3.12

Mô hình tính toán dữ liệu vào-ra của vị trí rôbôt hai khâu

sau khi sử dụng Subsystem

42 Hình 3.13

Sơ đồ cấu trúc của mạng nơron Elman

Đồ thị khối lượng của tải m3

43 Hình 3.14 44 Hình 3.15 45 Hình 3.16

Đồ thị sai lệch E giai đoạn học

46 Hình 3.17

Đồ thị mômen τ1 giai đoạn học

47 Hình 3.18

Đồ thị mômen τ2 giai đoạn học

∧ Đồ thị q1(nét đứt) và đồ thị 1q

______________________________________________________________ Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

(nét liền) giai đoạn học

Danh môc c¸c h×nh vÏ, ®å thÞ ______________________________________________________________

STT Ký hiÖu

DiÔn gi¶i tªn h×nh vÏ

48 Hình 3.19

∧ Đồ thị q2(nét đứt) và đồ thị 2q

49 Hình 3.20

(nét liền) giai đoạn học

∧ Đồ thị 3 chiều mô tả quan hệ(τ1,m3, 1q

50 Hình 3.21

) giai đoạn học

∧ Đồ thị 3 chiều mô tả quan hệ(τ2,m3, 2q

51 Hình 3.22

) giai đoạn học

52 Hình 3.23

Đồ thị mômen τ1 giai đoạn kiểm tra

53 Hình 3.24

Đồ thị mômen τ2 giai đoạn kiểm tra

∧ Đồ thị q1(nét đứt) và đồ thị 1q

54 Hình 3.25

(nét liền) giai đoạn kiểm tra

∧ Đồ thị q2(nét đứt) và đồ thị 2q

55 Hình 3.26

(nét liền) giai đoạn kiểm tra

∧ Đồ thị 3 chiều mô tả quan hệ(τ1,m3, 1q

56 Hình 3.27

) giai đoạn kiểm tra

∧ Đồ thị 3 chiều mô tả quan hệ(τ2,m3, 2q

______________________________________________________________ Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

) giai đoạn kiểm tra

Danh môc c¸c ch÷ viÕt t¾t, tiÕng n­íc ngoµi ______________________________________________________________

DANH MỤC CÁC CHỮ VIẾT TẮT, TIẾNG NƯỚC NGOÀI

STT

Ký hiệu

Diễn giải

Neural

Nơron

1

Artificial Neural

Nơron nhân tạo

2

Artificial Neural Networks

Mạng nơron nhân tạo

3

Back Propagation Learaning Rule

Luật học lan truyền ngược

4

Fuzzy logic

Lôgic mờ

5

Fuzzy Neural Networks

Mạng nơron mờ

6

Recall

Gọi lại

7

Input Layer

Lớp vào

8

Output Layer

Lớp ra

9

Hidden layer

Lớp ẩn

10

Learing

Học

11

Reinforcement Learning

Học củng cố

12

Paramater Learning

Học thông số

13

Structure Learning

Học cấu trúc

14

Supervised Learning

Học có giám sát

15

Unsupervised Learning

Học không có giám sát

16

17

Focused Back - Propgation Networks Mạng lan truyền ngược hội tụ

Recurrent Neural Networks

Mạng nơron hồi quy

18

19

Single Node Neural NetWorks

Mạng chỉ có một nơron

Single Layer Feedforward NetWork Mạng một lớp truyền thẳng

20

Multilayer Feedforward NetWork

Mạng nhiều lớp truyền thẳng

21

22

Model Predictive Control (MPC).

Model Reference Control

23

Điều khiển tiên đoán mô hình

24

Back Propagation Through Time-BPTT Lan truyền ngược theo thời gian

______________________________________________________________ Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Điều khiển theo mô hình mẫu:

Danh môc c¸c ch÷ viÕt t¾t, tiÕng n­íc ngoµi ______________________________________________________________

______________________________________________________________ Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Tài liệu tham khảo

TÀI LIỆU THAM KHẢO

1. Nguyễn Hữu Công. Giáo trình nhận dạng hệ thống điều khiển.

2. Phạm Hữu Đức Dục , Nguyễn Công Hiền, (2005), Nghiên cứu ứng dụng mạng

nơron mờ điều khiển thích nghi rôbôt hai khâu, Tuyển tập các báo cáo Khoa

học tại Hội nghị Toàn quốc lần thứ VI về Tự động hoá, 107 - 112.

3. Phạm Hữu Đức Dục, Ứng dụng mạng nơron truyền thẳng nhiều lớp nhận dạng vị

trí rôbôt hai khâu, Tạp chí KH&CN các trường ĐH Kỹ thuật, số 63, 2008, 1-5.

4. Phạm Hữu Đức Dục (2008), Ứng dụng mạng nơron Elman nhận dạng vị trí

rôbôt hai khâu. Bài báo đăng trên tạp chí nghiên cứu khoa học kỹ thuật và

công nghệ quân sự số 24 tháng 09 năm 2008 ( trang 84- 91). Trung tâm khoa

học kỹ thuật và công nghệ quân sự phát hành

5. Nguyễn Như Hiển, Lại Khắc Lãi (2007), Hệ mờ và nơron trong kỹ thuật điều

khiển. Nhà xuất bản khoa học tự nhiên và côngnghệ. Hà Nôị

6. Nguy ễn Doãn Phước, Phan Xuân Minh (2001), Nhận dạng hệ thống điều khiển.

Nhà xuất bản Khoa học và kỹ thuật. Hà Nội.

7. Lê Minh Trung (1999), Giáo trình mạng nơron nhân tạo.

Nhà xuất bản thống kê.

8. Astrom A. A, Eykhoft P. - "System Identification - A Survey" - Automatica, Vol.

7, 123-162, 1971.

9. CHIN TENG LIN, C.S. GEORGE LEE, (1996), Neural fuzzy systems,

Prentice Hall Internatinal, Inc.

10. H.W. Ge, Y.C. Liang, H.P. Lee, C. Lu, "Chapter 7, An improved particle swarm

otimization-based dynamic recurrent neural network for identifying and

controlling ultrasonic motors", Nova Science Publishers, 2007, 263-283.

11. Narendra, Parthasarathy, "Identification and control of dynamical systems using

Neural Networks ", IEEE. Trans. on Neural Networks, No.1, 1990, 4-27.

12. SOMLO J., LANTOS B., PHAM THUONG CAT, (1997), Advance Robot

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Control, Akademiai Kiado - Budapest.