i
ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
NGUYỄN XUÂN ĐĂNG
Chuyên ngành: Khoa học máy tính
Mã số: 60 48 0101
LUẬN VĂN THẠC SĨ KHOA CÔNG NGHỆ THÔNG TIN
Thái Nguyên - 2015
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
ii
Công trình đƣợc hoàn thành tại: Đại học công nghệ thông tin và truyền thông
Ngƣời hƣớng dẫn khoa học: TS. Vũ Nhƣ Lân
Phản biện 1: PGS. TS Vũ Chấn Hƣng Phản biện 2: TS Nguyễn Duy Minh
Luận văn sẽ đƣợc bảo vệ trƣớc Hội đồng chấm luận văn họp tại: Vào hồi...... giờ...... ngày....... tháng........ năm 20...
Có thể tìm hiểu luận văn tại trung tâm học liệu Đại học Thái Nguyên
Và thƣ viện Trƣờng Đại học công nghệ thông tin và truyền thông
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
iii
ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01.01
LUẬN VĂN THẠC SĨ KHOA CÔNG NGHỆ THÔNG TIN
NGƢỜI HUỚNG DẪN KHOA HỌC:
TS. VŨ NHƢ LÂN
Thái nguyên, 2015
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
iv
ĐẠI HỌC THÁI NGUYÊN ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGUYỄN XUÂN ĐĂNG
LUẬN VĂN THẠC SĨ KHOA CÔNG NGHỆ THÔNG TIN
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
v
Thái nguyên - 2015
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này là công trình nghiên cứu thực sự của cá
nhân tôi đƣợc thực hiện dƣới sự dìu dắt và hƣớng dẫn nhiệt tình của TS. Vũ
Nhƣ Lân.
Các số liệu, kết quả do bản thân nghiên cứu và tìm hiểu đƣợc trình bày
trong luận văn này trung thực và chƣa từng đƣợc công bố dƣới bất cứ hình
thức nào.
Tôi xin chịu trách nhiệm về nghiên cứu của mình.
Học viên
Nguyễn Xuân Đăng
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
vi
LỜI CẢM ƠN
Đầu tiên tôi xin gửi lời cảm ơn sâu sắc nhất tới TS. Vũ Nhƣ Lân, ngƣời
đã hƣớng dẫn khoa học, đã tận tình chỉ bảo, giúp đỡ tôi thực hiện luận văn.
Tôi xin cảm ơn các quí thầy cô Trƣờng Đại Học Công nghệ Thông Tin và
Truyền Thông Thái Nguyên đã giảng dạy và truyền kiến thức cho tôi.
Tôi xin chân thành cảm ơn bạn bè và đồng nghiệp đã tạo mọi điều kiện
giúp đỡ tôi hoàn thành nhiệm vụ học tập.
Cuối cùng, tôi xin cảm ơn những ngƣời thân, bạn bè và gia đinh đã ủng
hộ và giúp đỡ tôi hoàn thành luận văn này.
Mặc dù đã hết sức cố gắng hoàn thành luận văn với tất cả sự nỗ lực của
bản thân, nhƣng luận văn vẫn còn những thiếu sót. Kính mong nhận đƣợc
những ý kiến đóng góp của quý Thầy, Cô và bạn bè, đồng nghiệp.
Tôi xin chân thành cảm ơn!
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
vii
MỤC LỤC
PHẦN 1: MỞ ĐẦU .................................................................................................................. 11
1. Lý do chọn đề tài .................................................................................................................... 1
2. Đối tƣợng và phạm vi nghiên cứu .......................................................................................... 2
2.1. Đối tƣợng ............................................................................................................................. 2
2.2. Phạm vi nghiên cứu ............................................................................................................. 2
3. Hƣớng nghiên cứu của đề tài .................................................................................................. 3
4. Phƣơng pháp nghiên cứu ........................................................................................................ 3
4.1. Phƣơng pháp nghiên cứu lý thuyết ...................................................................................... 3
4.2. Phƣơng pháp nghiên cứu thực tiễn ...................................................................................... 3
5. Ý nghĩa khoa học của luận văn ............................................................................................... 4
6. Cấu trúc luận văn .................................................................................................................... 4
PHẦN 2: NỘI DUNG ................................................................................................................. 5
CHƢƠNG 1: GIỚI THIỆU MỘT SỐ KIẾN THỨC CƠ SỞ ..................................................... 5
1.1. Những vấn đề cơ sở của lý thuyết tập mờ và logic mờ ....................................................... 5
1.1.1. Lý thuyết tập mờ ............................................................................................................... 5
1.1.2. Logic mờ ........................................................................................................................... 6
1.1.2.1. Định nghia logic mờ ...................................................................................................... 6
1.1.2.2. Các phép toán logic mờ ................................................................................................. 7
1.2. Chuỗi thời gian mờ ............................................................................................................ 11
1.2.1 Khái niệm: ........................................................................................................................ 11
1.2.2. Một số định nghĩa liên quan đến chuỗi thời gian mờ ..................................................... 12
1.3. Quan hệ mờ ........................................................................................................................ 13
1.3.1. Các quan hệ mờ .............................................................................................................. 13
1.3.2. Các phép toán của quan hệ mờ ....................................................................................... 13
1.3.3. Suy luận xấp xỉ và suy diễn mờ ...................................................................................... 14
1.3.4. Hệ mờ .............................................................................................................................. 14
1.4. Lý thuyết tối ƣu .................................................................................................................. 17
1.5. Giới thiệu về đại số gia tử và một số tính chất. ................................................................. 18
1.5.1. Sơ lƣợc về đại số gia tử ................................................................................................... 18
1.5.2. Biến ngôn ngữ ................................................................................................................. 20
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
viii
1.5.3. Đại số gia tử của biến ngôn ngữ ..................................................................................... 22
1.5.4. Các tính chất cơ bản của ĐSGT tuyến tính ..................................................................... 24
1.5.5. Thuật toán tính toán của đại số gia tử ............................................................................. 25
KẾT LUẬN CHƢƠNG 1 ......................................................................................................... 28
CHƢƠNG 2: DỰ BÁO CHUỖI THỜI GIAN MỜ .................................................................. 29
2.1. Thuật toán dự báo chuỗi thời gian mờ của Song và Chissom ........................................... 29
2.2. Thuật toán dự báo mờ của Chen ........................................................................................ 36
2.2.1. Thuật toán của Chen phƣơng pháp ứng dụng vào dự báo tuyển sinh đại học Alabama . 36
2.2.2. Thuật toán bậc cao của Chen .......................................................................................... 43
KẾT LUẬN CHƢƠNG 2 ......................................................................................................... 45
........................... 46
. ......... 46
3.1. Xây dựng Thuật toán
3.2. So sánh các kết quả của các Thuật toán dự báo chuỗi thời gian mờ. ................................ 56
3.3. Nhận xét chung .................................................................................................................. 58
PHẦN 3: KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN ................................................................ 59
TÀI LIỆU THAM KHẢO ........................................................................................................ 60
................................................................................................................................. 62
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
ix
DANH MỤC VIẾT TẮT
STT Ký hiệu viết tắt Ý nghĩa
1 ĐSGT Đại số gia tử
2 NQHNN Nhóm quan hệ ngữ nghĩa
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
x
DANH MỤC CÁC HÌNH
Hình 1.1. Cấu hình cơ bản của hệ mờ ...................................................................................... 14
Hình 2.1: Số sinh viên nhập học thực tế và số sinh viên nhập học dự báo ............................... 36
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
xi
DANH MỤC CÁC BẢNG
Bảng 1.1 : Các cặp T - chuẩn và T - đối chuẩn. .......................................................................... 9
Bảng 1.2. Một số phép kéo theo mờ thông dụng ...................................................................... 10
Bảng 1.3. Ví dụ về tính âm dƣơng giữa các gia tử ................................................................... 23
Bảng 2.1: Chuyển đổi các giá trị lịch sử thành giá trị ngôn ngữ .............................................. 32
Bảng 2.2: Xác định các quan hệ thành viên .............................................................................. 34
Bảng 2.3. Bảng mờ hóa dữ liệu ................................................................................................ 39
Bảng 2.4. Mối quan hệ Logic mờ của tuyển sinh ..................................................................... 40
Bảng 2.5. Nhóm mối quan hệ logic mờ .................................................................................... 40
Bảng 2.6. Kết quả dự báo của Chen ......................................................................................... 42
Bảng 3.1 Số sinh viên nhập học tại trƣờng đại học Alabama từ 1971 đến 1992 ...................... 46
Bảng 3.2 Giá trị đầu và giá trị cuối của các khoảng giải nghĩa đƣợc chọn .............................. 54
Bảng 3.3 Kết quả tính toán dự báo tối ƣu số sinh viên nhập học ............................................. 55
Bảng 3.4: So sánh các phƣơng pháp dự báo với 7 khoảng chia ............................................... 57
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
1
PHẦN 1: MỞ ĐẦU
1. Lý do chọn đề tài
Logic mờ ra đời đã cung cấp một công cụ hữu hiệu để nghiên cứu và
xây dựng các hệ thống có khả năng xử lý thông tin không chính xác. Nhờ có
logic mờ mà con ngƣời xây dựng đƣợc những hệ có tính linh động rất cao,
những hệ chuyên gia có khả năng suy luận nhƣ những chuyên gia hàng đầu và
có khả năng tự hoàn thiện thông qua việc thu nhận tri thức mới.
Ngày nay logic mờ có phạm vi ứng dụng rộng rãi trên thế giới, từ
những hệ thống cao cấp phức tạp nhƣ những hệ dự báo, nhận dạng, robos, vệ
tinh, du thuyền, máy bay,… đến những đồ dùng hằng ngày nhƣ máy giặt, máy
điều hoà không khí, máy chụp hình tự động,… Trong đó việc dự báo lấy
chuỗi thời gian mờ làm cơ sở để nghiên cứu ứng dụng đã mang lại nhiều kết
quả cao và có giá trị thực tiễn. Thuật toán dự báo chuỗi thời gian mờ đã đƣợc
Song & Chissom nghiên cứu và đƣa ra đầu tiên trên tạp chí “Fuzzy Sets and
Systems” năm 1993 [14, 15, 16] và đƣợc Chen cải tiến vào năm 1996 [ 3 ].
Nhiều nghiên cứu dự báo có giá trị thực tế đã đƣợc thực hiện trên cơ sở
phƣơng pháp luận dự báo theo Thuật toán chuỗi thời gian mờ nêu trên. Ở Việt
Nam những nghiên cứu đầu tiên về lĩnh vực này đƣợc tác giả Nguyễn Công
Điều nghiên cứu và đăng trên các tạp chí “ khoa học và công nghệ ’’.
Tiếp cận đại số gia tử là cách tiếp cận khác biệt so với tiếp cận mờ, với
những kết quả ứng dụng có hiệu quả gần đây của ĐSGT do nhiều nhà khoa
học ở Việt Nam nhƣ: N.C Ho and W. Wechler, Nguyễn Cát Hồ, Vũ Nhƣ Lân,
Lê Xuân Viết … nghiên cứu gần đây là minh chứng quan trọng cho tính đúng
đắn của tiếp cận có xuất phát điểm khoa học dựa trên một hệ tiên đề chặt chẽ.
Các tham số của ĐSGT cho phép tính toán các giá trị ngữ nghĩa hợp lý. Tuy
nhiên để lựa chọn bộ tham số tốt có thể phải cần đến nhiều lớp gia tử tác
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
2
động lên phần tử sinh ban đầu trong biến ngôn ngữ. Và trên thực tế chỉ có
nhiều nhất 3 lớp gia tử tác động. Vì vậy nhiều giá trị ngôn ngữ trong biến
ngôn ngữ có thể đƣợc mô tả chƣa chính xác, dẫn đến quá trình suy luận không
hợp lý và phép giải mờ không đƣa ra đƣợc giá trị đúng đắn trong các ứng
dụng. Chính vì vậy cần thiết tạo ra một khoảng ngữ nghĩa rộng hơn khoảng
ngữ nghĩa do chỉ 1 lớp gia tử tác động để có thể thay thế nhiều lớp gia tử khác
cần có, tạo ra khả năng mô tả hợp lý hơn toàn bộ các giá trị ngôn ngữ trong
biến ngôn ngữ. Khoảng ngữ nghĩa này đƣợc tạo ra bằng tham số hiệu chỉnh
ngữ nghĩa và các tham số hiệu chỉnh ngữ nghĩa có thể thay thế cho các tác
động của nhiều lớp gia tử lên phần tử sinh.
Vì vậy em chọn “ Dự báo chuỗi thời gian mờ dựa trên đại số gia tử
với ngữ nghĩa ’’ làm luận văn nghiên cứu, việc sử dụng dự
báo chuỗi thời gian mờ dựa trên đại số gia tử với ngữ nghĩa là một
hƣớng đi khác trong các ứng dụng của ĐSGT. Và để có thể thấy rõ tính hiệu
quả của cần phải đƣợc nghiên cứu thử nghiệm trên cơ sở số liệu
và dụng cho
[14, 15, 16, 3]
2. Đối tƣợng và phạm vi nghiên cứu
2.1. Đối tƣợng
Nghiên cứu Thuật toán dự báo chuỗi thời gian mờ và đƣa ra kết quả
nghiên cứu về dự báo chuỗi thời gian mờ dựa trên đại số gia tử với tham số
hiệu chỉnh ngữ nghĩa.
2.2. Phạm vi nghiên cứu
- Nghiên cứu chuỗi thời gian mờ.
- Nghiên cứu Thuật toán dự báo của Chen.
- Nghiên cứu đại số gia tử với khoảng ngữ nghĩa.
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
3
- Nghiên cứu đề xuất Thuật toán dự báo chuỗi thời gian mờ dựa trên
đại số gia tử với ngữ nghĩa .
- Ứng dụng dự báo trên cơ sở chuỗi dữ liệu [3].
3. Hƣớng nghiên cứu của đề tài
- Nghiên cứu khoảng ngữ nghĩa.
- Nghiên cứu cách mô tả chuỗi thời gian theo các giá trị ngôn ngữ.
- Nghiên cứu xây dựng nhóm quan hệ ngữ nghĩa và so sánh với quan hệ
mờ.
- Đề xuất Thuật toán tính toán của tiếp cân ĐSGT với khoảng ngữ
nghĩa.
- Nghiên cứu cách mô tả giá trị ngôn ngữ theo tiếp cận ĐSGT với
khoảng ngữ nghĩa.
- Nghiên cứu chuyển thuật toán dự báo của Chen sang thuật toán dự
báo dựa trên Thuật toán tính toán của ĐSGT với khoảng ngữ nghĩa.
- Xây dựng chƣơng trình tính toán trên MATLAB cho bài toán dự báo
chuỗi thời gian mờ theo tiếp cận ĐSGT với ngữ nghĩa trên
khoảng ngữ nghĩa.
4. Phƣơng pháp nghiên cứu
4.1. Phƣơng pháp nghiên cứu lý thuyết
Phƣơng pháp nghiên cứu tài liệu: Phân tích tổng hợp, hệ thống hóa các
tài liệu có liên quan để xây dựng cơ sở lý luận cho đề tài nghiên cứu.
4.2. Phƣơng pháp nghiên cứu thực tiễn
+ Phƣơng pháp điều tra khảo sát: Thu thập, nghiên cứu thông tin về dự
báo, Thuật toán tính toán của đại số gia tử với khoảng ngữ nghĩa và những
vấn đề liên quan.
+ Phƣơng pháp chuyên gia: Kiểm tra, đƣa ra những kết quả dự báo về
chuỗi thời gian mờ dựa trên đại số gia tử với tham số hiệu chỉnh ngũ nghĩa và
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
4
hỏi ý kiến các chuyên gia về tính cấp thiết, khả thi và tìm kiếm những thông
tin có liên quan.
+ Phƣơng pháp thử nghiệm: Xây dựng chƣơng trình tính toán trên
MATLAB và chạy thử chƣơng trình.
5. Ý nghĩa khoa học của luận văn
Định hƣớng ứng dụng mới của tiếp cận đại số gia tử với ngữ nghĩa
trong bài toán dự báo chuỗi thời gian mờ.
6. Cấu trúc luận văn
Ngoài phần mở đầu và kết luận luận văn đƣợc chia làm 3 chƣơng:
+ Chƣơng 1: Giới thiệu một số kiến thức cơ sở.
+ Chƣơng 2: Dự báo chuỗi thời gian mờ .
+ Chƣơng 3: Dự báo chuỗi thời gian mờ ĐSGT với ngữ nghĩa
.
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
5
PHẦN 2: NỘI DUNG
CHƢƠNG 1: GIỚI THIỆU MỘT SỐ KIẾN THỨC CƠ SỞ
1.1. Những vấn đề cơ sở của lý thuyết tập mờ và logic mờ
1.1.1. Lý thuyết tập mờ
Lý thuyết tập mờ lần đầu tiên đƣợc Lofti A.Zadeh, một giáo sƣ thuộc
trƣờng Đại học Caliornia, Berkley giới thiệu trong một công trình nghiên cứu
vào năm 1965 và sau đó liên tục phát triển mạnh mẽ.
Năm 1970, tại trƣờng đại học Mary Queen, thành phố London- Anh, Ebrahim
Mamdani đã sử dụng logic mờ để điều khiển một máy hơi nƣớc mà ông
không thể điều khiển bằng kỹ thuật cổ điển.
Tại Nhật, logic mờ đƣợc ứng dụng vào nhà máy xử lý nƣớc của hãng
Fuji Electronic vào năm 1983, hệ thống xe điện ngầm của Hitachi năm 1987.
Tuy logic mờ ra đới ở Mỹ, ứng dụng lần đầu ở Anh, nhƣng nó lại đƣợc phát
triển và ứng dụng nhiều nhất ở Nhật.
Định nghĩa: Cho không gian nền U, tập A U đƣợc gọi là tập mờ nếu
A đƣợc xác định bởi hàm µA(x) : X→ [0,1]
đƣợc gọi là hàm thuộc, hàm liên thuộc hay hàm thành viên (membership
function). Với x X thì (x) đƣợc gọi là mức độ thuộc của x vào A.
Trọng tâm của lý thuyết tập mờ là việc đề xuất khái niệm tập mờ (fuzzy
sets). Về mặt toán học, một tập mờ A là một hàm số (gọi là hàm thuộc
(membership function)) xác định trên khoảng giá trị số mà đối số x có thể
chấp nhận (gọi là tập vũ trụ (universe of discourse)) X cho bởi:
(x) : X→ [0,1]
Trong đó, A là nhãn mờ của biến X, thƣờng mang một ý nghĩa ngôn
ngữ nào đó, mô tả định tính thuộc tính của đối tƣợng, chẳng hạn nhƣ cao,
thấp, nóng, lạnh, sáng, tối.....
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
6
đƣợc gọi là hàm thuộc, hàm liên thuộc hay hàm thành viên
(membership function).
Với x X thì (x) đƣợc gọi là mức độ thuộc của x vào A.
Nhƣ vậy ta có thể coi tập rõ là một trƣờng hợp đặc biệt của tập mờ,
trong đó hàm thuộc chỉ nhận 2 giá trị 0 và 1.
Ký hiệu tập mờ, ta có các dạng ký hiệu sau:
Liệt kê phần tử: giả sử U = {a,b,c,d} ta co thể xác định một tập mờ
A=
A =
A = trong trƣờng hợp U là không gian rời rạc
A = trong trƣờng hợp U là không gian liên tục
Lƣu ý: Các ký hiệu và không phải là các phép tính tổng hay tích phân,
mà chỉ là ký hiệu biểu thị tập hợp mờ.
Ví dụ: Tập mờ A là tập “số gần 2” xác định bởi hàm thuộc ta có
thể ký hiệu: A = hoặc A =
1.1.2. Logic mờ
1.1.2.1. Định nghia logic mờ
Biến ngôn ngữ đã đƣợc Zadeh đƣa ra năm 1973 nhƣ sau:
Một biến ngôn ngữ đƣợc xác định bởi bộ (x, T, U, M) trong đó:
- X là tên biến. Ví dụ “nhiệt độ”, “tốc độ”, “độ ẩm”,…
- T là tập các từ là các giá trị ngôn ngữ tự nhiên mà x có thể nhận. Ví
dụ x là “tốc độ” thì T có thể là {“chậm”, “trung bình”, “nhanh”}.
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
7
- U là miền các giá trị vật lý mà x có thể nhận Ví dụ x là “tốc độ” thì U
có thể là {0km/h,1km/h, …150km/h}.
- M là luật ngữ nghĩa, ứng mỗi từ trong T với một tập mờ At trong U.
Nhƣ vậy, biến ngôn ngữ là biến nhận các giá trị ngôn ngữ (linguistic
terms) mỗi giá trị ngôn ngữ thực chất là một tập mờ xác định bởi một hàm
thuộc và khoảng giá trị số tƣơng ứng và logic mờ cho phép các tập này có thể
xếp phủ lên nhau.
Logic mờ đƣợc phát triển từ lý thuyết tập mờ để thực hiện lập luận một
cách xấp xỉ thay vì lập luận chính xác theo lôgic vị từ cổ điển. Lôgic mờ có
thể đƣợc coi là mặt ứng dụng của lý thuyết tập mờ để xử lý các giá trị trong
thế giới thực cho các bài toán phức tạp.
Trong logic mờ thì mệnh đề là một câu phát biểu đúng sai, mỗi mệnh
đề mờ là một câu phát biểu không nhất thiết là đúng hoặc sai. Mệnh đề mờ
đƣợc gán cho một giá trị trong khoảng từ 0 đến 1 để chỉ mức độ đúng (độ
thuộc) của nó.
1.1.2.2. Các phép toán logic mờ
* Phép bù:
Phép phủ định trong logic kinh điển là một trong những phép toán cơ
bản cho việc xây dựng phép bù của 2 tập hợp. Để suy rộng phép này trong tập
mờ chúng ta cần tới toán tử v(NOT P). Toán tử này phải thỏa các tính chất
sau :
- V(NOT P) chỉ phụ thuộc vào v(P).
- Nếu v(P)=1 thì v(NOT P)=0
- Nếu v(P)=0 thì v(NOT P)=1
- Nếu v(P1) ≤ v(P2) thì v(NOT P1) ≥ v(NOT P2)
Định nghĩa 1: Hàm n : [0,1] → [0, 1] không tăng thỏa mãn các điều
kiện n(0) = 1, n(1) = 0, đƣợc gọi là hàm phủ định.
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
8
Định nghĩa 2: (Phần bù của một tập mờ): Cho n là hàm phủ định, phần
bù Ac của tập mờ A là một tập mờ với hàm thuộc đƣợc xác định bởi:
Ac(x) = n(A(x)), với mỗi x
* Phép giao hai tập mờ
Định nghĩa 1 ( T - chuẩn): Hàm T: [0,1]2 [0,1] là phép bội (T -
chuẩn) khi và chỉ khi thoả mãn các điều kiện sau:
- T(1, x) = x, với mọi 0 x 1.
- T có tính giao hoán : T(x,y) = T(y,x), với mọi 0 x, y 1.
- T không giảm: T(x,y)=T(u,v), với mọi x u, y v.
- T có tính kết hợp: T(x,T(y,z)) = T(T(x,y),z), với mọi 0 x,y, z 1.
Định nghĩa 2 (Phép giao hai tập mờ): Cho hai tập mờ A, B trên cùng
không gian nền với hàm thuộc A(x), B(x) tƣơng ứng. Cho T là một T-
Chuẩn. Phép giao của hai tập mờ A, B là một tập mờ (ký hiệu (A TB) trên
với hàm thuộc cho bởi biểu thức:
(A TB)(x) = T(A(x), B(x)), với mỗi x
Ví dụ:
Với T(x,y) = min(x,y)ta có: (A TB)(x) = min(A(x),B(x))
Với T(x,y) = x,y ta có (A TB)(x) = A(x).B(x) (tích đại số)
* Phép hợp hai tập mờ
Định nghĩa 1 (T - đối chuẩn): Hàm S:[0,1] 2 đƣợc gọi là phép tuyển (
T-đối chuẩn) nếu thoả mãn các điều kiện sau:
S(0,x) = x, với mọi 0 x 1.
S có tính giao hoán : S(x,y)= S(y,x) với mọi 0 x , y 1.
S không giảm: S(x,y)= S(u,v), với mọi x u, y v.
S có tính kết hợp: S(x,S(y,z)) = S(S(x,y),z) với mọi 0 x, y, z 1.
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
9
Định nghĩa 2 (phép hợp hai tập mờ): Cho hai tập mờ A, B trên cùng
không gian nền với hàm thuộc A(x), B(x) tƣơng ứng. Cho S là một T - đối
chuẩn. Phép hợp của hai tập mờ A, B là một tập mờ ( kí hiệu A SB)) trên
với hàm thuộc cho bởi biểu thức:
(A SB)(x)=S(A(x),B(x)), với mỗi x
Ví dụ:
Với S(x,y) = max(x,y): (A SB)(x)= max(A(x), B(x))
Với S(x,y) = x + y – x.y: (A SB)(x)= A(x) + B(x) – A(x) .B(x)
Ta có thể biểu diễn phép hợp của hai tập mờ qua hai hàm sau:
S(x,y) = max(x,y) và S(x,y) = x+y – x.y
* Luật De Morgan
Cho T là T - chuẩn, S là T - đối chuẩn và n là phép phủ định mạnh. Khi
đó bộ ba(T, S,n) là bộ ba De Morgan nếu:
n(S(x,y)) = T(n,(x),n(y))
Với phép phủ định n(n-1) = 1- x, chúng ta có một số cặp T-chuẩn và T-
đối chuẩn thoả mãn luật DeMorgan trong bảng 1.1
Bảng 1.1 : Các cặp T - chuẩn và T - đối chuẩn.
STT T(x,y) S(x,y)
Min(x,y) Max(x,y) 1
x.y x+ y – x.y 2
Max(x + y -1, 0) Min(x + y,1) 3
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
10
x + y >1
x + y <1
Else Else
Else
Min0(x,y)= Max1(x,y)=
4
max(x,y)=1
min(x,y)=0
Z(x,y) = Max1(x,y)=
Else
Else
5
6
7
* Phép kéo theo
Cho (T, S, n) là một bộ ba De Morgan với n là phép phủ định, phép kéo
theo lS(x,y) hay x y đƣợc xác định trên khoảng [0,1] đƣợc định nghĩa bằng
biểu thức sau đây:
lS(x,y) = S(T(x,y),n(x))
Bảng 1.2 dƣới đây sẽ liệt kê một số phép kéo theo mờ hay đƣợc sử dụng nhất.
Bảng 1.2. Một số phép kéo theo mờ thông dụng
STT Tên Biểu thức xác định
Early Zadeh x y = max(1-x,min(x,y)) 1
Lukasiewicz x y = min(1,1- x+y) 2
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
11
x y = min(x,y) 3 Mandani
Larsen x y = x.y 4
Standard Strict x y = 5
Godel x y = 5
Gaines
6
x y = max(1 –x,y) 7 Kleene – Dienes
x y = 1- x + y 8 Kleene – Dienes –Lukasiwicz
Yager x y = yx 9
1.2. Chuỗi thời gian mờ
1.2.1 Khái niệm:
Giả sử U là không gian nền. không gian nền này xác định một tập hợp
các đối tƣợng cần ghiên cứu. Nếu A là một tập con rõ của U thì ta có thể xác
định chính xác một hàm đặc trƣng:
Nhƣng với một tập mờ B trong không gian nền U thì phần tử x không
xác định chính xác đƣợc. Khi đó ta có định nghĩa: U [0,1] đƣợc gọi là hàm
thuộc (Membership function). Còn với bất kỳ một phần tử u nào của A thì
hàm (u) đƣợc gọi là độ thuộc của u vào tập mờ A.
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
12
Giả sử Y(t) là chuỗi thời gian (t = 0, 1, 2,…)
U là tập nền chứa các khoảng giá trị của chuỗi thời gian từ nhỏ nhất
đến lớn nhất. Xác định hàm thuộc : U [0,1] của tập mờ A, còn tập A trên
không gian nền U đƣợc viết nhƣ sau:
A = {((u1/u1, (u2/u2, …, (un/un), : ui U ; I = 1, 2, …, n}
(ui) là độ thuộc của ui vào tập A
1.2.2. Một số định nghĩa liên quan đến chuỗi thời gian mờ
Định nghĩa 1: Y(t) (t = … 0, 1, 2, …) là một tập con của R1. Y(t) là tập
nền trên đó xác định các tập mờ fi(t). F(t) là tập chứa các tập fi(t) (I = 1, 2,…)
khi đó ta gọi F(t) là chuỗi thời gian mờ xác định trên tập nền Y(t).
Định nghĩa 2: Tại các thời điểm t và t-1 có tồn tại một mối quan hệ mờ
giữa F(t) và F(t-1) sao cho F(t) = F(t-1) * R(t-1, t) với R(t-1, t) là quan hệ mờ giữa F(t)
và F(t-1) trong đó * là kí hiệu của một toán tử xác định trên tập mờ.
Ta cũng có thể kí hiệu mối quan hệ mờ giữa F(t) và F(t-1) bằng F(t-1)F(t).
Nếu đặt F(t-1) = Ai và F(t) = Aj thì ta kí hiệu mối quan hệ logic mờ giữa chúng
nhƣ sau: AiAj. với Ai đƣợc qui định là vế trái (LHS), và Aj qui định là vế phải
của mối quan hệ mờ (FLR).
Những FLR này có thể đƣợc nhóm lại để thiết lập những quan hệ mờ
Định nghĩa 3: Nhóm các mối quan hệ mờ
Các mối quan hệ logic có thể gộp lại thành một nhóm nếu trong ký hiệu
trên, cùng một vế trái sẽ có nhiều mối quan hệ tại vế phải. ví dụ nếu ta có các
mối quan hệ: AiAk, AiAm thì ta có thể gộp chúng thành nhóm các mối quan hệ
logic mờ sau: AiAk, Am
Định nghĩa 4: Giả sử F(t) suy ra từ F(t-1) và F(t) = F(t-1) * R(t-1,
t) cho mọi t. Nếu R(t-1, t) không phụ thuộc vào t thì F(t) đƣợc gọi là chuỗi
thời gian mờ dừng, còn ngƣợc lại ta có chuỗi thời gian mờ không dừng.
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
13
Định nghĩa 5: Giả sử F(t) suy đồng thời từ F(t-1), F(t-2),…, F(t-m)
m>0 và là chuỗi thời gian mờ dừng. Khi mối quan hệ mờ có thể viết đƣợc
F(t-1), F(t-2), …, F(t-m) F(t) và gọi đó là Thuật toán dự báo bậc m của chuỗi
thời gian mờ.
1.3. Quan hệ mờ
1.3.1. Các quan hệ mờ
Các quan hệ mờ là cơ sở dùng để tính toán và suy diễn (suy luận xấp
xỉ) mờ. Đây là một trong những vấn đề quan trọng trong các ứng dụng mờ
đem lại hiệu quả lớn trong thực tế, mô phỏng đƣợc một phần suy nghĩ của con
ngƣời. Chính vì vậy, mà các phƣơng pháp mờ đƣợc nghiên cứu và phát triển
mạnh mẽ. Tuy nhiên chính logic mờ mở rộng đƣợc nghiên cứu và phát triển
mạnh mẽ. Tuy nhiên chính logic mờ mở rộng từ logic đa trị, do đó nảy sinh ra
rất nhiều các quan hệ mờ, nhiều cách định nghĩa các toán tử T- chuẩn, T-
đối chuẩn, cũng nhƣ các phƣơng pháp mờ hoá, khử mờ khác nhau,…Sự đa
dạng này đòi hỏi ngƣời ứng dụng phải tìm hiểu để lựa chọn phƣơng pháp
thích hợp nhất cho ứng dụng của mình.
Định nghĩa: Cho U ≠ ; V = ; R là một tập mờ trên U x V gọi là
một quan hệ mờ (quan hệ hai ngôi).
0 R (x,y) = 1 R(x,y)
Tổng quát: R U1 U2 …….. Un là quan hệ n ngôi
0 R(u1, u2,……un) = R(u1, u2,…..un) 1
1.3.2. Các phép toán của quan hệ mờ
Định nghĩa: Cho R là quan hệ mờ trên X x Y, S là quan hệ mờ trên
Y x Z, lập phép hợp thành SoR là quan hệ mờ trên X x Z
Có R(x,y) với (x,y) XY, S(y,z) với (y,z)YZ. Định nghĩa phép hợp thành:
Phép hợp thành max – min xác định bởi: (SoR)(x,z)
Phép hợp thành max – prod xác định bởi: (SoR)(x,z)
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
14
Phép hợp thành max – T ( với T là T - chuẩn) xác định bởi: (SoT
R)(x,z)
1.3.3. Suy luận xấp xỉ và suy diễn mờ
Suy luận xấp xỉ hay còn gọi là suy luận mờ - đó là quá trình
suy ra những kết luận dƣới dạng các mệnh đề trong điều kiện các quy tắc ,
các luật, các dữ liệu đầu vào cho trƣớc cũng không hoàn toàn xác định. Trong
giải tích toán học chúng ta sử dụng Thuật toán sau để lập luận:
Định lý: “Nếu một hàm số là khả vi thì nó liên tục”
Sự kiện: Hàm f khả vi
Kết luận: Hàm f là liên tục
Đây là dạng suy luận dựa vào luật logic cổ điển Modus Ponens.
1.3.4. Hệ mờ
Kiến trúc cơ bản của một hệ mờ gồm 4 thành phần chính: Bộ mờ hoá,
Hệ luật mờ (Fuzzy Rule Base)
Các tập mờ
Các tập mờ
Đầu vào rõ
Đầu ra rõ
Bộ giải hoá (Dauzzifier)
đầu vào
đầu vào
hệ luật mờ, động cơ suy diễn mờ và bộ giải mờ nhƣ hình 1.1 dƣới đây
Bộ mờ hoá Động cơ suy diễn mờ (Fuzzy Interence Engine) Hình 1.1. Cấu hình cơ bản của hệ mờ
* Bộ mờ hoá
Thực hiện việc ánh xạ từ không gian đầu vào S vào các tập mờ xác
định trong S đƣợc cho bởi hàm thuộc : S [0,1]. Bộ phận này có chức
năng chính dùng để chuyển một giá trị rõ x X thành một giá trị mờ trong
S U (U là không gian nền). Có hai phƣơng pháp mờ hoá nhƣ sau:
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
15
+ Singleton fuzzifiter: Tập mờ A với x1 và hàm liên thuộc đƣợc định
nghĩa nhƣ sau:
1 if x = xi
A(x) =
0 if x
xi
+ No – Singleton fuzziffier: Với các hàm liên thuộc nhận giá trị lớn
nhất là 1 tạo x = xi và giảm dần từ 1 đến 0 với các giá trị dịch chuyển x x1.
* Hệ luật mờ
Gồm nhiều mệnh đề dạng:
IF < tập các điều kiện đƣợc thoả mãn > THEN < tập các hệ quả >
) dạng Giả sử hệ luật gồm M luật Rj (j=
is THEN y is Bj Rj: IF x1 is x2 is
) là các biến đầu vào hệ mờ, y là biến đầu ra của hệ mờ - Trong đó xi (i =
các biến ngôn ngữ, là các tập mờ trong các tập đầu vào X và là các tập
mờ trong các tập đầu ra Y – các giá trị của biến ngôn ngữ (ví dụ: “Rất nhớ”,
“nhỏ”, “Trung bình”, “Lớn”, “Rất lớn”,) đặc trƣng bởi các hàm thuộc
......
và . Khi đó là một quan hệ mờ từ các tập mờ đầu vào X = X1 X2
Xn tới các tập mờ đầu ra Y.
* Động cơ suy diễn
Đây là một bộ phận logic đƣa ra quyết định sử dụng hệ mờ để thực hiện
ánh xạ từ các tập mờ trong không gian đầu vào X thành tập mờ trong không
gian đầu ra Y.
Khi Rj là một quan hệ mờ, thì Rj có thể là một tập con của tích Decart
X Y = với . Vì vậy, quan hệ Rj là
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
16
một hàm
ánh xạ từ tập mờ trong X tới tập mờ trong
Y, đƣợc gọi là một dạng suy diễn mờ( để cho gọn, ta ký
hiệu Aj = )
* Bộ giải mờ
Đây là một ánh xạ từ các từ các tập mờ trong R thành các giá trị rõ ràng
trong R. Có nhiều phép giải mờ, với mỗi ứng dụng sẽ có một phƣơng thức
giải mờ khác nhau tuỳ thuộc yêu cầu ứng dụng. Dƣới đây sẽ liệt kê một số
phƣơng thức giải mờ thông dụng.
+ Phƣơng pháp độ cao:
Với j là chỉ số luật , y-j là điểm có độ liên thuộc lớn nhất trong tập mờ
j
đầu ra B’ , thứ j và đƣợc tính theo công thức
nhƣ sau:
+ Phƣơng pháp độ cao biến đổi:
với j hệ số biến đổi của luật j
+ Phƣơng pháp trọng tâm:
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
17
+ Phƣơng pháp tâm của các tập (Center – of – Sets): phƣơng pháp này
mỗi luật đƣợc thay thế bởi tập singleton tâm cj
1.4. Lý thuyết tối ƣu
Tối ƣu hóa là một trong những lĩnh vực kinh điển của toán học có ảnh
hƣởng đến hầu hết các lĩnh vực khoa hoc – công nghệ và kinh tế - xã hội.
Trong thực tế việc tìm giải pháp tối ƣu cho một vấn đề nào đó chiếm một vai
trò hết sức quan trọng. Phƣơng án tối ƣu là phƣơng án hợp lý, tốt nhất, tiết
kiệm chi phí, tài nguyên, nguồn lực mà lại cho hiệu quả cao
Cho hàm số f: D ⊂ Rn →Rn. Bài toán tối ƣu có dạng tổng quát: Max
(Min) f(x), với x ∈ D ⊂ Rn. Nhƣ vậy, cần tìm điểm x = (x1, x2, …, xn) ∈ D
⊂ Rn sao cho hàm mục tiêu f(x) đạt đƣợc giá trị lớn nhất đối với bài toán
Max – cực đại hóa ( giá trị nhở nhất đối với bài toán min – cực tiểu hóa).
Các bài toán tối ƣu đƣợc chia thành các lớp sau:
- Bài toán quy hoạch tuyến tính
- Bài toán tối ƣu phi tuyến hay còn gọi là bài toán quy hoạch phi tuyến
bao gồm cả bài toán quy hoạch lồi và bài toán quy hoạch toàn phƣơng
- Bài toán tối ƣu rời rạc, tối ƣu nguyên và hỗn hợp nguyên
- Bài toán quy hoach động
- Bài toán quy hoạch đa mục tiêu
- Bài toán quy hoạch ngẫu nhiên / mờ, đại số gia tử…
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
18
1.5. Giới thiệu về đại số gia tử và một số tính chất.
1.5.1. Sơ lƣợc về đại số gia tử
Đại số gia tử một cấu trúc đại số định lƣợng ngữ nghĩa của miền giá trị
ngôn ngữ của biến ngôn ngữ, đã đƣợc thiết lập, nghiên cứu và phát triển từ
hơn hai chục năm nay [7, 8, 12]. Một tính chất tự nhiên của ngữ nghĩa các giá
trị ngôn ngữ là ngữ nghĩa có tính so sánh đƣợc, nghĩa là giữa chúng có tồn tại
khách quan một quan hệ thứ tự. Trong khi ngữ nghĩa ngôn ngữ dựa trên tập
mờ bỏ qua quan hệ thức tự này, ĐSGT cố gắng phát hiện các tính chất của
ngữ nghĩa các giá trị ngôn ngữ dựa trên các mối quan hệ thứ tự đó [13]. Nhƣ
vậy, ĐSGT Thuật toán hóa ngữ nghĩa các giá trị ngôn ngữ, nó cố gắng phát
hiện các tính chất tự nhiên của các giá trị ngôn ngữ vốn tồn tại trong cấu trúc
thứ tự đó
.
:
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
19
(1).
.
(2).
.
.
Để thuận tiện cho việc biểu diễn ngữ nghĩa của các giá trị ngôn ngữ, giả
sử rằng miền tham chiếu thông thƣờng của các biến ngôn ngữ X là đoạn [a, b]
còn miền tham chiếu ngữ nghĩa Xs là đoạn [as,bs] ( 0 ≤. as < bs ≤ 1 ). Việc
chuyển đổi tuyến tính từ [a, b] sang [as,bs] đƣợc gọi là phép ngữ nghĩa hóa
tuyến tính (linear semantization) còn việc chuyển ngƣợc lại từ đoạn [as,bs]
sang [a, b] đƣợc gọi là phép giải nghĩa tuyến tính (linear desemantization).
Trong nhiều ứng dụng của ĐSGT, đã sử dụng miền ngữ nghĩa là đoạn
[as=0, bs=1], khi đó phép ngữ nghĩa hóa tuyến tính đƣợc gọi là phép chuẩn
hóa (linear Semantization = Normalization) và phép giải nghĩa tuyến tính
đƣợc gọi là phép giải chuẩn (Linear Desemantization = Denormalization ).
Nhƣ vậy có thể biểu diễn phép ngữ nghĩa hóa tuyến tính và phép giải nghĩa
tuyến tính đơn giản nhƣ sau:
Linear Semantization (x) = xs = as + ( bs – as ) ( x – a ) / ( b – a) (1.1a)
Linear Desemantization (xs) = x = a + ( b – a ) ( xs – as ) / ( bs – as) (1.2a)
Normalization (x) = xs = ( x – a ) / (b – a ) (1.1b)
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
20
Denormalization (xs) = x = a + ( b – a )xs (1.2b)
1.5.2. Biến ngôn ngữ
Khái niệm biến ngôn ngữ lần đầu tiên đƣơc Zadeh viết: “ Khi thiếu hụt
tính chính xác bề ngoài của những vấn đề phức tạp, một cách tự nhiên là tìm
cách sử dụng các biến ngôn ngữ, đó là các biến mà giá trị của chúng không
phải là số mà là các từ hoặc các câu trong ngôn ngữ tự nhiên hoặc nhân tạo.
Động lực cho việc sử dụng các từ, các câu hơn các số là đặc trƣng ngôn ngữ
của các từ, các câu thƣờng là ít xác định hơn số”. Để khái niệm này trở thành
một khái niệm toán học, Zadeh hình thức hóa khái niệm này nhƣ sau:
Định nghĩa: Biến ngôn ngữ đƣợc đặc trƣng bởi một bộ gồm năm thành
phần (X,T(X), U, R, M), ở đây X là tên biến, T(X) là tập các giá trị ngôn ngữ
của biến X, U là không gian tham chiếu của biến cơ sở u, mỗi giá trị ngôn ngữ
xem nhƣ là một biến mờ trên U kết hợp với biến cơ sở u, R là một qui tắc cú
pháp sinh các giá trị ngôn ngữ cho tập T(X), M là qui tắc ngữ nghĩa gán mỗi
giá trị ngôn ngữ trong T(X) với một tập mờ trên U.
Ví dụ 1.1. Xét biến ngôn ngữ có tên AGE, tức là X = AGE, biến cơ sở u
có miền xác định là U = [0, 100]. Khi đó tập các giá trị ngôn ngữ tƣơng ứng
của biến ngôn ngữ là T(AGE) bao gồm các giá trị
young old not young or old
not young not old not very young not very old
very young very old young or old
more–or–less young more–or–less old …
possibly young possibly old …
… … …
Các giá trị ngôn ngữ young và old đƣợc gọi là các giá trị nguyên thủy.
Mỗi giá trị ngôn ngữ trong T(AGE) là tên của một biến mờ trên U, tức là biến
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
21
có thể nhận giá trị trên U với mỗi giá trị ứng với một mức độ tƣơng thích
trong đoạn [0, 1], ràng buộc hạn chế trên mỗi giá trị ngôn ngữ hình thành ngữ
old(u) =
nghĩa cho giá trị ngôn ngữ đó, ví dụ ngữ nghĩa của old đƣợc cho nhƣ sau:
Tuy nhiên ngữ nghĩa của các giá trị khác trong T(AGE) có thể tính
thông qua tập mờ của các giá trị nguyên thủy bởi các phép toán tƣơng ứng với
các gia tử tác động nhƣ very, more – or – less,…
Trong các nghiên cứu của mình về biến ngôn ngữ và lập luận xấp xỉ,
Zadeh luôn nhấn mạnh hai đặc trƣng quan trọng nhất của biến ngôn ngữ:
- Đặc trƣng thứ nhất là tính phổ quát của cấu trúc miền giá trị của
chúng, tức là miền giá trị của hầu hết các biến ngôn ngữ có cùng cấu trúc cơ
sở theo nghĩa các giá trị ngôn ngữ tƣơng ứng là giống nhau ngoại trừ phần tử
sinh nguyên thủy.
- Đặc trƣng thứ hai là tính chất ngữ nghĩa độc lập ngữ cảnh của các gia
tử và các liên từ trong khi ngữ nghĩa của các phần tử sinh nguyên thủy là phụ
thuộc vào ngữ cảnh.
Hai đặc trƣng trên của biến ngôn ngữ cho phép ta sử dụng một tập các
gia tử ngôn ngữ cho nhiều biến ngôn ngữ khác nhau và có thể mô tả hình thức
miền giá trị của các biến ngôn ngữ bởi một cấu trúc ngôn ngữ toán học thuần
nhất. Vấn đề quan trọng nhất ở đây là Thuật toán phải dựa trên các yếu tố nào
để cho cấu trúc toán học đó phản ánh đƣợc càng nhiều ngữ nghĩa tự nhiên của
giá trị ngôn ngữ. Một cách tiếp cận đến vấn đề này đã đƣợc đề xuất trong [7,
8] dựa trên một số đặc trƣng ngôn ngữ sau:
- Các giá trị ngôn ngữ có ngữ nghĩa tự nhiên của chúng khi đƣợc con
ngƣời sử dụng trong cuộc sống hàng ngày, con ngƣời sử dụng ngữ nghĩa này
để xác định quan hệ thứ tự giữa các giá trị ngôn ngữ của cùng một biến.
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
22
- Các gia tử ngôn ngữ đƣợc con ngƣời sử dụng để nhấn mạnh về mặt
ngữ nghĩa của giá trị ngôn ngữ, tức là mỗi gia tử có thể làm mạnh lên hoặc
yếu đi ngữ nghĩa tự nhiên của giá trị ngôn ngữ đƣợc tác động.
Với mỗi giá trị ngôn ngữ x trong T(X) và tập H các gia tử ngôn ngữ,
khi đó H sẽ đƣợc phân hoạch thành hai tập con rời nhau sao cho một tập chứa
các gia tử làm tăng ngữ nghĩa của x và tập còn lại chứa các gia tử làm giảm
ngữ ngĩa của x. Hơn nữa trong mỗi tập con đó của H, các gia tử cũng đƣợc
sắp thứ tự theo mức độ nhấn ngữ nghĩa của chúng, ví dụ nhƣ mức độ nhấn
ngữ nghĩa của gia tử very đƣợc xem là mạnh hơn gia tử more. Đồng thời các
tác giả giới thiệu khái niệm đại số gia tử nhƣ là một cấu trúc toán học để
Thuật toán hóa cấu trúc tự nhiên miền giá trị của các biến ngôn ngữ.
1.5.3. Đại số gia tử của biến ngôn ngữ
Giả sử X là một biến ngôn ngữ và miền giá trị của X là Dom(X).
Định nghĩa: Một đại số gia tử AX tƣơng ứng của X là một bộ 4 thành
phần AX=(Dom(X), C, H, ) trong đó C là tập các phần tử sinh, H là tập các
gia tử và quan hệ “ ” là quan hệ cảm sinh ngữ nghĩa trên X.
i) Hai phần tử sinh của biến ngôn ngữ có khuynh hƣớng ngữ nghĩa trái
ngƣợc nhau: fast có khuynh hƣớng “đi lên” còn gọi là hƣớng dƣơng ký hiệu c+, slow có khuynh hƣớng “đi xuống” còn gọi là hƣớng âm, ký hiệu c-. Đơn
giản, theo quan hệ thứ tự ngữ nghĩa ta có: c+ > c . Chẳng hạn old > young,
true>false.
ii) Về trực giác, mỗi gia tử có khuynh hƣớng làm tăng hoặc giảm ngữ
nghĩa của phần tử sinh nguyên thủy. Chẳng hạn nhƣ Very fast > fast và Very
slow < slow điều này có nghĩa gia tử Very làm mạnh thêm ngữ nghĩa của cả
hai phần tử sinh fast, slow. Nhƣng Little fast < fast, Little slow > slow vì thế
Little có khuynh hƣớng làm yếu đi ngữ nghĩa của phần tử sinh. Ta nói Very là
gia tử dƣơng và Little là gia tử âm.
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
23
Ta ký hiệu H là tập các gia tử âm, H+ là tập các gia tử dƣơng và H = H- H+.
Nếu cả hai gia tử h và k cùng thuộc H+ hoặc H , thì ta nói h, k sánh đƣợc với
nhau. Dễ thấy Little và Possible là sánh đƣợc với nhau và Little > Posible, vì
Little false > Possible false > false. Ngƣợc lại, nếu h và k không đồng thời thuộc H+ hoặc H-, khi đó ta nói h, k ngƣợc nhau.
iii) Hơn nữa, chúng ta nhận thấy mỗi gia tử đều có sự ảnh hƣởng (làm
tăng hoặc làm giảm) đến ngữ nghĩa của các gia tử khác. Vì vậy, nếu k làm
tăng ngữ nghĩa của h, ta nói k là dƣơng đối với h. Ngƣợc lại, nếu k làm giảm
ngữ nghĩa của h, ta nói k là âm đối với h.
Chẳng hạn xét các gia tử ngôn ngữ V (Very), M (More), L (Little), P
(Possible), của biến ngôn ngữ TRUTH. Vì L true < true và VL true< L true<
PL true, nên V là dƣơng đối với L còn P là âm đối với L. Tính âm, dƣơng của
các gia tử đối với các gia tử khác không phụ thuộc vào phần tử ngôn ngữ mà
nó tác động. Thật vậy, nếu V dƣơng đối với L thì với bất kỳ phần tử x ta có:
(nếu x Lx thì Lx VLx) hay (nếu x Lx thì Lx VLx)
Nhìn chung, với bất kỳ h, k H, h đƣợc gọi là dƣơng đối với k nếu
( x X){( kx x hkx kx) hay (kx x hkx kx )}. Một cách tƣơng tự,
h đƣợc gọi là âm đối với k nếu ( x X){( kx x hkx kx) hay (kx
x hkx kx)}. Tính âm, dƣơng của các gia tử đƣợc thể hiện trong Bảng 1.2
Bảng 1.3. Ví dụ về tính âm dương giữa các gia tử
V M P L
V + + +
M + + +
P +
L +
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
24
iv) Một tính chất ngữ nghĩa quan trọng của các gia tử đƣợc gọi là tính
kế thừa. Tính chất này thể hiện ở chỗ khi tác động gia tử vào một giá trị ngôn
ngữ thì ngữ nghĩa của giá trị này bị thay đổi nhƣng vẫn giữ đƣợc ngữ nghĩa
gốc của nó. Điều này có nghĩa là với mọi gia tử h, giá trị hx thừa kế ngữ nghĩa
của x. Tính chất này góp phần bảo tồn quan hệ thứ tự ngữ nghĩa: nếu hx kx
thì h’hx k’kx, hay h’ và k’ bảo tồn quan hệ ngữ nghĩa của hx và kx một
cách tƣơng ứng. Chẳng hạn nhƣ theo trực giác ta có Ltrue Ptrue, khi đó:
PLtrue LPtrue.
1.5.4. Các tính chất cơ bản của ĐSGT tuyến tính
Xét một số tính chất cơ bản của ĐSGT tuyến tính.
Trƣớc hết ta thấy rằng khi tác động gia tử h H vào phần tử x X, thì
ta thu đƣợc phần tử ký hiệu hx.
Với mỗi x X ta ký hiệu H(x) là tập tất cả các phần tử u thuộc X xuất
phát từ x bằng cách sử dụng các gia tử trong H và ta viết u = hn…h1x, với hn,
H. …, h1
Định lý 1.1. Cho tập H– và H+ là các tập sắp thứ tự tuyến tính của
ĐSGT AX = (X, G, H, ). Khi đó ta có các khẳng định sau:
Với mỗi u X thì H(u) là tập sắp thứ tự tuyến tính.
Nếu X đƣợc sinh từ G bởi các gia tử và G là tập sắp thứ tự tuyến tính
thì X cũng là tập sắp thứ tự tuyến tính. Hơn nữa nếu u < v, và u, v là độc lập
với nhau, tức là u H(v) và v H(u), thì H(u) H(v).
Một cách tổng quát, mỗi miền ngôn ngữ của biến ngôn ngữ có thể đƣợc
tiên đề hóa và đƣợc gọi là đại số gia tử AX = (X, G, H, ), trong đó H là tập
thứ tự tuyến tính bộ phận. Chúng ta có định lý sau:
Định lý 1.2. Cho ĐSGT AX = (X, G, H, ). Khi đó ta có các khẳng
định sau:
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
25
Các toán tử trong Hc là so sánh đƣợc với nhau, c
{+, –}.
Nếu x X là điểm cố định đối với toán tử h H, tức là hx = x, thì nó
là điểm cố định đối với các gia tử khác.
Nếu x = hn…h1u thì tồn tại chỉ số i sao cho hi…h1u của x là một biểu
diễn chuẩn của x tƣơng ứng với u (x = hi…h1u và hi…h1u ≠ hi-1…h1u) và hjx
= x với mọi j > i.
Nếu h ≠ k và hx = kx thì x là điểm cố định.
Với bất kỳ gia tử h, k H, nếu x ≤ hx (x ≥ hx) thì x ≤ hx (x ≥ hx) và
nếu hx < kx, h ≠ k, thì hx ≤ kx.
Tiếp theo chúng ta nêu ra định lý dùng để so sánh hai phần tử trong
miền ngôn ngữ của biến ngôn ngữ X
Định lý 1.3. Cho x = hn…h1u và y = km…k1u là hai biểu diễn chuẩn của
x và y tƣơng ứng với u. Khi đó tồn tại chỉ số j ≤ min{n, m} + 1 sao cho hj’ =
kj’ với mọi j’ < j (ở đây nếu j = min {m, n} + 1 thì hoặc hj là toán tử đơn vị I,
hj = I, j = n + 1 ≤ m hoặc kj = I, j = m + 1 ≤ n) và
(1) x < y khi và chỉ khi hjxj < kjxj, trong đó xj = hj-1...h1u.
(2) x = y khi và chỉ khi m = n và hjxj = kjxj.
(3) x và y là không so sánh đƣợc với nhau khi và chỉ khi hjxj và kjxj là
không so sánh đƣợc với nhau.
1.5.5. Thuật toán tính toán của đại số gia tử
Gọi AX = (X, G, C, H, ≤) là một cấu trúc đại số với tập X là tập nền
của AX: G = { C+, C-} là tập phần tử sinh C = {0, w, 1}
Trong đó: 0, w, 1 tƣơng ứng là cận trái, trung hòa và cận phải
H là tập toán tử một ngôi đƣợc gọi là các gia tử
≤ Là biểu thị quan hệ thứ tự trên các giá trị ngôn ngữ
Gọi H- là tập hợp các gia tử âm, H+ là tập hợp các gia tử dƣơng của AX Ký hiệu: H- = { h-1, h-2,…, h-q}
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
26
H+ = { h1, h2,…, hp}
Trong đó: h-1 < h-2 <…< h-q
h1< h2 <…< hp
* Định nghĩa về độ đo tính mờ [6, 9]:
Fm: X→ [0, 1] gọi là độ đo tính mờ nếu thỏa mãn các điều kiện sau: Fm(c-) + fm(c+) = 1 và
Với các phần tử o, w, 1 sao cho fm(o) = fm(w) = fm(1)
Và với .
Đẳng thức trên không phụ thuộc vào các phần tử x, y và do đó ta có thể
ký hiệu là (h) và đây là độ tính mờ của gia tử h. Tính chất của fm(x) và (h)
nhƣ sau:
Fm(hx) = (h)fm(x), với
, với c {c-, c+}
và , với , > 0 và + = 1
* Định nghĩa về hàm dấu [6, 9]:
Hàm Sign: X → {-1, 0, 1} là một ánh xạ đƣợc gọi là hàm dấu với h,
h’∈ H và c ∈ {c-, c+} trong đó:
Sign(c-) = -1, Sign(c+) = 1
Sign(hc) = -Sign(c) nếu h là âm đối với c
Sign(hc) = sign(c) nếu h là dƣơng đối với c
Sign(h’hx) = -Sign(hx) nếu h’hx hx và h’ là âm đối với h
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
27
Sign(h’hx) = Sign(hx) nếu h’hx hx và h’ là dƣơng đối với h
Sign(h’hx) = 0 nếu h’hx = hx
Gọi fm là một độ đo tính mờ trên X, ánh xạ ngữ nghĩa định lƣợng :
X [0,1], đƣợc sinh ra bởi fm trên X, đƣợc xác định nhƣ sau:
,
với
j [-q^p], j 0.
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
28
KẾT LUẬN CHƢƠNG 1
Thuật toán dự báo theo chuỗi thời gian mờ đã đƣợc Song và Chinsom,
Chen nghiên cứu đã gặt hái đƣợc nhiều thành công. Dự báo chuỗi thời gian
mờ dựa trên đại số gia tử là cách tiếp cận khác biệt so với tiếp cận mờ truyền
thống. Với những lý luận và cơ sở về lý thuyết mờ cũng nhƣ đại số gia tử
đƣợc nêu ở trên sẽ mở ra hƣớng mới cho bài toán dự báo .
Với những dữ liệu thực tế thu đƣợc theo thời gian thƣờng chịu những
ảnh hƣờng của những yếu tố khác nhau nền việc dự báo chuỗi thời gian theo
hƣớng khác nhau là rất cần thiết và cần đƣợc nghiên cứu.
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
29
CHƢƠNG 2: DỰ BÁO CHUỖI THỜI GIAN MỜ
2.1. Thuật toán dự báo chuỗi thời gian mờ của Song và Chissom
Trong phần này, sử dụng khái niệm và phƣơng pháp dự báo của chuỗi
thời gian mờ đƣợc Song et. al
1990 [15, 16, 3]
. Tập A là mờ trên không Giả sử U là không gian nền: U = u1,u2,....,un
gian nền U nếu A đƣợc xác định bởi hàm:
A : U
A đƣợc gọi là hàm thuộc (Membership function). Còn với bất kỳ một phần tử
[0.1]
u nào của A thì hàm A (u) đƣợc gọi là độ thuộc của u vào tập mờ A.[15]
Tập mờ A trên không gian nền U đƣợc viết nhƣ sau:
Thuật toán dự báo chuỗi thời gian mờ của Song và Chinsom gồm các
bƣớc sau:
Bƣớc 1: Xác định tập nền
Bƣớc 2: Chia miền xác định của tập nền thành những khoảng bằng
nhau
Bƣớc 3. Xây dựng các tập mờ trên tập nền
Bƣớc 4: Mờ hóa chuỗi dữ liệu
Bƣớc 5: Xác định các quan hệ mờ
Bƣớc 6: Dự báo bằng phƣơng trình Ai=Ai−1* R, ở đây ký hiệu * là
toán tử max-min
Bƣớc 7: Giải mờ các kết quả dự báo.
Dựa vào thuật toán trên xây dựng các phƣơng pháp dự báo tuyển sinh
đại học Alabama đƣợc trình bày ngắn gọn nhƣ sau:
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
30
* Bước 1: Xác định tập nền
Đầu tiên phải tìm số sinh viên nhập học thấp nhất và cao nhất theo dữ
liệu lịch sử. Từ đó xác định không gian U với các giá trị [Dmin - D1, Dmax +
D2] mà D1 và D2 là hai số dƣơng thích hợp. Với dữ liệu tuyển sinh của các
trƣờng đại học từ năm 1971 đến năm 1992 với Dmin = 13055 và Dmax = 19328.
Để đơn giản, ta chọn D1 = 55 và D2 = 672. Nhƣ vậy, không gian là khoảng
thời gian U = [13000, 20000].
* Bước 2: Chia miền xác định của tập nền thành những khoảng bằng
nhau.
Phân vùng không gian U chia thành 7 khoảng bằng nhau u1, u2, u3, u4,
u5, u6 và u7 trong đó ul =[13000, 14000], u2 = [14000, 15000], u3 = [15000,
16000], u4 = [16000, 17000], u5 = [17000, 18000], u6 =[18000, 19000] và u7 =
[19000, 20000].
* Bước 3: Xây dựng các tập mờ trên tập nền
Đầu tiên, xác định một số giá trị ngôn ngữ. Trong bài toán dự báo số
sinh viên nhập học tại trƣờng Đại học Alabama, Song và Chinsom và sử
dụng các giá trị ngôn ngữA1 = (not many), A2 = (not too many), A3 =
(many), A4 =(many many), A5 = (very many), A6 = (too many), and A7
= (too many many). Không hạn chế về số lƣợng của các tập mờ xác định.
Tiếp theo, xác định các tập mờ trên U. Tất cả các tập mờ sẽ đƣợc dán
nhãn bởi các giá trị ngôn ngữ có thể. Trong [1], u1, u2 ... và u7 đƣợc chọn làm
các yếu tố của mỗi tập mờ. Xác định các thành viên của ul, u2, ..., và u7 đối
với mỗi Ai (i = 1, ..., 7), để đƣa ra đánh giá với mỗi uk (k = 1 ...., 7) thuộc Ai.
Nếu uk thuộc hoàn toàn về Ai thì các thành viên sẽ bằng 1; nếu tất cả uk
không thuộc về Ai , các thành viên sẽ là 0; ngƣợc lại chọn một trong số các
giá trị thuộc khoảng (0, 1) là mức độ mà uk thuộc về Ai. Nhƣ vậy, tất cả các
tập mờ Ai (i = 1, ..., 7) đƣợc thể hiện nhƣ sau:
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
31
A1 = {u1/1, u2/0.5, u3/0, u4/0, u5/0, u6/0, u7/0},
A2 = {ul/0.5, u2/1, u3/0.5, u4/0, u5/0, u6/0 , u7/0},
A3 = {ul/0, u2/0.5, u3/1, u4/0.5, u5/0, u6/0, u7/0},
(2.1) A4 = {u1/0, u2/0, u3/0.5, u4/1, u5/0.5, u6/0, u7/0},
A5 = {u1/0, u2/0, u3/0, u4/0.5, u5/l, u6/0.5, u7/0},
A6 = {u1/0, u2/0, u3/0, u4/0, u5/0.5, u6/1, u7/0.5},
A7 = {u1/0, u2/0, u3/0, u4/0, u5/0, u6/0.5, u7/1},
Trong đó ui (i = 1, ..., 7) là các phần tử và các số dƣới đây '/' là thành
viên của u để Aj (j= 1, ..., 7). Để đơn giản, ta sử dụng A1, A2, ..., A7 là vectơ
hàng tƣơng ứng (2.1).
* Bước 4. Mờ hóa chuỗi dữ liệu
Mờ hóa chuỗi dữ liệu tức là tìm ra một tập mờ tƣơng đƣơng với tập số
sinh viên nhập học mỗi năm.
Các phƣơng pháp thƣờng đƣợc sử dụng là để xác định tập cắt cho từng
Ai (i = 1, ..., 7). Nếu vào năm t, số sinh viên nhâp học nằm trong tập cắt của
Ak, sau đó số sinh viên nhâp học trong năm là Ak . Vấn đề với phƣơng pháp
này là có khả năng số sinh viên nhâp học tại năm t có thể nằm trong nhiều
hơn một tập cắt . Để tránh điều này, có thể dùng một phƣơng án khác. Thay vì
xác định bộ cắt, ta xác định mức độ của mỗi năm học thuộc từng Ai (i = 1 .....
7). Quá trình này cũng giống nhƣ xác định các phần tử từ ui đến Aj trong
Bƣớc 3.
hiện trong Bảng 2.1 và mỗi tập mờ có bảy phần tử.
* Bước 5. Xác định các quan hệ mờ
Xây dựng thuật toán dự báo từ Bảng 2.1 về sự tăng trƣởng của số sinh
k
viên nhập học trong trƣờng đại học. Đ
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
32
.
Bảng 2.1: Chuyển đổi các giá trị lịch sử thành giá trị ngôn ngữ
Year A1 A2 A3 A4 A5 A6 A7
1990 0 0.3 0.5 0.8 1 0 0
1989 0 0.25 0.55 1 0.8 0 0
1988 0 0.7 0.1 0.5 0.8 1 0
1987 0.1 0.5 1 0.8 0.1 0 0
1986 0.2 0.7 0.2 1 0 0 0
1985 1 0.2 0.8 0.2 0 0 0
1984 1 0.2 0.8 0.2 0 0 0
1983 1 0.2 0.8 0.2 0 0 0
1982 1 0.2 0.8 0.2 0 0 0
1981 0 1 0.2 0.8 0.5 0 0
1980 0 1 0.1 0.5 0.9 0.2 0
1979 0 1 0.1 0.5 0.9 0.2 0
1978 1 0 0.5 0.7 0.2 0 0
1977 1 0 0.6 0.6 0.1 0 0
1976 1 0.2 0.8 0.2 0 0 0
1975 1 0.2 0.8 0.2 0 0 0
1974 0 0 0 0.8 1 0.8 0.1
1973 1 0 0 0 0.9 0.2 0
1972 1 0 0 0 0.8 0.1 0
1971 1 0 0 0 0.5 0 0
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
33
, phát
triển các mối quan hệ logic nhƣ "Nếu số sinh viên nhập học năm i là Ak, thì
của năm (i+1) là Aj", tiếp tục nhƣ vậy cho đến hết. Sử dụng các kí hiệu của
Song và Chissom, ta có thể có đƣợc tất cả các mối quan hệ mờ logic từ Bảng
2.1 nhƣ sau (Lƣu ý: các mối quan hệ nhiều lần đƣợc tính chỉ một lần):
A1 A1, A1 A2, A2 A3, A3 A3, A3 A4,
(2.2) A4 A4, A4 A3, A4 A6, A6 A6 và A6 A7.
Theo định nghĩa chuỗi thời gian mờ bất biến. Ta xác định phép toán
' của hai vectơ. Giả sử C và B là các vectơ hàng của m chiều và D = (dij) =
' CT B. Khi đó các phần tử của ma trận D ở hàng i và cột j đƣợc xác định
nhƣ sau: dij = min (Ci, Bj) (i, j = 1, ..., m) trong đó Ci và Bj là phần tử thứ i và j
T A2, R3 = A2 T
của C và B tƣơng ứng.
T A1, R2 = A1 T A4, R7 =A4
T A3, R5 T A6 và
T A3, R4 = A3 T A3, R8 = A4 T A7. Khi đó, theo định lý 2, ta nhận đƣợc
Đặt R1 = A1 T A4, R6 = A4 A6, R9 = A6 = A3
R10 =A6
( 2.3 ) R(t, t - 1 ) = R = Ri
trong đó R là một ma trận 7 7 và là các phép toán tổ hợp.
Sử dụng công thức ( 2.3 ), kết quả tính toán :
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
34
Bảng 2.2: Xác định các quan hệ thành viên
Sử dụng R, xác định Thuật toán dự báo:
(2.4) Ai = Ai-1 ◦ R
Trong đó Ai-1 là số sinh viên nhập học của năm i - 1 và Ai là số sinh
viên dự báo nhập học của năm i trong tập mờ và '◦' là phép toán 'max-min ".
* Bước 6. Dự báo bằng phương trình Ai=Ai−1* R, ở đây ký hiệu * là toán
tử max-min
Giả sử biết số sinh viên nhập học của năm t có trong Bảng 2.1, dự báo
số sinh viên nhập học của năm (t + 1), đặt Ai-1 trong (2.4) đƣợc ghi tại năm t
và áp dụng công thức (2.4).
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
35
Khi đó, Ai sẽ là dự báo số sinh viên nhập học của năm (t + 1). Từ năm
1972 đến 1991, các kết quả đầu ra dự báo đƣợc trình bày trong Bảng 2.2.
* Bước 7. Giải mờ các kết quả dự báo.
Trong nghiên cứu này, ngƣời ta đã phát hiện ra rằng các phƣơng pháp
trọng tâm không thể dự báo số lƣợng đạt kết quả theo yêu cầu. Do đó, ta sẽ sử
dụng một số phƣơng pháp kết hợp. Có thể đề xuất một số nguyên tắc để giải
thích kết quả dự báo. Các nguyên tắc này là:
.
các khoảng thời gian liên kết tƣơng ứng là giá trị dự báo.
nhập học từ năm 1972 đến năm 1991. Các kết quả đƣợc liệt kê trong Bảng 2.2
và thể hiện trong hình 2.1 trong đó đƣờng nối liên tục là thực tế tuyển sinh và
đƣờng nét đứt là kết quả dự báo. Lƣu ý rằng không sử dụng các ghi danh dữ
liệu của năm 1991 để phát triển các Thuật toán
3.18%. Đối
với năm 1991, các s 1,7%. Đối với Thuật toán
3,18% khá thỏa đáng.
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
36
SỐ SINH VIÊN
Số sinh viên nhập học thực tế
Số sinh viên nhập học dự báo
NĂM
Hình 2.1: Số sinh viên nhập học thực tế và số sinh viên nhập học dự báo
2.2. Thuật toán dự báo mờ của Chen
2.2.1. Thuật toán của Chen phƣơng pháp ứng dụng vào dự báo tuyển
sinh đại học Alabama
* Thuật toán của Chen gồm một số bƣớc sau:
Bƣớc 1: Xác định tập nền U trên các giá trị lịch sử của chuỗi thời gian
Bƣớc 2: Xác định các tập mờ Aj
Bƣớc 3: Mờ hóa các giá trị lịch sử của chuỗi thời gian
Bƣớc 4: Xác định mối quan hệ mờ Aj → Ai
Qui tắc 1: - Nếu nhóm quan hệ mờ còn có 1 phần tử : Ai Aj, Thì giá trị
dự báo là tập mờ Aj
Qui tắc 2: - Nếu nhóm quan hệ mờ còn có n phần tử : Ai Aj1, Aj2, …,
Ajn Thì giá trị dự báo sẽ là nhóm mối quan hệ Aj1, Aj2, …, Ajn
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
37
Qui tắc 3: - Nếu nhóm quan hệ mờ là tập rỗng: Ai Thì giá trị dự báo là
tập mờ Ai
Bƣớc 5: Xác định nhóm quan hệ mờ trên nguyên tắc cùng một vế trái
sau đó tính mối quan hệ mờ Ri cho mỗi tập mờ Aj
Bƣớc 6: Dự báo và giải mờ các kết quả
Qui tắc 1: - Nếu giá trị dự báo là Aj thì giải mờ sẽ là trung điểm của uj
Qui tắc 2: - Nếu giá trị dự báo là Aj1, Aj2, …, thì giải mờ sẽ là: Trong
Mj là trung điểm của Uj tƣơng ứng
Qui tắc 3: - Nếu giá trị dự báo là Ai (Ai ) thì giải mờ sẽ là mi (trung
điểm của ui).
* Dựa vào thuật toán trên xây dựng các phƣơng pháp dự báo tuyển sinh
đại học Alabama đƣợc trình bày ngắn gọn nhƣ sau [15]:
Bước 1: Xác định tập nền U trên các giá trị lịch sử của chuỗi thời gian
Phân vùng vũ trụ của diễn ngôn U = [Dmin - D1, Dmax + D2] khoảng
chiều dài bằng nhau Ul, U2, ..., Um.
Ta phân vùng vũ trụ U =[13000,20000] thành bảy khoảng Ul, U2, U3,
U4, U5, U6, U7, với U1 = [13000, 14000],
U2 = [14000, 15000], U3 = [15000, 16000],
U4 = [16000, 17000], U5 = [17000, 18000],
U6 = [18000, 19000], U7 = [19000, 20000].
Bước 2: Xác định các tập mờ Aj
Hãy A1, A2, ..., Ak thể tập mờ mà là giá trị ngôn ngữ của các ngôn ngữ
biến "tuyển sinh". Xác định các tập mờ A1, A2 ..... Ak trên vũ trụ của ngôn U
nhƣ sau:
A1 = A11/U11 + A12/U2 + … + A1m/Um
A2 = A21/U11 + A22/U2 + … + A2m/Um
A3 = A31/U11 + A32/U2 + … + A3m/Um
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
38
………..
Ak = Ak1/U11 + Ak2/U2 + … + Akm/Um
Với Aij [0,1], l ≤ i≤ k,. , và 1 ≤ j ≤ m . các giá trị của Aij cho biết cấp
e [ 0 , 1 ] , 1 ≤ i ≤ k , và 1 ≤ j < bậc của thành viên uj trong tập mờ Aij nơi aij
m . Tìm hiểu mức độ của mỗi năm tuyển sinh thuộc mỗi Ai ( i = 1,2 ..... m ) .
Nếu các thành viên tối đa của tuyển sinh một năm là dƣới Ak , sau đó
ghi danh cho thuật toán mờ này đƣợc coi là Ak . Sau đó , mối quan hệ logic
mờ đƣợc bắt nguồn dựa trên lịch sử thuật toán mờ tuyển sinh . Trong nghiên
cứu này, các ngôn ngữ sau đây giá trị [ 14 ]:
A1 = (không nhiều), A2 = (không quá nhiều),
A3 = (nhiều), A4 = (nhiều nhiều),
A5 = (rất nhiều), A6 = (quá nhiều),
A7 = (quá nhiều nhiều) với:
A1 = 1/ul + 0.5/u2 + 0/u3 + 0/u4 + 0/u5 + 0/u6 + 0/u7,
A2 = 0.5/u1 - l/u2 + 0.5/u3 + 0/u4 + 0/u5 + 0/u6 + 0/u7,
A3 = 0/ul + 0.5/u2 + l/u3 + 0.5/u4 + 0/u5 + 0/u6 + 0/u7,
A4 = 0/ul + 0/u2 + 0.5/u3 + 1/u4 + 0.5/u5 + 0/u6 + 0/uv,
A5 = 0/ul + 0/u2 + 0/u3 + 0.5/u,, + l/u5 + 0.5/u6 + 0/u7,
A6 = 0/u1 + 0/u2 + 0/u3 + 0/u4 + 0.5/u 5 + l/u6 + 0.5/u7,
A7 = 0/u1 + 0/u2 + 0/u3 + 0/u4 + 0/u5 + 0.5/u6 + 1/u7.
Bước 3: Mờ hóa các giá trị lịch sử của chuỗi thời gian
Các học sinh nhập học lịch sử dựa theo thuật toán mờ tuyển sinh của
Đại học Alabama đƣợc thể hiện trong Bảng 2.3 mà đƣợc áp dụng từ [ 7 ] .
Nếu tuyển sinh năm i là Ai , sau đó là của năm i + 1 là Ak " , nơi đƣợc gọi là
Aj trạng thái hiện tại của tuyển sinh, và đƣợc gọi là Ak các trạng thái tiếp theo
của năm học.
(lƣu ý: lặp đi lặp lại các mối quan hệ đƣợc tính một lần duy nhất ) .
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
39
Bảng 2.3. Bảng mờ hóa dữ liệu
Tuyển sinh thực tế Thuật toán tuyển sinh Năm
13055 1971 A1
13563 1972 A1
13867 1973 A1
14696 1974 A2
15460 1975 A3
15311 1976 A3
15603 1977 A3
15861 1978 A3
16807 1979 A4
16919 1980 A4
16388 1981 A4
15433 1982 A3
15497 1983 A3
15145 1984 A3
15163 1985 A3
15984 1986 A3
16859 1987 A4
18150 1988 A6
18970 1989 A6
19328 1990 A7
19337 1991 A7
18876 1992 A6
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
40
Bước 4: Xác định mối quan hệ mờ Aj → Ai
Mối quan hệ logic mờ của tuyển sinh [ 15 ]
Bảng 2.4. Mối quan hệ Logic mờ của tuyển sinh
A1 → A1 A1 → A2 A2 → A3 A3 → A3
A3 → A4 A4 → A4 A4 → A3 A4 → A6
A6 → A6 A6 → A7 A7 → A7 A7 → A6
Bước 5 : Mờ Xác định nhóm quan hệ mờ
Chia các mối quan hệ logic mờ thành các nhóm dựa trên trạng thái hiện
tại của tuyển sinh theo các mối quan hệ logic mờ . Do đó, dựa vào bảng 2.4,
chúng ta có thể có đƣợc 6 nhóm logic mờ quan hệ đƣợc thể hiện trong bảng
2.5.
Nhóm mối quan hệ logic mờ [ 3 ]
Bảng 2.5. Nhóm mối quan hệ logic mờ
Nhóm 1: A1 → A1 A1 → A2
Nhóm 2: A2 → A3
Nhóm 3: A3 → A3 A3 → A4
Nhóm 4: A4 → A4 A4 → A3 A4 → A6
Nhóm 5: A6 → A6
Nhóm 6: A7 → A7
A6 → A7 A7 → A6
Bước 6: Dự báo và giải mờ các kết quả
Các các tính toán đƣợc thực hiện bằng cách sau đây theo nguyên tắc:
(1) Nếu ghi danh thuật toán mờ năm i là Aj, và chỉ có một mối quan hệ
logic mờ trong nhóm mối quan hệ logic mờ có nguồn gốc trong bƣớc 3 trong
đó trạng thái hiện tại của tuyển sinh là Aj, đƣợc thể hiện nhƣ sau:
Aj → Ak,
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
41
Trong đó Aj và Ak là tập mờ và tối đa giá trị thành viên của Ak xảy ra
ở khoảng Uk, thì dự báo nhập học của năm i + 1 là Mk.
(2) Nếu ghi thuật toán mờ năm i là Aj, và có nhiều mối quan hệ logic
mờ, các nhóm quan hệ logic mờ có nguồn gốc ở bƣớc 3 trong đó trạng thái
hiện tại của tuyển sinh tƣơng ứng là Aj, đƣợc thể hiện nhƣ sau:
Aj → Ak1
Aj → Ak2
…
Aj → AkP
Với: Aj, AK1, Ak2 ..... AKP là tập mờ, AK1, Ak2, ..., AKP giá trị thành viên
tối đa xảy ra trong khoảng thời gian U1, U2 ..... Up tƣơng ứng, và trung điểm
của U1, U2 ..... Up là M1, M2, ..., Mp sau đó các học dự báo của năm i + 1 là:
(Ml + M2 + ... + Mp) / p.
(3) Nếu ghi thuật toán mờ năm i là A, và có không tồn tại bất kỳ mối
quan hệ nhóm logic mờ mà hiện trạng công tác tuyển sinh là tại Aj, trong đó
giá trị thành viên tối đa của Aj xảy ra ở khoảng uj, và trung điểm của uj là mj,
thì tuyển sinh dự báo của năm i + 1 là mj.
Nhƣ vậy, chúng ta có thể dự báo các tuyển sinh của các trƣờng Đại học
Alabama từ 1972-1992 theo phƣơng pháp đƣợc đề xuất thu đƣợc các kết quả
và so sánh với kết quả của Song và Chinsom nhƣ sau [3]:
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
42
Bảng 2.6. Kết quả dự báo của Chen
Tuyển sinh thực tế Tuyển sinh dự báo ( Chen ) Năm
1971 13055
1972 13563 14000
1973 13867 14000
1974 14696 14000
1975 15460 15500
1976 15311 16000
1977 15603 16000
1978 15861 16000
1979 16807 16000
1980 16919 16833
1981 16388 16833
1982 15433 16833
1983 15497 16000
1984 15145 16000
1985 15163 16000
1986 15984 16000
1987 16859 16000
1988 18150 16833
1989 18970 19000
1990 19328 19000
1991 19337 19000
1992 18876 19000
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
43
2.2.2. Thuật toán bậc cao của Chen
Chen đề xuất thuật toán chuỗi thời gian mờ bậc cao nhƣ sau:
Bƣớc 1. Xác định tập U bao gồm khoảng giá trị của chuỗi thời gian.
Khoảng này xác định từ giá trị nhỏ nhất đến giá trị lớn nhất có thể của chuỗi
thời gian.
Bƣớc 2. Chia khoảng giá trị và xác định các tập mờ trên tập U
Bƣớc 3. Mờ hóa các dữ liệu chuỗi thời gian
Bƣớc 4. Thiết lập các mối quan hệ mờ, thí dụ nhƣ mối quan hệ mờ bậc
2 nhƣ sau: giá trị tại thời điểm (t – 2) và (t – 1) của chuỗi thời gian mờ tƣơng
ứng là Ai1 và Ai2 còn giá trị tại thời điểm t là Aj. Khi đó ta xác định mối quan
hệ mờ Ai1, Ai2 Aj.
Bƣớc 5. Dự báo và giải mờ. Trong bƣớc này giải mờ các kết quả và dự
báo đƣợc thực hiện nhƣ sau:
- Nếu bậc k = 2 có mối quan hệ logic là Ai1, Ai2 Aj và giá trị hàm thuộc
của Aj đạt giá trị lớn nhất tại đoạn ui và điểm giữa của ui là mi thì dự báo của
chuỗi thời gian tại thời điểm i là mi.
- Nếu k = 2 ta có các mối quan hệ
Ai1, Ai2 Aj1
Ai1, Ai2 Aj2
…. ….
Ai1, Ai2 Ajp
Trong đó Ai1, Ai2, Aj,…, Ap là những tập mờ thì ta sẽ gặp phải trƣờng
hợp khó khăn vì phải dự báo cho nhiều tập mờ Ajk (k = 1, 2, …, p). Trong
trƣờng hợp này, tiếp tục nâng bậc k lên bậc m mà có mối quan hệ mờ duy
nhất nhƣ trong trƣờng hợp trên.
Trong trƣờng hợp này ta có: Aim, Ai(m-1),…., Ai1 Aj1.
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
44
Khi đó ta sẽ xử lý nhƣ trƣờng hợp trên, có nghĩa là tìm đoạn ui mà
trong đó giá trị hàm thuộc của Aj1 đạt maximum điểm giữa của ui là mi thì dự
báo báo của chuỗi thời gian tại thời điểm i là mi.
Nếu vế phải của mối quan hệ mờ là trống nhƣ trƣờng hợp sau :
Ai1, Ai2,…, Ap và đoạn uim, ui(m-1), … ui1 tƣơng ứng với các giá trị hàm thuộc
của các tập mờ trên đạt giá trị maximal và mim, mi(m-1), … mi1 là các giá trị
trung điểm của các khoảng.
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
45
KẾT LUẬN CHƢƠNG 2
Phƣơng pháp dự báo của Chen để dự báo kết quả tuyển sinh của trƣờng
Đại học Alabama đã có những thành công và tiến bộ hơn so với các phƣơng
pháp dự báo trƣớc. Với việc sử dụng bộ số học đơn giản vào trong bài toán dự
báo đã có những thành công về mặt nghiên cứu đồng thời cũng mở ra hƣớng
mới tích cực hơn trong Thuật toán dự báo..
Kết quả nghiên cứu phân tích trên sẽ là cơ sở để xây dựng bài toán dự
báo kết quả tuyển sinh của trƣờng Đại học Alabama dựa trên ĐSGT.
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
46
3.1. Xây dựng thuật toán
ng tối ƣu.
Đại số gia tử là một tiếp cận mới đƣợc các tác giả N.C.Ho và W.
Wechler xây dựng vào những năm 1990, 1992. Ở đây, ĐSGT đƣợc sử dụng
để mô phỏng biến ngôn ngữ và có đƣợc cấu trúc ngữ nghĩa. Phép mờ hóa và
phép giải mờ đƣợc thay thế bằng phép ngữ nghĩa hóa và phép giải nghĩa
tƣơng ứng đơn giản hơn. ĐSGT dựa trên hệ mờ là một hƣớng đi mới, đƣợc
ứng dụng lần đầu tiên trong điều khiển mờ năm 2008.
.
Thuật toán dự báo chuỗi thời gian mờ lần đầu tiên đƣợc Song và
Chissom đƣa ra vào năm 1993 [15, 16, 3] và đƣợc ứng dụng để dự báo số sinh
viên nhập học tại trƣờng Đại học Alabama với dữ liệu nhƣ trong Bảng 3.1 sau
đây:
Bảng 3.1 Số sinh viên nhập học tại trường đại học Alabama từ 1971 đến 1992
Số sinh viên Số sinh viên Năm Năm nhập học nhập học
1971 13055 1982 15433
1972 13563 1983 15497
1973 13867 1084 15145
1974 14696 1985 15163
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
47
1975 1986 15460 15984
1976 1987 15311 16859
1977 1988 15603 18150
1978 1989 15861 18970
1979 1990 16807 19328
1980 1991 16919 19337
1981 1992 16388 18876
. Nhƣ vậy có
thể xây dựng đƣợc Thuật toán dự báo chuỗi thời gian mờ tƣơng tự nhƣ Thuật
toán Chen nhƣng không sử dụng tập mờ mà dựa trên tiếp cận ĐSGT với
Thuật toán
[8 :
hia miền xác định tập nền thành những
khoảng bằng nhau.
Bƣớc 2.
ĐGST) trên tập nề 1.
.
Bƣớc 4. Xác định các quan hệ ngữ nghĩa theo nhãn ngữ nghĩa .
Bƣớc 5. Tạo lập nhóm quan hệ ngữ nghĩa theo nhãn ngữ nghĩa.
.
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
48
: các bƣớc trên đây tƣơng tự với các bƣớc dự báo trong
Thuật toán Chen nhƣn
. Ở đây, phép mờ
hóa đƣợc thay bằng phép ngữ nghĩa hóa, quan hệ mờ đƣợc thay bằng quan hệ
ngữ nghĩa và nhóm quan hệ mờ đƣợc thay bằng nhóm quan hệ ng
.
Bài toán đƣợc chọn để so sánh và làm rõ hiệu quả dự báo của Thuật
toán trên là bài toán do Song & Chissom [15, 16] và Chen [3] đặt ra đầu tiên
để nghiên cứu Thuật toán chuỗi thời gian mờ trên quan điểm biến ngôn ngữ.
Đây cũng là bài toán cho đến nay vẫn đang đƣợc Chen và nhiều tá
[12] quan tâm
nghiên cứu cải tiến.
3.1 cụ
thể nhƣ sau:
+ Bƣớc 1: Xác định tập nền, chia miền xác định của tập nền thành những
khoảng bằng nhau.
Tập nền U đƣợc chọn tƣơng tự thuật toán của Chen có khoảng xác
định: [Dmin−D1, Dmax+D2] với Dmin và Dmax là số sinh viên nhập học thấp nhất
và cao nhất theo dữ liệu lịch sử nhập học của trƣờng cụ thể nhƣ sau:
Dmin=13055 và Dmax=19337.
Các biến D1 và D2 là các số dƣơng đƣợc chọn sao cho khoảng
[Dmin−D1, Dmax+D2
nhất và cao nhất tro .
Sử dụng cách chọn của Chen [6], D1 = 55 và D2 = 663,
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
49
Nhƣ vậy U= [13000, 20000]. Khoảng xác định tập nền U đƣợc Chen
[6] và nhiều tác giả khác chia thành 7 khoảng bằng nhau u1, u2, u3, u4, u5, u6
và u7. Trong đó u1 = [13000, 14000], u2 = [14000, 15000], u3 = [15000,
16000], u4 = [16000, 17000], u5 = [17000, 18000], u6 = [18000, 19000] và u7
= [19000, 20000].
+ Bƣớc 2. Xây dựng các nhãn ngữ nghĩa: ( giá trị ngôn ngữ không biểu
diễn dƣới dạng tập mờ ) của tiếp cận ĐSGT tƣ
trên tập nền. Để có thể dễ theo rõi và so sánh với các bƣớc dự báo trong Thuật
toán Chen, ở đây sử dụng một số ký hiệu tƣơng tự những ký hiệu Chen đã sử
dụng nhƣng với ý nghĩa của tiếp cận ĐSGT. Giả sử A1, A2 ,…, Ak là các nhãn
ngữ nghĩa đƣợc gán cho các khoảng u1, u2,…uk, k là số khoảng trên tập nền.
Khác với tập mờ trong nghiên cứu của Chen, các nhãn ngữ nghĩa ở đây đƣợc xây dựng từ các phần tử sinh c-, c+ với các gia tử h ϵ H tạo thành các giá trị
ngôn ngữ của biến ngôn ngữ “số sinh viên nhập học ”. Khi đó các nhãn ngữ
nghĩa A1, A2 ,…, Ak có dạng sau đây: A1= hA1c; A2= hA2c;….; Ak= hAkc, trong đó hAi, (i=1,2,…k) là chuỗi gia tử tác động lên c với c {c-, c+}.
Trong bài toán dự báo số sinh viên nhập học tại trƣờng Đại học
Alabama, Chen sử dụng các giá trị ngôn ngữ A1 = (not many), A2 = (not too
many), A3 = (many), A4 = (many many), A5 = (very many), A6 = (too many)
và A7
sử dụng 1 gia tử dƣơng “very” v 2 phần tử
sinh “small”và “large”để tạo ra 7 nhãn ngữ nghĩa tƣơng ứng với 7 giá trị ngôn
ngữ của Chen nhƣ sau: A1 = (very small), A2 = (small), A3 = (little small), A4
= (midle), A5 = (little large), A6 = (large) và A7 = (very large).
+ Bƣớc 3:
D
.
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
50
Để xác định ngữ nghĩa định lƣợng cho các nhãn ngữ nghĩa A1,
A2,...,A7 ở bƣớc 2, cần chọn trƣớc độ đo tính mờ của các gia tử (very),
(little) và giá trị độ đo tính mờ của phần tử sinh fm(c-) = θ với là phần tử
trung hoà đƣợc cho trƣớc. Nếu các nhãn ngữ nghĩa đƣợc tạo thành chỉ từ 1 gia
tử dƣơng và 1 gia tử âm ví dụ gia tử dƣơng “very” và gia tử âm “little ” tác
động lên các phần tử sinh “large” hoặc “small” nhƣ trên, thì (little) = α và
(very) = 1- α = β.
Nhƣ vậy ngữ nghĩa định lƣợng của các nhãn ngữ nghĩa sẽ chỉ phụ thuộc
vào các tham số của ĐSGT α, θ.
θ = 0.5, khi đó
đƣợc
trình bày ở chƣơng 1 nhƣ sau:
(3.1) ν(very small) = SA1 = 0.125
(3.2) ν(small) = SA2 = 0.25
(3.3) ν(little small) = SA3 = 0.375
(3.4) ν(midle) = SA4 = 0.5
(3.5) ν(little large) = SA5 = 0.625
(3.6) ν(large) = SA6 = 0.75
(3.7) ν(very large) = SA7 = 0.875
đây:
SA1 Biểu thức (3.8 : (1). Thứ tự ngữ nghĩa luôn đƣợc đảm bảo. (2). Các nhãn ngữ nghĩa Ai có giá trị ngữ nghĩa định lƣợng SAi(α, θ) và luôn có quan hệ ngữ nghĩa với nhau thông qua bộ tham số của ĐSGT α, θ. Nhƣ vậy, trong các ứng dụng cụ thể của tiếp cận ĐSGT, ảnh hƣởng của bộ tham số mang tính hệ thống. Có nghĩa là tất cả các giá trị ngôn ngữ trong biến ngôn ngữ đều chịu ảnh hƣởng bởi bộ tham sô của α θ (3.8). + Bƣớc 4: Xác định các quan hệ ngữ nghĩa theo nhãn ngữ nghĩa. Các quan hệ ngữ nghĩa đƣợc xác định trên cơ sở các dữ liệu lịch sử. Nếu đặt chuỗi thời gian mờ F(t-1) là Ak có ngữ nghĩa định lƣợng SAk và F(t) là Am có ngữ nghĩa định lƣợng SAm, thì Ak có quan hệ với Am và dẫn đến SAk có quan hệ với SAm. Quan hệ này đƣợc gọi là quan hệ ngữ nghĩa theo nhãn ngữ nghĩa và đƣợc ký hiệu là: (3.9) SAk SAm hoặc Semantization (Aj) Semantization (Ak) Trong bài toán dự báo số sinh nhập học tại trƣờng Alabama, ở đây Ak là nhãn ngữ nghĩa mô tả số sinh viên nhập học của năm hiện tại với ngữ nghĩa định lƣợng SAk, Am là nhãn ngữ nghĩa mô tả số sinh viên nhập học của năm tiếp theo với ngữ nghĩa định lƣợng SAm. Nhƣ vậy, trên cơ sở số liệu của Chen [3], có thể xác định đƣợc các quan hệ ngữ nghĩa theo nhãn ngữ nghĩa (kể cả số lần trùng nhau ) sau đây: SA1 → SA1 (trùng nhau 2 lần); SA1 → SA2; SA2 → SA3; SA3 → SA3 (trùng nhau 7 lần); SA3 → SA4 (trùng nhau 2 lần); SA4 → SA4 (trùng nhau 2 lần); (3.10) SA4 → SA3; SA4 → SA6; SA6 → SA6; SA6 → SA7; SA7 → SA7 SA7 → SA6 + Bƣớc 5. Tạo lập nhóm quan hệ ngữ nghĩa theo nhãn ngữ nghĩa. Nếu một ngữ nghĩa định lƣợng (vế trái (3.10)) có quan hệ với nhiều ngữ nghĩa định lƣợng (vế phải (3.10)), thì vế phải đƣợc chập lại thành một nhóm. Quan hệ đƣợc lập theo nhóm nhƣ vậy đƣợc gọi là nhóm quan hệ ngữ nghĩa (NQHNN). Nhƣ vậy từ (3.10) nhận đƣợc các NQHNN sau đây: Nhóm 1: SA1 → (SA1, SA1, SA2) Nhóm 2: SA2 → (SA3) Nhóm 3: SA3 → (SA3, SA3, SA3, SA3, SA3, SA3, SA3, SA4, SA4) Nhóm 4: SA4 → (SA4, SA4, SA3, SA6) Nhóm 5: SA6 → (SA6, SA7) Nhóm 6: SA7 → (SA7, SA6) + Giả sử số sinh viên nhập học tại năm (t - 1) của chuỗi thời gian mờ F(t- 1) đƣợc ngữ nghĩa hóa theo (3.9) là SAj, khi đó đầu ra dự báo của F(t) hay số sinh viên nhập học dự báo tại năm t đƣợc xác định theo các nguyên tắc (luật) sau đây: (1). Nếu tồn tại quan hệ 1-1 trong nhóm quan hệ ngữ nghĩa theo nhãn ngôn ngữ Aj nhƣ sau: (1.2b): DSAj SAj SAk, Desemantization (SAk) trên khoảng giải nghĩa uk [Dmin−D1, Dmax+D2]. , đầu ra dự bá (2). Nếu SAk là trống, SAj Desemantization ( (1.2b): DSAj gian mờ [Dmin−D1, Dmax+D2]. (3). Nếu tồn tại quan hệ 1-nhiều trong nhóm quan hệ ngữ nghĩa (kể cả quan hệ trùng) theo nhãn ngôn ngữ Aj: SAj (SAi, SAk,…, SAr), đầu (1.2b) cho từng dữ liệu lịch sử của nhóm quan hệ ngữ nghĩa: DSAj Desemantization (WSAiAj * SAi+ WSAkAj * i, uk… ur và thuộc khoảng xác định của tập nền chuỗi thời SAk+…+ WSArAj * SAr gian mờ [Dmin−D1, Dmax+D2]. Trong đó WSAiAj, WSAkAj…, WSArAj là trọng số ngữ nghĩa của từng thành phần trong NQHNN theo nhãn ngữ nghĩa Aj và đƣợc tính bằng tỷ số giữa số dữ liệu thuộc khoảng ui và tổng số dữ liệu thuộc các khoảng ui, uk,…, ur của NQHNN. Nhƣ vậy tính chuẩn hóa của các trọng số đƣợc đảm bảo: WSAiAj + WSAkAj +…+ WSArAj = 1. Tóm lại, thuật toán . Trong bài toán dự báo số sinh viên nhập học tại trƣờng đại học Alabama, có thể chọn các k (1.2b) với các giá trị đầu, giá trị cuối nhƣ trong Bảng 3.2 sau đây: Bảng 3.2 Giá trị đầu và giá trị cuối của các khoảng giải nghĩa được chọn Khoảng giải Giá trị Giá trị Khoảng giải Giá trị Giá trị nghĩa cho đầu cuối nghĩa cho các đầu cuối các điểm dự khoảng khoảng điểm dự báo khoảng khoảng báo 1 ( 1972 ) 13000 17000 12 ( 1983 ) 14000 18000 2 ( 1973 ) 18000 13 ( 1984 ) 14000 17000 13000 3 ( 1974 ) 13000 20000 14 ( 1985 ) 14000 17000 4 ( 1975 ) 15000 16000 15 ( 1986 ) 15000 18000 5 ( 1976 ) 14000 17000 16 ( 1987 ) 15000 19000 6 ( 1977 ) 14000 18000 17 ( 1988 ) 15000 20000 7 (1978 ) 15000 18000 18 ( 1989 ) 16000 20000 8 ( 1979 ) 15000 19000 19 ( 1990 ) 17000 20000 9 ( 1980 ) 15000 19000 20 ( 1991 ) 17000 20000 10 ( 1981 ) 14000 19000 21 ( 1992 ) 15000 20000 11 ( 1982 ) 13000 18000 Vấn đề dự báo tối ƣu chuỗi thời gian mờ theo nghĩa cực tiểu sai số trung bình bình phƣơng MSE có thể đƣợc thực hiện (1.1b) và phép giải n (1 . Chƣơng trình tính toán trên cơ sở sử dụng phần mềm tối ƣu hóa GA của MATLAB R2013a. Kết quả của Thuật toán ực tiểu hàm MSE đƣợc mô tả trong Bảng 3.3, trong đó MSE có dạng: SSVNHTT i là số sinh viên nhập học thực tế năm i; SSVNHDB i là số sinh viên nhập học dự báo năm i, i = 1 (1972), 2 (1973), …, 21 (1992). Bảng 3.3 Kết quả tính toán dự báo tối ưu số sinh viên nhập học tại trường đại học Alabama từ 1971 đến 1992 theo tiếp cận ĐSGT Số sinh Số sinh Số sinh Số sinh viên viên nhập Năm viên nhập Năm viển nhập nhập học học dự học thực tế học dự báo báo 1982 15610 15433 1971 13055 13820 1983 15599 15497 1972 13563 14025 1084 15199 15145 1973 13867 14436 1985 15199 15163 1974 14696 15374 1986 16199 15984 1975 15460 15199 1987 16599 16859 1976 15311 15599 1988 17610 18150 1977 15603 16199 1989 19069 18970 1978 15861 16599 1990 19301 19328 1979 16807 17088 1991 19301 19337 1980 16919 16610 1992 18836 18876 1981 16388 5 = 0.625 ) SA1 = 0.1815201791697217; SA2 = 0.3465991199102879; SA3 = 0.37415423402091175; SA4 = 0.6009736687271362; SA6 = 0.7547775046081667; SA7 = 0.7857793203108009 = 41874. 3.2. So sánh các kết quả của các Thuật toán dự báo chuỗi thời gian mờ. 6 bƣớc theo tiếp cận ĐSGT trên đây, xây dựng đƣợc Thuật toán dự báo cho năm 1971 1972 , 1972 1973, 1973 1974,….. , 1991 MATLAB R2013a ( ). Kết quả của Thuật toán dự báo sử dụng ĐSGT đƣợc mô tả trong Bảng 3.4. để so sánh với các kết quả của một số Thuật toán 7 khoảng chia. Lƣu ý rằng về nguyên tắc, độ chính xác của các phƣơng pháp dự báo chuỗi thời gian mờ theo tiếp cận của Song & Chisson, Chen và nhiều tác giả khác phụ thuộc rất nhiều vào quá trình mờ hóa chuỗi thời gian và giải mờ đầu ra dự báo và đặc biệt rất khó tối ƣu hóa đồng thời hai quá trình này. Trong khi đó, Thuật toán tính toán theo tiếp cận ĐSGT đảm bảo thứ tự ngữ nghĩa và đƣa ra cách chọn bộ tham số θ, α hợp lý hoặc dễ dàng định hƣớng đến tối ƣu để xây dựng dự báo dựa trên phép ngữ nghĩa hóa và phép giải nghĩa tuyến tính. Đây là tính chất rất quan trọng của tiếp cận ĐSGT và là cơ sở khoa học cho tính hiệu quả cao trong nhiều bài toán ứng dụng nói chung và bài toán dự báo chuỗi thời gian mờ nói riêng. Trong Bảng 3.4 So sánh kết quả dự báo theo tiếp cận ĐSGT với Thuật toán d [3] , Huarng [5] cùng sử dụng chuỗi thời gian mờ với 7 khoảng chia. Bảng 3.4: So sánh các phương pháp dự báo với 7 khoảng chia Số sinh Phƣơng Phƣơng Phƣơng Năm viên pháp pháp pháp nhập học Chen [4] Huarng [15] ĐSGT 1971 13055 1972 13563 14000 14000 13820 1973 13867 14000 14000 14025 1974 14696 14000 14000 14436 1975 15460 15500 15500 15374 1976 15311 16000 15500 15199 1977 15603 16000 16000 15599 1978 15861 16000 16000 16199 1979 16807 16000 16000 16599 1980 16919 16833 17500 17088 1981 16388 16833 16000 16610 1982 15433 16833 16000 15610 1983 15497 16000 16000 15599 1984 15145 16000 15500 15199 1985 15163 16000 16000 15199 1986 15984 16000 16000 16199 1987 16859 16000 16000 16599 17610 1988 18150 16833 17500 19069 1989 18970 19000 19000 19301 1990 19328 19000 19000 19301 1991 19337 19000 19500 18836 1992 18876 19000 19000 MSE 407507 226611 41874 3.3. Nhận xét chung Qua so sánh các thuật toán dự báo ứng dụng cho chuỗi dữ liệu lịch sử là số sinh viên nhập học tại trƣờng Đại học Alabama mà nhiều tác giả trên thế giới đang nghiê , thuật toán dự báo dựa trên ĐSGT là một thuật toán mới, hoàn toàn khác biệt, có khả năng dự báo chuỗi thời gian mờ với độ chính xác cao hơn so với một số thuật toán . Sự khác biệt thể hiện ở phƣơng pháp luận khi lần đầu tiên sử dụng phép ngữ nghĩa hóa thay cho phép mờ hóa, nhóm quan hệ ngữ nghĩa thay cho nhóm quan hệ mờ, phép giải nghĩa thay cho phép giải mờ u so với c Chen [3 cùng sử dụng 7 khoảng hiện có [ 5]. PHẦN 3: KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN Luận văn đƣa ra một số thông tin về chuỗi thời gian mờ và thuật toán xử lý chuỗi thời gian m tác giả xây dựng từ thế kỷ trƣớc áp dụng cho trƣờng Đại học Alabama từ năm 1971 đến năm 1992. Từ thuật toán đó tôi tiến hành nghiên cứu và xây dựng chƣơng trình dự báo chuỗi thời gian mờ dựa trên đại số gia tử với ngữ nghĩa . Với thuật toán trên tôi đã xây dựng chƣơng trình . Kết quả tính toán cho thấy mức độ phù hợp của dự báo so với số liệu thực tế. Chính vì vậy, thuật toán sử dụng chuỗi thời gian mờ đang đƣợc nhiều tác giả nghiên cứu có nhiều triển vọng ứng dụng trong công nghệ thông tin với những dữ liệu thực tế. Tuy nhiên vì điều kiện thời gian và trình độ còn hạn chế không thể tránh khỏi những thiếu sót trong quá trình xây dựng. nghiên cứu và trong nƣớc cũng nhƣ nhiều nƣớc với , môi trƣờng… để luận văn hoàn thiện và mang giá trị thực tiễn hơn nữa. TÀI LIỆU THAM KHẢO Tiếng việt [1] Nguyễn Công Điều: Một thuật toán mới cho Thuật toán chuỗi thời gian mờ. Tạp chí KHOA HỌC VÀ CÔNG NGHỆ, Tâp 49, Số 4, 2011, 11-25 [2] Nguyễn Duy Minh - Điều chỉnh ngữ nghĩa định lƣợng của giá trị ngôn ngữ trong đại số gia tử và ứng dụng, Tạp chí Khoa học và Công nghệ 49 (4) (2011) 27-40. Tiếng anh [3] Chen S.M.: Forecasting Enrollments Based on Fuzzy Time Series. Fuzzy Sets and Syst. 81, 311–319, 1996 [4] Dinko Vukadinović, Mateo Bašić, Cat Ho Nguyen, Nhu Lan Vu, Tien Duy Nguyen Hedge-Algebra-Based Voltage Controller for a Self- Excited Induction Generator, Control Engineering Practice, 30, 78–90, 2014. [5] Huarng, K. Heuristic Models of Fuzzy Time Series for Forecasting. Fuzzy Sets and Syst. 123, 369–386, 2001 [6] Hwang J.R. Chen, S.M, Lee, C.H, Handling Forecasting Problems using fuzzy time series Fuzzy Sets and Systems 100, 217 -228, 1988 [7] N.C Ho and W. Wechler, Hedge algebras: An algebraic approach to structures of sets of linguistic domains of linguistic truth variable, Fuzzy Sets and Systems, 35, 281-293, 1990 [8] N.C Ho and W. Wechler, Extended hedge algebras and their application to Fuzzy logic, Fuzzy Sets and Systems, 52, 259-281, 1992. [9] C.H. Nguyen, V.N. Huynh, W. Pedrycz, A Construction of Sound Semantic Linguistic Scales Using 4-Tuple Representation of Term Semantics, Int. J. Approx. Reason., DOI: 10.1016/j.ijar.2013.10.012 [10] Nguyen Cat Ho, Vu Nhu Lan, Le Xuan Viet, Optimal hedge- algebras-based controller: Design and Application, Fuzzy Sets and Systems 159 (2008) 968– 989. [11] Ho N. C., Lan V. N. - Hedge Algebras – An order – based structure of terms – domains: - An algebraic approach to human reasoning, Journal of Science and Technology 45 (6) (2009) 77-108. [12] Cat Ho, N. and H. Van Nam: An algebraic approach to linguistic hedges in Zadeh's fuzzy logic, Fuzzy Set and System, 129, 229-254, 2002. [13] Cong Nguyen Huu, Duy Nguyen Tien, Trung Ngo Kien, Ha Le Thi Thu, A Research on Parabolic Trough Solar Collector System Control based on Hedge Algebra, 11th International Conference on Control, Automation, Robotics and Vision, December, 715-720, 2010, Singapore. [14] Song Q, Chissom B.S. Fuzzy time series and its models. Fuzzy Sets and Syst. 54, 269–277, 1993. [15] Song Q, Chissom B.S: Forecasting enrollments with fuzzy time series – part 1. Fuzzy Sets and Syst. 54, 1–9, 1993. [16] Song Q, Chissom B.S.: Forecasting enrollments with fuzzy time series – part 2. Fuzzy Sets and Syst. 62, 1–8, 1994. function [y] = OHAP_6tuyentinhNNDLNGANsuaKXD(x) format long SV22=[13055;13563;13867;14696;15460;15311;15603;1586 1;16807;16919;16388;15433;15497;15145;15163;15984;16 859;18150;18970;19328;19337;18876] SV21=[13563;13867;14696;15460;15311;15603;15861;1680 7;16919;16388; 15433;15497;15145;15163;15984;16859;18150;18970;1932 8;19337;18876] xgmin=13000 xgmax=20000 WSA1A1=3/7 WSA2A1=1/7 WSA3A2=1 WSA3A3=9/71 WSA4A3=4/71 WSA4A4=4/20 WSA3A4=9/20 WSA6A4=3/20 WSA6A6=3/5 WSA7A6=2/5 WSA7A7=2/5 SA1=x(1) SA2=x(2) SA3=x(3) SA4=x(4) SA5=0.625 SA6=x(5) SA7=x(6) SP(1)=WSA1A1*SA1*2+WSA2A1*SA2 SP(2)=SP(1) SP(3)=SP(1) SP(4)=WSA3A2*SA3 SP(5)=WSA3A3*SA3*7+WSA4A3*SA4*2 SP(6)=SP(5) SP(7)=SP(5) SP(12)=SP(5) SP(13)=SP(5) SP(14)=SP(5) SP(15)=SP(5) SP(8)=SP(5) SP(16)=SP(5) SP(9)=WSA4A4*SA4*2+WSA3A4*SA3+WSA6A4*SA6 SP(11)=SP(9) SP(17)=SP(9) SP(18)=WSA6A6*SA6+WSA7A6*SA7 SP(20)=WSA6A7*SA6+WSA7A7*SA7 SP(21)=SP(20) xmin(1)=13000 xmax(1)=17000 xmin(2)=13000 xmax(2)=18000 xmin(3)=13000 xmax(3)=20000 xmin(4)=15000 xmax(4)=16000 xmin(5)=14000 xmax(5)=17000 xmin(6)=14000 xmax(6)=18000 xmin(7)=15000 xmax(7)=18000 xmin(8)=15000 xmax(8)=19000 xmin(9)=15000 xmax(9)=19000 xmin(10)=14000 xmax(10)=19000 xmin(11)=13000 xmax(11)=18000 xmin(12)=14000 xmin(13)=14000 xmax(13)=17000 xmin(14)=14000 xmax(14)=17000 xmin(15)=15000 xmax(15)=18000 xmin(16)=15000 xmax(16)=19000 xmin(17)=15000 xmax(17)=20000 xmin(18)=16000 xmax(18)=20000 xmin(19)=17000 xmax(19)=20000 xmin(20)=17000 xmax(20)=20000 xmin(21)=15000 xmax(21)=20000 SPP=0 DPP=0 for i=1:21, DeSP(i)=(SPP*SP(i)*(1-SP(i))+SP(i))*(xmax(i)- xmin(i))+xmin(i); DDeSP(i)=DPP*(DeSP(i)-xmin(i))*(xmax(i)- DeSP(i))/(xmax(i)-xmin(i))+DeSP(i); lb=[0/7;1/7;2/7;3/7;5/7;11/14]; ub=[3/14;5/14;7/14;9/14;13/14;14/14]; DP=[1;2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19; 20;21]; SAISO=SV21-DDeSP' SAISOBINHPHUONG=[SAISO(1)^2;SAISO(2)^2;SAISO(3)^2;SA ISO(4)^2;SAISO(5)^2;SAISO(6)^2;SAISO(7)^2;SAISO(8)^2 ;SAISO(9)^2;SAISO(10)^2;SAISO(11)^2;SAISO(12)^2;SAIS O(13)^2;SAISO(14)^2;SAISO(15)^2;SAISO(16)^2;SAISO(17 )^2; SAISO(18)^2;SAISO(19)^2;SAISO(20)^2;SAISO(21)^2] T=sum(SAISOBINHPHUONG) MSE=T/21 y=MSE BANG=[SV21 DP DDeSP' SAISOBINHPHUONG]http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
51
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
52
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
53
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
54
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
55
Ở đây: MSE (Mean Square Error) là sai số trung bình bình phƣơng;
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
56
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
57
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
58
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
59
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
60
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
61
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
62
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
63
WSA6A7=3/5
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
64
SP(19)=SP(18)
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
65
xmax(12)=18000
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN
66
end
http://www.lrc.tnu.edu.vn
Số hóa bởi Trung tâm Học liệu – ĐHTN