B Ộ GIÁO DỤC VÀ ĐÀO TẠO B Ộ QUỐC PHÒNG
HỌC VIỆN K Ỹ THUẬT QUÂN SỰ
Ễ Ớ NGUY N ĐÌNH GI I
Ứ Ự Ậ Ạ Ế Ị
Ệ Ợ Ự Ệ Ố NGHIÊN C U, XÂY D NG H TH NG L P K HO CH DU L CH D A TRÊN H G I Ý
LU NẬ VĂN TH CẠ SĨ
ọ Chuyên ngành: Khoa h c máy tính
Hà N iộ Năm 2016
B Ộ GIÁO DỤC VÀ ĐÀO TẠO B Ộ QUỐC PHÒNG
HỌC VIỆN K Ỹ THUẬT QUÂN SỰ
Ễ Ớ NGUY N ĐÌNH GI I
Ứ Ự Ậ Ạ Ế Ị
Ệ Ợ Ự Ệ Ố NGHIÊN C U, XÂY D NG H TH NG L P K HO CH DU L CH D A TRÊN H G I Ý
ọ Chuyên ngành: Khoa h c máy tính
ố Mã s : 60480101
CÁN BỘ HƯ NGỚ D NẪ KHOA H CỌ
ị ề Cán bộ hư ngớ d nẫ chính: TS. Nguy nễ Th Hi n
Hà N iộ Năm 2016
ƯỢ CÔNG TRÌNH Đ Ạ C HOÀN THÀNH T I
Ọ Ậ Ỹ Ệ Ự H C VI N K THU T QUÂN S
ộ ấ ệ ả Cán b ch m ph n bi n 1:
ộ ấ ệ ả Cán b ch m ph n bi n 2:
ạ ậ ượ ả ệ ạ Lu n văn th c sĩ đ c b o v t i:
Ộ Ồ Ấ Ậ Ạ H I Đ NG CH M LU N VĂN TH C SĨ
Ọ Ậ Ệ Ỹ Ự H C VI N K THU T QUÂN S
Ngày…tháng…năm 2016
C NGỘ HÒA XÃ H IỘ CHỦ NGHĨA VI TỆ NAM
Đ cộ l pậ – Tự do – H nhạ phúc
B NẢ XÁC NH NẬ CH NHỈ S AỬ LU NẬ VĂN TH CẠ SĨ
ễ Họ và tên tác giả lu nậ văn: Nguy n Đình Gi ớ i
ế ạ ệ ố ứ ự ậ Đề tài lu nậ văn: Nghiên c u, xây d ng h th ng l p k ho ch du
ệ ợ ự ị l ch d a trên h g i ý
ọ Chuyên ngành: Khoa h c máy tính
Mã số: 60480101
ộ ướ Cán b h ng d n: ị ề ễ ẫ TS. Nguy n Th Hi n
Tác giả, cán bộ hư ngớ d nẫ khoa h cọ và H iộ đ ngồ ch mấ lu nậ văn xác
nh nậ tác giả đã s aử ch aữ , bổ sung lu nậ văn theo biên b nả h pọ H iộ đ ngồ
ư ớ ộ ngày ..............................................v i các n i dung nh sau:
Ngày ..... tháng .... năm 2016
ộ ướ ẫ ả ậ Cán b h ng d n Tác gi lu n văn
ị ề ễ ễ Nguy n Th Hi n Nguy n Đình Gi ớ i
Ộ Ồ Ủ Ị Ư Ặ CH T CH HO C TH KÝ H I Đ NG
Tôi xin cam đoan:
Nh ngữ k tế quả nghiên c uứ đư cợ trình bày trong lu nậ văn là hoàn toàn
trung th cự , c aủ tôi, không vi ph mạ b tấ cứ đi uề gì trong lu tậ sở h uữ trí tuệ
và pháp lu tậ Vi tệ Nam. N uế sai, tôi hoàn toàn ch uị trách nhi mệ trư cớ pháp
lu tậ .
TÁC GIẢ LU NẬ VĂN
ớ ễ Nguy n Đình Gi i
Ụ Ụ M C L C
Trang
Trang phụ bìa:.....................................................................................................
B nả xác nh nậ ch nhỉ s aử lu nậ
văn:.......................................................................
B nả cam
đoan: ....................................................................................................
M cụ
l cụ :...............................................................................................................
ắ Tóm t ậ t lu n
văn:.................................................................................................
ữ ế ụ Danh m c ch vi t
t tắ ........................................................................................
ụ ả Danh m c b ng
bi uể ............................................................................................
Danh ụ m c hình
vẽ...............................................................................................
Ắ Ậ TÓM T T LU N VĂN
ễ ọ ọ + H và tên h c viên: Nguy n Đình Gi ớ i
ọ + Chuyên ngành: Khoa h c máy tính Khoá: 2014 2016
ộ ướ ễ ẫ ị + Cán b h ề ng d n: TS. Nguy n Th Hi n
ề ệ ố ự ự ứ ế ậ ạ ị + Tên đ tài: Nghiên c u, xây d ng h th ng l p k ho ch du l ch d a trên
ệ ợ h g i ý.
ắ ả ụ ể ậ ổ + Tóm t t: Nghiên c u ứ gi i thu t CBR đ áp d ng vào c ng thông tin du
ằ ườ ữ ế ấ ợ ợ ị l ch nh m g i ý cho ng ị i dùng nh ng tour du l ch h p lý nh t. K t qu ả
ượ ư ố ợ g i ý đ c đ a ra khá t t.
Ữ Ế Ụ Ắ Ả B NG DANH M C CH VI T T T
ữ Ký hi uệ Thu t ngậ
CBR Case –Based Reasoning
Ụ Ả Ể DANH M C B NG BI U
ả ̉ Bang 1. B ng d li u ữ ệ Khách s nạ
̉ Bang ả 2. B ng d ữ liệu thắng cảnh
ữ ệ ể ả ạ ị ̉ ặ Bang 3. B ng d li u đ c đi m, lo i hình du l ch
ả ố ̉ ữ ệ Bang 4. B ng d li u các thành ph
ế ể ả ̉ ữ ệ Bang 5. B ng d li u các đi m đ n
ữ ệ ự ệ ả ̉ Bang 6. B ng d li u s ki n, l ễ ộ h i
ữ ệ ơ ở ậ ả ̉ ấ Bang 7. B ng d li u c s v t ch t
ữ ệ ả ạ ̉ Bang 8. B ng d li u giá phòng các khách s n
ạ ả ữ ệ ả ẩ ̉ Bang 9. B ng d li u các lo i s n ph m
ữ ệ ả ̉ ự Bang 10. B ng d li u các khu v c
ả ạ ̉ ữ ệ Bang 11. B ng d li u các lo i phòng
ữ ệ ụ ủ ả ạ ị ̉ Bang 12. B ng d li u các d ch v c a khách s n
ả ̉ Bang 1 3. B ng d li u ữ ệ case base
ầ ủ ữ ệ ể ả ố ̉ Bang 14. B ng d li u đi m s các thành ph n c a case
ớ ̉ Bang 15. L p SimilityObject
ớ ̉ Bang 16. L p BaseConstraint
̉ ớ Bang 17. L p Location
ớ ̉ Bang 18. L p Accommodation
ớ ̉ Bang 19. L p TravelInformation
ớ ̉ Bang 20. L p Case
ớ ̉ Bang 21. L p CBRConfig
̉ ớ Bang 22. L p DBAdapter
ớ ̉ Bang 23. L p CBR
Ẽ Ụ DANH M C HÌNH V
̀ ọ ề Hinh 1.1. Minh h a v Collaborative filtering
̀ ả Hinh 1.2. Qui trình gi ậ i thu t CBR
Hinh ̀ 2.1. Mô hình logic CBR
ọ ộ Hinh ̀ 2.2. Minh h a m t case
ụ ả ế ắ ẩ Hinh ̀ 2.3. S p x p danh m c s n ph m
ế ể ế ắ Hình 2.4. S p x p đi m đ n
ế ố ươ ự Hình 2.5. Quá trình tìm ki m tình hu ng tour t ng t
ầ ợ Hinh ̀ 2.6. Qui trình g i ý các thành ph n tour
Hinh ̀ 3.1. Classes Diagram
ệ ủ ệ ố Hinh ̀ 3.2. Qui trình làm vi c c a h th ng
ự ợ Hinh ̀ 4.1. Các g i ý ban đ u cho khách l a ch n ọ ầ
Hinh ̀ 4.2. Khi đã hoàn thành các g i ýợ
14
M Đ UỞ Ầ
ấ ế ủ ề 1. Tính c p thi t c a đ tài
ệ ữ ể ế ấ ẫ ấ ộ Vi t Nam là m t trong nh ng đi m đ n h p d n và an toàn nh t th ế
ớ ặ ớ ả ố ữ ầ ặ ộ gi ủ i. Trong nh ng năm g n đây, m c dù ph i đ i m t v i cu c kh ng
ả ế ộ ố ộ ầ ẫ ớ ị ho ng kinh t toàn c u, GDP ngành Du L ch v n tăng v i m t t c đ đáng
ị ướ ả ẩ ổ ố ể n và du l ch c tính đã đóng góp 13,1% cho t ng s n ph m qu c dân
(GDP).
ị ệ ượ ụ ẽ ơ ẽ ạ Ngành du l ch Vi t Nam đ ữ ể c d báo s phát tri n m nh m h n n a
ươ ư ẫ ế ế ợ trong t ng khi mà chúng ta v n ch a bi t cách khai thác h t l ế ố i th v n có
ủ ấ ướ ừ ể ạ "r ng vàng, bi n b c" c a đ t n ộ c. Và m t th c t ự ế ẫ ồ ạ ạ ầ i h u v n t n t i, t
ữ ị ề ắ ắ ế h t nh ng khu du l ch l ố ư i t ứ duy bóc ng n c n dài đã ăn sâu vào ti m th c
ườ ế ế ẫ ọ ữ ủ c a nh ng ng ệ i làm kinh doanh d n đ n vi c thi u tôn tr ng du khách,
ợ ụ ờ ơ ơ ộ ể ừ ể ặ ị l i d ng th i c c h i đ ch t chém l a b p du khách đ nhanh chóng
ợ ể ậ ộ ạ ể ế ờ ế ki m l i nhu n trong m t mùa nào đó đ bù l i th i đi m khách trong
ở ự ủ ữ ề ể ả năm. Chính nh ng đi u đó đã và đang c n tr s phát tri n c a ngành du
ướ ị l ch n c nhà.
ứ ướ ự ề ề ấ ọ Đ ng tr c v n đ đó, tôi đã l a ch n đ tài ự ứ “Nghiên c u, xây d ng
ệ ợ ự ế ậ ạ ị ề ậ ệ ố h th ng l p k ho ch du l ch d a trên h g i ý” làm đ tài lu n văn t ố t
ệ ạ ỹ ủ nghi p th c s c a mình.
ủ ề ụ 2. M c tiêu c a đ tài
ậ ỹ ệ ợ ự ể ậ ỹ Tìm hi u k thu t k thu t xây d ng h g i ý
ự ổ ị Xây d ng c ng thông tin du l ch
ậ ợ ợ ổ ỹ ị Tích h p k thu t g i ý vào c ng thông tin du l ch
ố ượ ứ ạ 3. Đ i t ng và ph m vi nghiên c u
ố ượ ứ ả Đ i t ng nghiên c u: Gi ậ i thu t CBR
15
ứ ạ Ph m vi nghiên c u:
ứ ộ 4. N i dung nghiên c u
ươ Ợ Ố Ệ Ả Ch ng 1. H TH NG G I Ý VÀ GI Ậ I THU T CBR
ớ ệ ợ 1.1. Gi ệ ố i thi u h th ng g i ý
ả 1.2. Gi ậ i thu t CBR
ƯƠ Ị CH Ợ NG 2: BÀI TOÁN G I Ý TOUR DU L CH
ứ 2.1. Mô hình lôgic và các hàm ch c năng
ễ ể ầ 2.2. Bi u di n thành ph n tour
ươ Ế Ệ Ố Ổ Ế Ị Ch ng 3. PHÂN TÍCH THI T K H TH NG C NG THÔNG TIN DU L CH
3.1. Thi ế ế ơ ở ữ ệ t k c s d li u
3.2. Thi ế ế ươ t k ch ng trình
ươ Ự Ố Ệ Ch ng 4. XÂY D NG H TH NG
ệ ố ự 4.1. Xây d ng h th ng
ả ự ệ ế 4.2. K t qu th c hi n
Ế ƯỚ Ở Ộ Ậ K T LU N VÀ H NG M R NG
16
ươ Ệ Ố Ợ Ả Ậ Ch ng 1. H TH NG G I Ý VÀ GI I THU T CBR
ớ
ợ
ệ
1.1. Gi
ệ ố i thi u h th ng g i ý
1.1.1. H ệ th ng ố
g i ýợ ợ ộ ệ ố ệ ố ư ự ả H th ng g i ý [1] là m t h th ng có kh năng d đoán và đ a ra s ự
ộ ớ ườ ử ụ ệ ư ự ợ ế ợ g i ý cho m t items t i ng i s d ng. S g i ý liên quan đ n vi c đ a ra
ế ị ủ ườ ư ể ẳ ạ ả ẩ quy t đ nh c a ng ọ i dùng, ch ng h n nh ch n s n ph m nào đ mua,
ể ể ọ ị ị ọ ch n nghe bài hát nào hay ch n đ a đi m nào đ đi du l ch…
ấ ứ ộ ố ượ ử ụ ữ ệ ậ ể ạ Thu t ng “Items” s d ng đ đ i di n cho b t c m t đ i t ng,
ệ ố ợ ườ ộ n i dung nào mà h th ng g i ý cho ng i dùng.
ụ ươ ệ ử ọ ậ ụ ự ứ Các lĩnh v c ng d ng: Th ạ ng m i đi n t , Giáo d c, H c t p, Gi ả i
ạ ộ trí, M ng xã h i…
ệ ố ể Các h th ng đi n hình: Amazon.com, Pandora Radio, Netflix…
17
ươ ề ợ ố 1.2.2. Các ph ng pháp g i ý truy n th ng
ọ ộ 1.1.2.1. L c c ng tác (Collaborative filtering)
ươ ượ ự ự ệ ệ ậ Đây là ph ng pháp đ c th c hi n d a trên vi c thu th p và phân
ộ ượ ữ ề ớ ở tích m t l ủ ng l n nh ng thông tin v thói quen, hành vi hay s thích c a
ườ ừ ự ườ ả ng i dùng và t ữ đó d đoán nh ng item mà ng i dùng có kh năng hài
ọ ớ ủ ữ ệ ườ ự ố lòng thông qua vi c so sánh s gi ng nhau c a h v i nh ng ng i dùng
ủ ể ươ ọ ộ ạ khác. Đi m m nh chính c a ph ng pháp l c c ng tác (collaborative
ự ự ụ ả ộ ộ filtering) [1] đó là nó không th c s ph thu c vào kh năng phân tích n i
ủ ươ ả ộ ợ dung c a máy tính và do đó, ph ng pháp này có kh năng g i ý m t cách
ư ệ ố ứ ạ ữ ể ạ ẳ chính xác nh ng item ph c t p. Ch ng h n nh h th ng có th xem xét
ộ ộ ề ộ ủ ể ầ ộ m t b phim mà không c n “hi u” v n i dung c a b phim đó. Có khá
ề ượ ử ụ ể ườ ộ ươ ự ữ ậ nhi u thu t toán đã đ c s d ng đ đo l ng đ t ng t ữ gi a nh ng
ườ ặ ữ ộ ệ ố ợ ớ ng i dùng ho c gi ể các item v i nhau trong m t h th ng g i ý. Đi n
ư hình nh : knearest neighborhood (kNN) và Pearson Correlation.
18
ẫ ừ ồ ơ ủ ự ệ ườ ộ Vi c xây d ng m t mô hình m u t h s c a ng i dùng th ườ ng
ượ ự ữ ệ ươ ữ ệ ườ ậ đ c th c hi n gi a hai ph ng pháp thu th p d li u t ng mình và
ườ không t ng minh.
ậ ữ ệ ườ ụ ề ệ ộ M t vài ví d v vi c thu th p d li u t ng minh:
ầ ườ ể ầ ọ ộ ộ Yêu c u ng i dùng b u ch n m t item theo m t thang đi m nào đó
ầ ườ ế ạ ộ ộ Yêu c u ng ặ i dùng x p h ng m t ho c m t nhóm các item mà
ườ ng ấ i đó yêu thích nh t
ư ườ ử ụ ầ ọ ọ ộ Đ a ra cho ng i s d ng hai item, yêu c u h ch n m t item t ố t
h nơ
ầ ườ ụ ụ ả ủ ạ ẩ Yêu c u ng i d ng t o ra danh m c s n ph m yêu thích c a riêng
họ
ậ ữ ệ ụ ề ệ ộ ườ M t vài ví d v vi c thu th p d li u không t ng minh:
ườ ữ Theo dõi nh ng item mà ng i dùng đã xem
ườ ộ ờ Phân tích th i gian mà ng i dùng xem m t item
ữ ữ ề ả ẩ ườ ư L u gi thông tin v nh ng s n ph m mà ng ự i dùng đã mua tr c
tuy nế
ữ ậ ườ Thu th p danh sách nh ng item mà ng i dùng đã xem trên máy tính
c a hủ ọ
ườ ộ ể ế ọ Phân tích ng ạ i dùng trên m ng xã h i đ bi t h thích, không thích
ề đi u gì
ượ Nh ể c đi m:
ụ ề ộ ượ ớ ừ ườ Ph thu c nhi u vào l ng l n thông tin t phía ng i dùng, khó khăn
ộ ệ ố ữ ặ ớ ớ ớ ớ v i m t h th ng m i, g p khó khăn v i nh ng item m i
ọ ự ộ 1.1.2.2. L c d a trên n i dung (Contentbased filtering)
ọ ự ộ ươ L c d a trên n i dung (Contentbased filtering) [1] là ph ự ng pháp d a
ữ ủ ể ặ ậ trên nh ng đ c đi m c a chính item. Nói cách khác, thu t toán cho ph ươ ng
19
ố ắ ữ ữ ữ ể ợ ố ớ pháp này c g ng g i ý nh ng item có nh ng đi m gi ng v i nh ng item
ườ ứ ừ ượ ề ấ mà ng i dùng đã t ng quan tâm trong quá kh . Item đ c đ xu t là
ữ ượ ớ ộ ươ ọ ệ ồ ớ nh ng item đ c ch n ra v i đ t ấ ằ ng đ ng l n nh t b ng vi c so sánh
ữ ượ ườ ế ướ ớ v i nh ng item đã đ c ng ạ i dùng x p h ng, đánh giá tr c đó.
ề ơ ả ươ ộ ồ ơ ử ụ ể ặ V c b n, ph ng pháp này s d ng m t h s các đ c đi m v ề
ộ ở ộ ồ ơ ủ ệ ố ệ ố ạ ườ m t item bên trong h th ng. H th ng t o m t h s c a ng i dùng
ộ ơ ọ ỗ ọ ố ể ủ ố ộ ự d a trên m t véct tr ng s các thu c tính c a item. M i tr ng s bi u th ị
ủ ứ ộ ọ ỗ ộ ươ ố ớ ứ cho m c đ quan tr ng c a m i thu c tính t ng ng đ i v i ng ườ ử i s
ể ượ ừ ơ ế ạ ằ ộ ụ d ng và có th đ c tính toán t véct ề x p h ng n i dung b ng nhi u
ệ công ngh khác nhau.
ươ ử ụ ế ậ ả ơ ị Ph ấ ng pháp ti p c n đ n gi n nh t là s d ng giá tr trung bình t ừ
ơ ế ộ ố ạ ạ ươ ứ ạ ứ véct x p h ng item. Bên c nh đó có m t s ph ơ ng th c ph c t p h n
ậ ọ ư ẳ ỹ ạ ử ụ s d ng k thu t h c máy ch ng h n nh Bayesian Classifiers, Cluster
Analysis, Decision Trees và Artificial Neural Networks đ ể ướ ượ c l ng xác
ấ ườ ự ả ả ộ xu t mà ng ồ ự i dùng có kh năng thích m t item nào đó. S ph n h i tr c
ế ừ ườ ườ ti p t ng i dùng (th ng là nút like, dislike) cũng có th đ ể ượ ử ụ c s d ng
ế ặ ấ ị ữ ọ ố ộ ể đ gán thi ữ t đ t nh ng tr ng s cho nh ng thu c tính nh t đ nh (using
Rocchio Classification or other similar techniques)
ượ ủ ọ ự ệ ằ ể Nh ệ ố ộ c đi m chính c a l c d a trên n i dung đó là li u r ng h th ng
ữ ả ọ ở ừ ữ ủ ườ có kh năng h c nh ng s thích t ạ ộ nh ng ho t đ ng c a ng i dùng liên
ữ ế ể ộ ồ ộ ộ ử ụ quan đ n m t ngu n n i dung và s d ng chúng cho nh ng ki u n i dung
ệ ố ị ớ ạ ệ ạ ở ợ ộ khác. Khi h th ng b gi i h n b i vi c g i ý các n i dung cùng lo i mà
ườ ử ụ ả ẩ ợ ừ ệ ố ể ng i dùng đã s d ng, các s n ph m g i ý t ơ h th ng có th ít h n
ề ể ớ ộ ừ ữ ụ ị nhi u so v i các ki u n i dung t nh ng d ch v khác.
20
ả
1.2. Gi
ậ i thu t CBR
ệ 1.2.1. Khái ni m CBR
ể ượ CBR (Case –Based Reasoning) [2, 3] có th đ ư ộ ệ ứ c coi nh m t h th c
ươ ạ ộ ử ụ ự ữ ậ ph ệ ự ng pháp lu n ho t đ ng d a trên s tái s d ng nh ng kinh nghi m,
ượ ư ộ ạ ố đ c mô hình hóa nh m t tình hu ng (case). Bên c nh đó, CBR có th ể
ượ ư ộ ứ ể ậ ậ đ c hi u nh m t mô hình b c cao mô hình hóa quá trình nh n th c, hay
ộ ạ ể ả ứ ế ộ ả m t d ng th c tính toán đ gi i quy t m t bài toán phát sinh. Gi ậ i thu t
ệ ư ấ ụ ượ ậ ủ ế ể CBR áp d ng trong h t v n đ c t p trung ch y u theo cách hi u th ứ
ư ẳ ị ượ hai. Trong đó, nh Amoodt và Plaza [3] đã kh ng đ nh, CBR đ c coi nh ư
ộ ờ ả ộ ấ ử ụ ề ộ m t qui trình tìm l i gi ồ i cho m t v n đ , qui trình này s d ng m t ngu n
ứ ụ ể ượ ố ị ữ ậ ố tri th c c th đ c thu th p qua nh ng tình hu ng c đ nh đã phát sinh.
ữ ề ố ớ ươ ậ ố ị Đi u này đ i ngh ch v i nh ng ph ỉ ự ề ng pháp lu n truy n th ng ch d a
ề ộ ấ ị ữ ứ ề ề ấ ồ ổ ộ trên nh ng ngu n tri th c ph quát thu c v m t mi n v n đ nh t đ nh.
ữ ứ ượ ể ệ ử ụ ằ ộ Nh ng tri th c này đ ữ c th hi n b ng cách s d ng m t trong nh ng
ữ ể ứ ư ữ ễ ắ ạ ngôn ng bi u di n tri th c nh nh ng qui t c, d ng logic (firstorder
ữ ạ logic), hay các m ng ng nghĩa (semantic networks),..
ả
1.2.2. Gi ể ể ả ậ ề ậ ấ ố ậ i thu t CBR ụ Đ có th áp d ng qui trình gi i l p lu n tình hu ng CBR, v n đ căn
ệ ử ụ ữ ế ầ ả ả b n đ u tiên liên quan đ n vi c s d ng ngôn ng mô t ố tình hu ng (case
ử ụ ủ ữ ệ ạ representation language) và ph m vi s d ng c a nh ng khái ni m trong mô
ả ộ ứ ụ ữ ệ ệ ấ ố t tình hu ng. Nh ng khái ni m xu t hi n trong m t ng d ng CBR bao
ấ ộ ố ợ ả ộ ố ồ g m n i dung tình hu ng, c u trúc thích h p mô t m t tình hu ng, cách
ứ ề ứ ắ ế ễ ộ ố th c s p x p các tri th c v tình hu ng đã di n ra. Trong đó, n i dung tình
ự ụ ễ ố ộ ố ộ ố hu ng ph thu c vào lĩnh v c mà tình hu ng đó di n ra. M t tình hu ng có
ể ượ ử ụ ể ễ ằ ơ ặ ể th đ c bi u di n b ng cách s d ng véct ế đ c đi m tuy n tính (linear
21
ả ấ ố featured vector), văn b n bán c u trúc (semistructured text), hay các đ i
ượ ứ ạ ư ồ ố ượ ấ ẫ ị t ng có c u trúc ph c t p nh đ th (graph), m u đ i t ng (object
ữ ướ ố ượ pattern) trong ngôn ng h ng đ i t ng.
ươ ơ ặ ể ộ Trong ph ử ụ ng pháp s d ng véct ế đ c đi m tuy n tính, m t tình
ượ ả ư ộ ố ị ữ ể ặ ố hu ng đ c mô t ồ nh m t danh sách c đ nh nh ng đ c đi m không đ ng
ố ự ữ ấ ỗ ồ nh t (heterogeneous features) bao g m nh ng chu i (string), s th c, s ố
ề ơ ả ươ ả ố ớ nguyên, Boolean,.. V c b n, ph ng pháp mô t tình hu ng v i véct ơ
ế ượ ắ ồ ừ ươ ọ tuy n tính đ c b t ngu n t các ph ng pháp h c máy (machine learning)
ậ ạ ẫ ượ ị hay nh n d ng m u (pattern recognition), và đ ư ộ c đ nh nghĩa nh m t
ươ ớ ph ạ ng pháp sao chép (exemplar), ánh x (instance) hay ghi nh (memory).
ố ớ ữ ươ ả ế ấ ề Đ i v i nh ng ph ng pháp này, quá trình gi i quy t v n đ có th đ ể ượ c
ư ộ ụ ạ ộ ỏ coi nh m t bài toán phân lo i (classification) hay m t tác v ph ng đoán
ứ ươ ứ ch c năng (function approximation). Trong ph ng pháp th hai, thông tin
ủ ố ượ ể ễ ướ ạ ả ộ ầ đ u vào c a m t tình hu ng đ c bi u di n d ả i d ng văn b n. B n thân
ữ ệ ử ụ ữ ề ả ầ ả nh ng d li u văn b n đ u vào đã tr i qua quá trình ti n x lý. Ví d , quá
ỉ ụ ự ử ề ể ệ ồ trình ti n x lý có th bao g m vi c xây d ng ch m c (index), thông tin
ữ ệ ượ ữ ệ siêu d li u (metadata), tóm l ắ ả c cho d li u văn b n. Quá trình này g n
ớ ươ ữ ệ ậ ế k t CBR v i các ph ng pháp thu th p d li u (information retrieval).
ươ ự ế ợ ể ố ộ Trong ph ữ ố ng pháp cu i cùng, m t tình hu ng có th là s k t h p gi a
ả ả ớ ả ơ mô t văn b n (textbased) v i mô t véct (vectorbased representation)
ể ượ ặ ữ ệ ồ ị ữ ể ễ ằ ho c có th đ c bi u di n b ng nh ng mô hình d li u đ th . Ph ươ ng
ườ ượ ử ụ ườ ấ ợ pháp này th ng đ c s d ng trong tr ố ng h p tình hu ng có c u trúc
ứ ạ ữ ề ấ ồ ầ ph c t p, bao g m nhi u thành ph n phân c p (hierarchy). Nh ng tình
ệ ấ ố ư ấ ể ượ ị ư ữ hu ng xu t hi n trong t v n tour du l ch có th đ c coi nh nh ng tình
ứ ạ ớ ự ủ ệ ề ấ ấ ầ ố ạ hu ng có c u trúc ph c t p v i s xu t hi n c a nhi u thành ph n d ng
ư ị ỗ ở ể ự ệ cây nh đ a đi m (location), ch ạ (accomodation), s ki n (event), ho t
22
ề ể ấ ộ ố ễ ộ đ ng (activity),.. V n đ bi u di n m t tình hu ng tour c th s đ ụ ể ẽ ượ ề c đ
ế ủ ụ ươ ệ ử ụ ớ ậ c p chi ti t trong m c 2.2.1 c a ch ng 2 v i vi c s d ng XML là ngôn
ữ ệ ữ ng mô hình hóa d li u chính.
ạ ộ ố ườ ầ ồ Tóm l i, m t tình hu ng th ng bao g m ba thành ph n chính: Mô t ả
ề ả ế ả ấ v n đ (problem description), gi i pháp (solution) và k t qu (outcome).
ứ ấ ữ ầ ầ ế ả ộ ứ ự Thành ph n th nh t ch a đ ng nh ng thông tin c n thi t miêu t m t tình
ố ả ữ ệ ử ụ ể ả ị hu ng phát sinh, mô t ủ này bi u th kh năng tái s d ng d li u c a
ể ả ữ ả ố ế ấ ề ớ ế nh ng tình hu ng đã x y ra đ gi i quy t v n đ m i. N u coi quá trình
ờ ả ư ộ ề ớ ộ ố ướ tìm l i gi ấ i cho m t tình hu ng v n đ m i nh m t hàm c đoán thì
ầ ả ữ ệ ượ ư ủ ề ph n mô t d li u đ ị c xem nh mi n xác đ nh c a hàm, trong khi gi ả i
ề ế ả ị ồ pháp và k t qu xác đ nh các mi n gi ớ ạ ươ i h n t ng đ ng (codomain). Gi ả i
ị ượ ầ ế ấ ụ ề ể pháp bi u th l ng thông tin c n thi ế ể ả t đ gi i quy t v n đ , ví d nh ư
ộ ế ể ư ự ể ể ế ạ ợ ị xây d ng m t k ho ch h p lý đ có th đ a du khách đ n đ a đi m đúng
ả ượ ể ế ờ ố ư ộ ế ổ th i đi m. Cu i cùng, k t qu đ c coi nh m t đánh giá t ng k t m c đ ứ ộ
ủ ả ượ ả ế ấ ề ữ h u ích c a gi i pháp đ ụ c áp d ng gi i quy t v n đ phát sinh. Trong
ườ ả ệ ư ấ ủ ậ ị ượ tr ợ ng h p gi i thu t CBR c a h t v n du l ch đ c trình bày trong
ươ ẽ ượ ố ả ớ ữ ầ ch ng này, tình hu ng tour s đ c mô t ứ v i nh ng thành ph n ph c
ự ồ ớ ệ ữ ữ ạ t p, đ ng nghĩa v i không có s khác bi ầ t rõ ràng gi a nh ng thành ph n
ả ấ ề ớ ị ả ữ ể ầ mô t v n đ v i nh ng thành ph n bi u th gi i pháp. Trong quá trình x ử
ả ả ế ấ ề ế ể ế lý, gi i pháp gi ợ i quy t v n đ tìm ki m, g i ý đi m đ n (destination) có
ể ượ ư ả ủ ề ợ ể ấ ắ ị th đ c dùng nh mô t ả c a v n đ g i ý đ a đi m th ng c nh
(attraction) du khách nên đ n. ế
ề ơ ả ả ế ấ ề ươ ậ V c b n, qui trình gi i quy t v n đ theo ph ậ ng pháp l p lu n
ể ượ ố tình hu ng CBR có th đ c di n t ễ ả ở hình 1.2: b i
23
ả ậ i thu t CBR [2] ̀ Hinh 1.2. Qui trình gi
ủ ầ ả ố ả ậ là các tình hu ng, mô t ố tình hu ng đó và Đ u vào c a gi i thu t:
ụ ậ ỹ ươ ử ụ s d ng các k thu t phân vùng, phân c m và các ph ả ng pháp tính kho ng
ể ọ ừ ố ươ cách đ l c t CSDL ra các tình hu ng t ồ ng đ ng.
ủ ầ ả ố ươ ồ ng đ ng có đ t ộ ươ ng Đ u ra c a gi i thu t:
ấ ượ ư ố ồ đ ng cao nh t và đ ậ Là các tình hu ng t c l u vào CSDL tình hu ng.
Trong đó:
ướ ề ế ậ ướ ủ ầ ấ Ti p nh n v n đ : Trong b c đ u tiên c a qui trình, mô t ả B c 1.
ề ớ ượ ử ụ ữ ế ậ ằ ươ ề ấ v v n đ m i đ c ti p nh n. B ng cách s d ng nh ng ph ng pháp
ữ ệ ề ả ớ ị tính kho ng cách (distance metric) v i mi n xác đ nh là d li u mô t ả ấ v n
ố ươ ệ ạ ớ ồ ữ ề ầ đ đ u vào, nh ng tình hu ng t ấ ố ng đ ng v i tình hu ng đ i di n cho v n
ượ ọ ừ ơ ở ữ ệ ứ ữ ố ề đ phát sinh đ c l c ra t c s d li u ch a nh ng tình hu ng đã đ ượ c
ả ụ ậ ỹ gi i. Các k thu t phân vùng (case partition), phân c m (case cluster) tình
ể ượ ố ọ ữ ệ ố ộ ể ẩ ố hu ng có th đ c dùng đ đ y nhanh t c đ phân l c d li u tình hu ng.
24
ướ ả ữ ố ươ ử ụ Tái s d ng gi i pháp: Nh ng tình hu ng t ồ ng đ ng đ ượ c B c 2.
ộ ươ ứ ế ậ ầ ti p nh n sau quá trình tính toán m c đ t ồ ng đ ng ở ướ b c đ u tiên s ẽ
ượ ự ể ả ự ệ ố ớ đ c dùng đ xây d ng gi i pháp cho tình hu ng m i. Vi c xây d ng gi ả i
ể ỉ ơ ữ ọ ả ừ ữ ả pháp có th ch đ n gi n là trích ch n nh ng gi i pháp t ố nh ng tình hu ng
ươ ể ả ụ ồ ế ể ố t ng đ ng áp d ng đ gi ứ ạ ớ i quy t tình hu ng m i, cũng có th ph c t p
ả ừ ữ ố ươ ượ ọ ữ khi nh ng gi i pháp t nh ng tình hu ng t ồ ng đ ng đ c trích ch n và
ợ ớ ộ ả ề ớ ấ ớ tích h p v i nhau thành m t gi ấ i pháp m i chung nh t cho v n đ m i.
ướ ả ả ượ ự ử ổ S a đ i gi i pháp: Gi ớ i pháp m i sau khi đ c xây d ng s ẽ B c 3.
ượ ụ ể ủ ổ ể ứ ữ ử ầ đ c xem xét s a đ i đ đáp ng đúng nh ng yêu c u c th c a tình
ệ ạ ố ử ụ ụ ể ề ọ ị hu ng hi n t ộ i. Ví d trong đi u tr y h c, bác sĩ có th tái s d ng m t
ắ ự ộ ệ ồ ề ư ầ ị pháp đ đi u tr cho cùng m t b nh nh ng c n cân nh c s khác nhau v ề
ữ ệ ể ổ ặ ặ đ c đi m (tu i tác, cân n ng) gi a các b nh nhân.
ướ ệ ả ả ượ ử Xét duy t gi i pháp: Gi i pháp sau khi đ ổ c s a đ i hoàn B c 4.
ẽ ượ ỉ ụ ệ ả ế ch nh s đ c xét duy t, đánh giá khi áp d ng vào gi ố i quy t tình hu ng
ệ ạ ườ ả ả ế ấ ề hi n t i. Trong tr ợ ng h p gi ấ ạ i pháp th t b i trong gi i quy t v n đ , tình
ẽ ượ ư ề ạ ố ướ ướ ướ hu ng s đ c đ a v tr ng thái tr c đó trong b c 2, 3. Các b c 2, 3, 4
ể ượ ậ ậ ư ế ạ ả trong l p lu n CBR có th đ c coi nh các giai đo n tìm ki m gi i pháp
ề ớ ứ ớ ấ thích ng v i v n đ m i.
ướ ữ ả ư ả ớ L u tr gi i pháp: Gi ả ố i pháp cho tình hu ng m i sau khi tr i B c 5.
ẽ ượ ứ ữ ắ qua các quá trình thích ng (2, 3, 4) s đ ể ư c cân nh c đ l u tr vào c s ơ ở
ả ườ ớ ợ ữ ệ d li u các gi ố i pháp tình hu ng. Trong tr ố ng h p tình hu ng m i không
ượ ỹ ưỡ ươ ữ ồ ố ớ đ c đánh giá k l ng hay quá t ng đ ng v i nh ng tình hu ng đã đ ượ c
ữ ẽ ố ượ ư ữ ạ ư l u tr , tình hu ng này s không đ c l u tr vì không mang l ứ i tri th c
m i.ớ
25
ƯƠ Ị CH Ợ NG 2: BÀI TOÁN G I Ý TOUR DU L CH
ươ ả ẽ ử ụ ả ụ ậ Trong ch ng này tác gi s s d ng gi i thu t CBR áp d ng vào bài
ợ ị toán g i ý tour du l ch.
ể ấ ệ ế ả ầ Ta có th th y các thành ph n khái ni m liên quan đ n gi ậ ậ i thu t l p
ậ ố ượ ệ ợ ữ ầ ồ lu n tình hu ng đ c dùng trong h g i ý bao g m nh ng thành ph n sau:
ế ệ ậ ậ ố ệ Các khái ni m liên quan đ n qui trình l p lu n tình hu ng, các khái ni m
ả ấ ễ ủ ể ầ ố ộ mô t c u trúc bi u di n c a m t tình hu ng tour cùng các thành ph n thi ế t
ấ ấ ạ ế ả ắ ộ ơ ỉ ư ể ế y u nh t c u t o nên m t tour nh đi m đ n, n i ăn ngh , và th ng c nh,
ệ ư ấ ứ mô hình logic và các hàm ch c năng trong h t ả ệ ứ v n, các h th c kho ng
ộ ươ ứ ộ ươ ồ ồ cách giúp tính toán m c đ t ng đ ng, đ t ữ ng đ ng gi a các thành
ầ ố ố ả ộ ph n tour và tình hu ng tour, cu i cùng là mô t ợ qui trình g i ý m t tour
ộ ươ ự ỉ ầ ượ ừ ồ ợ hoàn ch nh d a trên tính toán đ t ng đ ng và g i ý l n l t t ng thành
ầ ẻ ữ ự ả ế ề ệ ị ph n tour riêng l . D a trên nh ng mô t chi ti t v các khái ni m, đ nh
ả ể ừ ậ ướ ự ể nghĩa cùng qui trình, gi i thu t, ta có th t ng b c xây d ng và ki m th ử
ả ủ ệ ả ụ ậ tính hi u qu c a gi ồ i thu t CBR bao g m các m c sau đây:
26
ứ 2.1. Mô hình lôgic và các hàm ch c năng
̀ Hinh 2.1. Mô hình logic CBR [2]
ượ ệ ữ ồ ể ễ ố ớ Hình 2.1 là l c đ bi u di n m i quan h gi a các l p đ i t ố ượ ng
ượ ử ụ ả ệ ư ấ ủ ầ ậ đ c s d ng trong gi i thu t CBR c a h t ồ v n. Các thành ph n g m
có: case, base constraint, location, attraction, accommodation, item, user
profile, reward, travel wish, travel bag, travel information
(cid:0) Case: Đ c hi u nh m t tình hu ng bi u th m t phiên (session)
ư ộ ị ộ ượ ể ể ố
ỉ ươ ữ ườ ệ ố ố hoàn ch nh t ng tác gi a ng i dùng và h th ng. Tình hu ng (phiên) này
ượ ở ạ ế ở ườ ồ ộ đ c kh i t o và k t thúc b i ng ể i dùng. Trong bi u đ 2, m t tình
ố ượ ầ ợ ở hu ng (case) đ c h p thành b i các thành ph n travel information (bao
ữ ầ ồ g m travel wish và travel bag), user profile và reward. Nh ng thành ph n
ẽ ầ ượ ượ này s l n l t đ c trình bày chi ti ế ướ t d i đây.
(cid:0) UserProfile: Là l p ch a nh ng thông tin v ng ứ
ữ ề ớ ườ i dùng. Thông tin
ồ ổ ớ ượ này bao g m tên, tu i, gi i tính và đ c dùng trong tính toán đ t ộ ươ ng
ườ ố ớ ườ ữ ồ đ ng gi a hai ng i dùng. Đ i v i ng i dùng không đăng ký, thông tin
ượ ư ữ ướ ạ đ c l u tr d ữ ệ i d ng d li u null.
27
(cid:0) TravelInformation: Là l p ch a thông tin v gi
ề ớ ạ ứ ầ ớ i h n yêu c u (base
ừ ườ ữ ầ ờ ồ ồ constraint) t ng ơ ả i dùng, đ ng th i bao g m nh ng thành ph n c b n
ư ể ế ả ắ ộ ủ c a m t tour nh đi m đ n (location), th ng c nh (attraction) và ch ỗ ở
ớ ổ ủ ớ (accommodation). Travel information là l p t ng quát c a hai l p con travel
bag và travel wish.
(cid:0) TravelBag: Là l p l u tr thông tin v nh ng thành ph n tour (đi m ể
ớ ư ữ ữ ề ầ
ỗ ở ượ ắ ườ ọ ừ ả ế đ n, th ng c nh, ch ) đ c ng i dùng chú ý ch n t danh sách đ ượ c
ữ ầ ạ ớ ợ ộ ầ ệ ợ g i ý. Nh ng thành ph n này đ i di n cho m t tour phù h p v i yêu c u
ườ ủ c a ng i dùng.
(cid:0) TravelWish: Là l p l u tr
ớ ư ữ ữ ệ ầ ọ ề ộ nh ng yêu c u, nguy n v ng v m t
ị ừ ườ ầ ươ ự ớ tour du l ch t phía ng i dùng. Các thành ph n tour t ng t v i các thành
ế ể ằ ầ ả ắ ồ ph n n m trong travel bag, bao g m đi m đ n, th ng c nh và ch ỗ ở ồ , đ ng
ờ ớ ữ ệ ủ ầ ườ th i v i d li u yêu c u (base constraint) c a ng i dùng . TravelWish có
ể ượ ư ậ ặ ặ ợ ị th đ c coi nh t p h p các c p đ c tínhgiá tr (featurevalue) mà ng ườ i
ỉ ị ươ ớ ệ ố ữ ặ dùng ch đ nh trong quá trình t ng tác v i h th ng. Nh ng đ c tính đ ượ c
ả ả ố ị ữ ặ ấ ớ mô t trong TravelWish ph i c đ nh, nh t quán v i nh ng đ c tính đ ượ c
ả ư ậ ữ ữ ầ mô t ặ ủ trong nh ng thành ph n (item) c a TravelBag. Nh v y, nh ng đ c
ữ ệ ệ ấ ạ ả ặ ỏ tính xu t hi n trong TravelBag ph i th a mãn nh ng đ c tính đ i di n cho
ườ ệ ấ ầ ủ yêu c u c a ng i dùng xu t hi n trong TravelWish.
(cid:0) Reward: Là l p l u tr
ớ ư ữ ủ ữ ườ nh ng đánh giá c a ng ề ừ i dùng v t ng
ữ ủ ể ể ầ ộ ị thành ph n c a m t tour bi u th trong TravelBag. Nh ng đi m đánh giá
ẽ ượ ư ạ ầ ủ ư ộ ữ ộ này s đ c l u l i nh m t trong nh ng thành ph n c a m t case.
(cid:0) ủ ẩ ả ệ ư ấ ả ẩ v n. Không gian s n ph m (item Item: Là s n ph m c a h t
ộ ộ ừ ể ồ ố ầ space) có th bao g m toàn b m t tình hu ng case hay t ng thành ph n
ư ể ế ắ ả ộ trong m t tour nh đi m đ n, th ng c nh hay ch ỗ ở .
28
ố ượ ạ ớ ả ố Bên c nh các l p đ i t ng mô t ầ tình hu ng case và các thành ph n
ứ ộ ố ượ ể ế trong m t tình hu ng, các hàm ch c năng đ c dùng đ tính toán k t qu ả
ồ ợ g i ý bao g m:
(cid:0) SearchItem: Hàm có d li u đ u vào là nh ng yêu c u v đ c tính ầ
ữ ệ ề ặ ữ ầ
ẩ ừ ườ ả ả ề ồ ữ ế ả ả s n ph m t ng ẩ i dùng, k t qu tr v g m danh sách nh ng s n ph m
ề ặ ữ ầ ả ẩ ỏ ượ ế th a mãn nh ng yêu c u v đ c tính. S n ph m đ ữ c tìm ki m là nh ng
ỗ ở ể ế ầ ạ ộ ồ thành ph n chính t o nên m t tour, bao g m đi m đ n, ch ắ , và th ng
ữ ế ậ ạ ả ẩ ệ ả c nh. Vì v y, hàm SearchItem đ i di n cho nh ng hàm tìm ki m s n ph m
ư ể ế ể ế ế ụ c th nh tìm ki m đi m đ n (searchLocation), tìm ki m ch ỗ ở
ắ ả ế (searchAccommodation) và tìm ki m th ng c nh (searchAttraction).
(cid:0) FindSimilarCases: Hàm có d li u đ u vào là mô t
ữ ệ ầ ả ủ ộ c a m t tình
ầ ừ ườ ố ớ ị ả ữ ồ ể hu ng m i bi u th yêu c u t ng i dùng. Mô t này g m có nh ng thông
ề ế tin v travelWish, travelBag, userProfile và reward. Quá trình tìm ki m tình
ươ ệ ứ ử ụ ữ ụ ả ồ ố hu ng t ừ ng đ ng s d ng nh ng h th c kho ng cách, áp d ng cho t ng
ệ ứ ẽ ượ ữ ầ ố ớ thành ph n con trong tình hu ng m i. Nh ng h th c này s đ c trình bày
ế ụ ủ ươ ả ả ề ế chi ti t trong m c 1.2.8 c a ch ế ng. K t qu tr v sau quá trình tìm ki m
ộ ươ ữ ố ấ ớ ồ là danh sách nh ng tình hu ng có đ t ố ng đ ng cao nh t v i tình hu ng
ạ ượ ư ộ ậ ệ hi n t i. Danh sách này đ ế c coi nh m t danh sách (t p) tham chi u
ử ụ ầ ợ (reference set), s d ng trong quá trình g i ý các thành ph n tour sau này.
(cid:0) ữ ệ ạ ộ ItemSimilarity: Hàm itemSimilarity đ i di n cho nh ng hàm tính đ
ươ ầ ạ ữ ệ ủ ữ ầ ồ ộ t ng đ ng c a nh ng thành ph n t o nên m t tour. D li u đ u vào là
ớ ế ả ị ữ ầ ạ ượ ượ ả ề nh ng thành ph n tour cùng lo i, v i k t qu đ nh l ng đ ể c tr v , bi u
ị ứ ộ ươ ộ ươ ồ ầ ồ ồ th m c đ t ng đ ng. Các hàm đo đ t ng đ ng thành ph n g m có
ộ ươ ữ ể ồ locationSimilarity (đo đ t ế ng đ ng gi a các đi m đ n),
ộ ươ ữ ể ồ ị accommodationSimiliarity (đo đ t ữ ng đ ng gi a nh ng đ a đi m ngh ỉ
ộ ươ ữ ắ ả ồ chân), attractionSimilarity (đo đ t ị ữ ng đ ng gi a nh ng th ng c nh, đ a
29
ộ ươ ể ị ồ đi m thu hút khách du l ch), userProfileSimilarity (đo đ t ữ ng đ ng gi a
ồ ơ ườ h s ng i dùng).
(cid:0) ố ượ ố ượ ề ồ c truy n vào hàm g m có đ i t ng thành ItemScore: Tham s đ
ủ ể ế ầ ả ắ ộ ơ ỉ ph n c a m t tour (đi m đ n, n i ngh chân, th ng c nh) và danh sách
ộ ươ ữ ố ồ ế nh ng tình hu ng tham chi u (reference cases) có đ t ấ ng đ ng cao nh t
ệ ạ ử ầ ố ớ v i tình hu ng hi n t i (current case). Sau x lý, các thành ph n tour s ẽ
ượ ể ươ ớ ộ ươ ứ ấ ớ ồ ậ nh n đ c đi m đánh giá t ng ng v i đ t ng đ ng cao nh t v i các
ế ể ạ ầ ậ ố ố thành ph n tour cùng lo i trong t p tình hu ng tham chi u. Đi m s đánh
ẽ ượ ể ế ạ ầ giá này s đ ợ c dùng đ x p h ng các thành ph n tour trong danh sách g i
ý.
(cid:0) RecommendItem: Các thành ph n tour đ
ầ ượ ế ợ ự ắ c g i ý và s p x p d a
ươ ử ụ ế ế ả ồ ị trên giá tr tính toán t ố ng đ ng kép s d ng k t qu tìm ki m tình hu ng
ộ ươ ữ ế ầ ồ tour tham chi u và nh ng thành ph n tour có đ t ấ ớ ớ ng đ ng l n nh t v i
ữ ế ầ nh ng thành ph n tour có trong danh sách tham chi u.
(cid:0) SortItem: Là m t hàm ti n ích giúp s p x p các k t qu tìm ki m ế
ế ế ệ ả ắ ộ
ứ ự ả ộ ươ ầ thành ph n tour theo th t ầ gi m d n đ t ồ ng đ ng.
ể ễ ầ
2.2. Bi u di n thành ph n tour ề ậ ư ộ ị ượ ấ ạ ừ ữ Nh đã đ c p, m t tour du l ch đ c c u t o nên t nh ng thành
ầ ẻ ữ ầ ượ ợ ơ ả ph n c b n riêng l . Nh ng thành ph n tour chính đ ồ c g i ý bao g m
ể ể ể ế ị ị ỉ đi m đ n (location), đ a đi m ngh chân (accommodation) và đi m du l ch
ể ượ ầ ư ả (attraction). Các thành ph n tour có th đ ẩ ữ c coi nh nh ng s n ph m
ượ ệ ố ữ ử ư ầ ợ ỏ đ ủ c h th ng x lý và đ a ra thành nh ng g i ý, th a mãn yêu c u c a
ườ ữ ả ầ ượ ề ng ẩ i dùng. Nh ng s n ph m thành ph n này đ ạ c chia thành nhi u lo i
ạ ạ ữ ẩ ậ ả ẩ ợ ộ ả s n ph m khác nhau. T p h p nh ng s n ph m cùng lo i t o nên m t
ẩ ượ ệ ệ ạ ả không gian s n ph m, đ ậ c ký hi u là X. Không gian X đ i di n cho t p
30
ữ ả ẩ ạ ượ ư ộ ơ ợ h p nh ng s n ph m cùng lo i, đ c coi nh m t không gian véct các
i ) n chi u. Ví d , trong không gian nh ng đ a đi m ngh
ữ ụ ể ề ị ặ đ c tính (X = X ỉ
ạ ị ở ằ ạ chân cho khách du l ch, khách s n New Sun ộ Hà N i, n m t i 23 Hàng Bài,
ộ ớ ạ ạ có giá là 20$/ đêm, thu c l p khách s n lo i 3, có thang máy có th đ ể ượ c
ệ ộ ơ ặ ư ộ ở ạ đ i di n b i m t véct đ c tính nh sau x = (Hà N i, 23 Hàng Bài, New
ể ỉ ị ị Sun, 3, 20, center, T) Đ a đi m (Location) x Đ a ch (Address) x Tên
ạ (Name) x Nhóm khách s n (category) x Giá (Price) x Thang máy (Lift),
ữ ữ ặ ộ ị trong đó “Hà N i”, “23 Hàng Bài”... là nh ng giá tr cho nh ng đ c tính mô
ả ộ ị ể ượ ữ ủ ể ỉ ị t m t đ a đi m ngh chân c a du khách. Nh ng giá tr này có th đ c chia
ra làm ba nhóm chính:
ặ ướ ạ ữ ạ ậ ố : Là t pậ Đ c tính d i d ng t p s nguyên h u h n (finite integer)
ị ể ữ ữ ữ ạ ầ ặ ị ủ ợ h p nh ng giá tr bi u th nhóm h u h n nh ng thành ph n đ c tính c a
ụ ư ẩ ườ ủ ể ợ ả s n ph m. Ví d nh trong tr ạ ạ ng h p c a khách s n k trên, khách s n
ữ ể ạ ạ ộ ộ ớ có th thu c vào m t trong nh ng l p khách s n lo i 1, 2 hay 3, category =
ị ữ ạ ự ữ ể ậ ổ ị ứ {1, 2, 3}. T p nh ng giá tr h u h n này bi u th cho s thay đ i trong m c
ữ ủ ạ ạ ạ ạ ọ ộ đ sang tr ng c a khách s n. Khách s n lo i 1 là nh ng khách s n có quy
ấ ượ ớ ụ ố ị ấ ấ ớ mô l n, ch t l ng d ch v t t nh t đi kèm v i giá thành cao nh t. T ươ ng
ứ ả ả ạ ạ ầ ạ ớ ng, khách s n lo i 2, 3 có qui mô và giá c gi m d n so v i lo i 1. Đây có
ư ộ ữ ể ộ ấ th coi nh m t quá trình mã hóa (encode) nh ng thu c tính có tính ch t
ấ ủ ả ụ ữ ể ẩ ớ ộ phân c p c a s n ph m. Quá trình này không th áp d ng v i nh ng thu c
ủ ả ề ấ ụ ẩ ấ ằ ộ ị tính c a s n ph m mà giá tr có tính ch t ngang b ng v c p đ . Ví d có
ể ấ ườ ỏ th th y trong tr ng h p “ ợ màu s c”ắ = {đ , xanh, vàng} ạ hay “lo i phòng
ở ữ ượ ặ ọ ạ ” = {khách s n, căn h }. ặ ộ Nh ng đ c tính này đ ữ c g i là nh ng đ c tính
ể ượ ạ d ng bi u t ng (symbolic hay norminal).
31
ặ ướ ạ ữ ớ ặ : V i nh ng đ c tính này, giá tr ị Đ c tính d ố ự i d ng s th c (real)
ố ự ữ ư ụ ặ ằ ả ủ c a đ c tính n m trong kho ng nh ng s th c, ví d nh giá thuê phòng
ể ượ ả ạ ộ ị ề ẩ ủ c a m t khách s n. Kho ng giá tr này có th đ ả c chu n hóa v kho ng
ị giá tr [0, 1].
ặ ướ ạ ể ượ ặ ứ ự : Là đ c tính ch a đ ng Đ c tính d i d ng bi u t ng (symbolic)
ầ ử ữ ữ ạ ợ ị ụ ớ ậ t p h p h u h n nh ng giá tr ph n t ặ . Ví d cho l p đ c tính này có th ể
ấ ườ ể ợ ộ ị đ a đi m th y trong tr ạ ng h p khách s n k trên, khi “ ể ể ” có th thu c {Hà
ẵ ộ ườ ữ ặ ớ ợ ị N i, Đà N ng, Sài Gòn}. Trong tr ng h p nh ng đ c tính v i giá tr có
ể ượ ặ ớ ướ ố ươ ề ạ d ng bi u t ng, khác v i hai đ c tính tr c đó, m i t ng quan v giá tr ị
ồ ạ ữ ữ ể ể ả ặ không t n t ạ i. Đ có th tính toán kho ng cách gi a nh ng đ c tính d ng
ể ượ ể ượ ữ ặ ể ạ ổ bi u t ng, nh ng đ c tính này có th đ ữ c chuy n đ i sang d ng nh ng
ướ ữ ữ ự ạ ầ ạ ố ử ạ ặ đ c tính d i d ng s th c hay có h u h n nh ng ph n t d ng s ố
ụ ữ ứ ể ả ệ ứ nguyên. Cách th hai đ tính toán kho ng cách là áp d ng nh ng h th c
ượ ế ể ượ ữ ế ặ ạ ế đ c thi t k riêng cho nh ng đ c tính d ng bi u t ng. Chi ti t v ề
ệ ứ ẽ ượ ữ ả ụ nh ng h th c tính kho ng cách s đ c trình bày trong m c 2.7.
ả ẩ ớ ố ỗ ữ Cu i cùng, v i m i không gian s n ph m X = X ệ i , nh ng khái ni m
ể ượ ệ ả ư ầ thành ph n có th đ c ký hi u và mô t nh sau:
ụ ả
ữ
ạ
ẩ
ậ
ậ
ợ
T p CX X : T p h p nh ng danh m c s n ph m cùng lo i X.
ầ ử
ượ
ữ
ả
ẩ
1,2,…….,m
ư , (m = |CX|): Đ c coi nh nh ng s n ph m ph n t
ộ ậ thu c t p
ụ danh m c CX.
ị ạ
ữ
ữ
ủ
ặ
ậ
j = (1
j, ……, n
j): Là t p nh ng giá tr đ i di n cho nh ng đ c tính c a véc ệ
ơ ả t
s n ph m
ẩ j X.
ệ ớ ố ữ ạ ị ạ ặ ề V i đi u ki n X ặ i là đ c tính có giá tr d ng s (h u h n nguyên ho c
ụ ả ữ ự ẩ ạ ả ị th c), CX là danh m c s n ph m cùng lo i X, kho ng nh ng giá tr kh d ả ị
i trong danh m c s n ph m CX có th đ
ặ ụ ả ể ượ ẩ ư ệ cho đ c tính X c ký hi u nh sau:
rangeCX(Xi) = (maxCX{i} minCX{i})
(1.1)
32
ấ ủ ộ
2.2.1. C u trúc c a m t case ụ ữ ề ấ ủ ệ ộ Trong m c này, nh ng khái ni m chính v c u trúc c a m t tình
ẽ ượ ố ướ ạ ễ ể ọ hu ng tour s đ c trình bày d ể i d ng bi u di n toán h c và khai tri n
ướ ạ ẽ ượ ễ ể ả ạ ộ ể d i d ng m t văn b n XML. D ng bi u di n này s đ c dùng đ tính
ứ ộ ươ ồ toán m c đ t ữ ng đ ng gi a các case.
ể ễ ọ 2.2.1.1. Bi u di n toán h c
ể ượ ữ ậ ợ ố ể ệ T p h p nh ng tình hu ng tour có th đ ộ c hi u theo khái ni m m t
ố ố ộ không gian tình hu ng (case space) CB. Trong đó, m t tình hu ng tour có
ầ ệ th đ ể ượ ấ ạ ừ ố c c u t o t b n thành ph n riêng bi t:
CB = TW x TB x U x R (1.2)
ữ ầ ồ Nh ng thành ph n này bao g m: travelWish (TW), travelBag (TB),
ầ ầ ượ ừ userPofile (U), và reward (R). Trong đó, t ng thành ph n l n l ộ t thu c v ề
ụ ớ ấ ị ể ộ m t ki u không gian nh t đ nh. Ví d , v i c = (tw, tb, u, r) ϵ CB, type (tw) =
ầ ủ ể ượ ạ ừ ạ TW. Bên c nh đó, t ng thành ph n c a không gian CB có th đ c t o nên
ừ ỏ ơ ủ ữ ể ầ ộ t ố nh ng thành ph n nh h n. Đi m khác c a m t không gian tình hu ng
ế ố ế ố ề ờ ồ ạ là y u t chi u th i gian (temporal dimension). Y u t này t n t ộ i khi m t
ượ ự ươ ữ ố tình hu ng tour đ c xây d ng thông qua quá trình t ng tác gi a ng ườ i
ệ ố ậ ố ộ dùng và h th ng. Vì v y, m t tình hu ng trong không gian CB luôn luôn
ượ ư ộ ả ề ộ ụ ấ ươ đ c coi nh m t “ nh ch p” có c u trúc v m t quá trình t ng tác
ườ ấ ị ộ ờ ng ả imáy trong m t kho ng th i gian nh t đ nh.
33
ộ ̀ Hinh ọ 2.2. Minh h a m t case
ố ượ ị ướ ấ ể ộ Nhìn vào hình 1.4, m t tình hu ng tour đ c bi u th d i c u trúc
ố ủ ệ ạ ạ ố ệ ạ d ng cây. G c c a cây đ i di n cho tình hu ng tuor hi n t i. Các nhánh
ỏ ơ ừ ệ ạ ộ ố ừ ầ nh h n đ i di n cho t ng thành ph n trong m t tình hu ng tour. T ng
ế ầ ượ ấ ừ ỏ ơ ữ ầ thành ph n này ti p theo đ c c u thành t nh ng ph n nh h n đ ượ c
ể ễ ướ ạ ộ ơ ặ ừ ầ ấ bi u di n d i d ng m t véct ộ đ c tính. T ng thành ph n c u thành m t
ượ ả ư ố tình hu ng tuor đ c mô t nh sau.
ể ượ ư ộ ỏ ả ậ c coi nh m t gi ợ hàng o t p h p TB (TravelBag): Có th đ
ữ ầ ượ ườ ọ ự ươ nh ng thành ph n tour đ c ng i dùng ch n l a trong quá trình t ng tác
ớ ệ ố ứ ạ ữ ệ ấ ượ ấ ừ v i h th ng. TB có c u trúc d li u ph c t p, đ c c u thành t ữ nh ng
ầ ử ố ế ể ộ ph n t n i ti p thu c nhi u không gian khác nhau.
TB = B x Seq(X1) x … x Seq(X3) (1.3)
ữ ứ ể Trong bi u th c (1.3), B, X1, …, X3 là nh ng không gian véct ơ ớ , v i
ữ ầ ươ ứ ể X1,.., X3 là nh ng không gian thành ph n tuor t ế ớ ng ng v i đi m đ n
ể ả ắ ỉ (location), đi m ngh chân (accomodation), và th ng c nh (attractions). B là
ả ấ ủ ữ ể ặ ầ ộ ừ không gian mô t nh ng đ c đi m yêu c u chung nh t c a m t TB t phía
34
ườ ủ ữ ặ ộ ổ ng ể i dùng. Nh ng đ c tính này có th là t ng chi phí c a m t tour TB
ạ ả ờ ị ỉ (cost), lo i hình nhà ngh (accomodation type), kho ng th i gian du l ch
ữ ộ ặ (travel duration) hay nhóm hành khách (travel party). M t trong nh ng đ c
ớ ặ ủ ể ể ể ầ ộ đi m này có th trùng v i đ c đi m c a m t thành ph n trong tour. Ví d ụ
ạ ặ ơ ộ ỉ ỉ ị ề v lo i hình nhà ngh là m t đ c tính xác đ nh n i ngh chân
ủ ể ạ ộ (accommodation) c a du khách có th là khách s n hay căn h .
ầ ả ữ ặ Các thành ph n Seq (X1), …, Seq(X3) mô t ỗ nh ng chu i các đ c tính
ứ ể ậ ộ ộ ộ ề thu c cùng m t không gian. Vì v y, m t TravelBag có th ch a nhi u
ư ộ ụ ầ ộ ộ ượ ể thành ph n thu c cùng m t ki u. Ví d nh m t travelbag đ c di n t ễ ả
ư ầ ầ ỗ ớ ộ ằ b ng hai thành ph n tb1, tb2 nh hình 1.4. V i m i thành ph n trong m t
ể ượ ỏ ơ ể ầ ấ travelbag có th đ ứ c phân chia theo c p thành ph n nh h n, bi u th c
ễ ể ộ ở bi u di n m t travelbag tr thành:
tb = (b, [x1,1, …, x1,j1], …, [x3,1, …, x3,j3])
ỗ ớ v i m i xi,j = (x11,1, …, xni,j). Trong hình 1.4, ta có:
tb = (1000, couple), [(Hanoi, historic), (New Sun, 120, 23 Hang Bai), ϕ,ϕ]
ụ ữ ể ặ ớ ữ V i nh ng đ c đi m chung b = (1000, couple). Trong ví d này, nh ng
ể ượ ả ị ế ồ ặ đ c đi m chung đ c gi đ nh g m có chi phí (budget) dành cho chuy n đi
ữ ế ạ ặ ủ c a du khách và lo i hình du khách (travel party). Nh ng đ c tính ti p theo
ả ể ế ớ ả ị ầ ượ l n l t mô t đi m đ n tb1 = (Hanoi, historic) (v i gi ế ể đ nh đi m đ n
ượ ả ở ể ặ ạ đ c mô t b i hai đ c đi m chính là tên (locationname) và lo i hình
ơ ớ ỉ (locationtype)), n i ngh chân tb2 = (New Sun, 120, 23 Hang Bai) (v i gi ả
ể ả ộ ị ể ồ ỉ ặ ị đ nh các đ c đi m mô t m t đ a đi m ngh chân g m có tên, giá thuê/đêm,
ỉ ườ ươ ườ ị đ a ch ). Trong quá trình ng i dùng t ớ ệ ố ng tác v i h th ng, ng i dùng có
ể ế ụ ộ ị ẽ ắ ả ọ th ti p t c ch n và thêm m t đ a danh th ng c nh s tham quan vào trong
ể ồ ủ ả ả ắ ị ữ túi du l ch o (travel bag) c a mình. Th ng c nh này có th g m nh ng
ụ ề ạ ỉ ị thông tin v tên, đ a ch , giá vé, lo i hình,.. Ví d tb3 = (Van Mieu, Quoc Tu
35
ư ậ ệ ạ ả ị ầ ủ Giam St, historic). Nh v y túi du l ch o đ i di n cho các thành ph n c a
ộ ườ ọ ẽ ượ ự ả ư m t tour ng i dùng l a ch n s đ c mô t nh sau:
tb = (1000, couple), [(Hanoi, historic), (New Sun, 120, 23 Hang Bai),
(Van Mieu, Quoc Tu Giam St, historic), ϕ]
ề ộ ể ầ ố ị ị TW (Travel Wish): Bi u th mong mu n, yêu c u v m t tour du l ch
ừ ườ ứ ạ ữ ệ ấ ượ ễ ả t phía ng i dùng. TW có c u trúc d li u ph c t p, đ c di n t nh ư
ộ ậ ữ ề ấ ầ ợ ộ m t t p h p nh ng truy v n (queries) v các thành ph n trong m t tour, có
ể ượ ố ớ ộ ư ể ấ c u trúc gi ng v i TravelBag. M t TW có th đ ễ c bi u di n nh sau:
TW = Q(B) x Seq(Q(X1)) x … x Seq(Q(X3)) (1.4)
ầ ấ ộ ươ ự ớ Trong đó, các thành ph n trong m t TW có c u trúc t ng t v i các
ầ ạ ộ thành ph n t o nên m t TravelBag.
ữ ủ ứ ể ấ ộ ặ Q (B): truy v n ch a nh ng đ c đi m chung c a m t tour.
ạ ả ề ừ ữ ấ ẩ ỗ Seq (Q(Xi)): chu i nh ng truy v n v t ng lo i s n ph m có trong
ủ ụ ể ấ ỗ ố ị tour, ví d , Seq(Q(X1)) là chu i truy v n bi u th mong mu n c a ng ườ i
ề ể ế ế ạ ộ ị dùng v đi m đ n (location) cho chuy n du l ch. Bên c nh đó, m t TB có
ỗ ự ự ề ả ể ẩ ạ ậ ộ th có nhi u s n ph m thu c cùng lo i, vì v y, m i s l a ch n s t ọ ẽ ươ ng
ứ ụ ề ể ễ ấ ớ ỗ ỗ ấ ộ ng v i m i truy v n khác nhau. M t ví d v bi u di n chu i truy v n
ư ể ớ ạ TW có th có d ng nh sau v i:
ấ ớ Q (B) = (budget < 2000) ∧ (party = couple): Truy v n v i yêu c u ầ
ỏ ơ ệ ề ề ớ chung v tour v i đi u ki n chi phí cho phép nh h n 1000$, và dành cho
ườ ị ộ m t ng i đi du l ch.
Seq(Q(X1)) = Seq(Q(accommodation)) = (location = Ha Noi) ∧ (cost <
ề ỗ ở ấ ầ ớ ề 150) ∧ (position = center): Truy v n v i yêu c u v ch ị ệ , đi u ki n là đ a
ạ ỏ ơ ộ ị ể đi m t i Hà N i, v trí trung tâm và giá thuê nh h n 150$/đêm.
Seq(Q(X2)) = Seq(Q(attraction)) = (attractiontype = historic) ∧ (date =
ậ ấ ợ ề ị 10/02/2009), (attractiontype = entertainment): T p h p hai truy v n v đ a
36
ể ả ắ ườ ế ầ ầ ố đi m th ng c nh ng ấ i dùng mu n đ n. Truy v n đ u tiên là yêu c u v ề
ử ả ắ ấ ị th ng c nh mang tính l ch s và ngày tham gia là 10/02/2009. Truy v n th ư
ề ắ ả ầ ả hai là yêu c u v th ng c nh mang tính gi i trí.
ư ậ Nh v y: TW = ((budget < 2000) ∧ (party = couple)) x ((location = Ha
Noi) ∧ (cost < 150) ∧ (position = center)) x (attractiontype = historic) ∧
((date = 10.02.2009), (attractiontype = entertainment))
ề ườ ệ ố ượ ễ ể ướ ạ i dùng h th ng đ c bi u di n d ộ i d ng m t U: Thông tin v ng
ơ ặ ẩ ả ố véct ạ ớ đ c tính trong không gian gi ng v i không gian s n ph m X có d ng
i=1 Ui. Trong bi u đ 3, m t véct
ể ộ ồ ơ ể ượ ễ ể ớ U = ∏n có th đ ặ c bi u di n v i ba đ c
ủ ể ườ ư ổ ớ đi m c a ng i dùng nh tên, tu i, gi i tính:
U = (name = Nam) ∧ (age = 20) ∧ (gender = male) (1.5)
ề ộ ượ ự ừ c xây d ng và tham gia t phía ng ườ i R: Đánh giá v m t tour đã đ
ớ ấ ủ ệ ấ ạ ố ộ dùng. C u trúc đánh giá gi ng v i c u trúc c a m t travelbag đ i di n cho
ồ ộ ộ ị ồ m t tour. Đánh giá bao g m đánh giá chung cho toàn b tour du l ch, đ ng
ờ ớ ừ ộ ậ ữ ầ ộ ạ th i v i t ng thành ph n trong tour. M t đánh giá là m t t p con h u h n
ầ ừ ủ ậ ố ể ấ ộ các ph n t ạ ủ c a t p s nguyên. C u trúc c a m t đánh giá có th có d ng
sau:
R = RB x Seq(RX1) x …x Seq(RX3) (1.6)
ụ ộ Trong đó, RB = RX1 = .. = RX4 = {1, 2, 3, 4, 5}. Ví d , m t tour du
ể ượ ư ể ố ở ị l ch có th đ c đánh giá b i đi m s nh sau r = {4, [5], [4], ∅}. Các
ầ ượ ươ ể ố ứ ớ ộ ượ đi m s đánh giá l n l t t ng ng v i toàn b tour đ ớ c đánh giá v i
ể ầ ố ượ ầ ượ ể ế ừ đi m s 4/5. T ng thành ph n đ c đánh giá l n l t là đi m đ n (5/5),
ể ắ ả ố ỉ ượ ơ n i ngh chân (4/5), th ng c nh (3/5). Đi m s 3/5 đ ư ể c coi nh đi m đánh
ặ ị ượ ữ ụ ầ ượ giá m c đ nh, đ c áp d ng cho nh ng thành ph n tour không đ c đánh
ườ ả ế ượ ữ ụ ườ ở giá b i ng i dùng. Gi thi t này đ c áp d ng cho nh ng tr ợ ng h p
ị ố ể ể ở ằ không có đi m đánh giá b i vì đi m đánh giá 3/5 là tr s trung gian, n m
37
ự ự ữ ữ ể ể gi a nh ng đi m đánh giá tích c c (4/5, 5/5) và đi m đánh giá tiêu c c (1/5,
2/5).
38
ặ ả 2.2.1.2. Đ c t XML
ủ ấ ố ượ ể ướ ạ ộ Đây là c u trúc c a m t tình hu ng tour và đ c khai tri n d i d ng
ư XML nh sau:
ặ ả ườ ổ Trong đ c t XML trên, ng ố i dùng tên Nam, 20 tu i, mong mu n
ượ ị ườ ạ ộ ớ ố đ c đi du l ch cùng ng i thân t i Hà N i v i chi phí t i đa cho phép là
ạ ở ị ớ ế ố ộ 2000$, mu n tìm ki m m t phòng đôi khách s n v trí trung tâm v i giá
ố ể ế ộ ớ thuê t ạ i đa 150$/đêm. Nam đã thêm Hà N i là đi m đ n, v i khách s n
ở ị ủ ị ỉ New Sun đ a ch 23 Hàng Bài vào tour du l ch c a mình.
ộ ươ ế ạ ồ 2.2.2. Đ t ng đ ng và x p h ng các item
ệ ươ ồ ượ ử ụ Khái ni m “t ng đ ng” (similarity) [3] đ c s d ng trong tính toán
ố ượ ữ ả ố ượ kho ng cách gi a hai đ i t ữ ng. Nh ng đ i t ạ ể ng này có th là cùng lo i
ụ ộ ươ ặ ộ ầ ị ứ ữ ể ồ ạ ho c khác lo i. Ví d , đ t ộ ng đ ng bi u th m c đ g n gũi gi a m t
ườ ớ ộ ườ ộ ả ẩ ớ ng i dùng t i m t nhóm ng i dùng, hay m t s n ph m t ụ i danh m c
ữ ả ẩ ườ ợ ủ ệ ư ấ ộ ươ ồ nh ng s n ph m. Trong tr ng h p c a h t v n, đ t ng đ ng mô t ả
ư ữ ả ầ ố kho ng cách gi a các thành ph n tour cũng nh các tình hu ng tour s ẽ
ượ ệ ứ ệ ứ ả đ c tính toán thông qua các h th c tính kho ng cách. Các h th c này s ẽ
ượ ộ ươ ạ ả ồ đ c dùng trong tính toán đ t ẩ ư ế ng đ ng cũng nh x p h ng s n ph m
ứ ộ ươ ề ệ ế ả ẩ ồ ự d a trên m c đ t ng đ ng. Các khái ni m v tìm ki m s n ph m t ươ ng
ự ư ắ ẽ ượ ả ẩ ụ t ế cũng nh s p x p s ph m s đ c trình bày trong m c này. Các h ệ
ẽ ượ ứ ả ụ th c kho ng cách s đ c trình bày trong m c 1.2.7.
ế ậ ạ ẩ ả 2.2.2.1. Thu th p và x p h ng s n ph m
n i=1 Xi là không gian các thành ph n tour (s n ph m), m t h
ớ ả ẩ ầ V i X = ∏ ộ ệ
ứ ượ ị ươ ị ứ ả th c kho ng cách đ ộ c đ nh nghĩa là m t hàm có giá tr d ớ ng ng v i
ạ ệ ứ ề ả ẩ ặ ả ượ ừ t ng c p s n ph m. Có nhi u lo i h th c kho ng cách đã đ c nghiên
39
ử ụ ổ ả ậ ứ c u và s d ng, trong khuôn kh gi i thu t CBR dùng trong h t ệ ư ấ v n,
ệ ứ ẽ ượ ử ụ ữ ạ nh ng h th c có d ng sau s đ c s d ng.
d(x,y) = f(w1(x) * d1(x1, y1), … , wn(x) * dn(xn, yn))
(1.8) f : Rn R+
ớ ứ ể ọ V i x, y ϵ X, 0 < wi(x) < 1 là tr ng s c a đ c đi m th i, f là hàm đ n ơ ố ủ ặ
i(xi, yi) là h th c kho ng cách
ệ ệ ứ ả đi u tăng (monotone increasing function), d
i còn
ạ ủ ặ ệ ứ ữ ạ ứ ị đ nh nghĩa theo lo i c a đ c tính th i. Bên c nh đó, nh ng h th c d
ượ ộ ươ ữ ư ọ ụ ồ đ c g i nh nh ng “phép đo đ t ộ ng đ ng c c b (local similarity
ế ố ụ ộ ả ữ ườ ậ measures)” trong thu t ng CBR. Y u t c c b x y ra trong tr ợ ng h p
ị ố ữ ụ ữ ố ọ ộ ổ nh ng tr ng s trong hàm d (x, y) là nh ng tr s thay đ i, ph thu c vào
ể ặ ừ t ng đi m đ c tính.
ị ộ ấ ươ ị ể ữ ồ Trong th c t , d ụ ng đ ng. Ví d , ự ế i là nh ng giá tr bi u th đ b t t
ớ ẽ ẫ ị ươ ế ặ ả ỏ ữ ồ hai đ c tính có kho ng cách l n s d n đ n giá tr t ng đ ng nh gi a hai
ộ ẽ ượ ụ ừ ả ị ể ở ặ đ c tính. T ng giá tr kho ng cách c c b s đ c ki m soát b i hàm t ổ
ổ ợ ụ ộ ư ữ ế ả ị ợ ổ h p t ng quát f, t h p nh ng giá tr kho ng cách c c b và đ a ra k t qu ả
+.
ộ ố ự ươ ả kho ng cách là m t s th c d ng R
ệ ứ ệ ứ ữ ụ ả ả ộ Ví d , m t trong nh ng h th c kho ng cách là h th c kho ng cách
ấ ồ không đ ng nh t Euclid – Overlap (Heterogeneous Euclid – Overlap Metric).
(1.9)
v i: ớ
(1.10)
40
i ≠ yi và 0 v i xớ i = yi. H s chu n hóa
ệ ố ẩ Và hàm overlap(xi, yi) = 1 n u xế
ượ ữ ữ ể ả ẩ ả đ ộ c dùng đ so sánh kho ng cách gi a nh ng s n ph m thu c
các không gian khác nhau.
ộ ươ ượ ị ả ủ ả ị Đ t ồ ng đ ng đ c đ nh nghĩa là ngh ch đ o c a kho ng cách:
Sim(x,y) = e(d(x,y)) (1.11)
ớ ệ ứ ả ượ ư ả ị V i h th c kho ng cách đ ẩ c đ nh nghĩa nh trên, các s n ph m
ươ ự ể ượ ứ ộ ươ ế ự ế ắ t ng t có th đ c tìm ki m và s p x p d a trên m c đ t ồ ng đ ng.
41
ẩ ươ ả ự 2.2.2.1.1. Tìm s n ph m t ng t
ả ẩ ộ ớ V i A ủ ậ X là m t không gian con c a t p không gian s n ph m tour
ả ẩ ượ ả ẩ ươ và p X là s n ph m đ c xét tìm các s n ph m t ng t ự kNNd(p, A) là ,
ộ ươ ữ ề ẩ ấ ả ồ ầ ậ t p nh ng láng gi ng g n nh t (s n ph m có đ t ấ ớ ng đ ng cao nh t v i
ẩ ượ ậ ả ệ ứ ử ụ ớ ả s n ph m đ ả ẩ c xét) v i p trong t p s n ph m A, s d ng h th c kho ng
ề ậ ượ ủ ợ ị cách d. T p láng gi ng này đ ộ ậ c đ nh nghĩa là m t t p h p con c a A.
ố ượ ằ ố ị ấ ượ ề ầ ị H ng s k xác đ nh s l ng láng gi ng g n nh t đ ử ụ c xác đ nh s d ng
ả kho ng cách d.
ế ể ậ ả ẩ ươ ự ệ Vì v y, có th nói vi c tìm ki m s n ph m t ng t ọ là quá trình ch n
1, x2, …, xk t
ữ ẩ ươ ấ ớ ả ẩ ồ ả ọ l c nh ng s n ph m x ng đ ng nh t v i s n ph m p trong
ộ ậ ả ẩ ợ ướ ẩ ươ m t t p h p không gian các s n ph m cho tr ả c. Các s n ph m t ng t ự
ẽ ượ ắ ứ ộ ươ ự ế ầ ả kNNd(p, A) cũng s đ c s p x p d a theo gi m d n m c đ t ồ ng đ ng
i)) sau quá trình tìm ki m. Quá trình tìm
ề ả ầ ế (tăng d n v kho ng cách d(p, x
ữ ế ả ậ ẩ ươ ự ệ ậ ki m t p nh ng s n ph m t ng t ự ượ đ ở c th c hi n b i thu t toán k
Nearest Neighbor kNNd(p,A,k)
ậ ả ệ ứ ế ẩ ả ẩ Tham s :ố H th c kho ng cách d, s n ph m xét tìm ki m p, t p s n ph m ả
A
ả ề ậ ấ ớ ế ề ả ẩ ầ K t qu : ả Tr v t p k s n ph m láng gi ng g n nh t v i p trong A,
ế ự ả ả ầ ắ s p x p theo trình t kho ng cách gi m d n
ự ậ ượ ở ữ ế D a vào thu t toán đ c trình bày ả trên, hàm tìm ki m nh ng s n
ươ ự ể ượ ư ự ệ ả ế ệ ố ẩ ph m t ng t có th đ c th c hi n nh sau: Gi thi t h th ng đang
ế ộ ườ ữ ế ố ị ể ợ g i ý m t đi m đ n và ng ể i dùng mong mu n tìm ki m nh ng đ a đi m
42
1
ế ố ớ ượ ấ ỏ ợ ể gi ng v i đi m đ n đang đ c g i ý, th a mãn truy v n Q = C C2
i là nh ng yêu c u (constraints) v đ c tính c th
ề ặ ữ ầ … ụ ể Cm v i Cớ
ữ ế ể ệ ề ậ ấ ộ ớ ợ ể ủ c a m t đi m đ n. V i đi u ki n truy v n Q, A là t p h p nh ng đi m
d
ể ế ỏ ế ế đ n th a mãn Q, p là đi m đ n đang đ ượ ư ấ c t v n, hàm tìm ki m kNN
ế ươ ẽ ế ế ể ả ồ ư (p,A,5) s tìm ki m và đ a ra k t qu 5 đi m đ n t ấ ớ ng đ ng nh t v i
ể ệ ạ ế đi m đ n đang đ ượ ư ấ c t v n hi n t i.
ắ ế ế ế ả 2.2.2.1.2. S p x p k t qu tìm ki m
ả ẩ ươ ẽ ắ ế Sau khi các s n ph m t ng t ự ượ đ ế ệ ố c tìm ki m, h th ng s s p x p
ộ ươ ự ế ể ả ồ ế k t qu tìm ki m d a trên đi m đánh giá đ t ng đ ng (similaritybased
ạ ướ ậ ượ scores). T i b c này, hai t p đ c xét là X S và R. Trong đó, S = {x1,
ậ ả ẩ ầ ượ ắ ậ ả ế ẩ c s p x p và R là t p s n ph m ữ x2, ..., xm} là t p nh ng s n ph m c n đ
ế ượ ể ể ươ ồ tham chi u (reference set) đ c dùng đ tính đi m t ừ ng đ ng cho t ng
ậ ả ầ ậ ẩ ả ượ thành ph n trong t p S. T p s n ph m tham kh o đ c trích ch n t ọ ừ ậ t p
ệ ạ ữ ố ố ớ ố ệ nh ng tình hu ng tour gi ng v i tình hu ng tour hi n t ế i. Vi c tìm ki m
ữ ố ươ ẽ ượ ồ ụ nh ng tình hu ng tour t ng đ ng s đ ủ c trình bày trong m c 2.8 c a
ươ ậ ả ẩ ượ ắ ế ử ụ ậ ch ng. T p s n ph m đ ả c s p x p s d ng kho ng cách d và t p tham
ả ượ kh o R đ ệ c ký hi u là:
ij, R) ≥ d(xik, R) (i ớ SS(R,d) = [xi1, …, xim] v i d(x ả ượ ị ấ ừ ỏ Kho ng cách d(x, R) đ ả
c đ nh nghĩa là kho ng cách nh nh t t ế
x đ n các ẩ ả
s n ph m r R. d(x, R) = (1.12) 43 i = xik đ ớ ị ẩ ả ượ ế ạ ơ V i đ nh nghĩa này, s n ph m x ế ả
c x p h ng cao h n n u s n ữ ầ ẩ ả ả ơ ố ớ ph m đó g n h n (có kho ng cách nh h n) ẩ
ỏ ơ đ i v i nh ng s n ph m ộ ậ ể ắ ự ể ế ế ế ả ả thu c t p tham kh o. Đ có th s p x p k t qu tìm ki m d a trên ệ ố ở ạ ữ ả ả ẩ ộ
kho ng cách gi a các s n ph m (hàm Sort(d, S, R)), h th ng kh i t o m t ỗ ộ ố ượ ả ả ẩ ồ ộ ừ chu i b ba đ i t ng g m s n ph m s thu c S, kho ng cách t s t ớ ậ
i t p ầ ử ấ ớ ầ ộ ươ ỗ ả ứ ẩ ớ R, và ph n t thu c R g n nh t v i s. T ng ng v i m i s n ph m s ấ ớ ề ẩ ả ầ ộ ộ thu c S, s n ph m láng gi ng g n nh t v i s, r = NN[1,1] thu c R và ả ượ ươ ự ớ kho ng cách d = d(s,r) = NN[1,2] đ c tính toán. T ng t ậ
v i thu t toán ữ ả ẩ ượ ế ắ ộ kNN, danh sách SS nh ng s n ph m đ c s p x p và b ba đ i t ố ượ
ng ượ ộ ộ ế ể ớ (s,d,r) đ c chuy n ti p sau m t b ba khác (s’,d’,r’) v i d > d’. Ví d v ụ ề ế ậ ườ ế ể ế ắ ợ ắ
thu t toán s p x p trong tr ng h p s p x p đi m đ n sau quá trình tìm ệ ạ ự ế ố ầ ủ ồ ườ ki m, d a vào tình hu ng tour hi n t i (bao g m yêu c u c a ng i dùng, ủ ữ ả ẩ ả ườ ừ nh ng s n ph m kh dĩ trong travelbag, thông tin c a ng i dùng), t yêu 1, loc2, loc3} đ ụ ể ề ể ữ ể ế ế ậ
ầ
c u c th v đi m đ n, t p nh ng đi m đ n S = {loc cượ ọ ọ ừ ế ụ ả ể ẩ ố tìm ki m và ch n l c t danh m c s n ph m. Cu i cùng, các đi m đ n s ế ẽ ượ ắ ứ ộ ươ ự ế ủ ừ ế ể ồ ớ đ c s p x p d a trên m c đ t ể
ng đ ng c a t ng đi m đ n v i đi m ữ ậ ố ươ ự ế ươ ứ
đ n t ả
ng ng trong t p tham kh o nh ng tình hu ng tour t ng t R. Đ ể ả ề ế ể ế ả ượ ắ tr v k t qu các đi m đ n đ ế
c s p x p, hàm Sortd(S, R) đ ượ ọ ớ
c g i v i d ế ể ả ữ
là kho ng cách gi a các đi m đ n. Sort(d,S,R) ả ậ ả ẩ ầ ượ ắ ế Tham s : ố kho ng cách d, t p s n ph m S c n đ ậ ả
c s p x p, t p s n ả ẩ ph m tham kh o R ỗ ả ế ả ẩ ượ ắ K t qu : chu i s n ph m đ c s p x p ế SS[i,j] (j = 1,2,3) 44 ệ ứ ả 2.2.2.2. Các h th c tính kho ng cách ủ ế ả ợ ụ ủ ế ộ ộ Đ chính xác c a k t qu g i ý ph thu c ch y u vào cách tính ầ ử ữ ả ệ ứ ổ ế kho ng cách gi a các ph n t ấ
ả
. Các h th c tính kho ng cách ph bi n nh t ể ấ ư ả ọ có th th y nh kho ng Euclid hay còn g i là Minkowsky (1.13) ả ớ ườ Trong đó là kho ng cách Euclid v i r th ng mang ị ươ ờ ệ ứ ả
ế ố kho ng cách giá tr nguyên d ng. V i h th c này, y u t mô t ả ự ấ
s b t ươ ố ượ ồ ộ ươ ả ớ ớ t ữ
ng đ ng gi a hai đ i t ng, v i kho ng cách càng l n, đ t ồ
ng đ ng ậ ỏ ươ ả ủ ồ ị càng nh . Vì v y, hàm t ả
ng đ ng là hàm ngh ch đ o c a hàm tính kho ng cách, ví d :ụ (1.14) ứ ộ ươ ệ ạ ể ượ ồ Bên c nh đó, vi c tính toán m c đ t ng đ ng cũng có th đ ế
c ti n ử ụ ằ ươ ố ươ hành b ng cách s d ng các ph ng pháp th ng kê. Trong đó, ph ng pháp ấ ươ ổ ế
n i ti ng nh t là ph ng sai Pearson (Pearson Corelation) (2.12) ơ ở ữ ệ ủ ặ ị V i ớ là giá tr trung bình c a đ c tính th ứ i trong c s d li u tình ố ườ ợ ươ ự ế hu ng (case base). Trong tr ng h p này, ph ư
ng sai Pearson tr c ti p đ a ế ả ư ậ ồ ra k t qu mô t ả ứ ộ ươ
m c đ t ng đ ng, nh v y . ệ ươ ả ỉ Tuy nhi n, ph ng sai Pearson hay kho ng cách Euclid ch đúng trong ườ ầ ử ả ủ ặ ẩ ợ ượ ể ễ tr ng h p các đ c tính c a ph n t s n ph m đ c bi u di n d ướ ạ
i d ng ị ố ườ ẩ ợ ượ ể giá tr s (numeric features). Trong tr ả
ng h p s n ph m đ ễ
c bi u di n 45 ướ ạ ể ượ ự ả d i d ng bi u t ng ký t (symbolic features), kho ng cách chéo (overlap ượ ử ụ ư ươ ể ả distance) đ c s d ng nh ph ữ
ng pháp đ tính toán kho ng cách gi a ể ượ ặ ạ các đ c tính d ng bi u t ng. (1.15) ươ ả ộ ươ ạ
Bên c nh ph ng pháp kho ng cách chéo, m t ph ng pháp khác ượ ử ụ ươ đ ộ
c s d ng r ng rãi là ph ng pháp VDM (Value Difference Metric). ộ ươ ả ố VDM là m t ph ữ
ng pháp th ng kê cho phép tính toán kho ng cách gi a ố ượ ữ ể ượ ặ ỉ ể ễ ướ ạ nh ng đ i t ng có đ c tính ch có th đ c bi u di n d ể
i d ng bi u ượ ự ả ộ ượ ả ơ t ng ký t . M t phiên b n đã đ ủ
c đ n gi n hóa c a VDM (không có ạ ố ọ tr ng s ) có d ng sau: (1.16) V i:ớ ố ớ ề ế ả ổ C là t ng s l p k t qu trong mi n bài toán. ể ớ ế ệ ề ấ ả ớ ị ộ
là xác su t đi u ki n đ l p k t qu là C v i giá tr thu c ượ ướ tính là đ c cho tr c. (1.17) ữ ố ươ ố ươ ư
Gi ng nh nh ng ph ng pháp th ng kê khác, ph ng pháp VDM ượ ể ả ế đ c dùng đ gi ạ
i quy t các bài toàn phân lo i (classification problem). Vì ườ ệ ư ấ ể ượ ệ ậ
v y, trong tr ợ
ng h p h t v n, VDM có th đ c dùng trong vi c phân ủ ư ặ ườ tách nhóm đ c tr ng thích/không thích c a ng i dùng. Tuy nhiên, VDM ứ ộ ươ ớ ợ ư ặ ồ không phù h p v i tính toán m c đ t ng đ ng nh đã trình bày, m c dù ườ ạ ấ ợ ượ trong tr ng h p c = 1, tính ch t phân lo i đã đ ạ ỏ
c lo i b . 46 ệ ứ ả ồ ấ
2.2.3. H th c kho ng cách không đ ng nh t ệ ư ấ ệ ứ ấ ượ ả ồ Trong h t v n, h th c kho ng cách không đ ng nh t đ ị
c đ nh ổ ợ ệ ứ ữ ụ ữ ặ ả nghĩa là t h p nh ng h th c kho ng cách áp d ng cho nh ng đ c tính ượ ễ ướ ạ ể ự đ c bi u di n d ố
i d ng s và ký t . (1.18) ầ ượ ệ ứ ụ ả ặ V i ớ ds và dn l n l ạ
t là h th c kho ng cách áp d ng cho đ c tính d ng ự ạ ườ ợ ượ ị ký t ố
và d ng s . Trong tr ặ
ng h p đ c tính đ c xét có giá tr null, ả ượ ặ ị ớ ị ả ử ặ kho ng cách đ c m c đ nh có giá tr là 1 v i gi s hai đ c tính không có ồ ạ ệ ố ị m i liên h khi không t n t i giá tr . ớ ự ự ừ ị ư ả ọ ủ ds T đ nh nghĩa kho ng cách nh trên, v i s l a ch n khác nhau c a ệ ứ ẽ ẫ ế ấ ồ và dn s d n đ n các h th c không đ ng nh t khác nhau. Trong đó, h ệ ệ ứ ứ ế ấ ổ th c n i ti ng nh t là h th c HEOM (Heterogeneous EuclideanOverlap ử ụ Metric) [2] s d ng (1.19) ệ ứ ụ ộ M t ví d khác là h th c HVDM (Heterogeneous Value Difference ử ụ Metric) [3] s d ng (1.20) ể ế ụ ệ ứ ượ Hai h th c HEOM và HVDM [3] có th ti p t c đ ằ
ế
c tùy bi n b ng ờ ạ ử ụ ữ ậ ẩ ỹ cách s d ng nh ng k thu t chu n hóa hay r i r c hóa khác nhau. Nh ư 47 ế ằ ổ ợ ệ ứ ữ ả ớ ậ
v y, b ng cách tùy bi n các t h p nh ng h th c kho ng cách v i các k ỹ ể ẩ ậ ượ ữ ờ ạ
thu t chu n hóa hay r i r c hóa, ta có th có đ ả
ệ ứ
c nh ng h th c kho ng ệ ư ấ ữ ấ ạ ồ cách không đ ng nh t khác nhau. Trong ph m vi h t ệ ứ
v n, nh ng h th c ấ ượ ả ồ ệ ứ kho ng cách không đ ng nh t đ ữ
c phân tích là nh ng h th c sau: (1.22) ệ ứ ươ ươ H th c t ồ
ng đ ng ph ng sai Pearson [3] (1.23) V i ớ là xác su tấ ứ ị ượ ữ ể ể ổ ặ
đ c tính th có giá tr . Xác su t ấ đ c dùng đ chuy n đ i nh ng giá tr ị ạ ự ạ ươ ặ
đ c tính d ng ký t ố
sang d ng s dùng trong ph ạ
ng sai Pearson. Bên c nh ị ạ ư ữ ấ ậ ỹ ị ử ụ
s d ng giá tr xác su t, các k thu t khác nh gán nh ng giá tr d ng ký t ự ươ ị ạ ữ ứ ớ ố ượ ụ t ng ng v i nh ng giá tr d ng s đã đ c áp d ng. Tuy nhiên, cách làm ả ế ượ ề ề ứ ự ấ ấ này không gi i quy t đ c v n đ v th t . Ng ượ ạ
c l ề
i, v n đ này có ể ượ ả ụ ế ử ụ ế ấ ị th đ c gi i quy t khi s d ng giá tr xác su t. Ví d , n u là m tộ ậ ặ ỉ ị ườ ặ
đ c tính ch nh n giá tr đúng (true) ho c sai (false), và ng ậ
i dùng nh n ượ ề ặ ề ề ẫ ơ ị ị đ ế
c nhi u giá tr đúng h n giá tr sai v đ c tính này. Đi u này d n đ n 48 ể ế ả ị ự ế ậ p(true) > p(false). D a vào k t qu đ nh tính này, ta có th k t lu n true > false, thay vì false > true. ệ ứ ử ụ ề ả ọ ố Các h th c kho ng cách đã trình bày đ u không s d ng tr ng s nh ư ề ậ ị ọ ụ ộ ườ ố
đã đ c p. Các giá tr tr ng s , ph thu c vào thông tin ng i dùng, yêu ẽ ượ ề ậ ơ ở ấ
ầ
c u truy v n,… s đ c đ c p sâu h n ụ
các m c sau. ộ ươ ồ 2.2.4. Đ t ữ
ng đ ng gi a hai case
ữ ộ ươ ủ ề ồ ố Đ t ng đ ng gi a các tình hu ng tour là ch đ trung tâm có vai trò ệ ư ấ ế ố ươ ọ ồ quan tr ng trong h t v n. Y u t t ế
ng đ ng này có vai trò tiên quy t ữ ệ ế ố ươ ự ướ trong vi c tìm ki m nh ng tình hu ng tour t ng t và cũng là b ầ
c đ u ộ ệ ố ấ ậ ậ ố tiên trong b t kì m t h th ng l p lu n tình hu ng CBR nào. ệ ư ấ ữ ủ ệ ế ề ệ
Trong đi u ki n c a h t t ố
v n, vi c tìm ki m nh ng tình hu ng ươ ự ặ ứ ạ ủ ề ầ ơ ộ t ng t ố
g p nhi u khó khăn h n vì c u trúc ph c t p c a m t tình hu ng ụ ố ượ ạ ừ ữ ộ
tour (m c 1.2.5). M t tình hu ng tour đ c t o nên t ầ
nh ng thành ph n ế ụ ữ ầ ồ ị ữ
ơ
đ n v (TW, TB, U, R ) và nh ng thành ph n này ti p t c bao g m nh ng ỏ ơ ữ ầ ầ ấ ạ ợ thành ph n nh h n. Nh ng thành ph n này h p thành c u trúc d ng cây ủ ộ ố (treebased model structure) c a m t tình hu ng tour. ự ấ ượ ố ượ D a trên c u trúc đ c mô t ả ở trên, hai tình hu ng tour đ c xem là ươ ữ ế ầ ấ ồ ố t ng đ ng n u nh ng thành ph n c u thành nên tình hu ng tour đó cũng ươ ề ồ ớ ớ t ng đ ng v i nhau. Đi u này có nghĩa v i c = (tw,tb,u,r) và c’ = ộ ươ ố ẽ ượ ồ (tw’,tb’,u’,r’) là hai tình hu ng tour, đ t ng đ ng Sim(c,c’) s đ c tính ộ ươ ự ầ ồ toán d a trên các đ t ng đ ng thành ph n Sim(tw,tw’),…,Sim(r,r’). Áp ươ ữ ể ậ ấ ồ ụ
d ng cách tính này theo ph ng pháp h i qui, ta có th nh n th y nh ng đ ộ ươ ể ế ụ ồ ượ t ầ
ng đ ng thành ph n có th ti p t c đ ự
c tính toán d a trên đ t ộ ươ
ng ớ ấ ỏ ơ ủ ủ ữ ầ ạ ộ ồ
đ ng c a nh ng thành ph n nh h n. V i c u trúc d ng cây c a m t tình ộ ươ ố ẽ ượ ồ ộ ươ ự ủ ồ hu ng tour, đ t ng đ ng s đ c tính d a trên đ t ng đ ng c a lá. Lá 49 ủ ấ ạ ố ượ ữ trong c u trúc d ng cây c a tình hu ng tour đ ả
ư
c xem nh nh ng s n ẩ ệ ầ ử ữ ữ ơ ph m tách bi t, là nh ng ph n t trong nh ng không gian véct đã đ ượ
c ụ ể ẵ ầ ớ ữ
ị
đ nh nghĩa s n (m c 1.2.4). V i nh ng thành ph n tour có cùng ki u, đ ộ ươ ồ ỗ ớ ươ ồ ớ t ị
ng đ ng mang giá tr khác r ng v i tw t ng đ ng v i tw’. ộ ươ ụ ệ ữ ồ ố Áp d ng khái ni m đ t ng đ ng gi a các tình hu ng, ta có th gi ể ả
i ự ế ế ợ ố quy t bài toán g i ý d a trên nguyên lý sau: “N u hai tình hu ng là t ươ
ng ầ ố ướ ể ượ ồ
đ ng, thành ph n trong tình hu ng tr c có th đ ử ụ
c tái s d ng làm l ờ
i ả ậ ậ ố ố gi ề
i cho tình hu ng sau”. Trong các bài toán l p lu n tình hu ng truy n ể ượ ệ ầ ố ể th ng, khái ni m thành ph n có th đ ầ
c hi u là thành ph n trong qui trình ư ậ ả ấ ổ ệ ư ấ ề ậ
l p lu n nh mô t v n đ . Trong khuôn kh h t ầ
v n, các thành ph n ượ ố ớ ấ ả ữ ầ ộ đ c khái quát lên đ i v i t ố
t c nh ng thành ph n trong m t tình hu ng ư ậ ể ữ ả ầ ợ tour. Nh v y, ta có th đoán bi ế ượ
t đ ự
ẩ
c nh ng s n ph m c n g i ý d a ủ ữ ố ươ ự ả trên TB c a nh ng tình hu ng tour t ng t ố
ữ
đã x y ra. Nh ng tình hu ng ươ ự ậ ả tour t ng t đã đ ượ ề ậ ở
c đ c p ầ
ph n tr ướ ướ
c d i tên “t p tham kh o”. c(Vc,Ec) (m tộ ồ ị ạ ộ ố Gi ả ử CB là m t tình hu ng có d ng đ th (graph) G s c ữ ữ ồ ỉ cây), ta ký hi u Vệ ầ ủ
c là nh ng đ nh (vertices) bao g m nh ng thành ph n c a c là nh ng c nh (edges). M t c nh (p,q) t n t ố ộ ạ ồ ạ ữ ạ tình hu ng c, và E i trong ườ ư ậ ủ ầ ầ ợ tr ể ấ
ng h p thành ph n q là thành ph n con c a p. Nh v y, ta có th th y ườ ợ ộ ố trong tr ng h p m t tình hu ng tour c = (tw,tb,u,r), ta có (c,tw) Ec. 1,[q11,…,q1k1],…, [q31,…,q3k1]) ta có (tw,q1) Ec hay (tw, ươ ự ớ T ng t , v i tw = (q [q11,…,q1k1] ) Ec. ồ ị ầ ớ ỗ ố V i m i nút (node) v (thành ph n tình hu ng tour) trong đ th , ta ký ầ ượ ệ ữ ề ậ hi u I(v) và O(v) l n l t là t p nh ng nút láng gi ng (inneighbors) và ủ ố ừ ề ề ả không ph i láng gi ng (outneighbors) c a n t v. T ng nút láng gi ng đ ượ
c ủ ữ ề ươ ệ
ký hi u là ả
. Nh ng nút không ph i là láng gi ng c a v t ng t ự ượ
c đ 50 ư ậ ộ ươ ữ ố ồ ký hi u làệ Nh v y, đ t ng đ ng gi a tình hu ng có th đ ể ượ
c ễ ả ở ươ di n t b i ph ng trình sau: (1.24) ớ ổ ợ ộ ươ ủ ữ ầ ồ ố V i F là hàm t h p đ t ng đ ng c a nh ng thành ph n tình hu ng. ộ ươ ồ ố ượ ố ượ ị Đ t ng đ ng tình hu ng đ ư
c đ nh nghĩa nh sau: “Hai đ i t ng đ ượ
c ươ ố ươ ế ề ồ ớ coi là t ng đ ng n u đ u có m i t ng quan v i cùng m t đ i t ộ ố ượ
ng ờ ồ ổ ợ ượ ề ươ khác”. Đ ng th i, hàm t h p F cũng đ ấ ằ
c đ xu t b ng ph ng trình sau: (1.25) ố ượ ằ ứ ả V i ớ là h ng s đ c dùng có vai trò suy gi m m c đ ộ ươ ộ ươ ồ ữ ầ ầ ồ t ng đ ng khi ta xét đ t ng đ ng gi a các t ng thành ph n khác nhau ễ ủ ể ấ ằ ố ố ộ ượ ọ trong c u trúc bi u di n c a m t tình hu ng. H ng s này đ ế
c g i là y u ế ơ ả ủ ủ ạ ươ ố
t phân h y (decay factor). Tuy nhiên, h n ch c b n c a ph ng trình ộ ươ ở ộ ươ ủ ữ ầ ồ tính đ t ồ
ng đ ng trên là đ t ng đ ng c a nh ng thành ph n không 51 ượ ụ ộ ươ ữ ồ ộ ẽ
liên quan s không đ c tính. Ví d đ t ộ
ng đ ng gi a m t tw và m t tb ẽ ộ ượ ư ậ ể ố
trong m t tình hu ng tour s không đ ứ
ể
c xét. Nh v y, đ có th đáp ng ộ ươ ầ ữ ồ ố ươ yêu c u tính toán đ t ng đ ng gi a các tình hu ng tour, hàm t ồ
ng đ ng ạ ớ ẽ
s có d ng sau v i c = (tw,tb,u,r) và c’ = (tw’,tb’,u’,r’) (1.26) ộ ươ ầ ẽ ượ ủ ừ ồ Trong đó, đ t ng đ ng c a t ng thành ph n s đ c tính toán khác ộ ươ ồ ượ ườ nhau. Đ t ng đ ng chéo Sim(tw, tw’) đ c dùng trong trong tr ợ
ng h p ủ ự ử ầ ầ ớ ố ộ ệ ư ấ
h t v n c n x lý yêu c u c a m t tình hu ng m i (tw) d a trên tình ố ượ ả ế ườ ợ ườ hu ng tour đã đ c gi i quy t (tb’). Trong tr ng h p này, ng i dùng ệ ư ấ ẽ ề ầ ố ớ ư
đ a ra yêu c u v tour, tình hu ng m i c phát sinh, h t ế
v n s tìm ki m ộ ươ ữ ố ồ ố nh ng tình hu ng tour c’ có đ t ấ ớ
ng đ ng cao nh t v i tình hu ng yêu ư ậ ể ả ẩ ớ ợ ế ể ư
ầ
c u m i. Nh v y, đ có th đ a ra g i ý s n ph m chi ti ạ
t, bên c nh tính ộ ươ ệ ố ử ụ ữ ữ ầ ồ toán đ t ng đ ng gi a các tw, h th ng c n tái s d ng nh ng thành ầ ượ ộ ươ ợ ể ồ ph n tour đã đ ự
c g i ý trong tb’, d a trên tính toán đ t ng đ ng đ có ứ ể ầ ớ ố ị ị th đáp ng yêu c u tw trong tình hu ng tour m i. Giá tr Rew(r’) đ nh ủ ứ ả ọ ộ ố ớ ố ệ
nghĩa m c đ quan tr ng c a tình hu ng tham kh o v i tình hu ng hi n ạ ừ ữ ả ố ượ ự ở t i. Nh ng tình hu ng tham kh o đã t ng đ c xây d ng b i cùng ng ườ
i ẽ ể ơ dùng s có đi m đánh giá cao h n. ạ ươ ử ụ ố ồ ọ Bên c nh đó, hàm t ng đ ng s d ng các tr ng s W ố ữ
i là nh ng s ị ằ ố ượ ự ọ ể ằ ữ
th c có giá tr n m gi a 0 và 1. Các tr ng s đ ứ
c dùng đ cân b ng m c ộ ươ ọ ữ ồ ố ộ
đ quan tr ng trong tính toán đ t ng đ ng gi a tình hu ng. Trong tr ườ
ng ộ ố ượ ị ỗ ộ ươ ẽ ồ ợ
h p m t trong hai tình hu ng đ c xét có giá tr r ng, đ t ng đ ng s có ị ằ ố ượ ữ ồ ạ ả
giá tr b ng 0 vì kho ng cách gi a hai đ i t ng không t n t i có giá tr ị 52 ể ượ ạ ấ ộ ồ ờ ố
ằ
b ng 1. Đ ng th i, m t tình hu ng có c u trúc d ng cây có th đ ể
c bi u ễ ướ ạ di n d i d ng sau: (1.27) ư ậ ộ ươ ễ ể ớ ữ ồ Nh v y, v i cách bi u di n trên, đ t ố
ng đ ng gi a các tình hu ng ượ ộ ươ ề ằ ồ ồ đ c qui v bài toán h i qui b ng cách tính đ t ữ
ủ
ng đ ng c a nh ng ầ ở ầ ấ ấ ơ thành ph n t ng th p h n trong cây c u trúc. ộ ươ ồ 2.2.4.1. Đ t ữ
ng đ ng gi a Travel Bag ủ ộ ườ ư ị
M t tour du l ch (TB) c a ng i dùng, nh đã trình bày ở ụ
m c ể ượ ễ ướ ạ ể ơ ổ ợ 2.4, có th đ c bi u di n d i d ng véct ư
h p nh sau: t TB = B x Seq(X1) x Seq(X2) x Seq(X3) (1.28) ủ ữ ầ ồ ộ Nh ng thành ph n c a m t TB bao g m: Không gian các véct ơ ề
v ỗ ả ể ế ầ ơ ỉ ắ
ẩ
yêu c u chung B và ba chu i s n ph m (đi m đ n, n i ngh chân, th ng ư ậ ị ỗ ữ ế ỗ ể
ả
c nh). Nh ng chu i này có th có giá tr r ng. Nh v y n u tb = (b, sb1, sb2, sb3) ta có v i. ớ 53 ộ ươ ộ N u ế ị
là m t tour du l ch khác, ta có đ t ồ
ng đ ng ữ ẩ ả ạ ộ ươ ư gi a hai s n ph m thu c cùng lo i theo ph ng trình nh sau: (1.28) ố ủ ọ ị ấ
Tr ng s c a tb[1] mang giá tr cao nh t ủ ầ ầ ượ ữ ọ ơ vì là thành ph n đ u tiên c a tb, đ c đánh giá quan tr ng h n nh ng thành ầ ạ ớ ọ ố ượ ỉ ệ ph n còn l i v i tr ng s đ c chia theo t l . ể ể ượ ị ộ ươ ữ ả ầ ồ Đ có th có đ c giá tr đ t ng đ ng gi a hai tb, ta c n ph i tính ộ ươ ủ ừ ầ ầ ầ ồ ộ toán đ t ng đ ng c a t ng thành ph n trong m t tb. Thành ph n đ u tiên ặ ả ấ ủ ầ ộ ể
là đ c đi m mô t yêu c u chung nh t c a m t tb (B): (1.29) ị ủ ữ ữ ầ ộ ơ Nh ng thành ph n trong B là nh ng giá tr c a m t véct ặ
các đ c tính ố ượ ườ ư ậ ị (chi phí cho phép (budget), s l ng ng i du l ch (party)...). Nh v y, ta có ộ ệ ứ ể ị ơ ả
th xác đ nh m t h th c kho ng cách trong không gian véct ặ
các đ c tính 54 ữ ầ ớ ể ễ này. Ng ượ ạ
c l i, v i nh ng thành ph n còn l ạ ượ
i đ c bi u di n d ướ ạ
i d ng ỗ ả ộ ươ ẩ ượ ư ể chu i s n ph m, đ t ồ
ng đ ng đ ễ
c bi u di n nh sau: (1.30) ệ ứ ể ả ả ẩ là h th c kho ng cách trong không gian s n ph m có ki u . ộ ươ ữ ồ 2.2.4.2. Đ t ng đ ng gi a Travel Wish ươ ự ớ ủ ầ ị ườ T ng t ề ộ
v i TB, yêu c u v m t tour du l ch c a ng i dùng (TW) ượ ư ể đ ễ
c bi u di n nh sau: (1.31) Trong đó: ữ ề ầ
là nh ng yêu c u chung v tour ề ể ữ ế ầ là nh ng yêu c u v đi m đ n (location) ữ ể ầ ị ỉ ề
là nh ng yêu c u v đ a đi m ngh chân (accommodation) ữ ả ầ ề ắ
là nh ng yêu c u v th ng c nh (attraction) ậ ươ ứ V y t ng ng ta có (1.32) 55 ữ ơ ặ ấ
V i ớ và là nh ng truy v n trong không gian véct ả
các đ c tính s n ẩ ấ ph m. Gi ả ử ồ ạ
s t n t i hai truy v n trong không gian v i ớ X là m tộ ơ ả ố ượ ữ ẩ không gian véct ấ
s n ph m. Truy v n này là nh ng đ i t ấ
ng có c u trúc ư nh sau: (1.34) v i:ớ (1.35) ể ả ể ụ ứ Đ mô t bi u th c trên, ta có ví d sau: ứ ấ ầ ộ ộ là hai truy v n thu c không gian thành ph n th 3 trong m t tình ể ố ử ố ọ ị hu ng tour (đi m ăn ngh ) ỉ X.2 Giá s các tr ng s có giá tr 1, ta có: 56 ộ ươ ậ ẽ ượ ồ ư ố ớ Đ t ng đ ng do v y s đ c tính nh sau (gi ng v i TB) (1.36) (1.37) Và (1.38) ộ ươ ữ ồ ớ 2.2.4.3. Đ t ng đ ng gi a Travel Bag v i Travel Wish (1.39) V i:ớ 57 (1.40) ừ T đây, ta có: (1.41) V i ớ Và (1.42) (1.39) ộ ươ ữ ồ ườ 2.2.4.4. Đ t ữ
ng đ ng gi a nh ng ng i dùng ệ ư ấ ồ ơ ườ ượ ị ộ ơ Trong h t v n, h s ng i dùng đ c đ nh nghĩa là m t véct các ư ậ ộ ươ ữ ồ ơ ồ ườ ể ượ ặ
đ c tính. Nh v y, đ t ng đ ng gi a h s ng i dùng có th đ c tính ư ộ ươ ữ ầ ồ toán nh đ t ng đ ng gi a các thành ph n tour. N u ế u = và (u1,…,un ), u^' = (u1^',…,un^'), ta có: (1.43) 58 ươ 2.2.4.5. T ồ
ng đ ng kép ươ ộ ươ ồ ữ ẩ ả ồ T ng đ ng kép là phép đo đ t ng đ ng gi a các s n ph m đ ượ
c ủ ự ế ầ ườ ố ớ ữ ả tìm ki m d a trên yêu c u (TW) c a ng ẩ
i dùng đ i v i nh ng s n ph m ữ ộ ố ươ ự ớ ệ ạ thu c nh ng tình hu ng tour t ng t ố
v i tình hu ng tour hi n t i đã đ ượ
c ế
tìm ki m. ụ ả ế ẩ ắ Hình 2.3. S p x p danh m c s n ph m ừ ả ử ầ ắ ữ ế ế ể ộ T hình 1.5, gi s ta c n s p x p m t danh sách nh ng đi m đ n đã ượ ế ầ ườ ự ố đ c tìm ki m theo yêu c u ng ữ
i dùng, d a trên nh ng tình hu ng tour ư ả tham kh o theo nh hình 1.6: 59 ế ể ắ ế
Hình 2.4. S p x p đi m đ n ư ậ ể ắ ứ ự ể ế ế ể ượ ầ ợ Nh v y, đ có th s p x p th t đi m đ n đ ả
c g i ý, ta c n ph i ộ ươ ủ ừ ữ ế ế ể ể ồ ớ tính toán đ t ng đ ng c a t ng đi m đ n v i nh ng đi m đ n có trong ụ ố ươ ự ả ử danh m c tình hu ng tour t ng t . Gi s ta có Sim(D1,CD1) = m Sim(D1,CD2) = n… Sim(D2,CD1) = p Sim(D2,CD2) = q … ầ ượ Trong đó Sim(D1, CD1) và Sim(CC, C2) = b l n l t là đ t ộ ươ
ng ệ ạ ữ ố ả ố ồ
đ ng gi a tình hu ng tour hi n t i và hai tình hu ng tour tham kh o đ ượ
c ộ ươ ị ươ ồ ồ xét. Ta có, đ t ng đ ng kép. Giá tr t ng đ ng Sim(CC, C1) có th ể ượ ư ọ ộ ươ ố ự ồ đ c coi nh tr ng s trong tính toán đ t ng đ ng kép. D a vào giá tr ị ươ ụ ủ ể ồ ớ t ả
ế
ng đ ng kép c a D1 v i các đi m đ n trong danh m c tour tham kh o, ị ượ ể ta xác đ nh đ c đi m đánh giá (1.44) ể ượ ươ ự ữ ự Đi m đánh giá Score(D2) cũng đ c xét t ng t ể
. D a trên nh ng đi m ể ị ượ ứ ự ợ ủ ẩ ả đánh giá này, ta có th xác đ nh đ c th t g i ý c a các s n ph m đ ượ
c tìm ki m.ế 60 ổ ể
2.2.4.6. Đánh giá t ng th (1.45) ớ ầ ố ữ ỗ ị ị ư ậ ầ ử ể ị ự ộ ươ ữ ổ ổ
V i là t ng s nh ng thành ph n trong có giá tr khác r ng vì giá tr trung
ỉ ồ ạ
ị
i khi các thành ph n có giá tr khác r ng. Nh v y, ta có . S
bình ch t n t
ổ
ụ
ữ
ị
d ng giá tr đánh giá t ng quan, ta có th xác đ nh m c đ khác nhau gi a
ố ớ ừ
ườ
ữ
i dùng đ i v i t ng tình hu ng xây d ng tour khác
nh ng đánh giá c a ng
ồ
nhau, hay đ t ỗ
ứ ộ
ố
ủ
ng đ ng gi a các đánh giá t ng quan ươ 2.2.4.7. Tìm case t ng t ự ề ộ ươ ữ ự ữ ồ ị
D a trên nh ng đ nh nghĩa v đ t ầ
ng đ ng gi a các thành ph n ộ ươ ữ ồ ố ừ ể
tour, ta có th tính toán đ t ng đ ng gi a các tình hu ng tour, t đó có ể ư ữ ố ươ ự ớ ố th đ a ra danh sách nh ng tình hu ng tour t ng t v i tình hu ng tour ệ ạ ữ ế ố ươ hi n t i. Quá trình tìm ki m nh ng tình hu ng tour t ng t ự ượ
đ ể ệ
c th hi n ằ
b ng hình 1.7 61 ế ố ươ ự ng t Hình 2.5. Quá trình tìm ki m tình hu ng tour t ữ ố ươ Danh sách nh ng tình hu ng tour t ng t ự ượ
đ ế
c tìm ki m qua hai b c:ướ ộ ọ ướ ầ ế ấ
B l c truy v n logic: Là b c đ u tiên trong quá trình tìm ki m. T i b ạ ướ
c ơ ở ữ ệ ữ ư ề ệ ố ỏ ấ
này, nh ng tình hu ng l u trong c s d li u th a mãn đi u ki n truy v n ớ ượ ầ ấ ọ ộ ồ logic v i B x U x R đ c trích ch n. M t truy v n Q bao g m yêu c u truy ấ ủ ơ ả ồ ơ ữ ặ ộ ườ ấ
v n nh ng đ c tính c b n nh t c a m t tour (B), h s ng i dùng (U), ữ ấ ồ ữ ệ ạ
và đánh giá (R). Ngu n d li u t o nên nh ng truy v n đ ượ ấ ừ
c l y t yêu ườ ố ớ ụ ề ữ ể ấ ộ ầ
c u ng ạ
i dùng đ i v i m t tour. Ví d v nh ng truy v n có th có d ng sau: (cid:0) Tìm ki m nh ng tình hu ng đã đ ữ ế ố ượ ự ộ ở
c xây d ng b i cùng m t ng ườ
i dùng (cid:0) Tìm ki m nh ng tình hu ng có đi m đ n gi ng v i đi m đ n c a
ủ ữ ế ể ể ế ế ố ớ ố ệ ạ ố
tình hu ng hi n t i 62 (cid:0) Tìm ki m nh ng tình hu ng có đi m đ n cùng lo i và tr i nghi m
ệ ữ ế ể ế ả ạ ố ườ ệ ạ ớ ố ố ng i dùng gi ng v i tình hu ng hi n t i (cid:0) Tìm ki m nh ng tình hu ng tour có kho ng th i gian du l ch nh h n
ỏ ơ ữ ế ả ờ ố ị 1 tu nầ ộ ử ể ả ố ượ ứ ệ ả ả ố Đ đ m b o hi u qu trong đáp ng t c đ x lý, s l ng tình ượ ế ở ướ ả ượ ố ả ướ ố
hu ng đ c tìm ki m b c này ph i đ c t i gi n vì b ế
c tìm ki m ố ươ ử ề ồ ố ờ tình hu ng t ng đ ng tiêu t n nhi u th i gian x lý. ướ ộ ươ ự ứ ữ ồ Trong b c th hai, d a vào tính toán đ t ng đ ng gi a tình ệ ạ ố ố ượ ế ở ướ hu ng hi n t i và tình hu ng tour đ c tìm ki m b ệ ố
c 1, h th ng s ẽ ấ ớ ệ ạ ề ầ ố ộ ươ ư
đ a ra k láng gi ng g n nh t v i tình hu ng tour hi n t i (đ t ồ
ng đ ng ả ậ ướ ế ượ ấ
cao nh t). Mô t thu t toán cho b c tìm ki m này đã đ c trình bày trong ớ ệ ứ ụ ầ ả ố ph n 2.6.1 v i h th c kho ng cách áp d ng cho tình hu ng tour hoàn ỉ
ch nh: d(c,c' )= ln(Sim(c,c')) (1.46) ợ ỉ 2.2.5. G i ý hoàn ch nh 63 ượ ỉ ể ấ
ự
D a vào hình 2.6 ta có th th y các thành ph n tour đ
ế ỉ ạ
ầ ợ
ả ầ ự ủ ẩ ế
ệ ạ ố ố ấ
ồ
ọ ừ ơ ở ữ ệ
ữ ữ ụ ố ự ế ế ư ậ
ả
ả
ả ng đ ng cao nh t v i tình hu ng tour hi n t
ự
ẩ
ầ
ẩ
ẩ ụ
ườ ộ ể ợ
ề ả
i dùng có th ch n m t hay nhi u s n ph m đ
ự
c xây d ng. Các b ườ ữ t c nh ng thành ph n thi ế
i cho đ n khi ng ả ấ ộ ợ
ầ
ầ
c g i ý d n
ụ
ướ
ộ
cho đ n khi t o thành m t tour hoàn ch nh. Các b
c g i ý áp d ng cho
ư
ắ
ơ
ể
ừ
ế
t ng thành ph n tour (đi m đ n, n i ăn ngh , th ng c nh) là nh nhau.
ườ
ầ
ệ ố
ầ
ướ
i dùng (TW), h th ng
B c đ u tiên, d a theo yêu c u đ u vào c a ng
ẽ ế
ơ ở ữ
ể
ụ ả
ế
s ti n hành tìm ki m danh m c s n ph m (v.d. đi m đ n) trong c s d
ữ
ủ
ự
ế
ệ
i, nh ng tình
li u. Ti p theo, d a vào c u trúc c a tình hu ng tour hi n t
ệ ạ ẽ ượ
ấ ớ
ộ ươ
ố
hu ng tour có đ t
i s đ
c
ố
c s d li u tình hu ng (case base). Nh v y, d a vào danh
trích ch n t
ượ
ự
ươ
c
, danh m c nh ng s n ph m đã đ
ng t
sách nh ng tình hu ng tour t
ộ
ứ
ượ ắ
ơ ở ữ ệ
tìm ki m trong c s d li u đ
c s p x p d a trên gi m d n m c đ
ẽ ượ
ố
ồ
ươ
c
ng đ ng kép (m c 2.8.5). Cu i cùng, danh sách g i ý s n ph m s đ
t
ợ
ượ
ể ọ
ư
ừ
c g i
đ a ra. T đó, ng
ượ
ướ
ị
ở
top trên đ thêm vào tour du l ch đang đ
c trên
ý
ượ ặ ạ
ế
ầ
ấ ả
đ
t
c l p l
i dùng đã có t
ị
ấ ủ
ế
y u nh t c a m t tour du l ch và c m th y hài lòng. 64 ươ Ế Ệ Ố Ổ Ế Ch ng 3. PHÂN TÍCH THI T K H TH NG C NG THÔNG TIN DU L CHỊ ơ ở ự ệ ớ D a vào các c s lý thuy t ế ở ươ
ch ng 1, cùng v i các tài li u [4,5,6,7] ượ ơ ồ ủ ự ư ể ả mà tôi đã có đ c các b ng th c th cũng nh các s đ c a thi ế ế ơ ở
t k c s ư ư ữ ệ
d li u cũng nh thi ế ế ươ
t k ch ng trình nh sau: ế ế ơ ở ữ ệ 3.1. Thi t k c s d li u ự ể
3.1.1. Các th c th ơ ồ ủ ư ư Báng fithou_accommodation: L u trg nh các s đ c a thi ế ế ơ ở
t k c s ữ ệ
d li u cũng ữ ệ ả ̉ Bang ạ
. B ng d li u khách s n ả Tên tr ngườ ể ữ ệ
Ki u d li u Ràng bu cộ ễ
Di n gi i Khóa chính Auto Increment ID int Name varchar Tên khách s nạ Address varchar ỉ
ị
Đ a ch ệ Phone varchar ạ
Đi n tho i Stars tinyint Sao ID_City int Khóa ngo iạ Thành phố Name_City varchar ậ Khóa ngo iạ ệ
Qu n, huy n ID_Des int Desc text Mô tả Images varchar nhẢ ID_Supplier int Name_Supplier varchar Checked tinyint ụ Services varchar ị
Các d ch v ơ ở ậ Facilities varchar ấ
C s v t ch t 65 ề ể ư ả ị ữ
B ng fithou_attraction l u tr các thông tin v đi m du l ch ữ ệ ả ắ ả ̉ Bang 2 . B ng d li u th ng c nh ả ngườ i Tên tr
ID ể ữ ệ
Ki u d li u
int Ràng bu cộ
Khóa chính ễ
Di n gi
Auto Name varchar Increment
ể
Tên đi m du Khóa ngo iạ l chị
ỉ
ị
Đ a ch
Thành phố ể Khóa ngo iạ Address
ID_City
Name_City
ID_Des
Price varchar
int
varchar
int
int ế
Đi m đ n
Giá vé (n uế ể có)
Mô tả
ạ
ệ
Đi n tho i
nhẢ
ặ
Đ c đi m Desc
Phone
Images
Characteristics
Checked
ID_Supplier text
varchar
varchar
varchar
tinyint
int ể ả ặ ạ ị B ng fithou_characteristics: Đ c đi m, lo i hình du l ch… ữ ệ ả ặ ạ ị ̉ ể
B ng d li u đ c đi m, lo i hình du l ch Bang 3. ả ngườ i Tên tr
ID ể ữ ệ
Ki u d li u
int Ràng bu cộ
Khóa chính ễ
Di n gi
Auto ể Name varchar Increment
ặ
Tên đ c đi m ụ ả ố B ng fithou_city: Danh m c các thành ph 66 ữ ệ ố ̉ Bang 4. B ngả d li u các thành ph ả ngườ i Tên tr
ID ể ữ ệ
Ki u d li u
int Ràng bu cộ
Khóa chính ễ
Di n gi
Auto ể Increment
ặ
Tên đ c đi m Name varchar Mô tả Desc text Khóa ngo iạ Khu v cự ID_Region int Name_Region varchar ả B ng fithou_destination ữ ệ ể ả ̉ Bang ế
5. B ng d li u các đi m đ n ả ngườ i Tên tr
ID ể ữ ệ
Ki u d li u
int Ràng bu cộ
Khóa chính ễ
Di n gi
Auto Increment ế Name varchar Tên đi m để ID_City int Khóa ngo iạ Thành phố Name_City varchar Images varchar nhẢ Desc text Mô tả ạ Characteristics varchar Lo i hình du l chị Checked tinyint ự ệ ả B ng fithou_event: Các s ki n, l ễ ộ
h i ữ ệ ự ệ ả ̉ ễ ộ
h i Bang 6. B ng d li u s ki n, l ả Tên tr ngườ ể ữ ệ
Ki u d li u Ràng bu cộ ễ
Di n gi i 67 ID int Khóa chính Auto Increment Name varchar ự ệ
Tên s ki n ID_City int Khóa ngo iạ Thành phố Name_City varchar Address varchar ỉ
ị
Đ a ch Price float Giá vé ệ Phone varchar ạ
Đi n tho i Desc text Mô tả Images varchar nhẢ ID_Supplier int Name_Supplier varchar Checked tinyint ấ ủ ả ạ ộ ơ ở ậ
B ng fithou_facilities: C s v t ch t c a m t khách s n ữ ệ ơ ở ậ ả ̉ Bang ấ
7. B ng d li u c s v t ch t ả Tên tr ngườ ể ữ ệ
Ki u d li u Ràng bu cộ ễ
Di n gi i ID int Khóa chính Auto Increment Name varchar ệ
Tên ti n nghi ủ ả ạ ạ ỗ B ng fithou_price_acc: Giá c a m i lo i phòng trong khách s n ữ ệ ả ̉ Bang ạ
8. B ng d li u giá phòng các khách s n 68 ả Tên tr ngườ ể ữ ệ
Ki u d li u Ràng bu cộ ễ
Di n gi i ID_Acc int Khóa chính Khách s nạ ạ ID_Type int Khóa chính Lo i phòng Price int Giá ộ ử ạ ả ủ ả ẩ B ng fithou_product_type: Các lo i s n ph m c a m t c a hàng ạ ả ữ ệ ả ẩ ̉ Bang 9. B ng d li u các lo i s n ph m ả Tên tr ngườ ể ữ ệ
Ki u d li u Ràng bu cộ ễ
Di n gi i ID int Khóa chính Auto Increment Name varchar ả
ạ
Tên lo i s n ph mẩ ả B ng fithou_region ữ ệ ả ̉ Bang ự
10. B ng d li u các khu v c ả ngườ i ể ữ ệ
Ki u d li u
int Ràng bu cộ
Khóa chính Tên tr
ID ễ
Di n gi
Auto Increment Name varchar Tên khu v cự Desc text Mô tả ả ạ ạ ộ B ng fithou_room_type: Các lo i phòng trong m t khách s n ữ ệ ạ ả ̉ Bang 11. B ng d li u các lo i phòng 69 ả ngườ i ể ữ ệ
Ki u d li u
int Ràng bu cộ
Khóa chính Tên tr
ID ễ
Di n gi
Auto Increment Name varchar ạ
Tên lo i phòng Images varchar Image Desc text Mô tả ứ Capacity tinyint ứ
S c ch a ụ ủ ạ ị ả ạ ộ B ng fithou_services: Các lo i d ch v c a m t khách s n ữ ệ ụ ủ ̉ Bang ạ
ị
12. B ngả d li u các d ch v c a khách s n ả ngườ i Tên tr
ID ể ữ ệ
Ki u d li u
int Ràng bu cộ
Khóa chính ễ
Di n gi
Auto Increment ụ Name varchar ị
Tên d ch v ả B ng fithou_rec_case: Case base ữ ệ ̉ d li u case base Bang 13 B ng ả ả ngườ i Tên tr
ID ể ữ ệ
Ki u d li u
int Ràng bu cộ
Khóa chính ễ
Di n gi
Auto Increment ID_TravelWish int Khóa ngo iạ Travel wish ID_TravelBag int Khóa ngo iạ Travel bag ID_UserProfile int Khóa ngo iạ Profile ID_Reward int Khóa ngo iạ Reward ố ủ ể ả ầ B ng fithou_rec_reward: Đi m s c a các thành ph n trong case ầ ủ ữ ệ ể ố ̉ d li u đi m s các thành ph n c a case Bang 14. B ng ả 70 ả ngườ i Tên tr
ID ể ữ ệ
Ki u d li u
int Ràng bu cộ
Khóa chính ễ
Di n gi
Auto Increment ể Base_Contraint tinyint Đi m đánh giá ể Location tinyint Đi m đánh giá ể Accommodation tinyint Đi m đánh giá ể Attraction tinyint Đi m đánh giá ơ ồ ự ế ể
3.1.2. S đ liên k t th c th 3.2. Thi ế ế ươ
t k ch ng trình ế ế 3.2.1. Thi ớ ữ ệ
t k các l p d li u
ớ ơ ở ố ượ SimilityObject: L p c s các đ i t ng khác ̉ Bang 15. L p ớ SimilityObject 71 ộ
Thu c tính Mô tả ộ ươ ự simility Đ t ng t ươ Ph ứ
ng th c Mô tả ở ạ __construct() Hàm kh i t o 72 ế ủ BaseConstraint: Các yêu c u v chuy n đi c a ng i dùng ̉ ầ
Bang ề
ườ
16. L pớ BaseConstraint ộ
Thu c tính Mô tả duration ế ờ Th i gian kéo dài chuy n đi month Đi vào tháng nào year Đi vào năm nào ư ế ặ party ộ
Đi nh th nào (m t mình, c p đôi, gia đình…) min_budget ấ ấ
Chi phí th p nh t max_budget Chi phí t i đaố ươ Ph ứ
ng th c Mô tả ở ạ __construct() Hàm kh i t o ả ộ ế Location: Mô t ể
m t đi m đ n ̉ Bang 17. L p ớ Location ộ
Thu c tính Mô tả city Mã thành phố ế ể destination Đi m đ n ể ặ chars Đ c đi m ế des_name ể
Tên đi m đ n ươ Ph ứ
ng th c Mô tả ở ạ __construct() Hàm kh i t o 73 74 ả ộ Accommodation: Mô t ̉ ạ
m t khách s n
18. L p ớ Accommodation Bang ộ
Thu c tính Mô tả accommondation Mã khách s nạ room_type ạ Lo i phòng capacity ứ ứ
S c ch a min_price ố Giá t ể
i thi u max_price Giá t i đãố star ạ ấ
Lo i m y sao is_hotel Có là khách s nạ services ụ ị
Các d ch v facilities ơ ở ậ ấ
C s v t ch t acc_name Tên khách s nạ ươ Ph ứ
ng th c Mô tả ở ạ __construct() Hàm kh i t o ả TravelInformation: Mô t travel bag và travel wish ̉ Bang 19. L p ớ TravelInformation ộ
Thu c tính Mô tả base_constraint ố ượ Đ i t ng BaseConstraint location ố ượ Đ i t ng Location accommodation ố ượ Đ i t ng Accommodation 75 attraction ố ượ Đ i t ng _Attraction ươ Ph ứ
ng th c Mô tả ở ạ __construct() Hàm kh i t o ấ ả ủ ế ị _Case: C u trúc case mô t chuy n đi c a khách du l ch ̉ Bang 20. L p ớ Case ộ
Thu c tính Mô tả travel_wish ố ượ Đ i t ng TravelInformation travel_bag ố ượ Đ i t ng TravelInformation user_profile ố ượ Đ i t ng UserProfile reward ố ượ Đ i t ng Reward ươ Ph ứ
ng th c Mô tả ở ạ __construct() Hàm kh i t o ố ế ậ ứ
CBRConfig: Ch a các thông s thi t l p ̉ Bang 21. L p ớ CBRConfig ộ
Thu c tính Mô tả no_of_sim_case ố ượ ươ ự ấ ng case t ng t l y ra ố ượ ố ơ ng t i đa các item g i ý S l
max_recommendation_item S l
max_search_item ố ượ ế ố S l ng tìm ki m t i đa 76 duration_range Duration Range month_range Month Range year_range Year Range budget_range Budget Range capacity_range Capacity Range acc_price_range Accommodation Price Range att_price_range Attraction Price Range star_range Star Range year_of_birth_range Year Of Birth Range no_of_characteristic ố ượ ặ ộ S l ủ
ng đ c tính c a m t item ố ượ ơ ở ậ ấ ủ ộ no_of_facility S l ng c s v t ch t c a m t khách s nạ no_of_service ố ượ ụ ủ ạ ộ ị S l ng d ch v c a m t khách s n alpha Alpha tw_weight ố ọ Tr ng s Travel Wish tb_weight ố Trong s Travel Bag twb_weight ố ọ Tr ng s Travel Wish Bag u_weight ố Trong s User Profile r_weight ọ ố
Tr ng s Reward ơ ở ữ ệ ế DBAdapter: Các thao tác tìm ki m trên c s d li u ̉ Bang 22. L p ớ DBAdapter 77 ộ
Thu c tính CI Mô tả
ố
Đ i t ượ
ng CI_Controler c aủ framework ươ Ph ứ
ng th c Mô tả _construct () ở ạ Hàm kh i t o fetch_all_case () ấ ộ L y toàn b case search_accommodation (accommodation, Tìm khách s nạ location)
search_attraction (attraction, location) ể ơ
Tìm đi m vui ch i search_location (location) ế ể
Tìm đi m đ n ố ượ ứ ả ớ
CBR: L p đ i t ng ch a các hàm gi ậ
i thu t ̉ Bang 23. L p ớ CBR Mô tả ộ
Thu c tính dba ố ượ Đ i t ng DBAdapter all_case ố ượ ả M ng đ i t ng _Case current_case ố ượ Đ i t ng _Case ươ Ph ứ
ng th c Mô tả __construct() ở ạ Hàm kh i t o location_simility(loc1, loc2) ộ ượ ự ữ ể ế Đ t ng t gi a 2 đi m đ n location_scoring(location, ế ể ể Cho đi m đi m đ n similar_cases)
recommend_location(user_profile, ế ợ ể
G i ý đi m đ n base_constraint, location) 78 attraction_simility(att1, att2) ộ ượ ự ữ ị Đ t ng t ể
gi a 2 đi m du l ch attraction_scoring(att, similar_cases) ể ể ị Cho đi m đi m du l ch recommend_attraction(attraction) ợ ị ể
G i ý đi m du l ch accommodation_simility(acc1, acc2) ộ ượ ự ữ ạ Đ t ng t gi a 2 khách s n accommodation_scoring(acc, ể ạ Cho đi m khách s n similar_cases)
recommend_accommodation(accommo ạ ợ G i ý khách s n dation)
case_simility(case1, case2) ộ ươ ự ữ Đ t ng t gi a 2 case find_similar_case() ươ ự Tìm case t ng t ộ ượ ự ữ base_constraint_simility(base1, base2) Đ t ng t gi a 2 Base Constraint travel_infomation_simility(t1, t2) ộ ượ ự Đ t ng t TravelInformation user_profile_simility(u1, u2) ộ ượ ự Đ t ng t User Profile reward_scoring(r) ể Cho đi m Reward ộ ượ ự ữ ả arrray_distance(arr1, arr2) Đ t ng t ặ
gi a 2 m ng đ c tính overlap(x, y) Hàm overlap quick_sort(out arr_sim_obj, left, right) ế ắ ằ
S p x p b ng quick sort 79 ơ ồ ế ớ
3.2.2. S đ liên k t l p 80 ̀
Hinh 3.1 Classes Diagram 81 ệ ố ồ ử
3.2.3. Lu ng x lý h th ng 82 ươ Ệ Ố Ự Ch ng 4 . XÂY D NG H TH NG ệ ố ự 4.1. Xây d ng h th ng ệ ố ượ ự ự ằ H th ng đ c xây d ng d a trên framework Codeigniter, nh m k ế ệ ủ ử ụ ừ ấ ộ ớ
th a và s d ng giao di n c a famework m t cách nhanh chóng nh t. V i ả ệ ố ự ợ ị ớ
mô hình 3 l p MVC tác gi đã xây d ng h th ng g i ý du l ch thành công. ả ậ ượ ệ ố ặ ổ ớ Gi i thu t CBR đ ắ
c cài đ t vào h th ng v i các hàm tính t ng, hàm s p ộ ươ ự ế ả ợ ế
x p, các hàm tính đ t ng t , các hàm g i ý và các hàm test k t qu . ả ự ế ệ 4.2. K t qu th c hi n ệ ố ợ ị ả ư ậ ượ H th ng g i ý du l ch dùng gi i thu t CBR đã đ a ra đ ợ
c các g i ý ế ừ ầ ấ ớ ườ ử ụ ấ ượ ố có tính k th a g n nh t v i ng i s d ng và có ch t l ợ
ng g i ý t t, có ứ ể ượ ệ ố ở ộ th đáp ng đ c khi m r ng h th ng. ệ ố ệ ạ ớ ị ị ể
H th ng hi n nay v i 50 đ a đi m du l ch, 200 khách s n và 150 ụ ể ề ể ế ằ ớ ợ ị ầ
đi m đ n v i nhi u d ch v khác nhau đ nh m g i ý cho khách hàng g n ố ủ ấ ớ ườ nh t v i mong mu n c a ng i dùng. ơ ở ủ ườ ỷ ệ ế ả ợ Trên c s đánh giá c a 105 ng i dùng, t ớ
k t qu g i ý đúng v i l ố ườ mong mu n ng i dùng là 90%. 83 ệ ủ ệ ố ộ ố M t s giao di n c a h th ng: ự ầ ợ ọ
Hình 4.1. Các g i ý ban đ u cho khách l a ch n 84 Hình 4.2. Khi đã hoàn thành các g i ýợ Ế ƯỚ Ở Ộ Ậ
K T LU N VÀ H NG M R NG ậ ế
1. K t lu n ự ậ ượ ư ấ ứ ượ Lu n văn đã xây d ng đ ệ ố
c h th ng t v n đáp ng đ ầ
c yêu c u ườ ễ ậ ượ ữ ợ ặ
ủ
c a bài toán đ t ra, giúp ng i dùng d dàng nh n đ ầ
c nh ng g i ý g n ủ ệ ố ứ ủ ự ấ ọ ị nh t cho l a ch n du l ch c a mình. Các ch c năng chính c a h th ng bao • g m:ồ • ế ậ ậ ạ ơ
ể
C p nh t khách s n; đi m đ n và khu vui ch i • ể ế ế ạ ơ
Tìm ki m Khách s n; đi m đ n và khu vui ch i ể ể ế ạ ợ ợ ợ ị ị ợ
G i ý du l ch: G i ý đ a đi m; G i ý khách s n; G i ý đi m đ n ở ộ ướ 2. H ng m r ng ể ạ ượ ệ ố ư ư ặ ợ ệ ả M c dù h th ng đã đ a ra các g i ý, nh ng đ đ t đ c hi u qu cao ệ ố ế ể ả ầ ổ ơ
h n, c n ph i phát tri n h th ng theo đúng ki n trúc “c ng thông tin”, ữ ệ ồ ủ ị trong đó d li u đ ượ ấ ừ
c l y t ngu n c a các công ty du l ch khác nhau đ ượ
c ứ ẽ ể ượ ứ ộ ủ ki m ch ng, khách hàng s đánh giá đ ợ
ợ
c m c đ phù h p c a các g i ý ệ ố ơ ở ư ớ ượ ộ do h th ng đ a ra. Trên c s đó m i đánh giá đ ủ
c đ chính xác c a ươ ph ng pháp. ự ự ề ầ ế ị ộ ệ ố
Ngoài ra c n xây d ng h th ng d a trên n n các thi t b di đ ng đ ể ề ự ư ấ ủ ế ệ ệ ậ ị ti n cho vi c truy c p c a khách du l ch, cũng nh l y ý ki n v s phù ệ ạ ợ ủ ệ ư ấ
h p c a h t v n hi n t i. 85 [1]. Aalap Kohojkar, Yang Liu, Zhan Shi, Recommender Systems, 2008. [2]. Adriano Venturini, Bora Arslan, Francesco Ricci, Nader Mirzadeh, Ả Ệ TÀI LI U THAM KH O [3]. Langer, Arthur M, Analysis and Design of Information Systems, 2008 [4]. Quang Nhat Nguyen and Francesco Ricci, Conversational Casebased Detailed Descriptions of CBR Methodologies, ICTirst, 2002. Recommendations Exploiting a Structured Case Model, 9th European Conference, ECCBR 2008, Trier, Germany, September 14, 2008. Proceedings. [5]. ThS. Nguy n Đ c Hoa C ng; PGS. TS Nguy n Xuân Hoài; TS. ươ ứ ễ ễ ễ ề ễ ằ ỗ ị Đ tàiề Nguy n Th Hi n; TS. Nguy n Đ Văn; TS. Ban Hà B ng, ệ ố ứ ự ứ ế ậ ọ ạ
nghiên c u khoa h c “Nghiên c u, xây d ng h th ng l p k ho ch ớ ổ ợ ị ị ệ du l ch tích h p v i c ng thông tin du l ch Vi t Nam”, ĐH Hà N i,ộ 2015. ế ế ệ ố ả Phân tích và thi t k h th ng thông tin qu n lý ễ
[6]. Nguy n Văn Ba, , NXB ĐHQG, 2002 ậ ế ế ệ ố t k h th ng thông tin ỹ
[7]. Lê Văn Phùng, K thu t phân tích và thi ướ ấ ả ề h ấ
ng c u trúc , Nhà xu t b n Thông tin và Truy n thông, 2011. LÝ L CHỊ TRÍCH NGANG ễ Họ và tên: Nguy n Đình Gi ớ
i ắ Ngày tháng năm sinh: 19/09/1988 Nơi sinh: B c Ninh ố ệ ầ Đ aị chỉ liên l cạ : 387 Hoàng Qu c Vi ộ
ấ
t C u Gi y – Hà N i Quá trình đào t oạ : ạ ọ ạ ệ ậ ọ ự + 2010 – 2013: Liên thông Đ i h c t ỹ
i H c vi n K thu t Quân s ọ ạ ọ ệ ậ ọ ự + 2014 – nay: H c cao h c t ỹ
i H c vi n K thu t Quân s ườ ư ẳ Quá trình công tác: 2011 – nay: Nhân viên Tr ạ
ng Cao đ ng S ph m ươ Trung ng. XÁC NH NẬ QUY NỂ LU NẬ VĂN ĐỦ ĐI UỆ KI NỆ B OẢ VỆ ễ ớ
i Họ và tên tác giả lu nậ văn: Nguy n Đình Gi ệ ố ứ ế ạ ậ ị ự
Đề tài lu nậ văn: Nghiên c u, xây d ng h th ng l p k ho ch du l ch d a
ự ệ ợ trên h g i ý ọ Chuyên ngành: Khoa h c máy tính Mã số: 60 48 01 01 ễ ị ề
Cán bộ hư ngớ d nẫ : TS. Nguy n Th Hi n ả ệ ướ ủ ề ệ ộ ồ ậ ấ Đã đ đi u ki n b o v tr c H i đ ng ch m lu n văn. Ộ ƯỚ Ọ Ẫ CÁN B H NG D N KHOA H C H CỌ VIÊN ị ề ễ ễ Nguy n Th Hi n
CHỦ NHI MỆ KHOA (BỘ MÔN) ớ
Nguy n Đình Gi
i
CÁN BỘ KI MỂ TRA QU NẢ LÝ CHUYÊN NGÀNHHEOM() =
(1.21)
HVDM() =
CORR() =
v i 1 ớ
ớ
v i 1 .
ớ
Trong đó w[1,1] = 1 và v i > 1.
=
ớ
v i và
ớ
v i và (1.33)
ố ớ ặ
ị ế
ị ủ
ứ
ặ
ả
là giá tr c a đ c tính th k, là kho ng giá tr bi n thiên đ i v i đ c tính
th k. ứ
ớ ầ ượ
ặ
ạ
ặ
ự
Ta gi
ả ử ở
s
đây ho c v i l n l
t là đ c tính d ng ký t
ố
ạ
và d ng s .
ữ
ấ
ả
ầ
ộ
ớ
ấ
V i là m t yêu c u truy v n tour khác, ta có kho ng cách gi a hai truy v n
ữ
ư
ả
ả
ớ
ố
ị
ượ
đ
ẩ
c đ nh nghĩa nh sau (gi ng v i cách tính kho ng cách gi a hai s n ph m
ộ
ộ
thu c cùng m t không gian)
V i ớ
và
ớ
v i và ta có
ớ ượ
ị
ươ
V i đ
c đ nh nghĩa theo ph
ầ
ng trình (1.34), là không gian thành ph n
ể
ế
ả
ắ
ỉ
ơ
tour ( là đi m đ n, là n i ăn ngh , là th ng c nh).
Ta có
ủ
ườ
ề
ộ
ượ
ượ
l
ầ
t là yêu c u c a ng
ị
i dùng v tour du l ch, và m t tour đã đ
ự
c xây d ng.
ể
ị
ượ
ộ ươ
ứ
ữ
ầ
ồ
ị
ể
Đ có th xác đ nh đ
c m c đ t
ng đ ng gi a tw và tb’, ta c n xác đ nh
ữ
ồ
ộ
ớ
ộ
ộ
ượ ộ ươ
đ
c đ t
ng đ ng gi a m t truy v n
ầ
ấ v i m t thành ph n thu c không gian X.
ớ
ượ ị
ươ
ả
ế ặ
ứ
V i và đ
c đ nh nghĩa theo ph
ng trình (3.32), gi
thi
t đ c tính th không
ớ ầ ượ
ệ
ề
ặ
ộ
ặ
ạ
ự
có đi u ki n ràng bu c, ta có ho c v i l n l
t là đ c tính d ng ký t
ạ
và d ng
ố ặ
s . Đ t , ta có:
ượ ị
ươ
V i ớ , và đ
c đ nh nghĩa trong ph
ng trình
ệ ứ
ồ ơ
ụ
ả
ớ
ườ
ả
V i là h th c kho ng cách áp d ng cho h s ng
i dùng , kho ng cách
ủ ồ ơ
ồ ơ
ữ
ừ
ặ
ặ
ố
ọ
gi a các đ c tính trong h s , và là tr ng s cho t ng đ c tính c a h s ng
ườ
i
dùng.
ể
ượ ư
ở
ườ
ượ
Đi m đánh giá đ
c đ a ra b i ng
i dùng, đ
ứ
c dùng trong đánh giá m c
ủ
ộ
ượ
ệ ố
ể
ợ
ượ
ộ
đ thành công c a m t tour đ
c h th ng g i ý. Đi m đánh giá đ
c dành cho
ổ ợ
ừ
ữ
ể
ầ
ộ
toàn b tour và t ng thành ph n trong tour. T h p nh ng đi m đánh giá này, ta
ể ọ
ổ
ố
ộ
ượ
ự
có th g i là đánh giá t ng quan. M t tình hu ng tour đ
ậ
c xây d ng và nh n
ệ ư ấ
ứ
ể
ổ
ượ
đ
c đi m đánh giá t ng quan càng cao, h t
v n càng ch ng t
ỏ ượ
đ
ệ
c hi u qu
ả
ệ ư
ể
ợ
ớ
ỗ
ữ
ươ
trong vi c đ a ra g i ý. V i m i đi m đánh giá
ố
là nh ng s nguyên d
ng, ta có
ố ự ươ
ữ
ẽ
ể
ổ
ượ
ị
đi m đánh giá t ng quan s là nh ng s th c d
ng, đ
c tính theo giá tr trung
ủ ừ
ầ
ả ử
ộ
ớ
bình c a t ng đánh giá thành ph n. Gi
ố
s ta có m t tình hu ng tour v i , trong
ữ
ể
ườ
ồ ạ
ợ
ằ
đó thang đi m đánh giá n m gi a 1 và 5: trong tr
ng h p đánh giá t n t
i. Ta
ị ố
ể
ả
ộ
ườ
ợ
ị
đ nh nghĩa là giá tr t
i đa kh dĩ cho m t đi m đánh giá (trong tr
ng h p này là
ể
ổ
ượ ị
ư
5), ta có đi m đánh giá t ng quan đ
c đ nh nghĩa nh sau:
ầ
ợ
Hình 2.6. Qui trình g i ý các thành ph n tour