B  Ộ GIÁO DỤC VÀ ĐÀO TẠO B  Ộ QUỐC PHÒNG

HỌC VIỆN K  Ỹ THUẬT QUÂN SỰ

Ễ Ớ NGUY N ĐÌNH GI I

Ứ Ự Ậ Ạ Ế Ị

Ệ Ợ Ự Ệ Ố NGHIÊN C U, XÂY D NG H  TH NG L P K  HO CH DU L CH D A TRÊN H  G I Ý

LU NẬ  VĂN TH CẠ  SĨ

ọ Chuyên ngành: Khoa h c máy tính

Hà N iộ  ­ Năm 2016

B  Ộ GIÁO DỤC VÀ ĐÀO TẠO B  Ộ QUỐC PHÒNG

HỌC VIỆN K  Ỹ THUẬT QUÂN SỰ

Ễ Ớ NGUY N ĐÌNH GI I

Ứ Ự Ậ Ạ Ế Ị

Ệ Ợ Ự Ệ Ố NGHIÊN C U, XÂY D NG H  TH NG L P K  HO CH DU L CH D A TRÊN H  G I Ý

ọ Chuyên ngành: Khoa h c máy tính

ố Mã s : 60480101

CÁN BỘ HƯ NGỚ  D NẪ  KHOA H CỌ

ị ề Cán bộ hư ngớ  d nẫ  chính: TS. Nguy nễ  Th  Hi n

Hà N iộ  ­ Năm 2016

ƯỢ CÔNG TRÌNH Đ Ạ C HOÀN THÀNH T I

Ọ Ậ Ỹ Ệ Ự H C VI N K  THU T QUÂN S

ộ ấ ệ ả Cán b  ch m ph n bi n 1:

ộ ấ ệ ả Cán b  ch m ph n bi n 2:

ạ ậ ượ ả ệ ạ Lu n văn th c sĩ đ c b o v  t i:

Ộ Ồ Ấ Ậ Ạ H I Đ NG CH M LU N VĂN TH C SĨ

Ọ Ậ Ệ Ỹ Ự H C VI N K  THU T QUÂN S

Ngày…tháng…năm 2016

C NGỘ  HÒA XàH IỘ  CHỦ NGHĨA VI TỆ  NAM

Đ cộ  l pậ  – Tự do – H nhạ  phúc

B NẢ  XÁC NH NẬ  CH NHỈ S AỬ  LU NẬ  VĂN TH CẠ  SĨ

ễ Họ và tên tác giả lu nậ  văn: Nguy n Đình Gi ớ i

ế ạ ệ ố ứ ự ậ Đề tài lu nậ  văn: Nghiên c u, xây d ng h  th ng l p k  ho ch du

ệ ợ ự ị l ch d a trên h  g i ý

ọ Chuyên ngành: Khoa h c máy tính

Mã số: 60480101

ộ ướ Cán b  h ng d n: ị ề ễ ẫ  TS. Nguy n Th  Hi n

Tác giả, cán bộ hư ngớ  d nẫ  khoa h cọ  và H iộ  đ ngồ  ch mấ  lu nậ  văn xác

nh nậ  tác  giả đã  s aử   ch aữ , bổ  sung  lu nậ  văn  theo  biên  b nả  h pọ  H iộ  đ ngồ

ư ớ ộ ngày ..............................................v i các n i dung nh  sau:

Ngày ..... tháng .... năm 2016

ộ ướ ẫ ả ậ Cán b  h ng d n Tác gi lu n văn

ị ề ễ ễ Nguy n Th  Hi n Nguy n Đình Gi ớ i

Ộ Ồ Ủ Ị Ư Ặ CH  T CH HO C TH  KÝ H I Đ NG

Tôi xin cam đoan:

Nh ngữ  k tế  quả nghiên c uứ  đư cợ  trình bày trong lu nậ  văn là hoàn toàn

trung th cự , c aủ  tôi, không vi ph mạ  b tấ  cứ đi uề  gì trong lu tậ  sở h uữ  trí tuệ

và pháp lu tậ  Vi tệ  Nam. N uế  sai, tôi hoàn toàn ch uị  trách nhi mệ  trư cớ  pháp

lu tậ .

TÁC GIẢ LU NẬ  VĂN

ớ ễ     Nguy n Đình Gi i

Ụ Ụ M C L C

Trang

Trang phụ bìa:.....................................................................................................

B nả  xác nh nậ  ch nhỉ s aử  lu nậ

văn:.......................................................................

B nả  cam

đoan: ....................................................................................................

M cụ

l cụ :...............................................................................................................

ắ Tóm t ậ   t lu n

văn:.................................................................................................

ữ ế ụ Danh m c ch  vi t

t tắ  ........................................................................................

ụ ả Danh m c b ng

bi uể ............................................................................................

Danh ụ m c hình

vẽ...............................................................................................

Ắ Ậ TÓM T T LU N VĂN

ễ ọ ọ + H  và tên h c viên: Nguy n Đình Gi ớ i

ọ + Chuyên ngành: Khoa h c máy tính Khoá: 2014 ­ 2016

ộ ướ ễ ẫ ị + Cán b  h ề ng d n: TS. Nguy n Th  Hi n

ề ệ ố ự ự ứ ế ậ ạ ị + Tên đ  tài: Nghiên c u, xây d ng h  th ng l p k  ho ch du l ch d a trên

ệ ợ h  g i ý.

ắ ả ụ ể ậ ổ + Tóm t t: Nghiên c u ứ  gi i thu t CBR đ  áp d ng vào c ng thông tin du

ằ ườ ữ ế ấ ợ ợ ị l ch nh m g i ý cho ng ị i dùng nh ng tour du l ch h p lý nh t. K t qu ả

ượ ư ố ợ g i ý đ c đ a ra khá t t.

Ữ Ế Ụ Ắ Ả B NG DANH M C CH  VI T T T

ữ Ký hi uệ Thu t ngậ

CBR Case –Based Reasoning

Ụ Ả Ể DANH M C B NG BI U

ả ̉ Bang 1. B ng d  li u ữ ệ  Khách s nạ

̉ Bang ả 2. B ng d ữ liệu thắng cảnh

ữ ệ ể ả ạ ị ̉ ặ Bang 3. B ng d  li u đ c đi m, lo i hình du l ch

ả ố ̉ ữ ệ Bang 4. B ng d  li u các thành ph

ế ể ả ̉ ữ ệ Bang 5. B ng d  li u các đi m đ n

ữ ệ ự ệ ả ̉ Bang 6. B ng d  li u s  ki n, l ễ ộ  h i

ữ ệ ơ ở ậ ả ̉ ấ Bang 7. B ng d  li u c  s  v t ch t

ữ ệ ả ạ ̉ Bang 8. B ng d  li u giá phòng các khách s n

ạ ả ữ ệ ả ẩ ̉ Bang 9. B ng d  li u các lo i s n ph m

ữ ệ ả ̉ ự Bang 10. B ng d  li u các khu v c

ả ạ ̉ ữ ệ Bang 11. B ng d  li u các lo i phòng

ữ ệ ụ ủ ả ạ ị ̉ Bang 12. B ng d  li u các d ch v  c a khách s n

ả ̉ Bang 1 3. B ng d  li u ữ ệ case base

ầ ủ ữ ệ ể ả ố ̉ Bang 14. B ng d  li u đi m s  các thành ph n c a case

ớ ̉ Bang 15. L p SimilityObject

ớ ̉ Bang 16. L p BaseConstraint

̉ ớ Bang 17. L p Location

ớ ̉ Bang 18. L p Accommodation

ớ ̉ Bang 19. L p TravelInformation

ớ ̉ Bang 20. L p Case

ớ ̉ Bang 21. L p CBRConfig

̉ ớ Bang 22. L p DBAdapter

ớ ̉ Bang 23. L p CBR

Ẽ Ụ DANH M C HÌNH V

̀ ọ ề Hinh 1.1. Minh h a v  Collaborative filtering

̀ ả Hinh 1.2. Qui trình gi ậ i thu t CBR

Hinh ̀ 2.1. Mô hình logic CBR

ọ ộ Hinh ̀ 2.2. Minh h a m t case

ụ ả ế ắ ẩ Hinh ̀ 2.3. S p x p danh m c s n ph m

ế ể ế ắ Hình 2.4. S p x p đi m đ n

ế ố ươ ự Hình 2.5. Quá trình tìm ki m tình hu ng tour t ng t

ầ ợ Hinh ̀ 2.6. Qui trình g i ý các thành ph n tour

Hinh ̀ 3.1. Classes Diagram

ệ ủ ệ ố Hinh ̀ 3.2. Qui trình làm vi c c a h  th ng

ự ợ Hinh ̀ 4.1. Các g i ý ban đ u cho khách l a ch n ọ ầ

Hinh ̀ 4.2. Khi đã hoàn thành các g i ýợ

14

M  Đ UỞ Ầ

ấ ế ủ ề 1. Tính c p thi t c a đ  tài

ệ ữ ể ế ấ ẫ ấ ộ Vi t Nam là m t trong nh ng đi m đ n h p d n và an toàn nh t th ế

ớ ặ ớ ả ố ữ ầ ặ ộ gi ủ   i. Trong nh ng năm g n đây, m c dù ph i đ i m t v i cu c kh ng

ả ế ộ ố ộ ầ ẫ ớ ị ho ng kinh t toàn c u, GDP ngành Du L ch v n tăng v i m t t c đ  đáng

ị ướ ả ẩ ổ ố ể n  và du l ch c tính đã đóng góp 13,1% cho t ng s n ph m qu c dân

(GDP).

ị ệ ượ ụ ẽ ơ ẽ ạ Ngành du l ch Vi t Nam đ ữ   ể c d  báo s  phát tri n m nh m  h n n a

ươ ư ẫ ế ế ợ trong t ng khi mà chúng ta v n ch a bi t cách khai thác h t l ế ố i th  v n có

ủ ấ ướ ừ ể ạ "r ng vàng, bi n b c" c a đ t n ộ c. Và m t th c t ự ế ẫ ồ ạ ạ ầ   i h u v n t n t i, t

ữ ị ề ắ ắ ế h t nh ng khu du l ch l ố ư i t ứ    duy bóc ng n c n dài đã ăn sâu vào ti m th c

ườ ế ế ẫ ọ ữ ủ c a nh ng ng ệ i làm kinh doanh d n đ n vi c thi u tôn tr ng du khách,

ợ ụ ờ ơ ơ ộ ể ừ ể ặ ị l i d ng th i c  c  h i đ  ch t chém l a b p du khách đ  nhanh chóng

ợ ể ậ ộ ạ ể ế ờ ế ki m l i nhu n trong m t mùa nào đó đ  bù l i th i đi m khách trong

ở ự ủ ữ ề ể ả năm. Chính nh ng đi u đó đã và đang c n tr  s  phát tri n c a ngành du

ướ ị l ch n c nhà.

ứ ướ ự ề ề ấ ọ Đ ng tr c v n đ  đó, tôi đã l a ch n đ  tài ự   ứ “Nghiên c u, xây d ng

ệ ợ ự ế ậ ạ ị ề ậ ệ ố h  th ng l p k  ho ch du l ch d a trên h  g i ý” làm đ  tài lu n văn t ố   t

ệ ạ ỹ ủ nghi p th c s  c a mình.

ủ ề ụ 2. M c tiêu c a đ  tài

ậ ỹ ệ ợ ự ể ậ ỹ ­ Tìm hi u k  thu t k  thu t xây d ng h  g i ý

ự ổ ị ­ Xây d ng c ng thông tin du l ch

ậ ợ ợ ổ ỹ ị ­ Tích h p k  thu t g i ý vào c ng thông tin du l ch

ố ượ ứ ạ 3. Đ i t ng và ph m vi nghiên c u

ố ượ ứ ả ­ Đ i t ng nghiên c u: Gi ậ i thu t CBR

15

ứ ạ ­ Ph m vi nghiên c u:

ứ ộ 4. N i dung nghiên c u

ươ Ợ Ố Ệ Ả Ch ng 1. H  TH NG G I Ý VÀ GI Ậ I THU T CBR

ớ ệ ợ 1.1. Gi ệ ố i thi u h  th ng g i ý

ả 1.2. Gi ậ i thu t CBR

ƯƠ Ị CH Ợ NG 2: BÀI TOÁN G I Ý TOUR DU L CH

ứ 2.1. Mô hình lô­gic và các hàm ch c năng

ễ ể ầ 2.2. Bi u di n thành ph n tour

ươ Ế Ệ Ố Ổ Ế Ị Ch ng 3. PHÂN TÍCH THI T K  H  TH NG C NG THÔNG TIN DU L CH

3.1. Thi ế ế ơ ở ữ ệ t k  c  s  d  li u

3.2. Thi ế ế ươ t k  ch ng trình

ươ Ự Ố Ệ Ch ng 4. XÂY D NG H  TH NG

ệ ố ự 4.1. Xây d ng h  th ng

ả ự ệ ế 4.2. K t qu  th c hi n

Ế ƯỚ Ở Ộ Ậ K T LU N VÀ H NG M  R NG

16

ươ Ệ Ố Ợ Ả Ậ Ch ng 1. H  TH NG G I Ý VÀ GI I THU T CBR

1.1. Gi

ệ ố i thi u h  th ng g i ý

1.1.1. H  ệ th ng ố

g i ýợ ợ ộ ệ ố ệ ố ư ự ả H  th ng g i ý [1] là m t h  th ng có kh  năng d  đoán và đ a ra s ự

ộ ớ ườ ử ụ ệ ư ự ợ ế ợ g i ý cho m t items t i ng i s  d ng. S  g i ý liên quan đ n vi c đ a ra

ế ị ủ ườ ư ể ẳ ạ ả ẩ quy t đ nh c a ng ọ i dùng, ch ng h n nh  ch n s n ph m nào đ  mua,

ể ể ọ ị ị ọ ch n nghe bài hát nào hay ch n đ a đi m nào đ  đi du l ch…

ấ ứ ộ ố ượ ử ụ ữ ệ ậ ể ạ Thu t ng  “Items” s  d ng đ  đ i di n cho b t c  m t đ i t ng,

ệ ố ợ ườ ộ n i dung nào mà h  th ng g i ý cho ng i dùng.

ụ ươ ệ ử ọ ậ ụ ự ứ Các lĩnh v c  ng d ng: Th ạ ng m i đi n t , Giáo d c, H c t p, Gi ả   i

ạ ộ trí, M ng xã h i…

ệ ố ể Các h  th ng đi n hình: Amazon.com, Pandora Radio, Netflix…

17

ươ ề ợ ố 1.2.2. Các ph ng pháp g i ý truy n th ng

ọ ộ 1.1.2.1. L c c ng tác (Collaborative filtering)

ươ ượ ự ự ệ ệ ậ Đây là ph ng pháp đ c th c hi n d a trên vi c thu th p và phân

ộ ượ ữ ề ớ ở tích m t l ủ   ng l n nh ng thông tin v  thói quen, hành vi hay s  thích c a

ườ ừ ự ườ ả ng i dùng và t ữ  đó d  đoán nh ng item mà ng i dùng có kh  năng hài

ọ ớ ủ ữ ệ ườ ự ố lòng thông qua vi c so sánh s  gi ng nhau c a h  v i nh ng ng i dùng

ủ ể ươ ọ ộ ạ khác.   Đi m   m nh   chính   c a   ph ng   pháp   l c   c ng   tác   (collaborative

ự ự ụ ả ộ ộ   filtering) [1] đó là nó không th c s  ph  thu c vào kh  năng phân tích n i

ủ ươ ả ộ ợ dung c a máy tính và do đó, ph ng pháp này có kh  năng g i ý m t cách

ư ệ ố ứ ạ ữ ể ạ ẳ chính xác nh ng item ph c t p. Ch ng h n nh  h  th ng có th  xem xét

ộ ộ ề ộ ủ ể ầ ộ m t b  phim mà không c n “hi u” v  n i dung c a b  phim đó. Có khá

ề ượ ử ụ ể ườ ộ ươ ự ữ ậ nhi u thu t toán đã đ c s  d ng đ  đo l ng đ  t ng t ữ    gi a nh ng

ườ ặ ữ ộ ệ ố ợ ớ ng i dùng ho c gi ể    các item v i nhau trong m t h  th ng g i ý. Đi n

ư hình nh : k­nearest neighborhood (k­NN) và Pearson Correlation.

18

ẫ ừ ồ ơ ủ ự ệ ườ ộ Vi c xây d ng m t mô hình m u t h  s  c a ng i dùng th ườ   ng

ượ ự ữ ệ ươ ữ ệ ườ ậ đ c th c hi n gi a hai ph ng pháp thu th p d  li u t ng mình và

ườ không t ng minh.

ậ ữ ệ ườ ụ ề ệ ộ M t vài ví d  v  vi c thu th p d  li u t ng minh:

ầ ườ ể ầ ọ ộ ộ ­ Yêu c u ng i dùng b u ch n m t item theo m t thang đi m nào đó

ầ ườ ế ạ ộ ộ ­ Yêu c u ng ặ i dùng x p h ng m t ho c m t nhóm các item mà

ườ ng ấ i đó yêu thích nh t

ư ườ ử ụ ầ ọ ọ ộ ­ Đ a ra cho ng i s  d ng hai item, yêu c u h  ch n m t item t ố   t

h nơ

ầ ườ ụ ụ ả ủ ạ ẩ ­ Yêu c u ng i d ng t o ra danh m c s n ph m yêu thích c a riêng

họ

ậ ữ ệ ụ ề ệ ộ ườ M t vài ví d  v  vi c thu th p d  li u không t ng minh:

ườ ữ ­ Theo dõi nh ng item mà ng i dùng đã xem

ườ ộ ờ ­ Phân tích th i gian mà ng i dùng xem m t item

ữ ữ ề ả ẩ ườ ư ­ L u gi thông tin v  nh ng s n ph m mà ng ự   i dùng đã mua tr c

tuy nế

ữ ậ ườ ­ Thu th p danh sách nh ng item mà ng i dùng đã xem trên máy tính

c a hủ ọ

ườ ộ ể ế ọ ­ Phân tích ng ạ i dùng trên m ng xã h i đ  bi t h  thích, không thích

ề đi u gì

ượ Nh ể c đi m:

ụ ề ộ ượ ớ ừ ườ ­ Ph  thu c nhi u vào l ng l n thông tin t phía ng i dùng, khó khăn

ộ ệ ố ữ ặ ớ ớ ớ ớ v i m t h  th ng m i, g p khó khăn v i nh ng item m i

ọ ự ộ 1.1.2.2. L c d a trên n i dung (Content­based filtering)

ọ ự ộ ươ L c d a trên n i dung (Content­based filtering) [1] là ph ự   ng pháp d a

ữ ủ ể ặ ậ trên nh ng đ c đi m c a chính item. Nói cách khác, thu t toán cho ph ươ   ng

19

ố ắ ữ ữ ữ ể ợ ố ớ pháp này c  g ng g i ý nh ng item có nh ng đi m gi ng v i nh ng item

ườ ứ ừ ượ ề ấ mà ng i dùng  đã t ng quan tâm trong quá kh . Item  đ c  đ  xu t là

ữ ượ ớ ộ ươ ọ ệ ồ ớ nh ng item đ c ch n ra v i đ  t ấ ằ ng đ ng l n nh t b ng vi c so sánh

ữ ượ ườ ế ướ ớ v i nh ng item đã đ c ng ạ i dùng x p h ng, đánh giá tr c đó.

ề ơ ả ươ ộ ồ ơ ử ụ ể ặ V  c  b n, ph ng pháp này s  d ng m t h  s  các đ c đi m v ề

ộ ở ộ ồ ơ ủ ệ ố ệ ố ạ ườ m t item bên trong h  th ng. H  th ng t o m t h  s  c a ng i dùng

ộ ơ ọ ỗ ọ ố ể ủ ố ộ ự d a trên m t véc­t tr ng s  các thu c tính c a item. M i tr ng s  bi u th ị

ủ ứ ộ ọ ỗ ộ ươ ố ớ ứ cho m c đ  quan tr ng c a m i thu c tính t ng  ng đ i v i ng ườ ử  i s

ể ượ ừ ơ ế ạ ằ ộ ụ d ng và có th  đ c tính toán t véc­t ề    x p h ng n i dung b ng nhi u

ệ công ngh  khác nhau.

ươ ử ụ ế ậ ả ơ ị Ph ấ ng pháp ti p c n đ n gi n nh t là s  d ng giá tr  trung bình t ừ

ơ ế ộ ố ạ ạ ươ ứ ạ ứ véc­t x p h ng item. Bên c nh đó có m t s  ph ơ   ng th c ph c t p h n

ậ ọ ư ẳ ỹ ạ ử ụ s  d ng k  thu t h c máy ch ng h n nh  Bayesian Classifiers, Cluster

Analysis, Decision Trees và Artificial Neural Networks đ ể ướ ượ c l ng xác

ấ ườ ự ả ả ộ xu t mà ng ồ ự   i dùng có kh  năng thích m t item nào đó. S  ph n h i tr c

ế ừ ườ ườ ti p t ng i dùng (th ng là nút like, dislike) cũng có th  đ ể ượ ử ụ   c s  d ng

ế ặ ấ ị ữ ọ ố ộ ể đ  gán thi ữ t đ t nh ng tr ng s  cho nh ng thu c tính nh t đ nh (using

Rocchio Classification or other similar techniques)

ượ ủ ọ ự ệ ằ ể Nh ệ ố   ộ c đi m chính c a l c d a trên n i dung đó là li u r ng h  th ng

ữ ả ọ ở ừ ữ ủ ườ có kh  năng h c nh ng s  thích t ạ ộ  nh ng ho t đ ng c a ng i dùng liên

ữ ế ể ộ ồ ộ ộ ử ụ quan đ n m t ngu n n i dung và s  d ng chúng cho nh ng ki u n i dung

ệ ố ị ớ ạ ệ ạ ở ợ ộ khác. Khi h  th ng b  gi i h n b i vi c g i ý các n i dung cùng lo i mà

ườ ử ụ ả ẩ ợ ừ ệ ố ể ng i dùng đã s  d ng, các s n ph m g i ý t ơ    h  th ng có th  ít h n

ề ể ớ ộ ừ ữ ụ ị nhi u so v i các ki u n i dung t nh ng d ch v  khác.

20

1.2. Gi

ậ i thu t CBR

ệ 1.2.1. Khái ni m CBR

ể ượ CBR (Case –Based Reasoning) [2, 3] có th  đ ư ộ ệ ứ   c coi nh  m t h  th c

ươ ạ ộ ử ụ ự ữ ậ ph ệ   ự ng pháp lu n ho t đ ng d a trên s  tái s  d ng nh ng kinh nghi m,

ượ ư ộ ạ ố đ c mô hình hóa nh  m t tình hu ng (case).   Bên c nh đó, CBR có th ể

ượ ư ộ ứ ể ậ ậ đ c hi u nh  m t mô hình b c cao mô hình hóa quá trình nh n th c, hay

ộ ạ ể ả ứ ế ộ ả m t d ng th c tính toán đ  gi i quy t m t bài toán phát sinh. Gi ậ   i thu t

ệ ư ấ ụ ượ ậ ủ ế ể CBR áp d ng trong h  t v n đ c t p trung ch  y u theo cách hi u th ứ

ư ẳ ị ượ hai. Trong đó, nh  Amoodt và Plaza [3] đã kh ng đ nh, CBR đ c coi nh ư

ộ ờ ả ộ ấ ử ụ ề ộ m t qui trình tìm l i gi ồ   i cho m t v n đ , qui trình này s  d ng m t ngu n

ứ ụ ể ượ ố ị ữ ậ ố tri th c c  th  đ c thu th p qua nh ng tình hu ng c  đ nh đã phát sinh.

ữ ề ố ớ ươ ậ ố ị Đi u này đ i ngh ch v i nh ng ph ỉ ự   ề ng pháp lu n truy n th ng ch  d a

ề ộ ấ ị ữ ứ ề ề ấ ồ ổ ộ trên nh ng ngu n tri th c ph  quát thu c v  m t mi n v n đ  nh t đ nh.

ữ ứ ượ ể ệ ử ụ ằ ộ Nh ng tri th c này đ ữ   c th  hi n b ng cách s  d ng m t trong nh ng

ữ ể ứ ư ữ ễ ắ ạ ngôn   ng   bi u   di n   tri   th c   nh   nh ng   qui   t c,   d ng   logic   (first­order

ữ ạ logic), hay các m ng ng  nghĩa (semantic networks),..

1.2.2. Gi ể ể ả ậ ề ậ ấ ố ậ i thu t CBR ụ Đ  có th  áp d ng qui trình gi i l p lu n tình hu ng CBR, v n đ  căn

ệ ử ụ ữ ế ầ ả ả b n đ u tiên liên quan đ n vi c s  d ng ngôn ng  mô t ố  tình hu ng (case

ử ụ ủ ữ ệ ạ representation language) và ph m vi s  d ng c a nh ng khái ni m trong mô

ả ộ ứ ụ ữ ệ ệ ấ ố t tình hu ng. Nh ng khái ni m xu t hi n trong m t  ng d ng CBR bao

ấ ộ ố ợ ả ộ ố ồ g m n i dung tình hu ng, c u trúc thích h p mô t m t tình hu ng, cách

ứ ề ứ ắ ế ễ ộ ố th c s p x p các tri th c v  tình hu ng đã di n ra. Trong đó, n i dung tình

ự ụ ễ ố ộ ố ộ ố hu ng ph  thu c vào lĩnh v c mà tình hu ng đó di n ra. M t tình hu ng có

ể ượ ử ụ ể ễ ằ ơ ặ ể th  đ c bi u di n b ng cách s  d ng véc­t ế  đ c đi m tuy n tính (linear

21

ả ấ ố   featured vector), văn b n bán c u trúc (semi­structured text), hay các đ i

ượ ứ ạ ư ồ ố ượ ấ ẫ ị t ng có c u trúc ph c t p nh   đ  th  (graph), m u  đ i t ng (object

ữ ướ ố ượ pattern) trong ngôn ng  h ng đ i t ng.

ươ ơ ặ ể ộ Trong ph ử ụ ng pháp s  d ng véc­t ế  đ c đi m tuy n tính, m t tình

ượ ả ư ộ ố ị ữ ể ặ ố hu ng đ c mô t ồ    nh  m t danh sách c  đ nh nh ng đ c đi m không đ ng

ố ự ữ ấ ỗ ồ nh t (heterogeneous features) bao g m nh ng chu i (string), s  th c, s ố

ề ơ ả ươ ả ố ớ nguyên, Boolean,.. V  c  b n, ph ng pháp mô t tình hu ng v i véc­t ơ

ế ượ ắ ồ ừ ươ ọ tuy n tính đ c b t ngu n t các ph ng pháp h c máy (machine learning)

ậ ạ ẫ ượ ị hay   nh n   d ng   m u   (pattern   recognition),   và   đ ư ộ   c   đ nh   nghĩa   nh   m t

ươ ớ ph ạ ng pháp sao chép (exemplar), ánh x  (instance) hay ghi nh  (memory).

ố ớ ữ ươ ả ế ấ ề Đ i v i nh ng ph ng pháp này, quá trình gi i quy t v n đ  có th  đ ể ượ   c

ư ộ ụ ạ ộ ỏ coi nh  m t bài toán phân lo i (classification) hay m t tác v  ph ng đoán

ứ ươ ứ ch c năng (function approximation). Trong ph ng pháp th  hai, thông tin

ủ ố ượ ể ễ ướ ạ ả ộ ầ đ u vào c a m t tình hu ng đ c bi u di n d ả i d ng văn b n. B n thân

ữ ệ ử ụ ữ ề ả ầ ả nh ng d  li u văn b n đ u vào đã tr i qua quá trình ti n x  lý. Ví d , quá

ỉ ụ ự ử ề ể ệ ồ trình ti n x  lý có th  bao g m vi c xây d ng ch  m c (index), thông tin

ữ ệ ượ ữ ệ siêu d  li u (metadata), tóm l ắ   ả c cho d  li u văn b n. Quá trình này g n

ớ ươ ữ ệ ậ ế k t   CBR   v i   các   ph ng   pháp   thu   th p   d   li u   (information   retrieval).

ươ ự ế ợ ể ố ộ Trong ph ữ   ố ng pháp cu i cùng, m t tình hu ng có th  là s  k t h p gi a

ả ả ớ ả ơ mô t văn b n (text­based) v i mô t véc­t (vector­based representation)

ể ượ ặ ữ ệ ồ ị ữ ể ễ ằ ho c có th  đ c bi u di n b ng nh ng mô hình d  li u đ  th . Ph ươ   ng

ườ ượ ử ụ ườ ấ ợ pháp này th ng đ c s  d ng trong tr ố ng h p tình hu ng có c u trúc

ứ ạ ữ ề ấ ồ ầ ph c  t p, bao  g m nhi u  thành ph n  phân c p  (hierarchy). Nh ng  tình

ệ ấ ố ư ấ ể ượ ị ư ữ hu ng xu t hi n trong t v n tour du l ch có th  đ c coi nh  nh ng tình

ứ ạ ớ ự ủ ệ ề ấ ấ ầ ố ạ   hu ng có c u trúc ph c t p v i s  xu t hi n c a nhi u thành ph n d ng

ư ị ỗ ở ể ự ệ cây nh  đ a đi m (location), ch ạ    (accomodation), s  ki n (event), ho t

22

ề ể ấ ộ ố ễ ộ đ ng (activity),.. V n đ  bi u di n m t tình hu ng tour c  th  s  đ ụ ể ẽ ượ ề c đ

ế ủ ụ ươ ệ ử ụ ớ ậ c p chi ti t trong m c 2.2.1 c a ch ng 2 v i vi c s  d ng XML là ngôn

ữ ệ ữ ng  mô hình hóa d  li u chính.

ạ ộ ố ườ ầ ồ Tóm l i, m t tình hu ng th ng bao g m ba thành ph n chính: Mô t ả

ề ả ế ả ấ v n đ  (problem description), gi i pháp (solution) và k t qu  (outcome).

ứ ấ ữ ầ ầ ế ả ộ ứ ự Thành ph n th  nh t ch a đ ng nh ng thông tin c n thi t miêu t m t tình

ố ả ữ ệ ử ụ ể ả ị hu ng phát sinh, mô t ủ    này bi u th  kh  năng tái s  d ng d  li u c a

ể ả ữ ả ố ế ấ ề ớ ế nh ng tình hu ng đã x y ra đ  gi i quy t v n đ  m i. N u coi quá trình

ờ ả ư ộ ề ớ ộ ố ướ tìm l i gi ấ i cho m t tình hu ng v n đ  m i nh  m t hàm c đoán thì

ầ ả ữ ệ ượ ư ủ ề ph n mô t d  li u đ ị c xem nh  mi n xác đ nh c a hàm, trong khi gi ả   i

ề ế ả ị ồ pháp và k t qu  xác đ nh các mi n gi ớ ạ ươ i h n t ng đ ng (codomain). Gi ả   i

ị ượ ầ ế ấ ụ ề ể pháp bi u th  l ng thông tin c n thi ế ể ả t đ  gi i quy t v n đ , ví d  nh ư

ộ ế ể ư ự ể ể ế ạ ợ ị xây d ng m t k  ho ch h p lý đ  có th  đ a du khách đ n đ a đi m đúng

ả ượ ể ế ờ ố ư ộ ế ổ th i đi m. Cu i cùng, k t qu  đ c coi nh  m t đánh giá t ng k t m c đ ứ ộ

ủ ả ượ ả ế ấ ề ữ h u ích c a gi i pháp đ ụ c áp d ng gi i quy t v n đ  phát sinh. Trong

ườ ả ệ ư ấ ủ ậ ị ượ tr ợ ng h p gi i thu t CBR c a h  t v n du l ch  đ c trình bày trong

ươ ẽ ượ ố ả ớ ữ ầ ch ng này, tình hu ng tour s  đ c mô t ứ    v i nh ng thành ph n ph c

ự ồ ớ ệ ữ ữ ạ t p, đ ng nghĩa v i không có s  khác bi ầ   t rõ ràng gi a nh ng thành ph n

ả ấ ề ớ ị ả ữ ể ầ mô t v n đ  v i nh ng thành ph n bi u th  gi i pháp. Trong quá trình x ử

ả ả ế ấ ề ế ể ế lý, gi i pháp gi ợ i quy t v n đ  tìm ki m, g i ý đi m đ n (destination) có

ể ượ ư ả ủ ề ợ ể ấ ắ ị th   đ c   dùng   nh   mô   t ả     c a   v n   đ   g i   ý   đ a   đi m   th ng   c nh

(attraction) du khách nên đ n. ế

ề ơ ả ả ế ấ ề ươ ậ V  c  b n, qui trình gi i quy t v n đ  theo ph ậ   ng pháp l p lu n

ể ượ ố tình hu ng CBR có th  đ c di n t ễ ả ở hình 1.2: b i

23

ả ậ i thu t CBR [2] ̀ Hinh 1.2. Qui trình gi

ủ ầ ả ố ả ậ  là các tình hu ng, mô t ố  tình hu ng đó và ­ Đ u vào c a gi i thu t:

ụ ậ ỹ ươ ử ụ s  d ng các k  thu t phân vùng, phân c m và các ph ả   ng pháp tính kho ng

ể ọ ừ ố ươ cách đ  l c t CSDL ra các tình hu ng t ồ ng đ ng.

ủ ầ ả ố ươ ồ ng đ ng có đ  t ộ ươ   ng ­ Đ u ra c a gi i thu t:

ấ ượ ư ố ồ đ ng cao nh t và đ ậ  Là các tình hu ng t c l u vào CSDL tình hu ng.

Trong đó:

ướ ề ế ậ ướ ủ ầ ấ  Ti p nh n v n đ : Trong b c đ u tiên c a qui trình, mô t ả B c 1.

ề ớ ượ ử ụ ữ ế ậ ằ ươ ề ấ v  v n đ  m i đ c ti p nh n. B ng cách s  d ng nh ng ph ng pháp

ữ ệ ề ả ớ ị tính kho ng cách (distance metric) v i mi n xác đ nh là d  li u mô t ả ấ    v n

ố ươ ệ ạ ớ ồ ữ ề ầ đ  đ u vào, nh ng tình hu ng t ấ   ố ng đ ng v i tình hu ng đ i di n cho v n

ượ ọ ừ ơ ở ữ ệ ứ ữ ố ề đ  phát sinh đ c l c ra t c  s  d  li u ch a nh ng tình hu ng đã đ ượ   c

ả ụ ậ ỹ gi i. Các k  thu t phân vùng (case partition), phân c m (case cluster) tình

ể ượ ố ọ ữ ệ ố ộ ể ẩ ố hu ng có th  đ c dùng đ  đ y nhanh t c đ  phân l c d  li u tình hu ng.

24

ướ ả ữ ố ươ ử ụ  Tái s  d ng gi i pháp: Nh ng tình hu ng t ồ ng đ ng đ ượ   c B c 2.

ộ ươ ứ ế ậ ầ ti p nh n sau quá trình tính toán m c đ  t ồ ng đ ng ở ướ  b c đ u tiên s ẽ

ượ ự ể ả ự ệ ố ớ đ c dùng đ  xây d ng gi i pháp cho tình hu ng m i. Vi c xây d ng gi ả   i

ể ỉ ơ ữ ọ ả ừ ữ ả pháp có th  ch  đ n gi n là trích ch n nh ng gi i pháp t ố    nh ng tình hu ng

ươ ể ả ụ ồ ế ể ố t ng đ ng áp d ng đ  gi ứ ạ   ớ i quy t tình hu ng m i, cũng có th  ph c t p

ả ừ ữ ố ươ ượ ọ ữ khi nh ng gi i pháp t nh ng tình hu ng t ồ ng đ ng đ c trích ch n và

ợ ớ ộ ả ề ớ ấ ớ tích h p v i nhau thành m t gi ấ i pháp m i chung nh t cho v n đ  m i.

ướ ả ả ượ ự ử ổ  S a đ i gi i pháp: Gi ớ i pháp m i sau khi đ c xây d ng s ẽ B c 3.

ượ ụ ể ủ ổ ể ứ ữ ử ầ đ c xem xét s a đ i đ  đáp  ng đúng nh ng yêu c u c  th  c a tình

ệ ạ ố ử ụ ụ ể ề ọ ị hu ng hi n t ộ   i. Ví d  trong đi u tr  y h c, bác sĩ có th  tái s  d ng m t

ắ ự ộ ệ ồ ề ư ầ ị pháp đ  đi u tr  cho cùng m t b nh nh ng c n cân nh c s  khác nhau v ề

ữ ệ ể ổ ặ ặ đ c đi m (tu i tác, cân n ng) gi a các b nh nhân.

ướ ệ ả ả ượ ử Xét duy t gi i pháp: Gi i pháp sau khi đ ổ c s a đ i hoàn B c 4.

ẽ ượ ỉ ụ ệ ả ế ch nh s  đ c xét duy t, đánh giá khi áp d ng vào gi ố   i quy t tình hu ng

ệ ạ ườ ả ả ế ấ ề hi n t i. Trong tr ợ ng h p gi ấ ạ i pháp th t b i trong gi i quy t v n đ , tình

ẽ ượ ư ề ạ ố ướ ướ ướ hu ng s  đ c đ a v  tr ng thái tr c đó trong b c 2, 3. Các b c 2, 3, 4

ể ượ ậ ậ ư ế ạ ả trong l p lu n CBR có th  đ c coi nh  các giai đo n tìm ki m gi i pháp

ề ớ ứ ớ ấ thích  ng v i v n đ  m i.

ướ ữ ả ư ả ớ L u tr  gi i pháp: Gi ả   ố i pháp cho tình hu ng m i sau khi tr i B c 5.

ẽ ượ ứ ữ ắ qua các quá trình thích  ng (2, 3, 4) s  đ ể ư c cân nh c đ  l u tr  vào c  s ơ ở

ả ườ ớ ợ ữ ệ d  li u các gi ố i pháp tình hu ng. Trong tr ố ng h p tình hu ng m i không

ượ ỹ ưỡ ươ ữ ồ ố ớ đ c đánh giá k  l ng hay quá t ng đ ng v i nh ng tình hu ng đã đ ượ   c

ữ ẽ ố ượ ư ữ ạ ư l u tr , tình hu ng này s  không đ c l u tr vì không mang l ứ   i tri th c

m i.ớ

25

ƯƠ Ị CH Ợ NG 2: BÀI TOÁN G I Ý TOUR DU L CH

ươ ả ẽ ử ụ ả ụ ậ Trong ch ng này tác gi s  s  d ng gi i thu t CBR áp d ng vào bài

ợ ị toán g i ý tour du l ch.

ể ấ ệ ế ả ầ Ta có th  th y các thành ph n khái ni m liên quan đ n gi ậ ậ   i thu t l p

ậ ố ượ ệ ợ ữ ầ ồ lu n tình hu ng đ c dùng trong h  g i ý bao g m nh ng thành ph n sau:

ế ệ ậ ậ ố ệ   Các khái ni m liên quan đ n qui trình  l p lu n tình hu ng, các khái ni m

ả ấ ễ ủ ể ầ ố ộ mô t c u trúc bi u di n c a m t tình hu ng tour cùng các thành ph n thi ế   t

ấ ấ ạ ế ả ắ ộ ơ ỉ ư ể ế y u nh t c u t o nên m t tour nh  đi m đ n, n i ăn ngh , và th ng c nh,

ệ ư ấ ứ mô hình logic và các hàm ch c năng trong h  t ả   ệ ứ  v n, các h  th c kho ng

ộ ươ ứ ộ ươ ồ ồ cách giúp tính toán m c đ  t ng đ ng, đ  t ữ ng đ ng gi a các thành

ầ ố ố ả ộ ph n tour và tình hu ng tour, cu i cùng là mô t ợ   qui trình g i ý m t tour

ộ ươ ự ỉ ầ ượ ừ ồ ợ hoàn ch nh d a trên tính toán đ  t ng đ ng và g i ý l n l t t ng thành

ầ ẻ ữ ự ả ế ề ệ ị ph n tour riêng l . D a trên nh ng mô t chi ti t v  các khái ni m, đ nh

ả ể ừ ậ ướ ự ể nghĩa cùng qui trình, gi i thu t, ta có th  t ng b c xây d ng và ki m th ử

ả ủ ệ ả ụ ậ tính hi u qu  c a gi ồ i thu t CBR bao g m các m c sau đây:

26

ứ 2.1. Mô hình lô­gic và các hàm ch c năng

̀ Hinh 2.1. Mô hình logic CBR [2]

ượ ệ ữ ồ ể ễ ố ớ Hình 2.1 là l c đ  bi u di n m i quan h  gi a các l p đ i t ố ượ   ng

ượ ử ụ ả ệ ư ấ ủ ầ ậ đ c s  d ng trong gi i thu t CBR c a h  t ồ    v n. Các thành ph n g m

có:   case,   base   constraint,   location,   attraction,   accommodation,   item,   user

profile, reward, travel wish, travel bag, travel information

(cid:0) Case: Đ c hi u nh  m t tình hu ng bi u th  m t phiên (session)

ư ộ ị ộ ượ ể ể ố

ỉ ươ ữ ườ ệ ố ố hoàn ch nh t ng tác gi a ng i dùng và h  th ng. Tình hu ng (phiên) này

ượ ở ạ ế ở ườ ồ ộ đ c kh i  t o và k t thúc b i ng ể i dùng. Trong bi u  đ  2, m t tình

ố ượ ầ ợ ở hu ng (case) đ c h p thành b i các thành ph n travel information (bao

ữ ầ   ồ g m travel wish và travel bag), user profile và reward. Nh ng thành ph n

ẽ ầ ượ ượ này s  l n l t đ c trình bày chi ti ế ướ t d i đây.

(cid:0) UserProfile:  Là l p ch a nh ng thông tin v  ng ứ

ữ ề ớ ườ i dùng. Thông tin

ồ ổ ớ ượ này bao g m tên, tu i, gi i tính và đ c dùng trong tính toán đ  t ộ ươ   ng

ườ ố ớ ườ ữ ồ đ ng gi a hai ng i dùng. Đ i v i ng i dùng không đăng ký, thông tin

ượ ư ữ ướ ạ đ c l u tr  d ữ ệ i d ng d  li u null.

27

(cid:0) TravelInformation: Là l p ch a thông tin v  gi

ề ớ ạ ứ ầ ớ i h n yêu c u (base

ừ ườ ữ ầ ờ ồ ồ constraint) t ng ơ ả   i dùng, đ ng th i bao g m nh ng thành ph n c  b n

ư ể ế ả ắ ộ ủ c a m t tour nh  đi m đ n (location), th ng c nh (attraction) và ch ỗ ở

ớ ổ ủ ớ (accommodation). Travel information là l p t ng quát c a hai l p con travel

bag và travel wish.

(cid:0) TravelBag: Là l p l u tr  thông tin v  nh ng thành ph n tour (đi m ể

ớ ư ữ ữ ề ầ

ỗ ở ượ ắ ườ ọ ừ ả ế đ n, th ng c nh, ch   ) đ c ng i dùng chú ý ch n t danh sách đ ượ   c

ữ ầ ạ ớ ợ ộ ầ   ệ ợ g i ý. Nh ng thành ph n này đ i di n cho m t tour phù h p v i yêu c u

ườ ủ c a ng i dùng.

(cid:0) TravelWish: Là l p l u tr

ớ ư ữ ữ ệ ầ ọ ề ộ    nh ng yêu c u, nguy n v ng v  m t

ị ừ ườ ầ ươ ự ớ tour du l ch t phía ng i dùng. Các thành ph n tour t ng t v i các thành

ế ể ằ ầ ả ắ ồ ph n n m trong travel bag, bao g m đi m đ n, th ng c nh và ch ỗ ở ồ   , đ ng

ờ ớ ữ ệ ủ ầ ườ th i v i d  li u yêu c u (base constraint) c a ng i dùng . TravelWish có

ể ượ ư ậ ặ ặ ợ ị th  đ c coi nh  t p h p các c p đ c tính­giá tr  (feature­value) mà ng ườ   i

ỉ ị ươ ớ ệ ố ữ ặ dùng ch  đ nh trong quá trình t ng tác v i h  th ng. Nh ng đ c tính đ ượ   c

ả ả ố ị ữ ặ ấ ớ mô t trong TravelWish ph i c  đ nh, nh t quán v i nh ng đ c tính đ ượ   c

ả ư ậ ữ ữ ầ mô t ặ   ủ   trong nh ng thành ph n (item) c a TravelBag. Nh  v y, nh ng đ c

ữ ệ ệ ấ ạ ả ặ ỏ tính xu t hi n trong TravelBag ph i th a mãn nh ng đ c tính đ i di n cho

ườ ệ ấ ầ ủ yêu c u c a ng i dùng xu t hi n trong TravelWish.

(cid:0) Reward: Là l p l u tr

ớ ư ữ ủ ữ ườ nh ng đánh giá c a ng ề ừ   i dùng v  t ng

ữ ủ ể ể ầ ộ ị thành ph n c a m t tour bi u th  trong TravelBag. Nh ng đi m đánh giá

ẽ ượ ư ạ ầ ủ ư ộ ữ ộ này s  đ c l u l i nh  m t trong nh ng thành ph n c a m t case.

(cid:0) ủ ẩ ả ệ ư ấ ả ẩ v n.   Không   gian   s n   ph m   (item Item:   Là   s n   ph m   c a   h   t

ộ ộ ừ ể ồ ố ầ   space) có th  bao g m toàn b  m t tình hu ng case hay t ng thành ph n

ư ể ế ắ ả ộ trong m t tour nh  đi m đ n, th ng c nh hay ch ỗ ở .

28

ố ượ ạ ớ ả ố Bên c nh các l p đ i t ng mô t ầ    tình hu ng case và các thành ph n

ứ ộ ố ượ ể ế trong m t tình hu ng, các hàm ch c năng đ c dùng đ  tính toán k t qu ả

ồ ợ g i ý bao g m:

(cid:0) SearchItem: Hàm có d  li u đ u vào là nh ng yêu c u v  đ c tính ầ

ữ ệ ề ặ ữ ầ

ẩ ừ ườ ả ả ề ồ ữ ế ả ả s n ph m t ng ẩ   i dùng, k t qu  tr  v  g m danh sách nh ng s n ph m

ề ặ ữ ầ ả ẩ ỏ ượ ế th a mãn nh ng yêu c u v  đ c tính. S n ph m đ ữ   c tìm ki m là nh ng

ỗ ở ể ế ầ ạ ộ ồ thành ph n chính t o nên m t tour, bao g m đi m đ n, ch ắ   , và th ng

ữ ế ậ ạ ả ẩ   ệ ả c nh. Vì v y, hàm SearchItem đ i di n cho nh ng hàm tìm ki m s n ph m

ư ể ế ể ế ế ụ c   th   nh   tìm   ki m   đi m   đ n   (searchLocation),   tìm   ki m   ch ỗ ở

ắ ả ế (searchAccommodation) và tìm ki m th ng c nh (searchAttraction).

(cid:0) FindSimilarCases: Hàm có d  li u đ u vào là mô t

ữ ệ ầ ả ủ ộ  c a m t tình

ầ ừ ườ ố ớ ị ả ữ ồ ể hu ng m i bi u th  yêu c u t ng i dùng. Mô t này g m có nh ng thông

ề ế tin v  travelWish, travelBag, userProfile và reward. Quá trình tìm ki m tình

ươ ệ ứ ử ụ ữ ụ ả ồ ố hu ng t ừ   ng đ ng s  d ng nh ng h  th c kho ng cách, áp d ng cho t ng

ệ ứ ẽ ượ ữ ầ ố ớ thành ph n con trong tình hu ng m i. Nh ng h  th c này s  đ c trình bày

ế ụ ủ ươ ả ả ề ế chi ti t trong m c 1.2.8 c a ch ế   ng. K t qu  tr  v  sau quá trình tìm ki m

ộ ươ ữ ố ấ ớ ồ là danh sách nh ng tình hu ng có đ  t ố   ng đ ng cao nh t v i tình hu ng

ạ ượ ư ộ ậ ệ hi n t i. Danh sách  này  đ ế   c coi  nh  m t danh sách  (t p)  tham  chi u

ử ụ ầ ợ (reference set), s  d ng trong quá trình g i ý các thành ph n tour sau này.

(cid:0) ữ ệ ạ ộ ItemSimilarity: Hàm itemSimilarity đ i di n cho nh ng hàm tính đ

ươ ầ ạ ữ ệ ủ ữ ầ ồ ộ t ng đ ng c a nh ng thành ph n t o nên m t tour. D  li u đ u vào là

ớ ế ả ị ữ ầ ạ ượ ượ ả ề nh ng thành ph n tour cùng lo i, v i k t qu  đ nh l ng đ ể   c tr  v , bi u

ị ứ ộ ươ ộ ươ ồ ầ ồ ồ th  m c đ  t ng đ ng. Các hàm đo đ  t ng đ ng thành ph n g m có

ộ ươ ữ ể ồ locationSimilarity   (đo   đ t ế   ng   đ ng   gi a   các   đi m   đ n),

ộ ươ ữ ể ồ ị accommodationSimiliarity (đo  đ  t ữ ng  đ ng gi a nh ng đ a  đi m ngh ỉ

ộ ươ ữ ắ ả ồ chân), attractionSimilarity (đo đ  t ị   ữ ng đ ng gi a nh ng th ng c nh, đ a

29

ộ ươ ể ị ồ đi m thu hút khách du l ch), userProfileSimilarity (đo đ  t ữ   ng đ ng gi a

ồ ơ ườ h  s  ng i dùng).

(cid:0) ố ượ ố ượ ề ồ c truy n vào hàm g m có đ i t ng thành ItemScore: Tham s  đ

ủ ể ế ầ ả ắ ộ ơ ỉ ph n c a m t tour (đi m đ n, n i ngh  chân, th ng c nh) và danh sách

ộ ươ ữ ố ồ ế nh ng tình hu ng tham chi u (reference cases) có đ  t ấ   ng đ ng cao nh t

ệ ạ ử ầ ố ớ v i tình hu ng hi n t i (current case). Sau x  lý, các thành ph n tour s ẽ

ượ ể ươ ớ ộ ươ ứ ấ ớ ồ ậ nh n đ c đi m đánh giá t ng  ng v i đ  t ng đ ng cao nh t v i các

ế ể ạ ầ ậ ố ố thành ph n tour cùng lo i trong t p tình hu ng tham chi u. Đi m s  đánh

ẽ ượ ể ế ạ ầ giá này s  đ ợ   c dùng đ  x p h ng các thành ph n tour trong danh sách g i

ý.

(cid:0) RecommendItem: Các thành ph n tour đ

ầ ượ ế ợ ự   ắ c g i ý và s p x p d a

ươ ử ụ ế ế ả ồ ị trên giá tr  tính toán t ố   ng đ ng kép s  d ng k t qu  tìm ki m tình hu ng

ộ ươ ữ ế ầ ồ tour tham chi u và nh ng thành ph n tour có đ  t ấ ớ   ớ ng đ ng l n nh t v i

ữ ế ầ nh ng thành ph n tour có trong danh sách tham chi u.

(cid:0) SortItem: Là m t hàm ti n ích giúp s p x p các k t qu  tìm ki m ế

ế ế ệ ả ắ ộ

ứ ự ả ộ ươ ầ thành ph n tour theo th  t ầ  gi m d n đ  t ồ ng đ ng.

ể ễ ầ

2.2. Bi u di n thành ph n tour ề ậ ư ộ ị ượ ấ ạ ừ ữ Nh  đã đ  c p, m t tour du l ch đ c c u t o nên t nh ng thành

ầ ẻ ữ ầ ượ ợ ơ ả ph n c  b n riêng l . Nh ng thành ph n tour chính đ ồ   c g i ý bao g m

ể ể ể ế ị ị ỉ đi m đ n (location), đ a đi m ngh  chân (accommodation) và đi m du l ch

ể ượ ầ ư ả (attraction). Các thành ph n tour có th   đ ẩ   ữ c coi nh  nh ng s n ph m

ượ ệ ố ữ ử ư ầ ợ ỏ đ ủ   c h  th ng x  lý và đ a ra thành nh ng g i ý, th a mãn yêu c u c a

ườ ữ ả ầ ượ ề ng ẩ i dùng. Nh ng s n ph m thành ph n này đ ạ   c chia thành nhi u lo i

ạ ạ ữ ẩ ậ ả ẩ ợ ộ   ả s n ph m khác nhau. T p h p nh ng s n ph m cùng lo i t o nên m t

ẩ ượ ệ ệ ạ ả không gian s n ph m, đ ậ   c ký hi u là X. Không gian X đ i di n cho t p

30

ữ ả ẩ ạ ượ ư ộ ơ ợ h p nh ng s n ph m cùng lo i, đ c coi nh  m t không gian véc­t các

i  ) n chi u. Ví d , trong không gian nh ng đ a đi m ngh

ữ ụ ể ề ị ặ đ c tính (X = X ỉ

ạ ị ở ằ ạ chân cho khách du l ch, khách s n New Sun ộ  Hà N i, n m t i 23 Hàng Bài,

ộ ớ ạ ạ có giá là 20$/ đêm, thu c l p khách s n lo i 3, có thang máy có th  đ ể ượ   c

ệ ộ ơ ặ ư ộ ở ạ đ i di n b i m t véc­t đ c tính nh  sau x = (Hà N i, 23 Hàng Bài, New

ể ỉ ị ị Sun, 3, 20, center, T) Đ a đi m (Location) x   Đ a ch  (Address) x Tên

ạ (Name) x Nhóm khách s n (category) x Giá (Price) x   Thang máy (Lift),

ữ ữ ặ ộ ị trong đó “Hà N i”, “23 Hàng Bài”... là nh ng giá tr  cho nh ng đ c tính mô

ả ộ ị ể ượ ữ ủ ể ỉ ị t m t đ a đi m ngh  chân c a du khách. Nh ng giá tr  này có th  đ c chia

ra làm ba nhóm chính:

ặ ướ ạ ữ ạ ậ ố : Là t pậ Đ c tính d i d ng t p s  nguyên h u h n (finite integer)

ị ể ữ ữ ữ ạ ầ ặ ị ủ   ợ h p nh ng giá tr  bi u th  nhóm h u h n nh ng thành ph n đ c tính c a

ụ ư ẩ ườ ủ ể ợ ả s n ph m. Ví d  nh  trong tr ạ   ạ ng h p c a khách s n k  trên, khách s n

ữ ể ạ ạ ộ ộ ớ có th  thu c vào m t trong nh ng l p khách s n lo i 1, 2 hay 3, category =

ị ữ ạ ự ữ ể ậ ổ ị ứ   {1, 2, 3}. T p nh ng giá tr  h u h n này bi u th  cho s  thay đ i trong m c

ữ ủ ạ ạ ạ ạ ọ ộ đ  sang tr ng c a khách s n. Khách s n lo i 1 là nh ng khách s n có quy

ấ ượ ớ ụ ố ị ấ ấ ớ mô l n, ch t l ng d ch v  t t nh t đi kèm v i giá thành cao nh t. T ươ   ng

ứ ả ả ạ ạ ầ ạ ớ ng, khách s n lo i 2, 3 có qui mô và giá c  gi m d n so v i lo i 1. Đây có

ư ộ ữ ể ộ ấ   th  coi nh  m t quá trình mã hóa (encode) nh ng thu c tính có tính ch t

ấ ủ ả ụ ữ ể ẩ ớ ộ   phân c p c a s n ph m. Quá trình này không th  áp d ng v i nh ng thu c

ủ ả ề ấ ụ ẩ ấ ằ ộ ị tính c a s n ph m mà giá tr  có tính ch t ngang b ng v  c p đ . Ví d  có

ể ấ ườ ỏ th  th y trong tr ng h p “ ợ màu s c”ắ  = {đ , xanh, vàng} ạ  hay “lo i phòng

ở ữ ượ ặ ọ ạ ” = {khách s n, căn h }. ặ ộ Nh ng đ c tính này đ ữ c g i là nh ng đ c tính

ể ượ ạ d ng bi u t ng (symbolic hay norminal).

31

ặ ướ ạ ữ ớ ặ : V i nh ng đ c tính này, giá tr ị Đ c tính d ố ự i d ng s  th c (real)

ố ự ữ ư ụ ặ ằ ả ủ c a đ c tính n m trong kho ng nh ng s  th c, ví d  nh  giá thuê phòng

ể ượ ả ạ ộ ị ề ẩ ủ c a m t khách s n. Kho ng giá tr  này có th  đ ả   c chu n hóa v  kho ng

ị giá tr  [0, 1].

ặ ướ ạ ể ượ ặ ứ ự   : Là đ c tính ch a đ ng Đ c tính d i d ng bi u t ng (symbolic)

ầ ử ữ ữ ạ ợ ị ụ ớ ậ t p h p h u h n nh ng giá tr  ph n t ặ . Ví d  cho l p đ c tính này có th ể

ấ ườ ể ợ ộ ị đ a đi m th y trong tr ạ ng h p khách s n k  trên, khi “ ể ể ” có th  thu c {Hà

ẵ ộ ườ ữ ặ ớ ợ ị N i, Đà N ng, Sài Gòn}. Trong tr ng h p nh ng đ c tính v i giá tr  có

ể ượ ặ ớ ướ ố ươ ề ạ d ng bi u t ng, khác v i hai đ c tính tr c đó, m i t ng quan v  giá tr ị

ồ ạ ữ ữ ể ể ả ặ không t n t ạ   i. Đ  có th  tính toán kho ng cách gi a nh ng đ c tính d ng

ể ượ ể ượ ữ ặ ể ạ ổ bi u t ng, nh ng đ c tính này có th  đ ữ   c chuy n đ i sang d ng nh ng

ướ ữ ữ ự ạ ầ ạ ố ử ạ ặ đ c   tính   d i   d ng   s   th c   hay   có   h u   h n   nh ng   ph n   t d ng   s ố

ụ ữ ứ ể ả ệ ứ   nguyên. Cách th  hai đ  tính toán kho ng cách là áp d ng nh ng h  th c

ượ ế ể ượ ữ ế ặ ạ ế đ c   thi t   k   riêng   cho   nh ng   đ c   tính   d ng   bi u   t ng.   Chi   ti t   v ề

ệ ứ ẽ ượ ữ ả ụ nh ng h  th c  tính kho ng cách s  đ c trình bày trong m c 2.7.

ả ẩ ớ ố ỗ ữ Cu i cùng, v i m i không gian s n ph m X = X ệ   i  , nh ng khái ni m

ể ượ ệ ả ư ầ thành ph n có th  đ c ký hi u và mô t nh  sau:

ụ ả

­ T p CX  X : T p h p nh ng danh m c s n ph m cùng lo i X.

ầ ử

ượ

­ 1,2,…….,m

ư  , (m = |CX|): Đ c coi nh  nh ng s n ph m ph n t

ộ ậ    thu c t p

ụ danh m c CX.

ị ạ

­ j = (1

j, ……, n

j): Là t p nh ng giá tr  đ i di n cho nh ng đ c tính c a véc­ ệ

ơ ả t

s n ph m

ẩ j  X.

ệ ớ ố ữ ạ ị ạ ặ ề ­ V i đi u ki n X ặ   i  là đ c tính có giá tr  d ng s  (h u h n nguyên ho c

ụ ả ữ ự ẩ ạ ả ị th c), CX là danh m c s n ph m cùng lo i X, kho ng nh ng giá tr  kh  d ả ị

i trong danh m c s n ph m CX có th  đ

ặ ụ ả ể ượ ẩ ư ệ cho đ c tính X c ký hi u nh  sau:

rangeCX(Xi) = (maxCX{i} ­ minCX{i})

(1.1)

32

ấ ủ ộ

2.2.1. C u trúc c a m t case ụ ữ ề ấ ủ ệ ộ Trong   m c   này,   nh ng   khái   ni m   chính   v   c u   trúc   c a   m t   tình

ẽ ượ ố ướ ạ ễ ể ọ hu ng tour s  đ c trình bày d ể   i d ng bi u di n toán h c và khai tri n

ướ ạ ẽ ượ ễ ể ả ạ ộ ể d i d ng m t văn b n XML. D ng bi u di n này s  đ c dùng đ  tính

ứ ộ ươ ồ toán m c đ  t ữ ng đ ng gi a các case.

ể ễ ọ 2.2.1.1. Bi u di n toán h c

ể ượ ữ ậ ợ ố ể ệ T p h p nh ng tình hu ng tour có th  đ ộ   c hi u theo khái ni m m t

ố ố ộ không gian tình hu ng (case space) CB. Trong đó, m t tình hu ng tour có

ầ ệ th  đ ể ượ ấ ạ ừ ố c c u t o t b n thành ph n riêng bi t:

CB = TW x TB x U x R (1.2)

ữ ầ ồ Nh ng   thành  ph n   này  bao   g m:   travelWish   (TW),  travelBag   (TB),

ầ ầ ượ ừ userPofile (U), và reward (R). Trong đó, t ng thành ph n l n l ộ t thu c v ề

ụ ớ ấ ị ể ộ m t ki u không gian nh t đ nh. Ví d , v i c = (tw, tb, u, r) ϵ CB, type (tw) =

ầ ủ ể ượ ạ ừ ạ TW. Bên c nh đó, t ng thành ph n c a không gian CB có th  đ c t o nên

ừ ỏ ơ ủ ữ ể ầ ộ t ố    nh ng thành ph n nh  h n. Đi m khác c a m t không gian tình hu ng

ế ố ế ố ề ờ ồ ạ là y u t chi u th i gian (temporal dimension). Y u t này t n t ộ   i khi m t

ượ ự ươ ữ ố tình hu ng tour đ c xây d ng thông qua quá trình t ng tác gi a ng ườ   i

ệ ố ậ ố ộ dùng và h  th ng. Vì v y, m t tình hu ng trong không gian CB luôn luôn

ượ ư ộ ả ề ộ ụ ấ ươ đ c coi nh  m t “ nh ch p” có c u trúc v  m t quá trình t ng tác

ườ ấ ị ộ ờ ng ả i­máy trong m t kho ng th i gian nh t đ nh.

33

ộ ̀ Hinh ọ 2.2.  Minh h a m t case

ố ượ ị ướ ấ ể ộ Nhìn vào hình 1.4, m t tình hu ng tour đ c bi u th  d i c u trúc

ố ủ ệ ạ ạ ố ệ ạ d ng cây. G c c a cây đ i di n cho tình hu ng tuor hi n t i. Các nhánh

ỏ ơ ừ ệ ạ ộ ố ừ   ầ nh  h n đ i di n cho t ng thành ph n trong m t tình hu ng tour. T ng

ế ầ ượ ấ ừ ỏ ơ ữ ầ thành ph n này ti p theo đ c c u thành t nh ng ph n nh  h n đ ượ   c

ể ễ ướ ạ ộ ơ ặ ừ ầ ấ bi u di n d i d ng m t véc­t ộ    đ c tính. T ng thành ph n c u thành m t

ượ ả ư ố tình hu ng tuor đ c mô t nh  sau.

ể ượ ư ộ ỏ ả ậ c   coi   nh   m t   gi ợ     hàng   o   t p   h p TB   (TravelBag):  Có   th   đ

ữ ầ ượ ườ ọ ự ươ nh ng thành ph n tour đ c ng i dùng ch n l a trong quá trình t ng tác

ớ ệ ố ứ ạ ữ ệ ấ ượ ấ ừ v i h  th ng. TB có c u trúc d  li u ph c t p, đ c c u thành t ữ    nh ng

ầ ử ố ế ể ộ ph n t n i ti p thu c nhi u không gian khác nhau.

TB = B x Seq(X1) x … x Seq(X3) (1.3)

ữ ứ ể Trong bi u th c (1.3), B, X1, …, X3 là nh ng không gian véc­t ơ ớ   , v i

ữ ầ ươ ứ ể X1,.., X3 là nh ng không gian thành ph n tuor t ế   ớ ng  ng v i đi m đ n

ể ả ắ ỉ (location), đi m ngh  chân (accomodation), và th ng c nh (attractions). B là

ả ấ ủ ữ ể ặ ầ ộ ừ không gian mô t nh ng đ c đi m yêu c u chung nh t c a  m t TB t phía

34

ườ ủ ữ ặ ộ ổ ng ể i dùng. Nh ng đ c tính này có th  là t ng chi phí c a m t tour TB

ạ ả ờ ị ỉ (cost), lo i hình nhà ngh  (accomodation type), kho ng th i  gian du l ch

ữ ộ ặ   (travel duration) hay nhóm hành khách (travel party). M t trong nh ng đ c

ớ ặ ủ ể ể ể ầ ộ đi m này có th  trùng v i đ c đi m c a m t thành ph n trong tour. Ví d ụ

ạ ặ ơ ộ ỉ ỉ ị ề v   lo i   hình   nhà   ngh   là   m t   đ c   tính   xác   đ nh   n i   ngh   chân

ủ ể ạ ộ (accommodation) c a du khách có th  là khách s n hay căn h .

ầ ả ữ ặ Các thành ph n Seq (X1), …, Seq(X3) mô t ỗ  nh ng chu i các đ c tính

ứ ể ậ ộ ộ ộ ề   thu c  cùng  m t  không gian.  Vì  v y,  m t  TravelBag  có  th  ch a  nhi u

ư ộ ụ ầ ộ ộ ượ ể thành ph n thu c cùng m t ki u. Ví d  nh  m t travelbag đ c di n t ễ ả

ư ầ ầ ỗ ớ ộ   ằ b ng hai thành ph n tb1, tb2 nh  hình 1.4. V i m i thành ph n trong m t

ể ượ ỏ ơ ể ầ ấ travelbag có th  đ ứ   c phân chia theo c p thành ph n nh  h n, bi u th c

ễ ể ộ ở bi u di n m t travelbag tr  thành:

tb = (b, [x1,1, …, x1,j1], …, [x3,1, …, x3,j3])

ỗ ớ v i m i xi,j  = (x11,1, …, xni,j). Trong hình 1.4, ta có:

tb = (1000, couple), [(Hanoi, historic), (New Sun, 120, 23 Hang Bai), ϕ,ϕ]

ụ ữ ể ặ ớ ữ   V i nh ng đ c đi m chung b = (1000, couple). Trong ví d  này, nh ng

ể ượ ả ị ế ồ ặ đ c đi m chung đ c gi đ nh g m có chi phí (budget) dành cho chuy n đi

ữ ế ạ ặ ủ c a du khách và lo i hình du khách (travel party). Nh ng đ c tính ti p theo

ả ể ế ớ ả ị ầ ượ l n l t mô t đi m đ n tb1 = (Hanoi, historic) (v i gi ế   ể  đ nh đi m đ n

ượ ả ở ể ặ ạ đ c mô t b i hai  đ c  đi m chính là tên (location­name) và lo i hình

ơ ớ ỉ (location­type)), n i ngh  chân tb2 = (New Sun, 120, 23 Hang Bai) (v i gi ả

ể ả ộ ị ể ồ ỉ ặ ị đ nh các đ c đi m mô t m t đ a đi m ngh  chân g m có tên, giá thuê/đêm,

ỉ ườ ươ ườ ị đ a ch ). Trong quá trình ng i dùng t ớ ệ ố ng tác v i h  th ng, ng i dùng có

ể ế ụ ộ ị ẽ ắ ả ọ th  ti p t c ch n và thêm m t đ a danh th ng c nh s  tham quan vào trong

ể ồ ủ ả ả ắ ị ữ   túi du l ch  o (travel bag) c a mình. Th ng c nh này có th  g m nh ng

ụ ề ạ ỉ ị thông tin v  tên, đ a ch , giá vé, lo i hình,.. Ví d  tb3  = (Van Mieu, Quoc Tu

35

ư ậ ệ ạ ả ị ầ ủ   Giam St, historic). Nh  v y túi du l ch  o đ i di n cho các thành ph n c a

ộ ườ ọ ẽ ượ ự ả ư m t tour ng i dùng l a ch n s  đ c mô t nh  sau:

tb = (1000, couple), [(Hanoi, historic), (New Sun, 120, 23 Hang Bai),

(Van Mieu, Quoc Tu Giam St, historic), ϕ]

ề ộ ể ầ ố ị ị TW (Travel Wish): Bi u th  mong mu n, yêu c u v  m t tour du l ch

ừ ườ ứ ạ ữ ệ ấ ượ ễ ả t phía ng i dùng. TW có c u trúc d  li u ph c t p, đ c di n t nh ư

ộ ậ ữ ề ấ ầ ợ ộ m t t p h p nh ng truy v n (queries) v  các thành ph n trong m t tour, có

ể ượ ố ớ ộ ư ể ấ c u trúc gi ng v i TravelBag. M t TW có th  đ ễ c bi u di n nh  sau:

TW = Q(B) x Seq(Q(X1)) x … x Seq(Q(X3)) (1.4)

ầ ấ ộ ươ ự ớ Trong đó, các thành ph n trong m t TW có c u trúc t ng t v i các

ầ ạ ộ thành ph n t o nên m t TravelBag.

ữ ủ ứ ể ấ ộ ặ Q (B): truy v n ch a nh ng đ c đi m chung c a m t tour.

ạ ả ề ừ ữ ấ ẩ ỗ Seq (Q(Xi)): chu i nh ng truy v n v  t ng lo i s n ph m có trong

ủ ụ ể ấ ỗ ố ị tour, ví d , Seq(Q(X1)) là chu i truy v n bi u th  mong mu n c a ng ườ   i

ề ể ế ế ạ ộ ị dùng v  đi m đ n (location) cho chuy n du l ch. Bên c nh đó, m t TB có

ỗ ự ự ề ả ể ẩ ạ ậ ộ th  có nhi u s n ph m thu c cùng lo i, vì v y, m i s  l a ch n s  t ọ ẽ ươ   ng

ứ ụ ề ể ễ ấ ớ ỗ ỗ ấ   ộ ng v i m i truy v n khác nhau. M t ví d  v  bi u di n chu i truy v n

ư ể ớ ạ TW có th  có d ng nh  sau v i:

ấ ớ Q (B) = (budget < 2000)  ∧  (party = couple): Truy v n v i yêu c u ầ

ỏ ơ ệ ề ề ớ chung v  tour v i đi u ki n chi phí cho phép nh  h n 1000$, và dành cho

ườ ị ộ m t ng i đi du l ch.

Seq(Q(X1)) = Seq(Q(accommodation)) = (location = Ha Noi) ∧  (cost <

ề ỗ ở ấ ầ ớ ề 150) ∧ (position = center): Truy v n v i yêu c u v  ch ị   ệ , đi u ki n là đ a

ạ ỏ ơ ộ ị ể đi m t i Hà N i, v  trí trung tâm và giá thuê nh  h n 150$/đêm.

Seq(Q(X2)) = Seq(Q(attraction)) = (attraction­type = historic) ∧ (date =

ậ ấ ợ ề ị   10/02/2009),  (attraction­type = entertainment): T p h p hai truy v n v  đ a

36

ể ả ắ ườ ế ầ ầ ố đi m th ng c nh ng ấ i dùng mu n đ n. Truy v n đ u tiên là yêu c u v ề

ử ả ắ ấ ị th ng c nh mang tính l ch s  và ngày tham gia là 10/02/2009. Truy v n th ư

ề ắ ả ầ ả hai là yêu c u v  th ng c nh mang tính gi i trí.

ư ậ Nh  v y: TW = ((budget < 2000) ∧ (party = couple)) x ((location = Ha

Noi)  ∧   (cost < 150)  ∧  (position = center)) x (attraction­type = historic)  ∧

((date = 10.02.2009),  (attraction­type = entertainment))

ề ườ ệ ố ượ ễ ể ướ ạ i dùng h  th ng đ c bi u di n d ộ   i d ng m t U: Thông tin v  ng

ơ ặ ẩ ả ố véc­t ạ   ớ  đ c tính trong không gian gi ng v i không gian s n ph m X có d ng

i=1 Ui. Trong bi u đ  3, m t véc­t

ể ộ ồ ơ ể ượ ễ ể ớ U = ∏n có th  đ ặ   c bi u di n v i ba đ c

ủ ể ườ ư ổ ớ đi m c a ng i dùng nh  tên, tu i, gi i tính:

U = (name = Nam) ∧ (age = 20) ∧ (gender = male) (1.5)

ề ộ ượ ự ừ c xây d ng và tham gia t phía ng ườ   i R: Đánh giá v  m t tour đã đ

ớ ấ ủ ệ ấ ạ ố ộ dùng. C u trúc đánh giá gi ng v i c u trúc c a m t travelbag đ i di n cho

ồ ộ ộ ị ồ   m t tour. Đánh giá bao g m đánh giá chung cho toàn b  tour du l ch, đ ng

ờ ớ ừ ộ ậ ữ ầ ộ ạ   th i v i t ng thành ph n trong tour. M t đánh giá là m t t p con h u h n

ầ ừ ủ ậ ố ể ấ ộ các ph n t ạ   ủ  c a t p s  nguyên. C u trúc c a m t đánh giá có th  có d ng

sau:

R = RB x Seq(RX1) x …x Seq(RX3) (1.6)

ụ ộ Trong đó, RB = RX1 = .. = RX4 = {1, 2, 3, 4, 5}. Ví d , m t tour du

ể ượ ư ể ố ở ị l ch có th  đ c đánh giá b i đi m s  nh  sau r = {4, [5], [4], ∅}.   Các

ầ ượ ươ ể ố ứ ớ ộ ượ đi m s  đánh giá l n l t t ng  ng v i toàn b  tour đ ớ   c đánh giá v i

ể ầ ố ượ ầ ượ ể ế ừ đi m s  4/5. T ng thành ph n đ c đánh giá l n l t là đi m đ n (5/5),

ể ắ ả ố ỉ ượ ơ n i ngh  chân (4/5), th ng c nh (3/5). Đi m s  3/5 đ ư ể c coi nh  đi m đánh

ặ ị ượ ữ ụ ầ ượ giá m c đ nh, đ c áp d ng cho nh ng thành ph n tour không đ c đánh

ườ ả ế ượ ữ ụ ườ ở giá b i ng i dùng. Gi thi t này đ c áp d ng cho nh ng tr ợ   ng h p

ị ố ể ể ở ằ   không có đi m đánh giá b i vì đi m đánh giá 3/5 là tr  s  trung gian, n m

37

ự ự ữ ữ ể ể gi a nh ng đi m đánh giá tích c c (4/5, 5/5) và đi m đánh giá tiêu c c (1/5,

2/5).

38

ặ ả 2.2.1.2. Đ c t XML

ủ ấ ố ượ ể ướ ạ ộ Đây là c u trúc c a m t tình hu ng tour và đ c khai tri n d i d ng

ư XML nh  sau:

ặ ả ườ ổ Trong đ c t XML trên, ng ố   i dùng tên Nam, 20 tu i, mong mu n

ượ ị ườ ạ ộ ớ ố đ c đi du l ch cùng ng i thân t i Hà N i v i chi phí t i đa cho phép là

ạ ở ị ớ ế ố ộ 2000$, mu n tìm ki m m t phòng đôi khách s n v  trí trung tâm v i giá

ố ể ế ộ ớ thuê t ạ   i đa 150$/đêm. Nam đã thêm Hà N i là đi m đ n, v i khách s n

ở ị ủ ị ỉ New Sun đ a ch  23 Hàng Bài vào tour du l ch c a mình.

ộ ươ ế ạ ồ 2.2.2. Đ  t ng đ ng và x p h ng các item

ệ ươ ồ ượ ử ụ Khái ni m “t ng đ ng” (similarity) [3] đ c s  d ng  trong tính toán

ố ượ ữ ả ố ượ kho ng cách gi a hai đ i t ữ ng. Nh ng đ i t ạ   ể ng này có th  là cùng lo i

ụ ộ ươ ặ ộ ầ ị ứ ữ ể ồ ạ ho c khác lo i. Ví d , đ  t ộ   ng đ ng bi u th  m c đ  g n gũi gi a m t

ườ ớ ộ ườ ộ ả ẩ ớ ng i dùng t i m t nhóm ng i dùng, hay m t s n ph m t ụ   i danh m c

ữ ả ẩ ườ ợ ủ ệ ư ấ ộ ươ ồ nh ng s n ph m. Trong tr ng h p c a h  t v n, đ  t ng đ ng mô t ả

ư ữ ả ầ ố kho ng cách gi a các thành ph n tour cũng nh  các tình hu ng tour s ẽ

ượ ệ ứ ệ ứ ả đ c tính toán thông qua các h  th c tính kho ng cách. Các h  th c này s ẽ

ượ ộ ươ ạ ả ồ đ c dùng trong tính toán đ  t ẩ   ư ế ng đ ng cũng nh  x p h ng s n ph m

ứ ộ ươ ề ệ ế ả ẩ ồ ự d a trên m c đ  t ng đ ng. Các khái ni m v  tìm ki m s n ph m t ươ   ng

ự ư ắ ẽ ượ ả ẩ ụ t ế  cũng nh  s p x p s  ph m s  đ c trình bày trong m c này. Các h ệ

ẽ ượ ứ ả ụ th c kho ng cách s  đ c trình bày trong m c 1.2.7.

ế ậ ạ ẩ ả 2.2.2.1. Thu th p và x p h ng s n ph m

n i=1 Xi  là không gian các thành ph n tour (s n ph m), m t h

ớ ả ẩ ầ V i X = ∏ ộ ệ

ứ ượ ị ươ ị ứ ả th c kho ng cách đ ộ c đ nh nghĩa là m t hàm có giá tr  d ớ   ng  ng v i

ạ ệ ứ ề ả ẩ ặ ả ượ ừ t ng c p s n ph m. Có nhi u lo i h  th c kho ng cách đã đ c nghiên

39

ử ụ ổ ả ậ ứ c u và s  d ng, trong khuôn kh  gi i thu t CBR dùng trong h  t ệ ư ấ    v n,

ệ ứ ẽ ượ ử ụ ữ ạ nh ng h  th c có d ng sau s  đ c s  d ng.

d(x,y) = f(w1(x) * d1(x1, y1), … , wn(x) * dn(xn, yn))

(1.8) f : Rn  R+

ớ ứ ể ọ V i x, y ϵ X, 0 < wi(x) < 1 là tr ng s  c a đ c đi m th  i, f là hàm đ n ơ   ố ủ ặ

i(xi, yi) là h  th c kho ng cách

ệ ệ ứ ả đi u tăng (monotone increasing function), d

i còn

ạ ủ ặ ệ ứ ữ ạ ứ ị đ nh nghĩa theo lo i c a đ c tính th  i. Bên c nh đó, nh ng h  th c d

ượ ộ ươ ữ ư ọ ụ ồ đ c   g i   nh   nh ng   “phép   đo   đ   t ộ ng   đ ng   c c   b   (local   similarity

ế ố ụ ộ ả ữ ườ ậ measures)” trong thu t ng  CBR. Y u t c c b  x y ra trong tr ợ   ng h p

ị ố ữ ụ ữ ố ọ ộ ổ nh ng tr ng s  trong hàm d (x, y) là nh ng tr  s  thay đ i, ph  thu c vào

ể ặ ừ t ng đi m đ c tính.

ị ộ ấ ươ ị ể ữ ồ Trong th c t , d ụ   ng đ ng. Ví d , ự ế i  là nh ng giá tr  bi u th  đ  b t t

ớ ẽ ẫ ị ươ ế ặ ả ỏ ữ ồ hai đ c tính có kho ng cách l n s  d n đ n giá tr  t ng đ ng nh  gi a hai

ộ ẽ ượ ụ ừ ả ị ể ở ặ đ c tính. T ng giá tr  kho ng cách c c b  s  đ c ki m soát b i hàm t ổ

ổ ợ ụ ộ ư ữ ế ả ị ợ ổ h p t ng quát f, t h p nh ng giá tr  kho ng cách c c b  và đ a ra k t qu ả

+.

ộ ố ự ươ ả kho ng cách là m t s  th c d ng R

ệ ứ ệ ứ ữ ụ ả ả ộ Ví d , m t trong nh ng h  th c kho ng cách là h  th c kho ng cách

ấ ồ không đ ng nh t Euclid – Overlap (Heterogeneous Euclid – Overlap Metric).

(1.9)

v i: ớ

(1.10)

40

i ≠ yi và 0 v i xớ i = yi. H  s  chu n hóa

ệ ố ẩ Và hàm overlap(xi, yi) = 1 n u xế

ượ ữ ữ ể ả ẩ ả đ ộ   c dùng đ  so sánh kho ng cách gi a nh ng s n ph m thu c

các không gian khác nhau.

ộ ươ ượ ị ả ủ ả ị Đ  t ồ ng đ ng đ c đ nh nghĩa là ngh ch đ o c a kho ng cách:

Sim(x,y) = e(­d(x,y)) (1.11)

ớ ệ ứ ả ượ ư ả ị V i h  th c kho ng cách đ ẩ   c đ nh nghĩa nh  trên, các s n ph m

ươ ự ể ượ ứ ộ ươ ế ự ế ắ t ng t có th  đ c tìm ki m và s p x p d a trên m c đ  t ồ ng đ ng.

41

ẩ ươ ả ự 2.2.2.1.1. Tìm s n ph m t ng t

ả ẩ ộ ớ V i A ủ ậ  X là m t không gian con c a t p không gian s n ph m tour

ả ẩ ượ ả ẩ ươ và p X là s n ph m đ c xét tìm các s n ph m t ng t ự kNNd(p, A) là ,

ộ ươ ữ ề ẩ ấ ả ồ ầ ậ t p nh ng láng gi ng g n nh t (s n ph m có đ  t ấ ớ   ng đ ng cao nh t v i

ẩ ượ ậ ả ệ ứ ử ụ ớ ả s n ph m đ ả   ẩ c xét) v i p trong t p s n ph m A, s  d ng h  th c kho ng

ề ậ ượ ủ ợ ị cách d. T p láng gi ng này đ ộ ậ c đ nh nghĩa là m t t p h p con c a A.

ố ượ ằ ố ị ấ ượ ề ầ ị H ng s  k xác đ nh s  l ng láng gi ng g n nh t đ ử ụ   c xác đ nh s  d ng

ả kho ng cách d.

ế ể ậ ả ẩ ươ ự ệ Vì v y, có th  nói vi c tìm ki m s n ph m t ng t ọ    là quá trình ch n

1, x2, …, xk  t

ữ ẩ ươ ấ ớ ả ẩ ồ ả ọ l c nh ng s n ph m x ng đ ng nh t v i s n ph m p trong

ộ ậ ả ẩ ợ ướ ẩ ươ m t t p h p không gian các s n ph m cho tr ả c. Các s n ph m t ng t ự

ẽ ượ ắ ứ ộ ươ ự ế ầ ả kNNd(p, A)  cũng s  đ c s p x p d a theo gi m d n m c đ  t ồ   ng đ ng

i))    sau quá trình tìm ki m. Quá trình tìm

ề ả ầ ế (tăng d n v  kho ng cách d(p, x

ữ ế ả ậ ẩ ươ ự ệ ậ ki m   t p   nh ng   s n   ph m   t ng   t ự ượ   đ ở c   th c   hi n   b i   thu t   toán   k

Nearest Neighbor ­ kNNd(p,A,k)

ậ ả ệ ứ ế ẩ ả ẩ   Tham s :ố  H  th c kho ng cách d, s n ph m xét tìm ki m p, t p s n ph m ả

A

ả ề ậ ấ ớ ế ề ả ẩ ầ K t qu : ả Tr  v  t p k s n ph m láng gi ng g n nh t v i p trong A,

ế ự ả ả ầ ắ s p x p theo trình t kho ng cách gi m d n

ự ậ ượ ở ữ ế D a vào thu t toán đ c trình bày ả    trên, hàm tìm ki m nh ng s n

ươ ự ể ượ ư ự ệ ả ế ệ ố ẩ ph m t ng t có th  đ c th c hi n nh  sau: Gi thi t h  th ng đang

ế ộ ườ ữ ế ố ị ể ợ g i ý m t đi m đ n và ng ể   i dùng mong mu n tìm ki m nh ng đ a đi m

42

1

ế ố ớ ượ ấ ỏ ợ ể gi ng v i đi m đ n đang đ c g i ý, th a mãn truy v n Q = C C2

i là nh ng yêu c u (constraints) v  đ c tính c  th

ề ặ ữ ầ … ụ ể Cm v i Cớ

ữ ế ể ệ ề ậ ấ ộ ớ ợ ể   ủ c a m t đi m đ n. V i đi u ki n truy v n Q, A là t p h p nh ng đi m

d

ể ế ỏ ế ế đ n th a mãn Q, p là đi m đ n đang đ ượ ư ấ c t v n, hàm tìm ki m kNN

ế ươ ẽ ế ế ể ả ồ ư (p,A,5) s  tìm ki m và đ a ra k t qu  5 đi m đ n t ấ ớ   ng đ ng nh t v i

ể ệ ạ ế đi m đ n đang đ ượ ư ấ c t v n hi n t i.

ắ ế ế ế ả 2.2.2.1.2. S p x p k t qu  tìm ki m

ả ẩ ươ ẽ ắ ế Sau khi các s n ph m t ng t ự ượ  đ ế   ệ ố c tìm ki m, h  th ng s  s p x p

ộ ươ ự ế ể ả ồ ế k t qu  tìm ki m d a trên đi m đánh giá đ  t ng đ ng (similarity­based

ạ ướ ậ ượ scores). T i b c này, hai t p đ c xét là X S và R. Trong đó, S = {x1,

ậ ả ẩ ầ ượ ắ ậ ả ế ẩ   c s p x p và R là t p s n ph m ữ x2, ..., xm} là t p nh ng s n ph m c n đ

ế ượ ể ể ươ ồ tham chi u (reference set) đ c dùng đ  tính đi m t ừ   ng đ ng cho t ng

ậ ả ầ ậ ẩ ả ượ thành ph n trong t p S. T p s n ph m tham kh o đ c trích ch n t ọ ừ ậ    t p

ệ ạ ữ ố ố ớ ố ệ nh ng tình hu ng tour gi ng v i tình hu ng tour hi n t ế   i. Vi c tìm ki m

ữ ố ươ ẽ ượ ồ ụ nh ng tình hu ng tour t ng đ ng s  đ ủ   c trình bày trong m c 2.8 c a

ươ ậ ả ẩ ượ ắ ế ử ụ ậ ch ng. T p s n ph m đ ả c s p x p s  d ng kho ng cách d và t p tham

ả ượ kh o R đ ệ c ký hi u là:

ij, R) ≥ d(xik, R) (i 

ớ SS(R,d) = [xi1, …, xim] v i d(x

ả ượ ị ấ ừ ỏ Kho ng cách d(x, R) đ ả c đ nh nghĩa là kho ng cách nh  nh t t ế  x đ n các

ẩ ả s n ph m r R.

d(x, R) = (1.12)

43

i = xik đ

ớ ị ẩ ả ượ ế ạ ơ V i đ nh nghĩa này, s n ph m x ế ả   c x p h ng cao h n n u s n

ữ ầ ẩ ả ả ơ ố ớ ph m  đó g n h n (có kho ng cách nh  h n) ẩ   ỏ ơ   đ i v i nh ng s n ph m

ộ ậ ể ắ ự ể ế ế ế ả ả thu c   t p   tham   kh o.   Đ   có   th   s p   x p   k t   qu   tìm   ki m   d a   trên

ệ ố ở ạ ữ ả ả ẩ ộ   kho ng cách gi a các s n ph m (hàm Sort(d, S, R)), h  th ng kh i t o m t

ỗ ộ ố ượ ả ả ẩ ồ ộ ừ chu i b  ba đ i t ng g m s n ph m s thu c S, kho ng cách t s t ớ ậ   i t p

ầ ử ấ ớ ầ ộ ươ ỗ ả ứ ẩ ớ R, và ph n t thu c R g n nh t v i s. T ng  ng v i m i s n ph m s

ấ ớ ề ẩ ả ầ ộ ộ thu c S, s n ph m láng gi ng g n nh t v i s, r = NN[1,1] thu c R và

ả ượ ươ ự ớ kho ng cách d = d(s,r) = NN[1,2] đ c tính toán. T ng t ậ  v i thu t toán

ữ ả ẩ ượ ế ắ ộ kNN, danh sách SS nh ng s n ph m đ c s p x p và b  ba đ i t ố ượ   ng

ượ ộ ộ ế ể ớ (s,d,r) đ c chuy n ti p sau m t b  ba khác (s’,d’,r’) v i d > d’. Ví d  v ụ ề

ế ậ ườ ế ể ế ắ ợ ắ thu t toán s p x p trong tr ng h p s p x p đi m đ n sau quá trình tìm

ệ ạ ự ế ố ầ ủ ồ ườ ki m, d a vào tình hu ng tour hi n t i (bao g m yêu c u c a ng i dùng,

ủ ữ ả ẩ ả ườ ừ nh ng s n ph m kh  dĩ trong travelbag, thông tin c a ng i dùng), t yêu

1, loc2, loc3} đ

ụ ể ề ể ữ ể ế ế ậ ầ c u c  th  v  đi m đ n, t p nh ng đi m đ n S = {loc cượ

ọ ọ ừ ế ụ ả ể ẩ ố tìm ki m và ch n l c t danh m c s n ph m. Cu i cùng, các đi m đ n s ế ẽ

ượ ắ ứ ộ ươ ự ế ủ ừ ế ể ồ ớ đ c s p x p d a trên m c đ  t ể   ng đ ng c a t ng đi m đ n v i đi m

ữ ậ ố ươ ự ế ươ ứ đ n t ả ng  ng trong t p tham kh o nh ng tình hu ng tour t ng t R.  Đ ể

ả ề ế ể ế ả ượ ắ tr  v  k t qu  các đi m đ n đ ế c s p x p, hàm Sortd(S, R) đ ượ ọ ớ   c g i v i d

ế ể ả ữ là kho ng cách gi a các đi m đ n.

Sort(d,S,R)

ả ậ ả ẩ ầ ượ ắ ế Tham s : ố kho ng cách d, t p s n ph m S c n đ ậ ả   c s p x p, t p s n

ả ẩ ph m tham kh o R

ỗ ả ế ả ẩ ượ ắ K t qu : chu i s n ph m đ c s p x p ế SS[i,j] (j = 1,2,3)

44

ệ ứ ả 2.2.2.2. Các h  th c tính kho ng cách

ủ ế ả ợ ụ ủ ế ộ ộ Đ  chính xác c a k t qu  g i ý ph  thu c ch  y u vào cách tính

ầ ử ữ ả ệ ứ ổ ế kho ng cách gi a các ph n t ấ   ả . Các h  th c tính kho ng cách ph  bi n nh t

ể ấ ư ả ọ có th  th y nh  kho ng Euclid hay còn g i là Minkowsky

(1.13)

ả ớ ườ Trong đó là kho ng cách Euclid v i r th ng mang

ị ươ ờ ệ ứ ả ế ố kho ng cách giá tr  nguyên d ng. V i h  th c này, y u t mô t ả ự ấ    s  b t

ươ ố ượ ồ ộ ươ ả ớ ớ t ữ ng đ ng gi a hai đ i t ng, v i kho ng cách càng l n, đ  t ồ   ng đ ng

ậ ỏ ươ ả ủ ồ ị càng nh . Vì v y, hàm t ả   ng đ ng là hàm ngh ch đ o c a hàm tính kho ng

cách, ví d :ụ

(1.14)

ứ ộ ươ ệ ạ ể ượ ồ Bên c nh đó, vi c tính toán m c đ  t ng đ ng cũng có th  đ ế   c ti n

ử ụ ằ ươ ố ươ hành b ng cách s  d ng các ph ng pháp th ng kê. Trong đó, ph ng pháp

ấ ươ ổ ế n i ti ng nh t là ph ng sai Pearson (Pearson Corelation)

(2.12)

ơ ở ữ ệ ủ ặ ị V i ớ là giá tr  trung bình c a đ c tính th ứ i trong c  s  d  li u tình

ố ườ ợ ươ ự ế hu ng (case base). Trong tr ng h p này, ph ư   ng sai Pearson tr c ti p đ a

ế ả ư ậ ồ ra k t qu  mô t ả ứ ộ ươ  m c đ  t ng đ ng, nh  v y .

ệ ươ ả ỉ Tuy nhi n, ph ng sai Pearson hay kho ng cách Euclid ch  đúng trong

ườ ầ ử ả ủ ặ ẩ ợ ượ ể ễ tr ng h p các đ c tính c a ph n t s n ph m đ c bi u di n d ướ ạ   i d ng

ị ố ườ ẩ ợ ượ ể giá tr  s  (numeric features). Trong tr ả ng h p s n ph m đ ễ   c bi u di n

45

ướ ạ ể ượ ự ả d i d ng bi u t ng ký t (symbolic features), kho ng cách chéo (overlap

ượ ử ụ ư ươ ể ả distance) đ c s  d ng nh  ph ữ   ng pháp đ  tính toán kho ng cách gi a

ể ượ ặ ạ các đ c tính d ng bi u t ng.

(1.15)

ươ ả ộ ươ ạ Bên   c nh   ph ng   pháp   kho ng   cách   chéo,   m t   ph ng   pháp   khác

ượ ử ụ ươ đ ộ c s  d ng r ng rãi là ph ng pháp VDM (Value Difference Metric).

ộ ươ ả ố VDM là m t ph ữ   ng pháp th ng kê cho phép tính toán kho ng cách gi a

ố ượ ữ ể ượ ặ ỉ ể ễ ướ ạ nh ng đ i t ng có đ c tính ch  có th  đ c bi u di n d ể   i d ng bi u

ượ ự ả ộ ượ ả ơ t ng ký t . M t phiên b n đã đ ủ c đ n gi n hóa c a VDM (không có

ạ ố ọ tr ng s ) có d ng sau:

(1.16)

V i:ớ

ố ớ ề ế ả ổ ­ C là t ng s  l p k t qu  trong mi n bài toán.

ể ớ ế ệ ề ấ ả ớ ị ­ ộ    là xác su t đi u ki n đ  l p k t qu  là C v i giá tr  thu c

ượ ướ tính  là  đ c cho tr c.

(1.17)

ữ ố ươ ố ươ ư Gi ng nh  nh ng ph ng pháp th ng kê khác, ph ng pháp VDM

ượ ể ả ế đ c dùng đ  gi ạ i quy t các bài toàn phân lo i (classification problem). Vì

ườ ệ ư ấ ể ượ ệ ậ v y, trong tr ợ ng h p h  t v n, VDM có th  đ c dùng trong vi c phân

ủ ư ặ ườ tách nhóm đ c tr ng thích/không thích c a ng i dùng. Tuy nhiên, VDM

ứ ộ ươ ớ ợ ư ặ ồ không phù h p v i tính toán m c đ  t ng đ ng nh  đã trình bày, m c dù

ườ ạ ấ ợ ượ trong tr ng h p c = 1, tính ch t phân lo i đã đ ạ ỏ c lo i b .

46

ệ ứ ả ồ ấ 2.2.3. H  th c kho ng cách không đ ng nh t

ệ ư ấ ệ ứ ấ ượ ả ồ Trong h  t v n, h  th c kho ng cách không đ ng nh t đ ị c đ nh

ổ ợ ệ ứ ữ ụ ữ ặ ả nghĩa là t h p nh ng h  th c kho ng cách áp d ng cho nh ng đ c tính

ượ ễ ướ ạ ể ự đ c bi u di n d ố i d ng s  và ký t .

(1.18)

ầ ượ ệ ứ ụ ả ặ V i ớ ds và dn l n l ạ   t là h  th c kho ng cách áp d ng cho đ c tính d ng

ự ạ ườ ợ ượ ị ký  t ố  và   d ng  s .   Trong  tr ặ ng   h p   đ c  tính   đ c   xét  có  giá  tr  null,

ả ượ ặ ị ớ ị ả ử ặ kho ng cách đ c m c đ nh có giá tr  là 1 v i gi s  hai đ c tính không có

ồ ạ ệ ố ị m i liên h  khi không t n t i giá tr .

ớ ự ự ừ ị ư ả ọ ủ ds T  đ nh nghĩa kho ng cách nh  trên, v i s  l a ch n khác nhau c a

ệ ứ ẽ ẫ ế ấ ồ và  dn  s  d n đ n các h  th c không đ ng nh t khác nhau. Trong đó, h ệ

ệ ứ ứ ế ấ ổ th c n i ti ng nh t là h  th c HEOM (Heterogeneous Euclidean­Overlap

ử ụ Metric) [2] s  d ng

(1.19)

ệ ứ ụ ộ M t ví   d  khác  là h  th c  HVDM  (Heterogeneous  Value Difference

ử ụ Metric) [3] s  d ng

(1.20)

ể ế ụ ệ ứ ượ Hai h  th c HEOM và HVDM [3] có th  ti p t c đ ằ   ế c tùy bi n b ng

ờ ạ ử ụ ữ ậ ẩ ỹ cách s  d ng nh ng k  thu t chu n hóa hay r i r c hóa khác nhau. Nh ư

47

ế ằ ổ ợ ệ ứ ữ ả ớ ậ v y, b ng cách tùy bi n các t h p nh ng h  th c kho ng cách v i các k ỹ

ể ẩ ậ ượ ữ ờ ạ thu t chu n hóa hay r i r c hóa, ta có th  có đ ả   ệ ứ c nh ng h  th c kho ng

ệ ư ấ ữ ấ ạ ồ cách không đ ng nh t khác nhau. Trong ph m vi h  t ệ ứ    v n, nh ng h  th c

ấ ượ ả ồ ệ ứ kho ng cách không đ ng nh t đ ữ c phân tích là nh ng h  th c sau:

HEOM() =

(1.21)

HVDM() =

(1.22)

ệ ứ ươ ươ H  th c t ồ ng đ ng ph ng sai Pearson [3]

CORR() =

(1.23)

V i ớ

là   xác   su tấ

ứ ị ượ ữ ể ể ổ ặ đ c tính th   có giá tr  .  Xác su t ấ  đ c dùng đ  chuy n đ i nh ng giá tr ị

ạ ự ạ ươ ặ đ c tính d ng ký t ố  sang d ng s  dùng trong ph ạ   ng sai Pearson. Bên c nh

ị ạ ư ữ ấ ậ ỹ ị ử ụ s  d ng giá tr  xác su t, các k  thu t khác nh  gán nh ng giá tr  d ng ký t ự

ươ ị ạ ữ ứ ớ ố ượ ụ t ng  ng v i nh ng giá tr  d ng s  đã đ c áp d ng. Tuy nhiên, cách làm

ả ế ượ ề ề ứ ự ấ ấ này không gi i quy t đ c v n đ  v  th  t . Ng ượ ạ c l ề i, v n đ  này có

ể ượ ả ụ ế ử ụ ế ấ ị th  đ c gi i quy t khi s  d ng giá tr  xác su t. Ví d , n u là m tộ

ậ ặ ỉ ị ườ ặ đ c tính ch  nh n giá tr  đúng (true) ho c sai (false), và ng ậ   i dùng nh n

ượ ề ặ ề ề ẫ ơ ị ị đ ế   c nhi u giá tr  đúng h n giá tr  sai v  đ c tính này. Đi u này d n đ n

48

ể ế ả ị ự ế ậ p(true) > p(false). D a vào k t qu  đ nh tính này, ta có th  k t lu n true >

false, thay vì false > true.

ệ ứ ử ụ ề ả ọ ố Các h  th c kho ng cách đã trình bày đ u không s  d ng tr ng s  nh ư

ề ậ ị ọ ụ ộ ườ ố đã đ  c p. Các giá tr  tr ng s , ph  thu c vào thông tin ng i dùng, yêu

ẽ ượ ề ậ ơ ở ấ ầ c u truy v n,… s  đ c đ  c p sâu h n ụ  các m c sau.

ộ ươ ồ 2.2.4. Đ  t

ữ ng đ ng gi a hai case ữ ộ ươ ủ ề ồ ố Đ  t ng đ ng gi a các tình hu ng tour là ch  đ  trung tâm có vai trò

ệ ư ấ ế ố ươ ọ ồ quan tr ng trong h  t v n.  Y u t t ế   ng đ ng này có vai trò tiên quy t

ữ ệ ế ố ươ ự ướ trong vi c tìm ki m nh ng tình hu ng tour t ng t và cũng là b ầ   c đ u

ộ ệ ố ấ ậ ậ ố tiên trong b t kì m t h  th ng l p lu n tình hu ng CBR nào.

ệ ư ấ ữ ủ ệ ế ề ệ Trong  đi u ki n c a h t t ố    v n, vi c tìm ki m nh ng tình hu ng

ươ ự ặ ứ ạ ủ ề ầ ơ ộ t ng t ố    g p nhi u khó khăn h n vì c u trúc ph c t p c a m t tình hu ng

ụ ố ượ ạ ừ ữ ộ tour (m c 1.2.5). M t tình hu ng tour đ c t o nên t ầ    nh ng thành ph n

ế ụ ữ ầ ồ ị ữ   ơ đ n v  (TW, TB, U, R ) và nh ng thành ph n này ti p t c bao g m nh ng

ỏ ơ ữ ầ ầ ấ ạ ợ thành ph n nh  h n. Nh ng thành ph n này h p thành c u trúc d ng cây

ủ ộ ố (tree­based model structure) c a m t tình hu ng tour.

ự ấ ượ ố ượ D a trên c u trúc đ c mô t ả ở trên, hai tình hu ng tour đ c xem là

ươ ữ ế ầ ấ ồ ố t ng đ ng n u nh ng thành ph n c u thành nên tình hu ng tour đó cũng

ươ ề ồ ớ ớ t ng   đ ng   v i   nhau.   Đi u   này   có   nghĩa   v i   c   =   (tw,tb,u,r)   và   c’   =

ộ ươ ố ẽ ượ ồ (tw’,tb’,u’,r’) là hai tình hu ng tour, đ  t ng đ ng Sim(c,c’) s  đ c tính

ộ ươ ự ầ ồ toán d a trên các đ  t ng đ ng thành ph n Sim(tw,tw’),…,Sim(r,r’). Áp

ươ ữ ể ậ ấ ồ ụ d ng cách tính này theo ph ng pháp h i qui, ta có th  nh n th y nh ng đ ộ

ươ ể ế ụ ồ ượ t ầ ng đ ng thành ph n có th  ti p t c đ ự c tính toán d a trên đ  t ộ ươ   ng

ớ ấ ỏ ơ ủ ủ ữ ầ ạ ộ ồ đ ng c a nh ng thành ph n nh  h n. V i c u trúc d ng cây c a m t tình

ộ ươ ố ẽ ượ ồ ộ ươ ự ủ ồ hu ng tour, đ  t ng đ ng s  đ c tính d a trên đ  t ng đ ng c a lá. Lá

49

ủ ấ ạ ố ượ ữ trong c u trúc d ng cây c a tình hu ng tour đ ả   ư c xem nh  nh ng s n

ẩ ệ ầ ử ữ ữ ơ ph m tách bi t, là nh ng ph n t trong nh ng không gian véc­t đã đ ượ   c

ụ ể ẵ ầ ớ ữ ị đ nh nghĩa s n (m c 1.2.4). V i nh ng thành ph n tour có cùng ki u, đ ộ

ươ ồ ỗ ớ ươ ồ ớ t ị ng đ ng mang giá tr  khác r ng v i tw t ng đ ng v i tw’.

ộ ươ ụ ệ ữ ồ ố Áp d ng khái ni m đ  t ng đ ng gi a các tình hu ng, ta có th  gi ể ả   i

ự ế ế ợ ố quy t bài toán g i ý d a trên nguyên lý sau: “N u hai tình hu ng là t ươ   ng

ầ ố ướ ể ượ ồ đ ng, thành ph n trong tình hu ng tr c có th  đ ử ụ c tái s  d ng làm l ờ   i

ả ậ ậ ố ố gi ề   i cho tình hu ng sau”. Trong các bài toán l p lu n tình hu ng truy n

ể ượ ệ ầ ố ể th ng, khái ni m thành ph n có th  đ ầ c hi u là thành ph n trong qui trình

ư ậ ả ấ ổ ệ ư ấ ề ậ l p lu n nh  mô t v n đ . Trong khuôn kh  h  t ầ    v n, các thành ph n

ượ ố ớ ấ ả ữ ầ ộ đ c khái quát lên đ i v i t ố   t c  nh ng thành ph n trong m t tình hu ng

ư ậ ể ữ ả ầ ợ tour. Nh  v y, ta có th  đoán bi ế ượ t đ ự   ẩ c nh ng s n ph m c n g i ý d a

ủ ữ ố ươ ự ả trên TB c a nh ng tình hu ng tour t ng t ố   ữ  đã x y ra. Nh ng tình hu ng

ươ ự ậ ả tour t ng t đã đ ượ ề ậ ở c đ  c p ầ  ph n tr ướ ướ c d i tên “t p tham kh o”.

c(Vc,Ec) (m tộ

ồ ị ạ ộ ố Gi ả ử  CB là m t tình hu ng có d ng đ  th  (graph) G s  c

ữ ữ ồ ỉ cây), ta ký hi u Vệ ầ ủ   c là nh ng đ nh (vertices) bao g m nh ng thành ph n c a

c  là nh ng c nh (edges). M t c nh (p,q) t n t

ố ộ ạ ồ ạ ữ ạ tình hu ng c, và E i trong

ườ ư ậ ủ ầ ầ ợ tr ể ấ   ng h p thành ph n q là thành ph n con c a p. Nh  v y, ta có th  th y

ườ ợ ộ ố trong tr ng h p m t tình hu ng tour  c = (tw,tb,u,r), ta có (c,tw) Ec.

1,[q11,…,q1k1],…, [q31,…,q3k1]) ta có (tw,q1)  Ec hay (tw,

ươ ự ớ T ng t , v i tw = (q

[q11,…,q1k1] ) Ec.

ồ ị ầ ớ ỗ ố V i m i nút (node) v (thành ph n tình hu ng tour) trong đ  th , ta ký

ầ ượ ệ ữ ề ậ hi u I(v) và O(v) l n l t là t p nh ng nút láng gi ng (in­neighbors) và

ủ ố ừ ề ề ả không ph i láng gi ng (out­neighbors) c a n t v. T ng nút láng gi ng đ ượ   c

ủ ữ ề ươ

v i 1 ớ

ệ ký hi u là ả . Nh ng nút không ph i là láng gi ng c a v t ng t ự ượ   c đ

50

ư ậ ộ ươ ữ ố ồ

v i 1 .

ký hi u làệ Nh  v y, đ  t ng đ ng gi a tình hu ng có th  đ ể ượ   c

ễ ả ở ươ di n t b i ph ng trình sau:

(1.24)

ớ ổ ợ ộ ươ ủ ữ ầ ồ ố V i F là hàm t h p đ  t ng đ ng c a nh ng thành ph n tình hu ng.

ộ ươ ồ ố ượ ố ượ ị Đ  t ng đ ng tình hu ng đ ư c đ nh nghĩa nh  sau: “Hai đ i t ng đ ượ   c

ươ ố ươ ế ề ồ ớ coi là t ng đ ng n u đ u có m i t ng quan v i cùng m t đ i t ộ ố ượ   ng

ờ ồ ổ ợ ượ ề ươ khác”. Đ ng th i, hàm t h p F cũng đ ấ ằ c đ  xu t b ng ph ng trình sau:

(1.25)

ố ượ ằ ứ ả V i  ớ là h ng s  đ c dùng có vai trò suy gi m m c  đ ộ

ươ ộ ươ ồ ữ ầ ầ ồ t ng đ ng khi ta xét đ  t ng đ ng gi a các t ng thành ph n khác nhau

ễ ủ ể ấ ằ ố ố ộ ượ ọ trong c u trúc bi u di n c a m t tình hu ng. H ng s  này đ ế   c g i là y u

ế ơ ả ủ ủ ạ ươ ố t phân h y (decay factor). Tuy nhiên, h n ch  c  b n c a ph ng trình

ộ ươ ở ộ ươ ủ ữ ầ ồ tính đ  t ồ ng đ ng trên là đ  t ng đ ng c a nh ng thành ph n không

51

ượ ụ ộ ươ ữ ồ ộ ẽ liên quan s  không đ c tính. Ví d  đ  t ộ ng đ ng gi a m t tw và m t tb

ẽ ộ ượ ư ậ ể ố trong m t tình hu ng tour s  không đ ứ   ể c xét. Nh  v y, đ  có th  đáp  ng

ộ ươ ầ ữ ồ ố ươ yêu c u tính toán đ  t ng đ ng gi a các tình hu ng tour, hàm t ồ   ng đ ng

ạ ớ ẽ s  có d ng sau v i c = (tw,tb,u,r) và c’ = (tw’,tb’,u’,r’)

(1.26)

ộ ươ ầ ẽ ượ ủ ừ ồ Trong đó, đ  t ng đ ng c a t ng thành ph n s  đ c tính toán khác

ộ ươ ồ ượ ườ nhau. Đ  t ng đ ng chéo Sim(tw, tw’) đ c dùng trong trong tr ợ   ng h p

ủ ự ử ầ ầ ớ ố ộ ệ ư ấ h  t v n c n x  lý yêu c u c a m t tình hu ng m i (tw) d a trên tình

ố ượ ả ế ườ ợ ườ hu ng tour đã đ c gi i quy t (tb’). Trong tr ng h p này, ng i dùng

ệ ư ấ ẽ ề ầ ố ớ ư đ a ra yêu c u v  tour, tình hu ng m i c phát sinh, h  t ế    v n s  tìm ki m

ộ ươ ữ ố ồ ố nh ng tình hu ng tour c’ có đ  t ấ ớ ng đ ng cao nh t v i tình hu ng yêu

ư ậ ể ả ẩ ớ ợ ế ể ư ầ c u m i. Nh  v y, đ  có th  đ a ra g i ý s n ph m chi ti ạ t, bên c nh tính

ộ ươ ệ ố ử ụ ữ ữ ầ ồ toán đ  t ng đ ng gi a các tw, h  th ng c n tái s  d ng nh ng thành

ầ ượ ộ ươ ợ ể ồ ph n tour đã đ ự c g i ý trong tb’, d a trên tính toán đ  t ng đ ng đ  có

ứ ể ầ ớ ố ị ị th  đáp  ng yêu c u tw trong tình hu ng tour m i. Giá tr  Rew(r’) đ nh

ủ ứ ả ọ ộ ố ớ ố ệ   nghĩa m c đ  quan tr ng c a tình hu ng tham kh o v i tình hu ng hi n

ạ ừ ữ ả ố ượ ự ở t i. Nh ng tình hu ng tham kh o đã t ng đ c xây d ng b i cùng ng ườ   i

ẽ ể ơ dùng s  có đi m đánh giá cao h n.

ạ ươ ử ụ ố ồ ọ Bên c nh đó, hàm t ng đ ng s  d ng các tr ng s  W ố ữ i là nh ng s

ị ằ ố ượ ự ọ ể ằ ữ th c có giá tr  n m gi a 0 và 1. Các tr ng s  đ ứ   c dùng đ  cân b ng m c

ộ ươ ọ ữ ồ ố ộ đ  quan tr ng trong tính toán đ  t ng đ ng gi a tình hu ng. Trong tr ườ   ng

ộ ố ượ ị ỗ ộ ươ ẽ ồ ợ h p m t trong hai tình hu ng đ c xét có giá tr  r ng, đ  t ng đ ng s  có

ị ằ ố ượ ữ ồ ạ ả giá tr  b ng 0 vì kho ng cách gi a hai đ i t ng không t n t i có giá tr ị

52

ể ượ ạ ấ ộ ồ ờ ố ằ b ng 1. Đ ng th i, m t tình hu ng có c u trúc d ng cây có th  đ ể   c bi u

ễ ướ ạ di n d i d ng sau:

(1.27)

ư ậ ộ ươ ễ ể ớ ữ ồ Nh  v y, v i cách bi u di n trên, đ  t ố   ng đ ng gi a các tình hu ng

ượ ộ ươ ề ằ ồ ồ đ c qui v  bài toán h i qui b ng cách tính đ  t ữ   ủ ng đ ng c a nh ng

ầ ở ầ ấ ấ ơ thành ph n t ng th p h n trong cây c u trúc.

ộ ươ ồ 2.2.4.1. Đ  t ữ ng đ ng gi a Travel Bag

ủ ộ ườ ư ị M t tour du l ch (TB) c a ng i dùng, nh  đã trình bày ở ụ    m c

ể ượ ễ ướ ạ ể ơ ổ ợ 2.4, có th  đ c bi u di n d i d ng véc­t ư  h p nh  sau: t

TB = B x Seq(X1) x Seq(X2) x Seq(X3) (1.28)

ủ ữ ầ ồ ộ Nh ng thành ph n c a m t TB bao g m: Không gian các véc­t ơ ề   v

ỗ ả ể ế ầ ơ ỉ ắ   ẩ yêu c u chung B và ba chu i s n ph m (đi m đ n, n i ngh  chân, th ng

ư ậ ị ỗ ữ ế ỗ ể ả c nh). Nh ng chu i này có th  có giá tr  r ng. Nh  v y n u

tb = (b, sb1, sb2, sb3)

ta có

v i. ớ

53

ộ ươ ộ N u ế ị  là m t tour du l ch khác, ta có đ  t ồ   ng đ ng

ữ ẩ ả ạ ộ ươ ư gi a hai s n ph m thu c cùng lo i theo ph ng trình nh  sau:

(1.28)

ố ủ ọ ị

Trong đó w[1,1] = 1 và  v i  > 1.

ấ   Tr ng s  c a tb[1] mang giá tr  cao nh t

ủ ầ ầ ượ ữ ọ ơ vì là thành ph n đ u tiên c a tb, đ c đánh giá quan tr ng h n nh ng thành

ầ ạ ớ ọ ố ượ ỉ ệ ph n còn l i v i tr ng s  đ c chia theo t  l .

ể ể ượ ị ộ ươ ữ ả ầ ồ Đ  có th  có đ c giá tr  đ  t ng đ ng gi a hai tb, ta c n ph i tính

ộ ươ ủ ừ ầ ầ ầ ồ ộ toán đ  t ng đ ng c a t ng thành ph n trong m t tb. Thành ph n đ u tiên

ặ ả ấ ủ ầ ộ ể là đ c đi m mô t yêu c u chung nh t c a m t tb (B):

(1.29)

ị ủ ữ ữ ầ ộ ơ Nh ng thành ph n trong B là nh ng giá tr  c a m t véc­t ặ  các đ c tính

ố ượ ườ ư ậ ị (chi phí cho phép (budget), s  l ng ng i du l ch (party)...). Nh  v y, ta có

ộ ệ ứ ể ị ơ ả th  xác đ nh m t h  th c kho ng cách trong không gian véc­t ặ  các đ c tính

54

ữ ầ ớ ể ễ này. Ng ượ ạ c l i, v i nh ng thành ph n còn l ạ ượ i đ c bi u di n d ướ ạ   i d ng

ỗ ả ộ ươ ẩ ượ ư ể chu i s n ph m, đ  t ồ ng đ ng đ ễ c bi u di n nh  sau:

=

(1.30)

ệ ứ ể ả ả ẩ

ớ v i   và

là h  th c kho ng cách trong không gian s n ph m có ki u .

ộ ươ ữ ồ 2.2.4.2. Đ  t ng đ ng gi a Travel Wish

ươ ự ớ ủ ầ ị ườ T ng t ề ộ  v i TB, yêu c u v  m t tour du l ch c a ng i dùng (TW)

ượ ư ể đ ễ c bi u di n nh  sau:

(1.31)

Trong đó:

ữ ề ầ  là nh ng yêu c u chung v  tour

ề ể ữ ế ầ là nh ng yêu c u v  đi m đ n (location)

ữ ể ầ ị ỉ ề là   nh ng   yêu   c u   v   đ a   đi m   ngh   chân

(accommodation)

ữ ả ầ ề ắ  là nh ng yêu c u v  th ng c nh (attraction)

ậ ươ ứ V y t ng  ng ta có

(1.32)

55

ữ ơ ặ ấ V i  ớ   và    là nh ng truy v n trong không gian véc­t ả    các đ c tính s n

ẩ ấ ph m. Gi ả ử ồ ạ  s  t n t i hai truy v n trong không gian v i   ớ X  là m tộ

ơ ả ố ượ ữ ẩ không gian véc­t ấ  s n ph m. Truy v n này là nh ng đ i t ấ ng có c u trúc

ư nh  sau:

v i  và      (1.33)

ố ớ ặ

ị ế

ị ủ

ả  là giá tr  c a đ c tính th  k,  là kho ng giá tr  bi n thiên đ i v i đ c tính

th  k. ứ

ớ ầ ượ

Ta gi

ả ử ở  s

đây  ho c  v i  l n l

t là đ c tính d ng ký t

ố ạ  và d ng s .

ấ   V i  là m t yêu c u truy v n tour khác, ta có kho ng cách gi a hai truy v n

ư

ượ đ

ẩ   c đ nh nghĩa nh  sau (gi ng v i cách tính kho ng cách gi a hai s n ph m

ộ thu c cùng m t không gian)

(1.34)

v i:ớ

(1.35)

ể ả ể ụ ứ Đ  mô t bi u th c trên, ta có ví d  sau:

V i  ớ

ứ ấ ầ ộ ộ là   hai   truy   v n   thu c   không   gian   thành   ph n   th   3   trong   m t   tình

ể ố ử ố ọ ị hu ng tour (đi m ăn ngh ) ỉ X.2 Giá s  các tr ng s  có giá tr  1, ta có:

56

ộ ươ ậ ẽ ượ ồ ư ố ớ Đ  t ng đ ng do v y s  đ c tính nh  sau (gi ng v i TB)

(1.36)

ớ v i  và  ta có

(1.37)

(1.38)

ớ ượ

ươ

V i đ

c đ nh nghĩa theo ph

ầ   ng trình (1.34),   là không gian thành ph n

ế

ơ tour ( là đi m đ n,  là n i ăn ngh ,  là th ng c nh).

ộ ươ ữ ồ ớ 2.2.4.3. Đ  t ng đ ng gi a Travel Bag v i Travel Wish

Ta có

ườ

ượ

ượ l

ầ t là yêu c u c a ng

ị i dùng v  tour du l ch, và m t tour đã đ

ự   c xây d ng.

ượ

ộ ươ

ể Đ  có th  xác đ nh đ

c m c đ  t

ng đ ng gi a tw và tb’, ta c n xác đ nh

ượ ộ ươ đ c đ  t

ng đ ng gi a m t truy v n

ầ ấ  v i m t thành ph n thu c không gian X.

ượ ị

ươ

ế ặ

V i  và  đ

c đ nh nghĩa theo ph

ng trình (3.32), gi

thi

t đ c tính th   không

ớ ầ ượ

có đi u ki n ràng bu c, ta có  ho c  v i  l n l

t là đ c tính d ng ký t

ạ    và d ng

ố ặ s . Đ t , ta có:

(1.39)

V i:ớ

57

(1.40)

ừ T  đây, ta có:

(1.41)

V i ớ

(1.42)

ượ ị

ươ

V i ớ , và   đ

c đ nh nghĩa trong ph

ng trình

(1.39)

ộ ươ ữ ồ ườ 2.2.4.4. Đ  t ữ ng đ ng gi a nh ng ng i dùng

ệ ư ấ ồ ơ ườ ượ ị ộ ơ Trong h  t v n, h  s  ng i dùng đ c đ nh nghĩa là m t véc­t các

ư ậ ộ ươ ữ ồ ơ ồ ườ ể ượ ặ đ c tính. Nh  v y, đ  t ng đ ng gi a h  s  ng i dùng có th  đ c tính

ư ộ ươ ữ ầ ồ toán nh  đ  t ng đ ng gi a các thành ph n tour. N u ế u = và

(u1,…,un ), u^' = (u1^',…,un^'),  ta có:

(1.43)

58

ệ ứ

ồ ơ

ườ

V i  là h  th c kho ng cách áp d ng cho h  s  ng

i dùng ,  kho ng cách

ủ ồ ơ

ồ ơ

ọ gi a các đ c tính trong h  s , và  là tr ng s  cho t ng đ c tính c a h  s  ng

ườ   i

dùng.

ươ 2.2.4.5. T ồ ng đ ng kép

ươ ộ ươ ồ ữ ẩ ả ồ T ng đ ng kép là phép đo đ  t ng đ ng gi a các s n ph m đ ượ   c

ủ ự ế ầ ườ ố ớ ữ ả tìm ki m d a trên yêu c u (TW) c a ng ẩ   i dùng đ i v i nh ng s n ph m

ữ ộ ố ươ ự ớ ệ ạ thu c nh ng tình hu ng tour t ng t ố  v i tình hu ng tour hi n t i đã đ ượ   c

ế tìm ki m.

ụ ả ế ẩ ắ Hình 2.3. S p x p danh m c s n ph m

ừ ả ử ầ ắ ữ ế ế ể ộ T  hình 1.5, gi s  ta c n s p x p m t danh sách nh ng đi m đ n đã

ượ ế ầ ườ ự ố đ c tìm ki m theo yêu c u ng ữ i dùng, d a trên nh ng tình hu ng tour

ư ả tham kh o theo nh  hình 1.6:

59

ế ể ắ ế Hình 2.4. S p x p đi m đ n

ư ậ ể ắ ứ ự ể ế ế ể ượ ầ ợ Nh  v y, đ  có th  s p x p th  t đi m đ n đ ả   c g i ý, ta c n ph i

ộ ươ ủ ừ ữ ế ế ể ể ồ ớ tính toán đ  t ng đ ng c a t ng đi m đ n v i nh ng đi m đ n có trong

ụ ố ươ ự ả ử danh m c tình hu ng tour t ng t . Gi s  ta có

Sim(D1,CD1) = m

Sim(D1,CD2) = n…

Sim(D2,CD1) = p

Sim(D2,CD2) = q …

ầ ượ Trong đó Sim(D1, CD1)   và Sim(CC, C2) = b l n l t là đ  t ộ ươ   ng

ệ ạ ữ ố ả ố ồ đ ng gi a tình hu ng tour hi n t i và hai tình hu ng tour tham kh o đ ượ   c

ộ ươ ị ươ ồ ồ xét. Ta có, đ  t ng đ ng kép. Giá tr  t ng đ ng Sim(CC, C1) có th ể

ượ ư ọ ộ ươ ố ự ồ đ c coi nh  tr ng s  trong tính toán đ  t ng đ ng kép. D a vào giá tr ị

ươ ụ ủ ể ồ ớ t ả   ế ng đ ng kép c a D1 v i các đi m đ n trong danh m c tour tham kh o,

ị ượ ể ta xác đ nh đ c đi m đánh giá

(1.44)

ể ượ ươ ự ữ ự Đi m đánh giá Score(D2) cũng đ c xét t ng t ể   . D a trên nh ng đi m

ể ị ượ ứ ự ợ ủ ẩ ả đánh giá này, ta có th  xác đ nh đ c th  t g i ý c a các s n ph m đ ượ   c

tìm ki m.ế

60

ổ ể 2.2.4.6. Đánh giá t ng th

ượ ư

ườ

ượ

Đi m đánh giá đ

c đ a ra b i ng

i dùng, đ

ứ   c dùng trong đánh giá m c

ượ

ệ ố

ượ

ộ đ  thành công c a m t tour đ

c h  th ng g i ý. Đi m đánh giá đ

c dành cho

ổ ợ

toàn b  tour và t ng thành ph n trong tour. T  h p nh ng đi m đánh giá này, ta

ể ọ

ượ

có th  g i là đánh giá t ng quan. M t tình hu ng tour đ

ậ   c xây d ng và nh n

ệ ư ấ

ượ đ

c đi m đánh giá t ng quan càng cao, h  t

v n càng ch ng t

ỏ ượ  đ

ệ c hi u qu

ệ ư

ươ

trong vi c đ a ra g i ý. V i m i đi m đánh giá

ố  là nh ng s  nguyên d

ng, ta có

ố ự ươ

ượ

đi m đánh giá t ng quan s  là nh ng s  th c d

ng, đ

c tính theo giá tr  trung

ủ ừ

ả ử

bình c a t ng đánh giá thành ph n. Gi

ố  s  ta có m t tình hu ng tour  v i , trong

ườ

ồ ạ

ằ đó thang đi m đánh giá n m gi a 1 và 5:  trong tr

ng h p đánh giá t n t

i. Ta

ị ố

ườ

ị đ nh nghĩa  là giá tr  t

i đa kh  dĩ cho m t đi m đánh giá (trong tr

ng h p này là

ượ ị

ư

5), ta có đi m đánh giá t ng quan đ

c đ nh nghĩa nh  sau:

(1.45)

ớ ầ ố ữ ỗ ị ị

ư ậ ầ ử

ể ị

ộ ươ ữ ổ ổ V i  là t ng s  nh ng thành ph n trong  có giá tr  khác r ng vì giá tr  trung  ỉ ồ ạ ị i khi các thành ph n có giá tr  khác r ng. Nh  v y, ta có . S bình  ch  t n t ổ ụ ữ ị d ng giá tr  đánh giá t ng quan, ta có th  xác đ nh m c đ  khác nhau  gi a  ố ớ ừ ườ ữ   i dùng đ i v i t ng tình hu ng xây d ng tour khác nh ng đánh giá c a ng ồ nhau, hay đ  t ỗ ứ ộ ố ủ ng đ ng gi a các đánh giá t ng quan

ươ 2.2.4.7. Tìm case t ng t ự

ề ộ ươ ữ ự ữ ồ ị D a trên nh ng đ nh nghĩa v  đ  t ầ   ng đ ng gi a các thành ph n

ộ ươ ữ ồ ố ừ ể tour, ta có th  tính toán đ  t ng đ ng gi a các tình hu ng tour, t đó có

ể ư ữ ố ươ ự ớ ố th  đ a ra danh sách nh ng tình hu ng tour t ng t v i tình hu ng tour

ệ ạ ữ ế ố ươ hi n t i. Quá trình tìm ki m nh ng tình hu ng tour t ng t ự ượ  đ ể ệ   c th  hi n

ằ b ng hình 1.7

61

ế ố ươ ự ng t Hình 2.5. Quá trình tìm ki m tình hu ng tour t

ữ ố ươ Danh sách nh ng tình hu ng tour t ng t ự ượ   đ ế c tìm ki m qua hai

b c:ướ

ộ ọ ướ ầ ế ấ B  l c truy v n logic: Là b c đ u tiên trong quá trình tìm ki m. T i b ạ ướ   c

ơ ở ữ ệ ữ ư ề ệ ố ỏ ấ   này, nh ng tình hu ng l u trong c  s  d  li u th a mãn đi u ki n truy v n

ớ ượ ầ ấ ọ ộ ồ logic v i B x U x R đ c trích ch n. M t truy v n Q  bao g m yêu c u truy

ấ ủ ơ ả ồ ơ ữ ặ ộ ườ ấ v n nh ng đ c tính c  b n nh t c a m t tour (B), h  s  ng i dùng (U),

ữ ấ ồ ữ ệ ạ và đánh giá (R). Ngu n d  li u t o nên nh ng truy v n đ ượ ấ ừ c l y t yêu

ườ ố ớ ụ ề ữ ể ấ ộ ầ c u ng ạ   i dùng đ i v i m t tour. Ví d  v  nh ng truy v n có th  có d ng

sau:

(cid:0) Tìm ki m nh ng tình hu ng đã đ

ữ ế ố ượ ự ộ ở c xây d ng b i cùng m t ng ườ   i

dùng

(cid:0) Tìm ki m nh ng tình hu ng có đi m đ n gi ng v i đi m đ n c a ủ

ữ ế ể ể ế ế ố ớ ố

ệ ạ ố tình hu ng hi n t i

62

(cid:0) Tìm ki m nh ng tình hu ng có đi m đ n cùng lo i và tr i nghi m ệ

ữ ế ể ế ả ạ ố

ườ ệ ạ ớ ố ố ng i dùng gi ng v i tình hu ng hi n t i

(cid:0) Tìm ki m nh ng tình hu ng tour có kho ng th i gian du l ch nh  h n ỏ ơ

ữ ế ả ờ ố ị

1 tu nầ

ộ ử ể ả ố ượ ứ ệ ả ả ố Đ  đ m b o hi u qu  trong  đáp  ng t c đ  x  lý, s  l ng tình

ượ ế ở ướ ả ượ ố ả ướ ố hu ng đ c tìm ki m b c này ph i đ c t i gi n vì b ế   c tìm ki m

ố ươ ử ề ồ ố ờ tình hu ng t ng đ ng tiêu t n nhi u th i gian x  lý.

ướ ộ ươ ự ứ ữ ồ Trong   b c   th   hai,   d a   vào   tính   toán   đ   t ng   đ ng   gi a   tình

ệ ạ ố ố ượ ế ở ướ hu ng hi n t i và tình hu ng tour đ c tìm ki m b ệ ố c 1, h  th ng s ẽ

ấ ớ ệ ạ ề ầ ố ộ ươ ư đ a ra k láng gi ng g n nh t v i tình hu ng tour hi n t i (đ  t ồ   ng đ ng

ả ậ ướ ế ượ ấ cao nh t). Mô t thu t toán cho b c tìm ki m này đã đ c trình bày trong

ớ ệ ứ ụ ầ ả ố ph n 2.6.1 v i h  th c kho ng cách áp d ng cho tình hu ng tour  hoàn

ỉ ch nh:

d(c,c' )= ­ln(Sim(c,c')) (1.46)

ợ ỉ 2.2.5. G i ý hoàn ch nh

63

ợ Hình 2.6. Qui trình g i ý các thành ph n tour

ượ

ỉ ể ấ ự D a vào hình 2.6 ta có th  th y các thành ph n tour đ ế

ỉ ạ ầ ợ ả

ầ ự ủ

ế ệ ạ ố

ấ ồ ọ ừ ơ ở ữ ệ ữ ữ ụ ố

ự ế ế

ư ậ ả ả ả

ng đ ng cao nh t v i tình hu ng tour hi n t ự ẩ ầ ẩ ẩ ụ ườ ộ

ể ợ ề ả i dùng có th  ch n m t hay nhi u s n ph m đ ự c xây d ng. Các b

ườ ữ t c  nh ng thành ph n thi ế i cho đ n khi ng

ả ấ ộ ợ ầ   ầ c g i ý d n ụ ướ ộ   cho đ n khi t o thành m t tour hoàn ch nh. Các b c g i ý áp d ng cho ư ắ ơ ể ừ ế   t ng thành ph n tour (đi m đ n, n i ăn ngh , th ng c nh) là nh  nhau. ườ ầ ệ ố   ầ ướ i dùng (TW), h  th ng B c đ u tiên, d a theo yêu c u đ u vào c a ng ẽ ế ơ ở ữ  ể ụ ả ế s  ti n hành tìm ki m danh m c s n ph m (v.d. đi m đ n) trong c  s  d ữ ủ ự ế ệ   i, nh ng tình li u. Ti p theo, d a vào c u trúc c a tình hu ng tour hi n t ệ ạ ẽ ượ   ấ ớ ộ ươ ố hu ng tour có đ  t i s  đ c ố    c  s  d  li u tình hu ng (case base). Nh  v y, d a vào danh trích ch n t ượ   ự ươ c , danh m c nh ng s n ph m đã đ ng t sách nh ng tình hu ng tour t ộ  ứ ượ ắ ơ ở ữ ệ tìm ki m trong c  s  d  li u đ c s p x p d a trên gi m d n m c đ ẽ ượ   ố ồ ươ c ng đ ng kép (m c 2.8.5). Cu i cùng, danh sách g i ý s n ph m s  đ t ợ   ượ ể ọ ư ừ c g i đ a ra. T  đó, ng ượ ướ ị ở  top trên đ  thêm vào tour du l ch đang đ   c trên ý  ượ ặ ạ ế   ầ ấ ả đ t c l p l i dùng đã có t ị ấ ủ ế y u nh t c a m t tour du l ch và c m th y hài lòng.

64

ươ Ế Ệ Ố Ổ Ế Ch ng 3. PHÂN TÍCH THI T K  H  TH NG C NG THÔNG TIN

DU L CHỊ

ơ ở ự ệ ớ D a vào các c  s  lý thuy t ế ở ươ  ch ng 1, cùng v i các tài li u [4,5,6,7]

ượ ơ ồ ủ ự ư ể ả mà tôi đã có đ c các b ng th c th  cũng nh  các s  đ  c a thi ế ế ơ ở  t k  c  s

ư ư ữ ệ d  li u cũng nh  thi ế ế ươ t k  ch ng trình nh  sau:

ế ế ơ ở ữ ệ 3.1. Thi t k  c  s  d  li u

ự ể 3.1.1. Các th c th

ơ ồ ủ ư ư Báng fithou_accommodation: L u trg nh  các s  đ  c a thi ế ế ơ ở  t k  c  s

ữ ệ d  li u cũng

ữ ệ ả ̉ Bang ạ . B ng d  li u khách s n

ả Tên tr ngườ ể ữ ệ Ki u d  li u Ràng bu cộ ễ Di n gi i

Khóa chính Auto Increment ID int

Name varchar Tên khách s nạ

Address varchar ỉ ị Đ a ch

ệ Phone varchar ạ Đi n tho i

Stars tinyint Sao

ID_City int Khóa ngo iạ Thành phố

Name_City varchar

ậ Khóa ngo iạ ệ Qu n, huy n ID_Des int

Desc text Mô tả

Images varchar nhẢ

ID_Supplier int

Name_Supplier varchar

Checked tinyint

ụ Services varchar ị Các d ch v

ơ ở ậ Facilities varchar ấ C  s  v t ch t

65

ề ể ư ả ị ữ B ng fithou_attraction l u tr  các thông tin v  đi m du l ch

ữ ệ ả ắ ả ̉ Bang 2 . B ng d  li u th ng c nh

ả ngườ i

Tên tr ID ể ữ ệ Ki u d  li u int Ràng bu cộ Khóa chính ễ Di n gi Auto

Name varchar Increment ể Tên   đi m   du

Khóa ngo iạ l chị ỉ ị Đ a ch Thành phố

ể Khóa ngo iạ

Address ID_City Name_City ID_Des Price varchar int varchar int int ế Đi m đ n Giá   vé   (n uế

ể có) Mô tả ạ ệ Đi n tho i nhẢ ặ Đ c đi m

Desc Phone Images Characteristics Checked ID_Supplier text varchar varchar varchar tinyint int

ể ả ặ ạ ị B ng fithou_characteristics: Đ c đi m, lo i hình du l ch…

ữ ệ ả ặ ạ ị ̉ ể B ng d  li u đ c đi m, lo i hình du l ch Bang 3.

ả ngườ i

Tên tr ID ể ữ ệ Ki u d  li u int Ràng bu cộ Khóa chính ễ Di n gi Auto

ể Name varchar Increment ặ Tên đ c đi m

ụ ả ố B ng fithou_city: Danh m c các thành ph

66

ữ ệ ố ̉ Bang 4. B ngả  d  li u các thành ph

ả ngườ i

Tên tr ID ể ữ ệ Ki u d  li u int Ràng bu cộ Khóa chính ễ Di n gi Auto

ể Increment ặ Tên đ c đi m Name varchar

Mô tả Desc text

Khóa ngo iạ Khu v cự ID_Region int

Name_Region varchar

ả B ng fithou_destination

ữ ệ ể ả ̉ Bang ế 5. B ng d  li u các đi m đ n

ả ngườ i

Tên tr ID ể ữ ệ Ki u d  li u int Ràng bu cộ Khóa chính ễ Di n gi Auto Increment

ế Name varchar Tên đi m để

ID_City int Khóa ngo iạ Thành phố

Name_City varchar

Images varchar nhẢ

Desc text Mô tả

ạ Characteristics varchar Lo i   hình   du

l chị

Checked tinyint

ự ệ ả B ng fithou_event: Các s  ki n, l ễ ộ  h i

ữ ệ ự ệ ả ̉ ễ ộ  h i Bang 6. B ng d  li u s  ki n, l

ả Tên tr ngườ ể ữ ệ Ki u d  li u Ràng bu cộ ễ Di n gi i

67

ID int Khóa chính Auto Increment

Name varchar ự ệ Tên s  ki n

ID_City int Khóa ngo iạ Thành phố

Name_City varchar

Address varchar ỉ ị Đ a ch

Price float Giá vé

ệ Phone varchar ạ Đi n tho i

Desc text Mô tả

Images varchar nhẢ

ID_Supplier int

Name_Supplier varchar

Checked tinyint

ấ ủ ả ạ ộ ơ ở ậ B ng fithou_facilities: C  s  v t ch t c a m t khách s n

ữ ệ ơ ở ậ ả ̉ Bang ấ 7. B ng d  li u c  s  v t ch t

ả Tên tr ngườ ể ữ ệ Ki u d  li u Ràng bu cộ ễ Di n gi i

ID int Khóa chính Auto Increment

Name varchar ệ Tên ti n nghi

ủ ả ạ ạ ỗ B ng fithou_price_acc: Giá c a m i lo i phòng trong khách s n

ữ ệ ả ̉ Bang ạ 8. B ng d  li u giá phòng các khách s n

68

ả Tên tr ngườ ể ữ ệ Ki u d  li u Ràng bu cộ ễ Di n gi i

ID_Acc int Khóa chính Khách s nạ

ạ ID_Type int Khóa chính Lo i phòng

Price int Giá

ộ ử ạ ả ủ ả ẩ B ng fithou_product_type: Các lo i s n ph m c a m t c a hàng

ạ ả ữ ệ ả ẩ ̉ Bang 9. B ng d  li u các lo i s n ph m

ả Tên tr ngườ ể ữ ệ Ki u d  li u Ràng bu cộ ễ Di n gi i

ID int Khóa chính Auto Increment

Name varchar ả   ạ Tên   lo i   s n

ph mẩ

ả B ng fithou_region

ữ ệ ả ̉ Bang ự 10. B ng d  li u các khu v c

ả ngườ i

ể ữ ệ Ki u d  li u int Ràng bu cộ Khóa chính Tên tr ID ễ Di n gi Auto Increment

Name varchar Tên khu v cự

Desc text Mô tả

ả ạ ạ ộ B ng fithou_room_type: Các lo i phòng trong m t khách s n

ữ ệ ạ ả ̉ Bang 11. B ng d  li u các lo i phòng

69

ả ngườ i

ể ữ ệ Ki u d  li u int Ràng bu cộ Khóa chính Tên tr ID ễ Di n gi Auto Increment

Name varchar ạ Tên lo i phòng

Images varchar Image

Desc text Mô tả

ứ Capacity tinyint ứ S c ch a

ụ ủ ạ ị ả ạ ộ B ng fithou_services: Các lo i d ch v  c a m t khách s n

ữ ệ ụ ủ ̉ Bang ạ ị 12. B ngả  d  li u các d ch v  c a khách s n

ả ngườ i

Tên tr ID ể ữ ệ Ki u d  li u int Ràng bu cộ Khóa chính ễ Di n gi Auto Increment

ụ Name varchar ị Tên d ch v

ả B ng fithou_rec_case: Case base

ữ ệ ̉ d  li u case base Bang 13 B ng ả

ả ngườ i

Tên tr ID ể ữ ệ Ki u d  li u int Ràng bu cộ Khóa chính ễ Di n gi Auto Increment

ID_TravelWish int Khóa ngo iạ Travel wish

ID_TravelBag int Khóa ngo iạ Travel bag

ID_UserProfile int Khóa ngo iạ Profile

ID_Reward int Khóa ngo iạ Reward

ố ủ ể ả ầ B ng fithou_rec_reward: Đi m s  c a các thành ph n trong case

ầ ủ ữ ệ ể ố ̉ d  li u đi m s  các thành ph n c a case Bang 14. B ng ả

70

ả ngườ i

Tên tr ID ể ữ ệ Ki u d  li u int Ràng bu cộ Khóa chính ễ Di n gi Auto Increment

ể Base_Contraint tinyint Đi m đánh giá

ể Location tinyint Đi m đánh giá

ể Accommodation tinyint Đi m đánh giá

ể Attraction tinyint Đi m đánh giá

ơ ồ ự ế ể 3.1.2. S  đ  liên k t th c th

3.2. Thi ế ế ươ t k  ch ng trình

ế ế 3.2.1. Thi

ớ ữ ệ   t k  các l p d  li u ớ ơ ở ố ượ SimilityObject: L p c  s  các đ i t ng khác

̉ Bang 15. L p ớ SimilityObject

71

ộ Thu c tính Mô tả

ộ ươ ự simility Đ  t ng t

ươ Ph ứ ng th c Mô tả

ở ạ __construct() Hàm kh i t o

72

ế ủ BaseConstraint: Các yêu c u v  chuy n đi c a ng i dùng

̉ ầ Bang ề ườ 16. L pớ  BaseConstraint

ộ Thu c tính Mô tả

duration ế ờ Th i gian kéo dài chuy n đi

month Đi vào tháng nào

year Đi vào năm nào

ư ế ặ party ộ Đi   nh   th   nào   (m t   mình,   c p   đôi,   gia

đình…)

min_budget ấ ấ Chi phí th p nh t

max_budget Chi phí t i đaố

ươ Ph ứ ng th c Mô tả

ở ạ __construct() Hàm kh i t o

ả ộ ế Location: Mô t ể  m t đi m đ n

̉ Bang 17. L p ớ Location

ộ Thu c tính Mô tả

city Mã thành phố

ế ể destination Đi m đ n

ể ặ chars Đ c đi m

ế des_name ể Tên đi m đ n

ươ Ph ứ ng th c Mô tả

ở ạ __construct() Hàm kh i t o

73

74

ả ộ Accommodation: Mô t

̉ ạ  m t khách s n 18. L p ớ Accommodation Bang

ộ Thu c tính Mô tả

accommondation Mã khách s nạ

room_type ạ Lo i phòng

capacity ứ ứ S c ch a

min_price ố Giá t ể i thi u

max_price Giá t i đãố

star ạ ấ Lo i m y sao

is_hotel Có là khách s nạ

services ụ ị Các d ch v

facilities ơ ở ậ ấ C  s  v t ch t

acc_name Tên khách s nạ

ươ Ph ứ ng th c Mô tả

ở ạ __construct() Hàm kh i t o

ả TravelInformation: Mô t travel bag và travel wish

̉ Bang 19. L p ớ TravelInformation

ộ Thu c tính Mô tả

base_constraint ố ượ Đ i t ng BaseConstraint

location ố ượ Đ i t ng Location

accommodation ố ượ Đ i t ng Accommodation

75

attraction ố ượ Đ i t ng _Attraction

ươ Ph ứ ng th c Mô tả

ở ạ __construct() Hàm kh i t o

ấ ả ủ ế ị _Case: C u trúc case mô t chuy n đi c a khách du l ch

̉ Bang 20. L p ớ Case

ộ Thu c tính Mô tả

travel_wish ố ượ Đ i t ng TravelInformation

travel_bag ố ượ Đ i t ng TravelInformation

user_profile ố ượ Đ i t ng UserProfile

reward ố ượ Đ i t ng Reward

ươ Ph ứ ng th c Mô tả

ở ạ __construct() Hàm kh i t o

ố ế ậ ứ CBRConfig: Ch a các thông s  thi t l p

̉ Bang 21. L p ớ CBRConfig

ộ Thu c tính Mô tả

no_of_sim_case ố ượ ươ ự ấ ng case t ng t l y ra

ố ượ ố ơ ng t i đa các item g i ý

S  l max_recommendation_item S  l max_search_item ố ượ ế ố S  l ng tìm ki m t i đa

76

duration_range Duration Range

month_range Month Range

year_range Year Range

budget_range Budget Range

capacity_range Capacity Range

acc_price_range Accommodation Price Range

att_price_range Attraction Price Range

star_range Star Range

year_of_birth_range Year Of Birth Range

no_of_characteristic ố ượ ặ ộ S  l ủ ng đ c tính c a m t item

ố ượ ơ ở ậ ấ ủ ộ no_of_facility S  l ng c  s  v t ch t c a m t khách

s nạ

no_of_service ố ượ ụ ủ ạ ộ ị S  l ng d ch v  c a m t khách s n

alpha Alpha

tw_weight ố ọ Tr ng s  Travel Wish

tb_weight ố Trong s  Travel Bag

twb_weight ố ọ Tr ng s  Travel Wish Bag

u_weight ố Trong s  User Profile

r_weight ọ ố Tr ng s  Reward

ơ ở ữ ệ ế DBAdapter: Các thao tác tìm ki m trên c  s  d  li u

̉ Bang 22. L p ớ DBAdapter

77

ộ Thu c tính

CI Mô tả ố Đ i t ượ   ng

CI_Controler c aủ

framework

ươ Ph ứ ng th c Mô tả

_construct () ở ạ Hàm kh i t o

fetch_all_case () ấ ộ L y toàn b  case

search_accommodation (accommodation, Tìm khách s nạ

location) search_attraction (attraction, location) ể ơ Tìm đi m vui ch i

search_location (location) ế ể Tìm đi m đ n

ố ượ ứ ả ớ CBR: L p đ i t ng ch a các hàm gi ậ i thu t

̉ Bang 23. L p ớ CBR

Mô tả ộ Thu c tính

dba ố ượ Đ i t ng DBAdapter

all_case ố ượ ả M ng đ i t ng _Case

current_case ố ượ Đ i t ng _Case

ươ Ph ứ ng th c Mô tả

__construct() ở ạ Hàm kh i t o

location_simility(loc1, loc2) ộ ượ ự ữ ể ế Đ  t ng t gi a 2 đi m đ n

location_scoring(location, ế ể ể Cho đi m đi m đ n

similar_cases) recommend_location(user_profile, ế ợ ể G i ý đi m đ n base_constraint, location)

78

attraction_simility(att1, att2) ộ ượ ự ữ ị Đ  t ng t ể  gi a 2 đi m du l ch

attraction_scoring(att, similar_cases) ể ể ị Cho đi m đi m du l ch

recommend_attraction(attraction) ợ ị ể G i ý đi m du l ch

accommodation_simility(acc1, acc2) ộ ượ ự ữ ạ Đ  t ng t gi a 2 khách s n

accommodation_scoring(acc, ể ạ Cho đi m khách s n

similar_cases) recommend_accommodation(accommo ạ ợ G i ý khách s n

dation) case_simility(case1, case2) ộ ươ ự ữ Đ  t ng t gi a 2 case

find_similar_case() ươ ự Tìm case t ng t

ộ ượ ự ữ base_constraint_simility(base1, base2) Đ   t ng   t gi a   2   Base

Constraint

travel_infomation_simility(t1, t2) ộ ượ ự Đ  t ng t TravelInformation

user_profile_simility(u1, u2) ộ ượ ự Đ  t ng t User Profile

reward_scoring(r) ể Cho đi m Reward

ộ ượ ự ữ ả arrray_distance(arr1, arr2) Đ  t ng t ặ    gi a 2 m ng  đ c

tính

overlap(x, y) Hàm overlap

quick_sort(out arr_sim_obj, left, right) ế ắ ằ S p x p b ng quick sort

79

ơ ồ ế ớ    3.2.2. S  đ  liên k t l p

80

̀ Hinh 3.1 Classes Diagram

81

ệ ố ồ ử 3.2.3. Lu ng x  lý h  th ng

82

ươ Ệ Ố Ự Ch ng 4 . XÂY D NG H  TH NG

ệ ố ự 4.1. Xây d ng h  th ng

ệ ố ượ ự ự ằ H  th ng đ c xây d ng d a trên framework Codeigniter, nh m k ế

ệ ủ ử ụ ừ ấ ộ ớ   th a và s  d ng giao di n c a famework m t cách nhanh chóng nh t. V i

ả ệ ố ự ợ ị ớ mô hình 3 l p MVC tác gi đã xây d ng h  th ng g i ý du l ch thành công.

ả ậ ượ ệ ố ặ ổ ớ Gi i thu t CBR đ ắ   c cài đ t vào h  th ng v i các hàm tính t ng, hàm s p

ộ ươ ự ế ả ợ ế x p, các hàm tính đ  t ng t , các hàm g i ý và các hàm test k t qu .

ả ự ế ệ 4.2. K t qu  th c hi n

ệ ố ợ ị ả ư ậ ượ H  th ng g i ý du l ch dùng gi i thu t CBR đã đ a ra đ ợ   c các g i ý

ế ừ ầ ấ ớ ườ ử ụ ấ ượ ố có tính k  th a g n nh t v i ng i s  d ng và có ch t l ợ ng g i ý t t, có

ứ ể ượ ệ ố ở ộ th  đáp  ng đ c khi m  r ng h  th ng.

ệ ố ệ ạ ớ ị ị ể H  th ng hi n nay v i 50 đ a đi m du l ch,   200 khách s n và 150

ụ ể ề ể ế ằ ớ ợ ị ầ   đi m đ n v i nhi u d ch v  khác nhau đ  nh m g i ý cho khách hàng g n

ố ủ ấ ớ ườ nh t v i mong mu n c a ng i dùng.

ơ ở ủ ườ ỷ ệ ế ả ợ Trên c  s  đánh giá c a 105 ng i dùng, t ớ    k t qu  g i ý đúng v i l

ố ườ mong mu n ng i dùng là 90%.

83

ệ ủ ệ ố ộ ố M t s  giao di n c a h  th ng:

ự ầ ợ ọ Hình 4.1. Các g i ý ban đ u cho khách l a ch n

84

Hình 4.2. Khi đã hoàn thành các g i ýợ

Ế ƯỚ Ở Ộ Ậ K T LU N VÀ H NG M  R NG

ậ ế 1. K t lu n

ự ậ ượ ư ấ ứ ượ Lu n văn đã xây d ng đ ệ ố c h  th ng t v n đáp  ng đ ầ   c yêu c u

ườ ễ ậ ượ ữ ợ ặ ủ c a bài toán đ t ra, giúp ng i dùng d  dàng nh n đ ầ   c nh ng g i ý g n

ủ ệ ố ứ ủ ự ấ ọ ị nh t cho l a ch n du l ch c a mình. Các ch c năng chính c a h  th ng bao

g m:ồ

ế ậ ậ ạ ơ ể ­ C p nh t khách s n; đi m đ n và khu vui ch i

ể ế ế ạ ơ ­ Tìm ki m Khách s n; đi m đ n và khu vui ch i

ể ể ế ạ ợ ợ ợ ị ị ợ ­ G i ý du l ch: G i ý đ a đi m; G i ý khách s n; G i ý đi m đ n

ở ộ ướ 2.  H ng m  r ng

ể ạ ượ ệ ố ư ư ặ ợ ệ ả M c dù h  th ng đã đ a ra các g i ý, nh ng đ  đ t đ c hi u qu  cao

ệ ố ế ể ả ầ ổ ơ h n, c n ph i phát tri n h  th ng theo đúng ki n trúc “c ng thông tin”,

ữ ệ ồ ủ ị trong đó d  li u đ ượ ấ ừ c l y t ngu n c a các công ty du l ch khác nhau đ ượ   c

ứ ẽ ể ượ ứ ộ ủ ki m ch ng, khách hàng s  đánh giá đ ợ   ợ c m c đ  phù h p c a các g i ý

ệ ố ơ ở ư ớ ượ ộ do h  th ng đ a ra. Trên c  s  đó m i đánh giá đ ủ   c đ  chính xác c a

ươ ph ng pháp.

ự ự ề ầ ế ị ộ ệ ố Ngoài ra c n xây d ng h  th ng d a trên n n các thi t b  di đ ng đ ể

ề ự ư ấ ủ ế ệ ệ ậ ị ti n cho vi c truy c p c a khách du l ch, cũng nh  l y ý ki n v  s  phù

ệ ạ ợ ủ ệ ư ấ h p c a h  t v n hi n t i.

85

[1]. Aalap Kohojkar, Yang Liu, Zhan Shi, Recommender Systems, 2008.

[2]. Adriano   Venturini,   Bora   Arslan,   Francesco   Ricci,   Nader   Mirzadeh,

Ả Ệ TÀI LI U THAM KH O

[3]. Langer, Arthur M, Analysis and Design of Information Systems, 2008

[4]. Quang Nhat Nguyen and Francesco Ricci,  Conversational Case­based

Detailed Descriptions of CBR Methodologies, ICT­irst, 2002.

Recommendations   Exploiting   a   Structured   Case   Model,  9th   European

Conference,   ECCBR   2008,   Trier,   Germany,   September   1­4,   2008.

Proceedings.

[5]. ThS.   Nguy n   Đ c   Hoa   C ng;   PGS.   TS   Nguy n   Xuân   Hoài;   TS.

ươ ứ ễ ễ

ễ ề ễ ằ ỗ ị Đ  tàiề Nguy n Th  Hi n; TS. Nguy n  Đ  Văn; TS. Ban Hà B ng,

ệ ố ứ ự ứ ế ậ ọ ạ   nghiên c u khoa h c “Nghiên c u, xây d ng h  th ng l p k  ho ch

ớ ổ ợ ị ị ệ du l ch tích h p v i c ng thông tin du l ch Vi t Nam”, ĐH Hà N i,ộ

2015.

ế ế ệ ố ả Phân tích và thi t k  h  th ng thông tin qu n lý ễ [6]. Nguy n Văn Ba, ,

NXB ĐHQG, 2002

ậ ế ế ệ ố t k  h  th ng thông tin ỹ [7]. Lê Văn Phùng,   K  thu t phân tích và thi

ướ ấ ả ề h ấ ng c u trúc , Nhà xu t b n Thông tin và Truy n thông, 2011.

LÝ L CHỊ TRÍCH NGANG

ễ Họ và tên: Nguy n Đình Gi ớ i

ắ Ngày tháng năm sinh: 19/09/1988 Nơi sinh: B c Ninh

ố ệ ầ Đ aị  chỉ liên l cạ : 387 Hoàng Qu c Vi ộ ấ t ­ C u Gi y – Hà N i

Quá trình đào t oạ :

ạ ọ ạ ệ ậ ọ ự + 2010 – 2013: Liên thông Đ i h c t ỹ i H c vi n K  thu t Quân s

ọ ạ ọ ệ ậ ọ ự + 2014 – nay: H c cao h c t ỹ i H c vi n K  thu t Quân s

ườ ư ẳ Quá trình công tác: 2011 – nay: Nhân viên Tr ạ   ng Cao đ ng S  ph m

ươ Trung ng.

XÁC NH NẬ  QUY NỂ  LU NẬ  VĂN ĐỦ ĐI UỆ  KI NỆ  B OẢ  VỆ

ễ ớ i Họ và tên tác giả lu nậ  văn: Nguy n Đình Gi

ệ ố ứ ế ạ ậ ị ự   Đề tài lu nậ  văn: Nghiên c u, xây d ng h  th ng l p k  ho ch du l ch d a ự

ệ ợ trên h  g i ý

ọ Chuyên ngành: Khoa h c máy tính

Mã số: 60 48 01 01

ễ ị ề Cán bộ hư ngớ  d nẫ : TS. Nguy n Th  Hi n

ả ệ ướ ủ ề ệ ộ ồ ậ ấ Đã đ  đi u ki n b o v  tr c H i đ ng ch m lu n văn.

Ộ ƯỚ Ọ Ẫ CÁN B  H NG D N KHOA H C H CỌ  VIÊN

ị ề ễ ễ

Nguy n Th  Hi n CHỦ NHI MỆ  KHOA (BỘ MÔN) ớ  Nguy n Đình Gi i CÁN BỘ KI MỂ  TRA

QU NẢ  LÝ CHUYÊN NGÀNH