intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn:Nghiên cứu luật kết hợp và ứng dụng trong công tác quản lý kho hàng tại siêu thị metro

Chia sẻ: Nguyen Vang | Ngày: | Loại File: PDF | Số trang:26

541
lượt xem
106
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Tham khảo luận văn - đề án 'luận văn:nghiên cứu luật kết hợp và ứng dụng trong công tác quản lý kho hàng tại siêu thị metro', luận văn - báo cáo, thạc sĩ - tiến sĩ - cao học phục vụ nhu cầu học tập, nghiên cứu và làm việc hiệu quả

Chủ đề:
Lưu

Nội dung Text: Luận văn:Nghiên cứu luật kết hợp và ứng dụng trong công tác quản lý kho hàng tại siêu thị metro

  1. -1- B GIÁO D C VÀ ĐÀO T O Đ I H C ĐÀ N NG LÊ VĂN ĐÔNG NGHIÊN C U LU T K T H P VÀ NG D NG TRONG CÔNG TÁC QU N LÝ KHO HÀNG T I SIÊU TH METRO Chuyên ngành : KHOA H C MÁY TÍNH Mã s : 60.48.01 TÓM T T LU N VĂN TH C SĨ K THU T Đà N ng - Năm 2011
  2. -2- Công trình ñư c hoàn thành t i Đ I H C ĐÀ N NG Ngư i hư ng d n khoa h c: PGS.TSKH TR N QU C CHI N Ph n bi n 1 : TS. HUỲNH CÔNG PHÁP Ph n bi n 2 : TS. TRƯƠNG CÔNG TU N Lu n văn ñư c b o v t i H i ñ ng ch m Lu n văn t t nghi p th c sĩ k thu t h p t i Đ i h c Đà N ng vào ngày 10 tháng 09 năm 2011. Có th tìm hi u lu n văn t i: • Trung tâm Thông tin - H c li u, Đ i h c Đà N ng • Trung tâm H c li u, Đ i h c Đà N ng.
  3. -3- M Đ U 1. Lý do ch n ñ tài Trong nh ng năm g n ñây, s phát tri n m nh m c a công ngh thông tin ñã làm cho kh năng thu th p và lưu tr thông tin c a h th ng thông tin tăng m t cách nhanh chóng. Bên c nh ñó, vi c tin h c hóa m t cách t và nhanh chóng các ho t ñ ng s n xu t, kinh doanh cũng như nhi u lĩnh v c ho t ñ ng khác ñã t o cho chúng ta m t lư ng d li u c n lưu tr và x lý kh ng l . Trong b i c nh ñó, vi c nghiên c u ñ ra các phương pháp, công c m i h tr con ngư i khám phá, phân tích, t ng h p thông tin nh m ñ tìm và rút ra các tri th c h u ích, các qui lu t ti m n h tr ti n trình ra quy t ñ nh là m t nhu c u b c thi t. T ñó giúp cho nhà qu n lý có cái nhìn t ng quan hơn v d li u, có th ñưa ra nh ng nh n ñ nh, quy t ñ nh, nh ng d ñoán mang tính chi n lư c nh t. Hi n nay v n ñ khai phá lu t k t h p ch m i ñư c ñ c p và ñang tr thành m t khuynh hư ng quan tr ng c a khai phá d li u. Lu t k t h p là lu t ng m ñ nh m t s quan h k t h p gi a m t t p các ñ i tư ng mà các ñ i tư ng có th ñ c l p hoàn toàn v i nhau. Do ñây là m t hư ng ñi ti m năng, có nhi u kh năng phát tri n trong tương lai, nên em ñã ch n ñ tài : “Nghiên c u lu t k t h p và ng d ng trong công tác qu n lý kho hàng t i siêu th Metro” trong ñ t th c hi n Lu n văn t t nghi p này.
  4. -4- 2. Đ i tư ng và ph m vi nghiên c u Đ i tư ng Lý thuy t K thu t khai phá d li u Nghi p v qu n lý kho hàng trong Siêu th D li u Cơ s d li u: các m t hàng, khách hàng . . . Các văn b n, qui ñ nh liên quan ñ n công tác qu n lý trong siêu th . Công ngh Công c l p trình: Visual Studio C#. Cơ s d li u: Microsoft SQL Server 2005 Ph m vi Nghiên c u các ki n th c cơ b n v phương pháp phát hi n lu t k t h p Nghiên c u các quá trình tác nghi p trong h th ng Xây d ng H h tr ra quy t ñ nh ph c v cho công tác qu n lý. 3. M c tiêu và nhi m v M c tiêu ng d ng lu t k t h p vào công tác qu n lý kho hàng. Giúp cho nhà qu n lý có th ñưa ra nh ng nh n ñ nh, nh ng d ñoán mang tính chi n lư c. Nhi m v Nghiên c u cơ s lý thuy t Nghiên c u k thu t khai phá d li u.
  5. -5- Nghiên c u và phát tri n các thu t gi i tìm t p m c ph bi n, lu t k t h p, lu t phân l p, lu t gom c m d li u. ng d ng các thu t toán trên vào cơ s d li u qu n lý kho hàng. Tri n khai xây d ng ng d ng Xây d ng cơ s d li u m u. Xây d ng các ng d ng. 4. Phương pháp nghiên c u Tham kh o các tài li u liên quan, các bài báo cáo khoa h c. . . L p k ho ch, lên quy trình, ti n ñ th c hi n Nghiên c u k thu t khai phá d li u b ng lu t k t h p vào vi c qu n lý kho hàng t i siêu th . 5. Ý nghĩa khoa h c và th c ti n c a ñ tài Ý nghĩa khoa h c ng d ng tin h c trong công tác qu n lý. Ý nghĩa th c ti n Gi i quy t ñư c các công vi c tác nghi p H tr ñưa ra các quy t ñ nh, các d ñoán mang tính chi n lư c cho ngư i qu n lý. Giúp nhà qu n lý có cái nhìn t ng quan v d li u. 6. Tên ñ tài “NGHIÊN C U LU T K T H P VÀ NG D NG TRONG CÔNG TÁC QU N LÝ KHO HÀNG T I SIÊU TH METRO”
  6. -6- 7. C u trúc lu n văn N i dung chính c a lu n văn ñư c chia thành 2 chương như sau: Chương 1: Cơ s lý thuy t v khai phá d li u và lu t k t h p. Chương 2: ng d ng khai phá lu t k t h p trong công tác qu n lý kho hàng t i siêu th .
  7. -7- CHƯƠNG 1 CƠ S LÝ THUY T V KHAI PHÁ D LI U VÀ LU T K T H P 1.1. T NG QUAN V KHAI PHÁ D LI U 1.1.1. Đ nh nghĩa khai phá d li u Khai phá d li u là ti n trình khám phá tri th c ti m n trong các CSDL, c th hơn, ñó là ti n trình l c, s n sinh nh ng tri th c ho c các m u ti m n, chưa bi t, nh ng thông tin h u ích t các CSDL l n. 1.1.2. Các ng d ng c a khai phá d li u Phát hi n tri th c và khai phá d li u liên quan ñ n nhi u ngành, nhi u lĩnh v c: th ng kê, trí tu nhân t o, CSDL, thu t toán, tính toán song song… Đ c bi t phát hi n tri th c và khai phá d li u r t g n gũi v i lĩnh v c th ng kê, s d ng các phương pháp th ng kê ñ mô hình hóa d li u và phát hi n các m u. Khai phá d li u có nhi u ng d ng trong th c t , ví d như: B o hi m, tài chính và th trư ng ch ng khoán; Th ng kê, phân tích d li u và h tr ra quy t ñ nh; Đi u tr y h c và chăm sóc y t ; S n xu t và ch bi n; Text mining và Web mining; Lĩnh v c khoa h c. . . 1.1.3. Các bư c c a quy trình khai phá d li u Quy trình khai phá d li u thư ng tuân theo các bư c sau: Bư c th nh t: Hình thành, xác ñ nh và ñ nh nghĩa bài toán Bư c th hai: Thu th p và ti n x lý d li u Bư c th ba: Khai phá d li u, rút ra các tri th c Bư c th tư: Phân tích và ki m ñ nh k t qu Bư c th năm: S d ng các tri th c phát hi n ñư c
  8. -8- Tóm l i, khám phá tri th c là m t quá trình k t xu t ra tri th c t kho d li u mà trong ñó khai phá d li u là công ño n quan tr ng nh t. 1.1.4. Nhi m v chính trong khai phá d li u Quá trình khai phá d li u là quá trình phát hi n ra m u thông tin. Trong ñó gi i thu t khai phá tìm ki m các m u ñáng quan tâm theo d ng xác ñ nh như các lu t, phân l p, h i quy, cây quy t ñ nh, … 1.1.4.1. Phân l p (phân lo i – classification) 1.1.4.2. H i quy (regression) 1.1.4.3. Phân nhóm (clustering) 1.1.4.4. T ng h p (summarization) 1.1.4.5. Mô hình hóa s ph c thu c (dependency modeling) 1.1.4.6. Phát hi n s bi n ñ i và ñ l ch (change and deviation dectection) 1.1.5. Các phương pháp khai phá d li u 1.1.5.1. Các thành ph n c a gi i thu t khai phá d li u 1.1.5.2. Phương pháp suy di n/ quy n p 1.1.5.3. Phương pháp ng d ng K – láng gi ng g n 1.1.5.4. Phương pháp s d ng cây quy t ñ nh và lu t 1.1.5.5. Phương pháp phát hi n lu t k t h p 1.1.6. L i th c a khai phá d li u so v i các phương pháp cơ b n 1.1.6.1. H c máy (Machine Learning) 1.1.6.2. Phương pháp h chuyên gia 1.1.6.3. Phát ki n khoa h c
  9. -9- 1.1.6.4. Phương pháp th ng kê 1.1.7. L a ch n phương pháp 1.1.8. Thách th c trong ng d ng và nghiên c u k thu t khai phá d li u ñây, ta ñưa ra m t s khó khăn trong vi c nghiên c u và ng d ng k thu t khai phá d li u. Tuy nhiên, có khó khăn không có nghĩa là vi c gi i quy t là hoàn toàn b t c mà ch mu n nêu lên r ng ñ khai phá ñư c d li u không ph i là ñơn gi n, mà ph i xem xét cũng như tìm cách gi i quy t nh ng v n ñ này. Ta có th li t kê m t s khó khăn sau: 1.1.8.1. Các v n ñ v CSDL Đ u vào ch y u c a m t h th ng khám phá tri th c là các d li u thô cơ s , phát sinh trong khai phá d li u chính là t ñây. Do các d li u trong th c t thư ng ñ ng, không ñ y ñ , l n và b nhi u. Trong nh ng trư ng h p khác, ngư i ta không bi t CSDL có ch a các thông tin c n thi t cho vi c khai phá hay không và làm th nào ñ gi i quy t v i s dư th a nh ng thông tin không thích h p. 1.1.8.2. M t s v n ñ khác • “Quá phù h p” • Đánh giá t m quan tr ng th ng kê • Kh năng bi u ñ t các m u • S tương tác gi a ngư i s d ng và các tri th c s n có
  10. - 10 - 1.2. LU T K T H P TRONG KHAI PHÁ D LI U 1.2.1. Vài nét v khai phá lu t k t h p 1.2.2. M t s ñ nh nghĩa cơ b n Đ nh nghĩa 1.1: Lu t k t h p H ng m c (item) là m t hàng trong gi hàng hay m t thu c tính. T p các h ng m c (itemset) là t p các m t hàng trong gi hàng hay t p các thu c tính, I = {i 1 , i 2, .., i m } Ví d : t p I = { s a, bánh mì, ngũ c c, s a chua} Giao d ch (Transation) là t p các h ng m c ñư c mua trong m t gi hàng (có TID là mã giao d ch). Giao d ch t là t p các h ng m c sao cho t ⊆ Ι. Ví d : t = {bánh mì, s a chua, ngũ c c} Cơ s d li u giao d ch là t p các giao d ch, ví d cơ s d li u giao d ch D = {t1 , t 2, . . .t n}. M t lu t k t h p là m t m nh ñ kéo theo có d ng X→Y, trong ñó X, Y ⊆ I, th a mãn ñi u ki n X∩Y=∅. Các t p X và Y ñư c g i là t p các h ng m c (itemset). T p X g i là nguyên nhân, t p Y g i là h qu . Đ nh nghĩa 1.2: Đ h tr Đ h tr c a t p các h ng m c X trong cơ s d li u giao d ch D là t l gi a s các giao d ch ch a X trên t ng s các giao d ch trong D, ký hi u là Support(X ) hay Supp(X). Ta có: 0 ≤ Supp(X) ≤ 1 v i m i t p h p X. Đ h tr c a m t lu t k t h p X→Y s là: Supp(X→Y) = Supp(X∪Y)
  11. - 11 - Đ nh nghĩa 1.3: Đ tin c y Đ tin c y (Confidence) c a lu t k t h p có d ng: X Y là t l gi a s lư ng các giao d ch trong D ch a X ∪ Y v i s giao d ch trong D có ch a t p X. Ký hi u ñ tin c y c a m t lu t là Conf (X Y). Supp(X ∪ Y) Conf (X Y) = Supp(X) • Vi c khai thác các lu t k t h p có th ñư c phân tích thành hai giai ño n sau: 1. Tìm t t c các t p m c ph bi n t CSDL D t c là tìm t t c các t p m c có ñ h tr l n hơn ho c b ng minsupp. 2. Sinh ra các lu t t các t p m c ph bi n (large itemsets) sao cho ñ tin c y c a lu t l n hơn ho c b ng minconf. 1.2.3. Ví d v bài toán phát hi n lu t k t h p 1.2.4. M t s hư ng ti p c n trong khai phá lu t k t h p Lu t k t h p nh phân Lu t k t h p có thu c tính s và thu c tính h ng m c Lu t k t h p ti p c n theo hư ng t p thô Lu t k t h p nhi u m c Lu t k t h p m Lu t k t h p v i thu c tính ñư c ñánh tr ng s Khai phá lu t k t h p song song 1.2.5. M t s thu t toán phát hi n lu t k t h p 1.2.5.1. Thu t toán AIS 1.2.5.2. Thu t toán SETM
  12. - 12 - 1.2.5.3. Thu t toán Apriori 1.2.5.4. Thu t toán Apriori -TID 1.2.5.5. Thu t toán Apriori –Hybrid 1.2.5.6. Thu t toán FP-Growth 1.2.5.7. Thu t toán tìm lu t k t h p v i cây quy t ñ nh M t s ñ nh nghĩa Đ nh nghĩa 1.4 : Cây quy t ñ nh là m t c u trúc phân c p c a các nút và các nhánh. Trong ñó có 3 lo i nút trên cây : - Nút g c - Nút n i b : mang tên thu c tính c a CSDL - Nút lá : mang tên l p M t cây quy t ñ nh bi u di n m t phép tuy n c a các k t h p, c a các ràng bu c ñ i v i các giá tr thu c tính. M i ñư ng ñi t nút g c ñ n nút lá s tương ng v i m t k t h p c a các ki m tra giá tr thu c tính. * Phát bi u v n ñ : Cho b ng d li u A g m n dòng v i các thu c tính: (X1 , X2 , ..., X N, Y), trong ñó Y là thu c tính output (thu c tính c n d báo) và X 1, X 2, ..., XN là các thu c tính input. Gi s Y ñã ñư c r i r c hóa thành k giá tr là y1 , y2 ,..., yk (nghĩa là giá tr t i Y c a m t dòng b t kỳ trong A ph i là m t trong các y1, y2 ,..., yk ). G i n y1 là s dòng trong b ng A th a ñi u ki n Y = y1 , ký hi u tương t cho n y 2 ,..., n y k . Đương nhiên ta có các n y i ph i l n hay b ng 0 và ( n y1 + n y 2 + ...+ n y k ) = n. Khi ñó ta có các ñ nh nghĩa sau:
  13. - 13 - Đ nh nghĩa 1.5 : Đ phân tán thông tin c a b ng A là m t giá tr trong kho ng t 0 ñ n 1, ñư c tính b i: I( n y1 , n y 2 , ..., n y k ) = n y1 n y1 − log k n y1 + n y 2 + ... + n y k n y1 + n y 2 + ... + n y k ny2 n y2 − log k n y1 + n y2 + ... + n y k n y1 + n y2 + ... + n y k ... n yk n yk − log k n y1 + n y2 + ... + n yk n y1 + n y2 + ... + n yk Trong ñó, ta qui ư c log k 0 = 0 . Nh n xét: Hàm I không thay ñ i giá tr khi ta hoán v các n y i . Hàm I ñ t giá tr l n nh t (b ng 1) khi n y1 = n y 2 = . . .= n y k , nghĩa là các dòng trong b ng A ñư c phân tán ñ u cho các trư ng h p (r i r c) c a thu c tính output Y. Hàm I ñ t giá tr nh nh t (b ng 0) khi có m t n y i nào ñó b ng n (t ng s dòng c a b ng A), và ñương nhiên là các n y i còn l i ph i b ng 0. Khi ñó, ta nói r ng b ng A không phân tán thông tin gì c , và cũng có nghĩa là b ng A không có gì ñ d báo.
  14. - 14 - Đ nh nghĩa 1.6 : G i n y m là m t giá tr l n nh t trong các n y1 , n y 2 ,..., n y k , và g i ym là giá tr tr i c a thu c tính nym output Y, thì khi ñó ta có ñ tr i output c a b ng A s là n Đ nh nghĩa 1.7 : G i X là m t thu c tính input c a b ng A, gi s X ñã ñư c r i r c hóa thành m giá tr x1 , x 2, ..., x m. Phép tách A d a vào thu c tính X, ký hi u là TX, t o thành m b ng con c a A: TX = {A1, A2 , ..., Am}, trong ñó: - A1 , A2 , ..., Am t o thành m t phân ho ch trên A, nghĩa m là Ai∩Aj = ∅, ∀i, j =1,2,...,m, i ≠ j và U A = A. i =1 i - Ai là t p h p các dòng trong A có giá tr t i X là x i, nghĩa là Ai = {t∈A|t.X = x i}, ∀i = 1, 2, ..., m. Đ nh nghĩa 1.8 : G i TX là m t phép tách như trong ñ nh A nghĩa 1.7. V i m i i t 1 ñ n m, g i ny1i là s dòng trong b ng Ai th a ñi u ki n Y = y1, ký hi u tư ng t cho A ny2i A ,..., ny ki . Đ phân tán thông tin c a phép tách TX , ký hi u E(TX), là m t giá tr t 0 ñ n 1, ñư c tính b i:  k Ai  m  ∑ ny j   j =1 Ai  E(TX) = ∑  k × I (ny1 ny2 ,..., n yk )  i =1 Ai Ai  ∑ ny j   j =1 
  15. - 15 - Trong ñó: - n y ji là s dòng trong b ng Ai th a ñi u ki n Y=yj . A k - ∑n j =1 Ai yj là s dòng c a b ng Ai. k - ∑n j =1 yj là s dòng c a b ng A. A A A - I (n y1i n y2i ,..., n yki ) là ñ phân tán thông tin c a b ng con Ai. M t phép tách TX ñư c g i là “t t” khi các b ng con Ai t o thành có ñ phân tán thông tin th p, hay nói theo nghĩa c a phương pháp gom c m, các b ng con Ai là các c m có ña s ph n t (dòng) có giá tr t i Y gi ng nhau. T ñó, phép tách TX là t t khi E(TX) th p, và ngư c l i. Gi i thu t xây d ng cây quy t ñ nh * Phát bi u bài toán: Cho b ng d li u A g m n dòng v i các thu c tính (X 1, X2 , ..., XN , Y), trong ñó Y là thu c tính Output (thu c tính c n d báo) và X 1, X 2, ..., X N là các thu c tính input. T t c thu c tính c a A ñ u có giá tr r i r c và w là ngư ng ñ tin c y ch p nh n ñư c. * Input: - B ng d li u A g m n dòng v i các thu c tính (X1 , X2 , ..., XN, Y), trong ñó Y là thu c tính Output (thu c tính c n d báo) và X1, X2 , ..., XN là các thu c tính input. T t c thu c tính c a A ñ u có giá tr r i r c. - w: ngư ng ñ tin c y ch p nh n ñư c. * Output: - Các lu t sinh ra t cây quy t ñ nh.
  16. - 16 - * Các bư c th c hi n: Bư c 1: Xác ñ nh thu c tính X m trong các X1, X 2, ..., XN th a E( T X m ) là bé nh t. Bư c 2: Th c hi n phép tách T(X m) trên b ng A, ta có t ng th nh t c a cây quy t ñ nh v i nút g c là X m. Bư c 3: V i m i b ng con Ai (t o thành t phép tách bư c 2). - N u b ng con có ñ tr i output l n hơn hay b ng w thì b ng này chính là m t nút lá c a cây quy t ñ nh. Giá tr tr i chính là k t lu n t i nút lá, và ñ tr i output chính là ñ tin c y c a k t lu n. - N u b ng con có ñ tr i output bé hơn w và m i c t (m i thu c tính) ñ u ch có m t giá tr ho c b ng không có dòng nào (nghĩa là b ng không th tách ñư c n a) thì b ng này cũng chính là m t nút lá, và k t lu n t i nút này là “Không ñ cơ s ñ k t lu n gì v output”. - N u b ng con này có ñ tr i output bé hơn w thì th c hi n l i thao tác tương t như ñã làm v i b ng A bư c 1, bư c 2 và bư c 3. Ưu ñi m c a cây quy t ñ nh Chuy n ñ i t cây quy t ñ nh sang lu t Tri th c trên cây quy t ñ nh có th ñư c rút trích và bi u di n thành m t d ng lu t IF – THEN (N U – THÌ). Khi ñã xây d ng ñư c cây quy t ñ nh, ta có th d dàng chuy n cây quy t ñ nh này thành m t t p các lu t tương ñương, m t lu t tương ñương v i m t ñư ng ñi t g c ñ n nút lá. Giai ño n chuy n ñ i t cây quy t ñ nh sang lu t thư ng bao g m 4 bư c sau :
  17. - 17 - - C tta - L a ch n - S px p - Ư c lư ng, ñánh giá Ví d minh h a * Phát bi u bài toán : Gi s doanh nghi p ñã ñưa ra m t s tiêu chí ñ phân lo i khách hàng là VIP ho c không VIP: có kh i lư ng giao d ch trung bình m i tháng ñ t t 3,000,000 VND tr lên, có t n su t giao d ch trung bình 10 l n m i tháng. V n ñ ñ t ra c a doanh nghi p là c n xác ñ nh các ñ c trưng chung c a nhóm khách hàng VIP, ñ t ñó làm cơ s d báo v m t khách hàng (m i) có ti m năng tr thành khách hàng VIP hay không? Gi s doanh nghi p d a vào các thu c tính (c a khách hàng) ñ ch n ñ c trưng g m: Tu i, gi i tính, kho ng thu nh p, TT Hôn nhân. Kh o sát giá tr t i các thu c tính này trên nhóm khách hàng ñã ñư c phân lo i theo tiêu chí trên, ta có b ng d li u sau khi ñã r i r c các thu c tính như sau:
  18. - 18 - B ng 1.5: B ng sau khi r i r c các thu c tính c a khách hàng TT STT Tu i Gi i tính Thu nh p Là KH VIP Hôn nhân 1 2 1 3 0 1 2 1 1 3 0 0 3 2 1 3 1 0 4 3 1 1 1 1 5 2 0 3 1 0 6 2 1 3 1 1 7 2 1 1 1 0 8 1 1 2 1 0 9 2 1 3 0 1 10 3 1 2 1 1 11 2 0 3 1 0 12 3 0 1 1 1 13 2 1 3 0 1 14 3 1 2 1 0 15 3 0 2 1 0 16 3 0 3 1 0 17 1 1 3 0 0 18 1 0 3 0 0 19 1 1 2 1 1 20 3 0 2 1 0 Trong b ng trên, các thu c tính ñã ñư c r i r c hóa theo cách: - Tu i: B ng 1 n u tu i nh hơn 25, b ng 2 n u tu i t 25 ñ n 40, b ng 3 n u tu i l n hơn 40. - Gi i tính: B ng 1 n u là n , b ng 0 n u là nam.
  19. - 19 - - Thu nh p: B ng 1 n u thu nh p ít hơn 30 tri u VND/năm, b ng 2 n u t 30 tri u VND ñ n 50 tri u VND/năm, b ng 3 n u trên 50 tri u VND/năm, - TT HN: B ng 0 n u chưa l p gia ñình, b ng 1 n u ngư c l i. - Là KH VIP: B ng 0 n u không thu c lo i khách hàng VIP, b ng 1 n u ngư c l i. Khi ñó, các ñ c trưng chung mà doanh nghi p c n tìm chính là m t s phân l p hay gom c m có ñ nh hư ng (trên b ng d li u ñã có trên) mà các k t qu có th ñư c bi u di n d ng lu t k t h p E(X)→E(Y). Trong ñó: Y chính là thu c tính “Là KH VIP” và E(Y) là ñi u ki n “Y=1” (ho c th m chí là Y =0), nghĩa là m i dòng t trong b ng trên ñư c g i là th a E(Y) khi giá tr t i c t Y là 1, X là t p (ho c t p con c a) các thu c tính còn l i (Tu i, Gi i tính, Thu nh p, TT Hôn nhân), và E(X) là m t ñi u ki n mô t ñ c trưng chung trên X. Đương nhiên r ng lu t k t h p ñư c ch n ph i có ñ ph bi n, ñ tin c y và ñ quan tr ng ñ t t. Áp d ng thu t toán cho b ng d li u trên (m c b ng 1.5), v i ngư ng ñ tin c y cho trư c w là 0.7 * K t qu t p lu t ta thu ñư c ví d trên là : Lu t 1. (Gi i tính =0) → (là KH VIP =0) Lu t 2. (Gi i tính = 1,Tu i = 1) → (Là KH VIP = 0) Lu t 3. (Gi i tính = 1,Tu i = 2,TT Hôn nhân= 0) → (Là KHVIP = 1) Lu t 4. (Gi i tính = 1,Tu i = 2,TT Hôn nhân = 1, Thu nh p = 1) → (Là KH VIP = 0) Lu t 5. (Gi i tính = 1,Tu i = 3,Thu nh p = 1) → (Là KH VIP = 1).
  20. - 20 - Các lu t 1, 2, ..., 5 tìm ñư c t ví d trên có th ñư c bi u di n l i d ng cây quy t ñ nh như sau: Gi i tính =0 =1 Là KH VIP =0 Tu i =1 =3 =2 Là KH VIP =0 TT Hôn Thu nhân nh p =0 =1 =1 Là KH VIP =1 Thu nh p Là KH VIP =1 =1 Là KH VIP =0 Hình 1.3 : Sơ ñ cây quy t ñ nh
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
9=>0