intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Báo cáo nghiên cứu khoa học: "Xây dựng cây quyết định đa trị dựa trên tập thô."

Chia sẻ: Nguyễn Phương Hà Linh Linh | Ngày: | Loại File: PDF | Số trang:8

121
lượt xem
14
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Tuyển tập các báo cáo nghiên cứu khoa học hay nhất của trường đại học vinh tác giả. 8. Nguyễn Thị Minh Tâm, Xây dựng cây quyết định đa trị dựa trên tập thô..Toán học là môn khoa học nghiên cứu về các số, cấu trúc, không gian và các phép biến đổi. Nói một cách khác, người ta cho rằng đó là môn học về "hình và số." Theo quan điểm chính thống, nó là môn học nghiên cứu về các cấu trúc trừu tượng định nghĩa từ các tiên đề, bằng cách sử dụng Luận lý học (lôgic)...

Chủ đề:
Lưu

Nội dung Text: Báo cáo nghiên cứu khoa học: "Xây dựng cây quyết định đa trị dựa trên tập thô."

  1. §¹i häc Vinh T¹p chÝ khoa häc, tËp XXXVI, sè 4A-2007 X¢Y DùNG C¢Y QUYÕT §ÞNH §A TRÞ DùA TR£N TËP TH¤ NguyÔn ThÞ Minh T©m (a) Tãm t¾t. Bµi b¸o nµy giíi thiÖu mét c¸ch tiÕp cËn ®Ó x©y dùng c©y quyÕt ®Þnh ®a trÞ cã kh¶ n¨ng chÞu lçi dùa trªn m« h×nh tËp th« cã ®é chÝnh x¸c thay ®æi. Mét kh¸i niÖm míi vÒ quan hÖ t−¬ng ®−¬ng víi ®é chÝnh x¸c β ®−îc ®−a ra trong lý thuyÕt tËp th« cã ®é chÝnh x¸c thay ®æi vµ ®−îc ¸p dông ®Ó x©y dùng c©y quyÕt ®Þnh ®a trÞ. I. GIíI THIÖU HiÖn nay, c¸c ph−¬ng ph¸p ph©n líp ®ang ®−îc quan t©m nghiªn cøu trong nhiÒu lÜnh vùc: khai ph¸ d÷ liÖu, thèng kª, häc m¸y,... Môc ®Ých ph©n líp lµ ph©n lo¹i c¸c ®èi t−îng dùa trªn gi¸ trÞ cña c¸c thuéc tÝnh ban ®Çu vµ thuéc tÝnh nh·n. Trong bµi b¸o nµy chóng t«i ®−a ra mét trong nh÷ng c¸ch tiÕp cËn míi ®Ó lùa chän thuéc tÝnh lµ x©y dùng c©y quyÕt ®Þnh dùa trªn lý thuyÕt tËp th«. Lý thuyÕt tËp th« ®−îc Pawlak ®Ò xuÊt, ®· trë thµnh mét c«ng cô to¸n häc ®Ó gi¶i quyÕt víi nh÷ng th«ng tin mê, kh«ng ch¾c ch¾n. Lý thuyÕt tËp th« tæ hîp c¸c quan hÖ kh«ng ph©n biÖt (quan hÖ t−¬ng ®−¬ng) thµnh c¸c tËp xÊp xØ cña c¸c ®èi t−îng dùa trªn tËp xÊp xØ trªn vµ xÊp xØ d−íi ([8]). Mét trong nh÷ng vÊn ®Ò cña lý thuyÕt tËp th« lµ ph©n líp, nh−ng c¸c líp trong lý thuyÕt tËp th« ph¶i lµ chÝnh x¸c vµ ch¾c ch¾n. Trong thùc tÕ, hai ®iÓm l©n cËn cã thÓ kh«ng gièng nhau vÒ c¬ b¶n do thiÕu c¸c ®Æc tr−ng dÉn ®Õn viÖc ph©n líp kh«ng ch¾c ch¾n. B»ng c¸ch tæ hîp x¸c suÊt c¸c luËt quyÕt ®Þnh, m« h×nh tËp th« cã ®é chÝnh x¸c thay ®æi cho phÐp ph©n líp tõng phÇn. Khi mét ®èi t−îng ®−îc ph©n líp b»ng lý thuyÕt tËp th«, nÕu th«ng tin vÒ ®èi t−îng ®Çy ®ñ vµ ch¾c ch¾n th× ®ã lµ ph©n líp ®óng, cßn m« h×nh tËp th« cã ®é chÝnh x¸c thay ®æi ph©n líp ®èi t−îng víi mét ®é chÝnh x¸c β nµo ®ã ([11]). II. Lý THUYÕT TËP TH¤ ë ®©y ta chØ xÐt m« h×nh tËp th« gåm tËp c¸c ®èi t−îng U cña hÖ th«ng tin, c¸c kÕt qu¶ thu ®−îc tõ m« h×nh nµy chØ cã thÓ ¸p dông ®−îc cho tËp ®èi t−îng thuéc m« h×nh ®ã. Gi¶ sö ta cã tËp ®èi t−îng cã c¸c nh·n líp ®Ó chØ ra líp mµ mçi ®èi t−îng thuéc vµo líp ®ã. Ta gäi nh·n líp lµ thuéc tÝnh quyÕt ®Þnh vµ c¸c thuéc tÝnh cßn l¹i lµ thuéc tÝnh ®iÒu kiÖn. §Þnh nghÜa 1. NÕu S = (U, A ∪ {d}) lµ b¶ng quyÕt ®Þnh, trong ®ã A lµ tËp thuéc tÝnh ®iÒu kiÖn, d lµ tËp thuéc tÝnh quyÕt ®Þnh, ta x¸c ®Þnh hµm: δA(u) = {i: tån t¹i u’ IND(A)u vµ d(u) = i} (u’ IND(A)u tøc lµ u’ kh«ng ph©n biÖt ®−îc víi u theo tËp thuéc tÝnh A). B¶ng quyÕt ®Þnh S lµ nhÊt qu¸n nÕu card(δA(u)=1 víi mäi u∈U, ng−îc l¹i th× S lµ kh«ng nhÊt qu¸n. NhËn bµi ngµy 14/9/2007. Söa ch÷a xong 27/11/2007. 57
  2. NguyÔn ThÞ Minh T©m ... C¢Y QUYÕT §ÞNH §A TRÞ DùA TR£N TËP TH¤, tr. 57-64 T−¬ng tù ta ®Þnh nghÜa: γA(u,i) = {u’∈ U}: u’ IND(A)u & d(u’) = i trong ®ã u∈ U & i ∈ δA(u) card (γ A (u , i )) λ A (u, i ) = u∈ U & i ∈ δA(u) ∑ card (γ A (u, i )) j∈δ A (u ) σA(u) = {i: λA(u,i) ≥ β } u∈ U. B¶ng quyÕt ®Þnh S lµ nhÊt qu¸n víi ®é chÝnh x¸c β nÕu card(σA(u) = 1 ∀u ∈ U, ng−îc l¹i th× S lµ kh«ng nhÊt qu¸n víi ®é chÝnh x¸c β . β β §Þnh nghÜa 2. NÕu Y ⊇ X ⇔ X ⊆ Y ⇔ Pr(Y | X) ≥ β , th× ta nãi X ®−îc chøa víi ®é chÝnh x¸c β trong Y hay Y chøa X víi ®é chÝnh x¸c β (0≤β≤1). §Þnh nghÜa 3. Cho (U, R) lµ mét kh«ng gian xÊp xØ, trong ®ã U lµ tËp ®èi t−îng kh¸c rçng, R lµ hä quan hÖ t−¬ng ®−¬ng trªn U. U/R = {E1, E2, ...., En} lµ c¸c líp t−¬ng ®−¬ng cña R, víi mäi X ⊆ U, c¸c xÊp xØ trªn vµ xÊp xØ d−íi víi ®é chÝnh x¸c β ®−îc ®Þnh nghÜa nh− sau: i) TËp xÊp xØ trªn cña X theo quan hÖ R víi ®é chÝnh x¸c β :   β Υ{E i ∈ X }. β = POS R ( X ) = Υ  E ∈ U / R | X ⊇ E  = Rβ X   Pr ( X | Ei )≥ β ii) TËp xÊp xØ d−íi theo quan hÖ R cña X víi ®é chÝnh x¸c β :   1− β Υ{E i ∈ X } . β R β X = NONNEG R ( X ) = Υ  E ∈ U / R | X ⊇ E  =   Pr ( X | Ei )≥1− β TËp R β X lµ tËp c¸c phÇn tö cña U ®−îc ph©n líp lµ phÇn tö cña X víi x¸c suÊt β . Tri thøc cho tr−íc ®−îc biÓu diÔn b»ng c¸c thuéc tÝnh tõ R; R β X lµ tËp c¸c phÇn tö cña U ®−îc ph©n líp thuéc X hoÆc -X víi x¸c suÊt 1-β , 0≤β≤1. iii) BN R (α ) = R β X − R β X ®−îc gäi lµ miÒn biªn cña X cã ®é chÝnh x¸c β . Nã β bao gåm tÊt c¶ ®èi t−îng kh«ng thÓ ph©n líp râ rµng thuéc vµo tËp X. Mét tËp ®−îc gäi lµ th« nÕu miÒn biªn cña nã kh¸c rçng, ng−îc l¹i tËp ®ã ®−îc gäi lµ tËp chÝnh x¸c. TËp hiÖn t¹i XÊp xØ trªn XÊp xØ d−íi H×nh 1. XÊp xØ trªn vµ xÊp xØ d−íi cña mét tËp 58
  3. §¹i häc Vinh T¹p chÝ khoa häc, tËp XXXVI, sè 4A-2007 §Þnh nghÜa 4. NÕu B lµ tËp con cña tËp thuéc tÝnh A cña b¶ng quyÕt ®Þnh nhÊt qu¸n cã ®é chÝnh x¸c β : S = (U,A∪{d}), th× B ®−îc gäi lµ quan hÖ rót gän cña S cã ®é chÝnh x¸c β khi vµ chØ khi β lµ tËp tèi thiÓu cã tÝnh chÊt: σA(u) = σB(u) víi mäi u∈U. - §Æt tËp c¸c quan hÖ rót gän cña S cã ®é chÝnh x¸c β lµ REDβ(S, A∪{d}). - §Æt tËp c¸c thuéc tÝnh cÇn thiÕt thuéc A cã ®é chÝnh x¸c β lµ COREβ(S, A∪{d}) th× COREβ(S, A∪{d}) = ∩REDβ(S, A∪{d}). §Þnh nghÜa 5. Nh©n tè quan träng cña mét thuéc tÝnh Cj trong C ®−îc ®Þnh card (C + d − C j ) nghÜa nh− sau: importance-factor = 1 - . card (C + d ) §Þnh nghÜa 6. Gi¶ sö P, Q lµ 2 hä c¸c quan hÖ t−¬ng ®−¬ng cña tËp ®èi t−îng U. Ký hiÖu U/IND(P) = {X1, X2, .... , Xn}; U/IND(Q) = {Y1, Y2, .... , Ym}     β β Υ Υ §Æt H i  X j | X j ⊆ Yi  ,  X j | X j ⊄ Yi  , = = H m +1 x j ∈U / IND ( P )   x j ∈U / IND ( P )   th× {H1, H2, .... , Hm+1} ®−îc gäi lµ suy réng cña P víi ®é chÝnh x¸c β cã quan hÖ víi Q, ®−îc ký hiÖu lµ GENQβ(P) vµ cã thÓ gäi {H1, H2, .... , Hm+1} lµ mét phÐp t¸ch cña tËp ®èi t−îng U. III. C¢Y QUYÕT §ÞNH §A TRÞ 3.1. TËp d÷ liÖu huÊn luyÖn ®a trÞ B¶ng 1 lµ vÝ dô minh ho¹ tËp d÷ liÖu huÊn luyÖn ®a trÞ. Mçi b¶n ghi cña tËp d÷ liÖu cã 4 thuéc tÝnh th«ng th−êng vµ mét thuéc tÝnh nh·n líp. Thuéc tÝnh maker, performance, color lµ thuéc tÝnh cã gi¸ trÞ phi sè cßn thuéc tÝnh price lµ thuéc tÝnh cã gi¸ trÞ sè. Thuéc tÝnh nh·n líp gåm 3 gi¸ trÞ ‘A’, ‘B’, ‘C’. S¶n phÈm p3 lµ mét vÝ dô vÒ d÷ liÖu ®a trÞ bëi nã cã 2 gi¸ trÞ ®èi víi thuéc tÝnh color: “yellow” vµ “green”. B¶ng 1. TËp d÷ liÖu huÊn luyÖn ®a trÞ Id maker price performance color Class label p1 A $100 not good yellow A,B,C p2 B $880 good yellow B,C p3 A $370 not good yellow, green A p4 C $1230 good blue B p5 B $910 good yellow, blue B,C p6 B $770 not good yellow A,B,C p7 B $590 not good yellow, green A,B p8 C $1350 good green A,B,C p9 C $1250 good yellow, green A,B,C p10 B $1140 good yellow, green A p11 A $340 not good yellow, blue A,C p12 C $1300 good yellow A,B p13 B $1090 good blue C p14 B $810 good green A p15 B $520 not good yellow, blue, green C 59
  4. NguyÔn ThÞ Minh T©m ... C¢Y QUYÕT §ÞNH §A TRÞ DùA TR£N TËP TH¤, tr. 57-64 3.2. C©y ®a trÞ Mét c©y quyÕt ®Þnh ®a trÞ t−¬ng øng víi tËp d÷ liÖu trong b¶ng 1 ®−îc minh ho¹ ë h×nh 2. Trong c©y nµy, mçi nót trong t−¬ng ®−¬ng víi mét thuéc tÝnh, mçi nh¸nh cña thuéc tÝnh sè t−¬ng ®−¬ng víi mét kho¶ng gi¸ trÞ, mçi nh¸nh cña thuéc tÝnh phi sè t−¬ng ®−¬ng víi mét gi¸ trÞ, c¸c nót l¸ lµ c¸c nh·n. Sau khi c©y quyÕt ®Þnh ®a trÞ ®−îc x©y dùng, ta cã thÓ ph©n líp mét ®èi t−îng th«ng qua c©y ®ã. VÝ dô trong b¶ng 1 ta cã s¶n phÈm p7 víi thuéc tÝnh maker = ‘B’, price = '590’, performance = ‘not good’ vµ color = ‘green, yellow’. B¾t ®Çu víi thuéc tÝnh price = ‘590’ ta ®i däc theo nh¸nh ‘477 - 599’ vµ nhËn ®−îc thuéc tÝnh color. TiÕp tôc ®i theo nh¸nh ‘green’ ta nhËn ®−îc hai nh·n ‘A’, ‘B’ vµ ®i theo nh¸nh ‘yellow’ ta nhËn ®−îc nh·n ‘C’. Hîp c¸c nh·n nµy l¹i ta ®−îc kÕt qu¶ dù ®o¸n lµ ‘A’, ‘B’, ‘C’. ViÖc lùa chän thuéc tÝnh ®a trÞ tèt nhÊt kh¸c víi lùa chän thuéc tÝnh ®¬n trÞ theo ph−¬ng ph¸p truyÒn thèng: - §èi víi d÷ liÖu ®a trÞ, viÖc nhãm ®Çy ®ñ nghÜa lµ mçi nót con xÊp xØ cã cïng nhiÒu nh·n, trong khi ®èi víi d÷ liÖu ®¬n trÞ th× mçi nót con xÊp xØ cã cïng mét nh·n. - Trong ph©n líp b¶n ghi, mét b¶n ghi cã thuéc tÝnh ®a trÞ ®i ®Õn nhiÒu nh¸nh trong khi mét b¶n ghi ®¬n trÞ chØ ®i ®Õn mét nh¸nh. price 100~224 1225~1350 225~349 850~974 350~474 975~109 1100~1224 725~849 A,B,C A,C A B,C C A A,B,C 475~599 color performance blue good not good yellow green C A,B C A A,B,C H×nh 2. VÝ dô vÒ c©y quyÕt ®Þnh ®a trÞ 3.3. Gi¶i thuËt c¬ b¶n x©y dùng c©y quyÕt ®Þnh ®a trÞ C¸c gi¶i thuËt x©y dùng c©y quyÕt ®Þnh th−êng tr¸nh x©y dùng nh÷ng c©y lín bëi v× chóng sÏ sinh ra nhiÒu luËt, ®iÒu nµy sÏ kh«ng hiÖu qu¶ trong viÖc dù ®o¸n 60
  5. §¹i häc Vinh T¹p chÝ khoa häc, tËp XXXVI, sè 4A-2007 ph©n líp. V× vËy viÖc x©y dùng c©y quyÕt ®Þnh nhá ®Ó ®−a ra c¸c luËt tèt nhÊt lµ vÊn ®Ò cã tÇm quan träng. Gi¶i thuËt: Input: TËp d÷ liÖu huÊn luyÖn ®a trÞ D. Output: C©y quyÕt ®Þnh ®a trÞ T. Begin 1. Khëi t¹o c©y T vµ ®Æt tÊt c¶ c¸c b¶n ghi cña T ë gèc. 2. while (c¸c nót l¸ trong T lµ nót NONSTOP) 3. for mçi thuéc tÝnh i cña nót NONSTOP do 4. for mçi kho¶ng gi¸ trÞ cña thuéc tÝnh i do 5. ®¸nh gi¸ ®é tèt ®èi víi c¸ch chia cña thuéc tÝnh i; 6. for mçi nót l¸ NONSTOP do 7. lÊy c¸ch chia tèt nhÊt ®èi víi nót l¸ nµy; 8. t¸ch c¸c b¶n ghi vµ ph¸t triÓn c©y thªm 1 møc theo c¸ch chia tèt nhÊt; 9. x¸c ®Þnh c¸c nót cã thÓ dõng, ®¸nh dÊu chóng lµ c¸c nót STOP vµ x¸c ®Þnh tËp nh·n kÕt qu¶ cña chóng. 10. return T. End; C¸c b−íc 3-5 vµ b−íc 9 lµ c¸c b−íc ®iÒu kiÖn. B−íc 3-5 x¸c ®Þnh nót l¸ vµ c¸c nh¸nh cña nã. B−íc 9 x¸c ®Þnh nót l¸. IV. X¢Y DùNG C¢Y QUYÕT §ÞNH §A TRÞ DùA TR£N TËP TH¤ 4.1. Gi¶i thuËt RS_DTA (Rough Set base Decision Tree Algorithm) Input: B¶ng quyÕt ®Þnh S = (U, A ∪ {d}). Output: C©y quyÕt ®Þnh ®a trÞ T. Procedure Khëi t¹o c©y cã biÕn T lµ c©y rçng. Nh·n ë gèc lµ tËp c¸c ®èi t−îng U vµ tËp c¸c thuéc tÝnh ®iÒu kiÖn hiÖn t¹i A (Current Condition Attributes Set - CCAS). Tr¹ng th¸i cña nót gèc lµ unready. while (cã nót l¸ mang tr¹ng th¸i unready) do begin for (mçi nót l¸ nh·n N lµ unready cña c©y T) begin if (tån t¹i 1 ®èi t−îng u nh·n N cã σA(u) = ∅) then begin prinf (“b¶ng quyÕt ®Þnh lµ kh«ng nhÊt qu¸n víi ®é chÝnh x¸c β ”); return; end if (mäi ®èi t−îng ®ang g¸n nh·n N cã cïng σA(u)) then begin Thay thÕ tËp ®èi t−îng t¹i N b»ng c¸i chung cña nã: σA(u); Thay ®æi tr¹ng th¸i cña N lµ ready; end else begin TÝnh P = COREβ(N, CCAS ∪{d}); if P = ∅ | P = CCAS then begin P = thuéc tÝnh tõ tËp CCAS cã importance factor cao nhÊt; 61
  6. NguyÔn ThÞ Minh T©m ... C¢Y QUYÕT §ÞNH §A TRÞ DùA TR£N TËP TH¤, tr. 57-64 end TÝnh GENDβ(P); CCAS = CCAS \ P; Thay thÕ nh·n cña nót N b»ng P vµ ®¸nh dÊu lµ ready; T¹o m+1 nót míi N1, N2, ..... , Nm+1 víi tr¹ng th¸i unready lµ c¸c c©y con cña nót N, trong ®ã Ni = Hi, i = 1,2,....,m+1 vµ g¸n nh·n chóng víi CCAS. end end end return T 4.2. VÝ dô minh ho¹ Gi¶ sö ta cã b¶ng quyÕt ®Þnh nh− trong b¶ng 2. DÔ nhËn thÊy b¶ng trªn lµ kh«ng nhÊt qu¸n v× tån t¹i u9 IND u10 vµ d(u9)≠d(u10), do ®ã kh«ng thÓ ph©n líp cho c¸c ®èi t−îng nµy nh− c¸c ®èi t−îng ë b¶ng 1. Tuy nhiªn c¸c ®èi t−îng trªn nhÊt qu¸n víi mét ®é chÝnh x¸c β nµo ®ã, gi¶ sö β = 0,6. Tõ b¶ng 2 ta cã: U/IND(C) = { {1}, {2, 4,18, 21, 22}, {3, 7, 9, 10, 14}, {5}, {6}, {8}, {11}, {12}, {13}, {15}, {16}, {17}, {19}, {20} }. U/IND(D) = { {1, 2, 3, 4, 7, 9, 12, 14, 18, 20}, {5, 6, 8, 10, 11, 13, 15, 16, 17, 19, 21, 22}} P = COREβ (N, CCAS ∪ {d}) = {C1,C4} U/P = { {1, 12, 13}, {2, 4, 16, 18, 21, 22}, {3, 7, 9, 10, 14, 20}, {5, 19}, {6, 8,1 5}, {11, 17}} TÝnh GENDβ(P): H1 = {3, 7, 9, 10, 14, 20}; H2 = {5, 6, 8, 11, 15, 17, 19}; H3 = {1, 2, 4, 12, 13, 16, 18, 21, 22} B¶ng 2. VÝ dô vÒ b¶ng quyÕt ®Þnh Thuéc tÝnh C¸c thuéc tÝnh ®iÒu kiÖn TËp ®èi quyÕt ®Þnh t−îng U C1 C2 C3 C4 Líp (D) 1 high high high normal H 2 high high high good H 3 low or less than zero low normal good H 4 high high high good H 5 middle high high normal F 6 low or less than zero middle high normal F 7 low or less than zero low normal good H 8 low or less than zero low normal normal F 9 low or less than zero low normal good H 10 low or less than zero low normal good F 11 middle low normal good F 12 high middle high normal H 62
  7. §¹i häc Vinh T¹p chÝ khoa häc, tËp XXXVI, sè 4A-2007 13 high low normal normal F 14 low or less than zero low normal good H 15 low or less than zero middle normal normal F 16 high middle normal good F 17 middle middle high good F 18 high high high good H 19 middle high normal normal F 20 low or less than zero middle high good H 21 high high high good F 22 high high high good F ¸p dông gi¶i thuËt RS_DTA, tËp ®èi t−îng U ®−îc ph©n líp dùa vµo H1,H2,H3 vµ x©y dùng c©y quyÕt ®Þnh nh− sau: TËp ®èi t−îng U C1: low or less than zero C1: low or less than C1: high C4: normal zero C4: good HoÆc C1:middle C4: good {1,2,4,12,13,16,18, {5,6,8,11,15,17,19} {3,7,9,10,14,20} 21,22} H F C3: high C3: normal {1,2,4,12,18, {13,16} 21,22} H F H×nh 3. C©y quyÕt ®Þnh ®a trÞ x©y dùng bëi gi¶i thuËt RS_DTA V. KÕT LUËN ViÖc x©y dùng c©y quyÕt ®Þnh dùa trªn lý thuyÕt tËp th« truyÒn thèng chØ thùc hiÖn ®èi víi c¸c b¶ng quyÕt ®Þnh nhÊt qu¸n (b¶ng 1). Trªn ®©y chóng t«i ®· ®−a ra mét c¸ch tiÕp cËn tËp th« ®Ó x©y dùng c©y quyÕt ®Þnh ®a trÞ nh»m qu¶n lý c¸c hÖ th«ng tin ®a trÞ vµ ®−a ra mét gi¶i thuËt x©y dùng c©y quyÕt ®Þnh dùa trªn m« h×nh tËp th« cã ®é chÝnh x¸c thay ®æi cã kh¶ n¨ng chÞu lçi. Cho dï tån t¹i sù kh«ng nhÊt qu¸n trong b¶ng quyÕt ®Þnh nh−ng gi¶i thuËt vÉn cã thÓ ®−a ra kÕt qu¶ kh¸ võa ý. So víi gi¶i thuËt ID3 [9] th× c©y quyÕt ®Þnh x©y dùng dùa trªn gi¶i thuËt RS_DTA cã cÊu tróc ®¬n gi¶n h¬n vµ cã c¸c luËt tèt h¬n. 63
  8. NguyÔn ThÞ Minh T©m ... C¢Y QUYÕT §ÞNH §A TRÞ DùA TR£N TËP TH¤, tr. 57-64 T I LIÖU THAM KH¶O [1] Hå CÈm Hµ, Mét c¸ch tiÕp cËn më réng c¬ së d÷ liÖu quan hÖ víi th«ng tin kh«ng ®Çy ®ñ, LuËn ¸n tiÕn sÜ To¸n häc, Tr−êng §HBK Hµ Néi, 2002. [2] NguyÔn §¨ng Khoa, Nghiªn cøu mét vµi khÝa c¹nh cña lý thuyÕt tËp th« vµ øng dông, LuËn ¸n tiÕn sÜ To¸n häc, Tr−êng §HBK Hµ Néi, 2002. [3] N. T. Thuy, N. N. Hieu, A framework for knowledge discovery in multivalued tables using rough set approach, Proceeding of Joint Workshop of Vietnamese Society of AI, SIGKBS-JSAI, ICS-IPSJ and IEICE-SIGAI on Active Mining, Hanoi, Vietnam, 2004. [4] H. T. Bao, Introduction To Knowledge Discovery And Data Mining, http://www.ioit.ac.vn, 2000. [5] Chang-Ling Hsu, Multi-valued and Multi-labeled Decision Tree Classifiers For Data Mining, PhD Thesis in Information Management, China, 2004. [6] Jin Mao Wei, Rough Set based approach to selection of node, Yang’s Scientific Research Institute, 2002. [7] X. Liu, H. Huang, W. Xu, A Contribution to Decision Tree Construction Based on Rough Set Theory, Springer-Verlag Berlin, 2004. [8] Z. Pawlak, Rough Sets, Theoretical Aspects of Reasoning about Data. Dordrecht, Kluwer, 1991. [9] J. R. Quinlan, Induction of decision trees, In: Machine Learning, 1986. [10] Sonajharia Minz, Rajni Jain, Rough Set based Decision Tree Model for Classification, Springer-Verlag Berlin, 2003. [11] W. Ziarko, Variable Precision Rough Set Model, Journal of computer and System Sciences, 46, 1993, 39–59. [12] Y. Zhao, H. Zhang, Q. Pan, Classification Using the Variable Precision Rough Set, Springer-Verlag Berlin, 2003. SUMMARY A Multivariate Decision Tree Construction Based on Rough Set This paper presented an approach to construct multivariate decision tree, which has the ability of fault tolerance, based on the variable precision rough sets model. A new concept of generalization of one equivalence relation with precision β is introduced in the variable precision rough sets model and used for construction of multivariate decision tree. (a) Khoa C«ng NghÖ Th«ng Tin, Tr−êng §¹i häc Vinh. 64
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
3=>0