intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn thạc sĩ: Ứng dụng khai thác dữ liệu để dự đoán sự tăng trưởng số thuê bao di động

Chia sẻ: Sdfas Vfdtg | Ngày: | Loại File: PDF | Số trang:26

103
lượt xem
19
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Ứng dụng khai thác dữ liệu để dự đoán sự tăng trưởng số thuê bao di động để tìm ra những xu hướng của những khách hàng thuê bao, có thể rời mạng viễn thông không.

Chủ đề:
Lưu

Nội dung Text: Luận văn thạc sĩ: Ứng dụng khai thác dữ liệu để dự đoán sự tăng trưởng số thuê bao di động

  1. B GIÁO D C VÀ ĐÀO T O Đ I H C ĐÀ N NG NGUY N VĂN SANG NG D NG KHAI THÁC D LI U Đ D ĐOÁN S TĂNG TRƯ NG S THUÊ BAO DI Đ NG CHUYÊN NGÀNH: KHOA H C MÁY TÍNH MÃ S : 60.48.01 TÓM T T LU N VĂN TH C SĨ K THU T Đà N ng - Năm 2011
  2. Công trình ñư c hoàn thành t i Đ I H C ĐÀ N NG Ngư i hư ng d n khoa h c: PGS.TS. VÕ TRUNG HÙNG Ph n bi n 1: PGS.TS. PHAN HUY KHÁNH Ph n bi n 2: GS.TS. NGUY N THANH TH Y Lu n văn ñư c b o v trư c H i ñ ng ch m Lu n văn t t nghi p Th c sĩ K thu t h p t i Đ i h c Đà N ng vào ngày 11 tháng 09 năm 2011 Có th tìm hi u lu n văn t i : - Trung tâm Thông tin - H c li u, Đ i h c Đà N ng - Trung tâm H c li u, Đ i h c Đà N ng
  3. - 1- M Đ U 1. Lý do ch n ñ tài Ngày nay, vi n thông là m t lĩnh v c phát tri n r t nhanh chóng. Các công ty vi n thông không ng ng nâng cao, c i ti n ch t lư ng các d ch v c a mình, nh m ñáp ng nhu c u c a khách hàng. Các công ty ñ t n t i và phát tri n s c nh tranh v i nhau, khách hàng s có nhi u cơ h i ñ l a ch n, do ñó v n ñ tìm hi u khách hàng s d ng các d ch v vi n thông r t quan tr ng. Trong quá trình như v y các d ch v luôn ñư c th nghi m, các hình khuy n mãi ña d ng và phong phú làm cho th trư ng vi n thông sôi ñ ng ngày càng tăng trư ng nhanh. Tuy nhiên m t trái c a nó cũng làm cho nhà cung c p d ch v r t nhi u phi n ph c trong qu n lí như thuê bao o, tăng trư ng o. Các công ty vi n thông có th d a vào CSDL chi ti t cu c g i (Call Detail Record) ñ phân tích s li u hành vi s d ng c a khách hàng. Hàng ngày hàng tri u cu c g i ñư c ghi nh n t i các t ng ñài v i m c ñích chính là ñ tính cư c cho khách hàng và qu n lý m ng, cách mà khách hàng s d ng m ng, các s n ph m và các d ch v vi n thông. Ngoài ra các công ty vi n thông còn lưu các thông tin khác như phi u ñăng kí d ch v , các thông báo l i v m ng. Các b n ghi chi ti t cu c g i cho bi t khi nào thì m t d ch v ñư c s d ng mà còn cho bi t d ch v ñó ñư c s d ng như th nào. M t nhà cung c p d ch v thành công khi có quan h t t v i khách hàng, gi ñư c các khách hàng cũ và có thêm khách hàng m i. Thông tin ch a ñ ng trong các b n ghi cu c g i là m t tài s n vô cùng quý giá, nó có th ch ra khách hàng c n gì, vì sao mà khách hàng c n các d ch v , khách
  4. - 2- nào hài lòng, khách hàng nào ñem l i l i nhu n, khách hàng nào có th r i b . Do ñó thách th c l n nh t là quá trình tìm hi u hành vi s d ng c a khách hàng ñ có th ñi u ch nh d ch v cũng như ñánh giá v s tăng trư ng gi a o và th c. Ngư i s d ng không ti p xúc tr c ti p v i nhà cung c p d ch v ñi n tho i. Khách hàng ch ti p xúc v i nhà cung c p d ch v qua b ph n chăm sóc khách hàng. Do ñó ngu n d li u ch y u ñ chúng ta nghiên c u khách hàng là thông qua các b n tin cu c g i. 2. M c ñích nghiên c u ng d ng khai phá d li u ñ tìm ra nh ng xu hư ng c a nh ng khách hàng thuê bao, h có th r i b m ng vi n thông hay không. D ñoán tăng trư ng h ng năm s thuê bao di ñ ng ñ có chính sách ñi u ti t, ñ u tư m ng vi n thông và chăm sóc khách hàng thích h p. 3. Phương pháp nghiên c u Phương pháp nghiên c u tài li u: Qua ngu n tài li u ñư c xu t b n, các bài báo ñăng trên các t p chí khoa h c, các tài li u liên quan ñ n vi n thông. Phương pháp ñi u tra: ñi u tra, thu th p t i các công ty vi n thông. Phương pháp th c nghi m: Th c hi n vi c cài ñ t, th nghi m cơ s d li u, ch nh s a ñ cho k t qu mong ñ i. 4. Ý nghĩa khoa h c và th c ti n
  5. - 3- K t qu ñưa ra có th ñánh giá tình hình th trư ng d ch v vi n thông hi n nay. Đánh giá ñư c nh ng xu hư ng c a ngư i s d ng, ư c lư ng ñư c bao nhiêu ph n trăm thuê bao th c, và thuê bao o. Ư c lư ng ñư c s thuê bao gia tăng hàng năm. K t qu nghiên c u có th làm tài li u cho các nhà cung c p d ch v vi n thông. 5. B c c lu n văn Lu n văn ñư c chia thành 3 chương. Chương 1: Nghiên c u t ng quan khai phá d li u Tìm hi u khái quát chung v khai phá d li u, các bư c khai phá d li u, các công c c th ti p c n ñư c ñưa ra ñ gi i quy t bài toán. Chương 2: D ñoán tăng trư ng s thuê bao Đưa ra bài toán tăng trư ng, phân tích thi t k h th ng và ñưa ra phương pháp gi i bài toán. Chương 3: Xây d ng ng d ng T k t qu ñã nghiên c u, cài ñ t thu t toán xây d ng chương trình ng d ng có tính th c ti n. Đưa ra k t lu n, rút ra nh ng m t ưu ñi m và nh ng h n ch .
  6. - 4- CHƯƠNG 1. NGHIÊN C U T NG QUAN KHAI PHÁ D LI U 1.1. KHAI PHÁ D LI U Đ nh nghĩa Khai phá d li u là quá trình tìm ki m m u m i, nh ng thông tin ti m n mang tính d ñoán d a vào các kh i d li u l n ñã lưu trư c ñó. Nh ng công c KPDL có th d ñoán nh ng xu hư ng trong tương lai, các tri th c mà KPDL mang l i giúp cho các t ch c ra các quy t ñ n k p th i. S phân tích m t cách t ñ ng và mang tính d báo c a KPDL có ưu th hơn h n so v i phân tích thông thư ng d a trên nh ng s ki n mang quá kh c a các h h tr ra quy t ñ nh(Decision Support Systems) trư c ñây. V i nh ng n i dung ñư c trình bày trên, có th hi u m t cách sơ lư c r ng: KPDL ñư c ñ nh nghĩa là quá trình tìm ki m thong tin có ích ti m n và mang tính d ñoán trong các kh i d li u l n. Vai trò c a khai phá d li u Cu c cách m ng c a khoa h c k thu t s cho phép s hóa thông tin tr nên d dàng hơn và chi phí lưu tr t ñó tr nên th p hơn, s lư ng kh ng l c a d li u ñư c t p trung và lưu tr trong CSDL trên các thi t b ñi n t như: ñĩa c ng, băng t , ñĩa quang, CD ROM, th nh ..khi n t c ñ tăng c a d li u quá l n. T ñó d n ñ n k thu t th ng kê và các công c qu n tr d li u d a trên kh i d li u kh ng l ñó, không còn phù h p và không th phân tích tích ñ y ñ n a.
  7. - 5- D li u c a chúng ta sau khi x lý tr c tuy n ph c v cho m t m c ñích nào ñó ñư c lưu l i ngày càng l n. Trong kh i lư ng d li u này còn r t nhi u thông tin có ích mang tính th ng kê, có tính quy lu t v n ñang còn ti m n mà chúng ta chưa bi t, ñ i h i chúng ta c n ph i khai phá m i có ñư c. Do ñó c n ph i có nh ng công c t ñ ng rút trích các thông tin, các lu t có ích. M t hư ng ti p c n n i có kh năng giúp cho các t ch c khai thác các thông tin ý nghĩa t các t p d li u l n ñó là KPDL. V i nh ng ưu ñi m trên, KPDL ñã ch ng t ñư c tính h u d ng c a nó trong môi trư ng ngày nay. Vì v y mà KPDL ñư c ng d ng r ng rãi trong các lĩnh v c thương m i, tài chính, y h c, giáo d c, vi n thông, ngân hàng... 1.2. CÁC BƯ C KHAI PHÁ D LI U KPDL ñư c chia thành các bư c như sau: Bi n ñ i d li u Các tri th c Ti n x lí d li u Đánh giá và bi u KPDL di n tri th c D li u ñã s ch Trích ch n D li u ñã ñư c d li u trích ch n D li u Hình 1.1: Các bư c khai phá d li u ban ñ u
  8. - 6- Trích ch n d li u (Data selection): là bư c ch n nh ng t p d li u c n ñư c khai phá t các t p d li u l n (Databases, Data Warehouse). Ti n x lý d li u (Data Preprocessing): là bư c làm s ch d li u (x lý d li u không ñ y ñ , d li u nhi u, d li u không nh t quán..), rút g n d li u(s d ng các phương pháp thu g n d li u, histograms, l y m u..), r i r c hóa d li u (d a vào histograms, entropy, phân kho ng..) sau bư c này, d li u s nh t quán ñ y ñ , ñư c rút g n và ñư c r i r c hóa. Bi n ñ i d li u (Data Transformation): là bư c chu n hóa và làm m n d li u ñ ñưa d li u v d ng thu n l i nh t nh m ph c v cho các k thu t khai phá các bư c ti p theo. KPDL (Data Mining): ñây là bư c quan tr ng và tiêu t n nhi u th i gian nh t c a KPDL. Áp d ng các k thu t (ph n l n là các k thu t c a Machine Learning) ñ khai phá trích ch n các m u (pattern) thông tin d a vào các m i liên h ñ c bi t trong d li u Đánh giá và bi u di n tri th c (Knowledge Representtation & Evaluation): Dùng các k thu t hi n th d li u ñ trình bày các m u thông tin và m i liên h ñ c bi t trong d li u ñã ñư c khai phá, bi u di n theo d ng g n gũi v i ngư i s d ng như ñ th m cây, b ng bi u, lu t.. ñ ng th i bư c này cũng ñánh giá nh ng tri th c khai phá ñư c theo nh ng tiêu chí nh t ñ nh. Trong giai ño n KPDL, có th c n s tương tác c a ngư i dùng ñ ñi u ch nh và rút ra các tri th c c n thi t.
  9. - 7- 1.3. CÁC D NG D LI U ĐƯ C KHAI PHÁ KPDL ñã ch ng t ñư c nh ng tính h u d ng trong th c t và vì v y mà ñư c ng d ng r ng rãi trong các lĩnh v c thương m i, tài chính, y h c, giáo d c, vi n thông, ngân hàng.. v i nh ng CSDL ñã có ñ ñưa ra nh ng lu t. KPDL có kh năng ch p nh n m t s d ng CSDL như sau: CSDL giao tác (Transactonal Databases): là d ng d li u tác nghi p có các b n ghi giao tác. D ng CSDL này ph bi n trong ngân hàng. CSDL quan h (Relational Databases): là d ng d li u tác nghi p ñư c t ch c theo mô hình d li u quan h . CSDL ña chi u (Mutidimention Structures, Data Warehouses): là các kho d li u ñư c t p h p và ch n l c t nhi u ngu n d li u khác nhau. D ng d li u này ch y u ph c v cho quá trình phân tích cung như khai phá tri th c và h tr quá trình ra quy t ñ nh CSDL quan h -hư ng ñ i tư ng (Object Relational Databases): là d ng d li u lai gi a hai mô hình quan h và ñ i tư ng. 1.4. HƯ NG TI P C N VÀ K THU T KHAI PHÁ D LI U KPDL là m t lĩnh v c r ng v i nhi u hư ng nghiên c u, ti p c n khác nhau. M t s hư ng ti p c n chính c a KPDL ñư c phân chia theo ch c năng theo l p các bài toán khác nhau. 1.4.1. Cây quy t ñ nh và lu t Cây quy t ñ nh là m t phương pháp mô t tri th c d ng ñơn gi n nh m phân các ñ i tư ng d li u thành m t s l p nh t ñ nh. Các nút c a cây ñư c gán nhãn là tên các thu c tính, các c nh ñư c gán các giá tr c a các thu c tính, các lá miêu t các l p khác nhau. Các ñ i tư ng ñư c phân
  10. - 8- l p theo các ñư ng ñi trên cây, qua các c nh tương ng v i giá tr c a thu c tính các ñ i tư ng lá.[1] Hình 1.2: Mô t cây quy t ñ nh Cây quy t ñ nh trên miêu t ñi u ki n chơi th thao v i các thu c tính ñ t ra quang c nh, gió, ñ m. Có hai giá tr lá “Có” và “Không”. Cây quy t ñ nh và lu t có ưu ñi m là hình th c miêu t ñơn gi n, mô hình suy di n khá d ñ i v i ngư i s d ng. Tuy nhiên, gi i h n c a nó là miêu t cây và lu t ch có th bi u di n ñư c m t s d ng ch c năng, vì v y gi i h n c v ñ chính xác và mô hình, Cho ñ n nay ñã có r t nhi u gi i thu t suy di n s d ng các lu t và cây quy t ñ nh ñư c áp d ng trong máy h c và th ng kê. 1.4.2. Phân l p Bayes Lý thuy t Bayes cung c p m t ti p c n theo xác xu t ñ suy di n. Nó d a trên gi thuy t r ng s lư ng c a khuynh hư ng b chi ph i b i phân
  11. - 9- b xác su t và quy t ñ nh t i ưu có th ñư c t o b i s suy lu n v nh ng xác su t ñi li n v i d li u ñư c quan sát. Đây là v n ñ quan tr ng c a máy h c b i vì nó cung c p m t ti p c n ñ nh lư ng cho vi c xem xét c n th n b ng ch ng h tr nh ng gi thuy t thay ñ i. Lý thuy t Bayes cung c p gi i thu t h c cơ b n mà v n d ng nh ng xác xu t cũng như là m t khung làm vi c cho s phân tích s ho t ñ ng c a nh ng gi i thu t mà không th v n d ng rõ ràng . H c theo xác su t: Tính xác su t hi n cho gi thuy t, trong s nh ng ti p c n th c d ng nh t cho các ki u ch c ch n c a nh ng v n ñ h c. Tính tăng d n: m i ví d hu n luy n có th gia tăng vi c tăng ho c gi m mà không gian gi thuy t ñúng. Ki n th c trư c có th k t h p v i d li u ñư c quan sát. Tiên ñoán xác su t: Tiên ñoán nhi u không gian gi thuy t, ñư c ño b i xác su t c a nó. 1.4.3. H i quy H i quy - nói theo cách ñơn gi n, là ñi ngư c l i v quá kh (regression) ñ nghiên c u nh ng d li u (data) ñã di n ra theo th i gian (d li u chu i th i gian - time series) ho c di n ra t i cùng m t th i ñi m (d li u th i ñi m ho c d li u chéo - cross section) nh m tìm ñ n m t quy lu t v m i quan h gi a chúng. M i quan h ñó ñư c bi u di n thành m t phương trình (hay mô hình) g i là: phương trình h i quy mà d a vào ñó, có th gi i thích b ng các k t qu lư ng hoá v b n ch t, h tr c ng c các lý thuy t và d báo tương lai.
  12. - 10- Trong phân tích ho t ñ ng kinh doanh cũng như trong nhi u lĩnh v c khác, h i quy là công c phân tích ñ y s c m nh không th thay th , là phương pháp th ng kê toán dùng ñ ư c lư ng, d báo nh ng s ki n x y ra trong tương lai d a vào quy lu t quá kh 1.4.3.1. Phương pháp h i quy ñơn Còn g i là h i quy ñơn bi n, dùng xét m i quan h tuy n tính gi a 1 bi n k t qu và 1 bi n gi i thích hay là bi n nguyên nhân (n u gi a chúng có m i quan h nhân qu ). Trong phương trình h i quy tuy n tính, m t bi n g i là: bi n ph thu c; m t bi n kia là tác nhân gây ra s bi n ñ i, g i là bi n ñ c l p. 1.4.3.2. Phương pháp h i quy b i Còn g i là phương pháp h i quy ña bi n, dùng phân tích m i quan h gi a nhi u bi n s ñ c l p (t c bi n gi i thích hay bi n nguyên nhân) nh hư ng ñ n 1 bi n ph thu c (t c bi n phân tích hay bi n k t qu ).
  13. - 11- CHƯƠNG 2. D ĐOÁN TĂNG TRƯ NG S THUÊ BAO 2.1. GI I THI U BÀI TOÁN 2.1.1. Bài toán Trong lĩnh v c vi n thông s lư ng khách hàng s d ng d ch v thuê bao r t l n. Đ c bi t trong th i gian g n ñây v i s phát tri n nhanh c a ngành này kèm theo là các chính sách qu n lý thông thoáng ñã t o ñi u ki n cho ngư i dùng th a mãn nhu c u s d ng. Bên c nh ñó các hình th c khuy n mãi mang tính c nh tranh lành m nh ñư c tri n khai nh m thu hút khách hàng v mình. T ñó n y sinh m t trái là thuê bao o, m t s ngư i dùng nhi u thuê bao ch m c ñích là t n d ng chính sách khuy n mãi. Đ nhìn nh n v n ñ m t cách khách quan hơn chúng ta dùng công c khai phá d li u ñ phân tích nh ng khách hàng ñâu là ti m tàng g n bó, ñâu là thuê bao o và s r i b , t ñó có th ñi u ch nh chính sách h p lý và cu i cùng là có th d ñoán s tăng trư ng hàng năm c a s lư ng thuê bao. 2.1.2. Các t p CSDL qu n lí thuê bao liên quan ñ n bài toán 2.1.2.1. Gi i thi u v chi ti t cu c g i 2.1.2.2. CSDL tính cư c (Billing’) 2.1.2.3.Cơ s d li u khách hàng (Customer) 2.1.3. M t s thu c tính c a Chi ti t cu c g i 2.2. PHÂN TÍCH THI T K H TH NG 2.2.1. Cách gi i quy t yêu c u c a bài toán
  14. - 12- 2.2.2. Phương pháp tri n khai 2.2.3. N i dung tri n khai 2.2.4. Xây d ng t p CSDL hu n luy n 2.2.5. Công ngh s d ng 2.2.6. Các công vi c ti n hành v i d li u 2.2.7. Phân tích thi t k h th ng 2.2.7.1. Ki n trúc h th ng D li u hu n luy n Chi ti t cu c g i Ti n Thu t toán phân l p x lý Tính cư c d li u K t qu phân l p Mô hình Khách phân l p hàng H i quy d ñoán tăng trư ng D li u chưa phân l p Hình 2.1: Mô hình h th ng 2.2.7.2. Các b ng d li u 2.2.7.3 lư c ñ quan h c a các ñ i tư ng
  15. - 13- Hình 2.2: Mô hình quan h gi a các CSDL 2.3. PHÂN L P D ĐOÁN XU HƯ NG KHÁCH HÀNG 2.3.1. Xây dưng t p d li u hu n luy n (Training Data) D a trên các cơ s d li u ñã có như Chi ti t cu c g i, tính cư c, thông tin v khách hàng chúng ta ch n các thu c tính ch a nhi u thông tin có kh năng mang l i cho vi c d ñoán ñ chúng ta t o ra cơ s d li u t ng h p. Cơ s d li u này ñư c t o ra t nh ng thông tin quan tr ng nh t và có th d dàng phân tích cho vi c d ñoán, ñư c g i là t p là DL ñ u vào hay còn g i là t p DL hu n luy n (Training data).
  16. - 14- B ng 2.1: T p CSDL hu n luy n Th i S d ng Tên khách hàng S thuê bao gian Tin nh n Tài kho n R ib DV g i Nguy n Văn An 0905245678 Nhi u V a Nhi u Cao Không Lê Thanh Bình 0935234532 Ít Ng n Ít Th p Có Lê Trung Kiên 01223563456 Trung Dài Trung bình Trung Không bình bình Thái Xuân Lan 0903541789 Ít Ng n Ít Cao Có Đ Kim Lan 0904237865 Nhi u Dài Nhi u Th p Không Tr n Thúy H ng 0932456654 Nhi u V a Trung bình Trung Không bình Nguy nVăn Nam 01215673565 Trư c Ng n Ít Cao Có Lê H i Nam 0905234561 Trư c Dài Nhi u Trung Không bình 2.3.2. Gi i thi u v phân l p 2.3.2.1. Xây d ng mô hình 2.3.2.2. S d ng mô hình 2.3.3. M t s phương pháp phân l p
  17. - 15- 2.3.3.1. Xây d ng cây quy t ñ nh Xây d ng cây quy t ñ nh là v n ñ then ch t và quan tr ng nh t c a vi c khai phá d li u b ng k thu t này. Các thu t toán xây d ng cây quy t ñ nh ñã ñư c các nhà khoa h c phát tri n, công b và gi i thi u. M t s thu t toán tiêu bi u như sau:[4] Xây d ng cây Thu t toán t ng quát xây d ng cây quy t ñ nh Trong khai phá d li u b ng cây quy t ñ nh thì xây d ng cây là v n ñ m u ch t và quan tr ng nh t. Các thu t toán xây d ng cây quy t ñ nh ñã ñư c các nhà khoa h c phát tri n, công b và c i ti n theo th i gian. Tuy nhiên, v m t t ng quát thì m t cây quy t ñ nh ñư c xây d ng theo thu t toán sau: D li u vào: T p d li u D, t p danh sách thu c tính, t p nhãn l p D li u ra: Mô hình cây quy t ñ nh Thu t toán: T ocây (T p d li u E, t p danh sách thu c tính F, t p nhãn l p) 1 N u ñi u_ki n_d ng (E,F) = ñúng 2 nútlá = CreateNode () 3 nútlá.nhãnl p=Phânl p (E) 4 return nútlá 5 Ngư c l i 6 Nútg c = CreateNode () 7 Nútg c.ñi uki nki mtra = tìm_ñi m_chia_t t_nh t (E, F) 8 Đ t V = {v| v tho ñi u ki n là ph n phân chia xu t phát t Nútg c} 9 L p qua t ng t p phân chia v ∈ V 10 Đ t Ev = {e | Nútg c.ñi uki nki mtra(e) = v và e ∈ E} Đ t F = F \ {các giá tr c a ñi u ki n ñ phân chia v} 11 Nútcon = T ocây (Ev, F, t p nhãn l p)
  18. - 16- 12 D ng l p 13 End if 14 Tr v nútg c. Hàm chính G i hàm T ocây (T p d li u E, t p danh sách thu c tính c a E, t p nhãn l p). 2.3.3.2. Phân l p Bayes 2.3.4. D ñoán s tăng trư ng 2.3.4.1. Phương pháp h i qui tuy n tính Phân tích h i qui tuy n tính là m t mô hình d báo thi t l p m i quan h gi a bi n ph thu c v i hai hay nhi u bi n ñ c l p. Trong ph n này, chúng ta ch xét ñ n m t bi n ñ c l p duy nh t. N u s li u là m t chu i theo th i gian thì bi n ñ c l p là giai ño n th i gian và bi n ph thu c thông thư ng là doanh s bán ra hay b t kỳ ch tiêu nào khác mà ta mu n d báo. Mô hình này có công th c:Y = ax + b[6] a = n∑ xy − ∑ x∑ y n ∑ x 2 − ( ∑ x) 2 b = ∑ x 2 ∑ y − ∑ x∑ xy 2 n ∑ x − (∑ x ) 2 Trong ñó : y - Bi n ph thu c c n d báo. x - Bi n ñ c l p a - Đ d c c a ñư ng xu hư ng b - Tung ñ g c n - S lư ng quan sát 2.3.4.2. Mô hình d báo theo phương trình h i quy
  19. - 17- CHƯƠNG 3. XÂY D NG NG D NG 3.1. GI I THI U Ph n m m ñư c xây d ng v i cho phép tương tác v i d li u và th c hi n khai phá d li u. Đ tương tác v i d li u ph n m m th c hi n các ch c năng như c p nh t, kh i t o, và xem d li u g c. Trong quá trình khai phá d li u th c hi n nhi m v chính c a bài toán ñó là d ñoán nh ng khách hàng r i b và d ñoán tăng trư ng s thuê bao h ng năm. Trong bài toán này ñưa ra ñó là phân l p khách hàng d a trên hai xu hư ng ñó là g n bó và r i b , t ñó xác ñ nh ñư c m i tương quan gi a giá tr “th c” và “ o” ph c v riêng cho t ng l p khách hàng có cùng nhu c u, s thích, ñưa ra các chính sách giá ưu ñãi và các chương trình khuy n mãi ñ i v i t ng l p ñ i tư ng riêng. Ch ng h n, ñ i v i ngư i dùng ñi n tho i di ñ ng tr trư c, có ngư i g i ñi nhi u nhưng có ngư i h u như ch s d ng ñ nh n các cu c g i thì chính sách ñ i v i hai ñ i tư ng này như th nào? Ngư i g i nhi u có nhu c u giá cư c th p, ta có th ñưa ra chương trình gi m giá cư c t phút g i th bao nhiêu tr ñi. Nhưng ñ i v i ngư i dùng ch nghe thì chương trình này không có ý nghĩa v i h mà chương trình tăng ngày s d ng s có ý nghĩa hơn. Sau khi ta có ñư c d ñoán ñư c nh ng giá tr th c c a thuê bao ta dùng phương pháp phân tích h i quy ñ d ñoán tăng trư ng h ng năm. Các con s và giá tr ñư c ñưa ra giúp nhà cung c p d ch v ñánh giá khách quan v m t ñ nh lư ng s thuê bao. Các s li u ñư c ñưa ra truy xu t dư i d ng bi u ñ và d ng b ng. Nh ng con s ñư c ñưa ra minh h a, ph n ánh
  20. - 18- th c t s tăng trư ng c a s thuê bao di ñ ng. Ph n m m th c hi n hai ch c năng d ñoán trên có ý nghía th c s b i nhà cung c p d ch v vi n thông, là m t cách ñ ñi tìm nh ng ch và hi u qu sau h ng năm ho t ñ ng ñ có nh ng phương pháp chính sách ñi u ch nh phù h p hơn. 3.2. QUÁ TRÌNH PHÁT TRI N Đ tài d a trên ý tư ng d a vào khai phá d li u ñ phân tích và chăm sóc khách hàng vi n thông. Trong ñó d a vào nh ng thông tin, tính ch t c a khách hàng lưu trên cơ s d li u qu n lý ñ t ng h p thành m t cơ s d li u m i. Phân l p khách hàng còn là ñ u vào cho r t nhi u bài toán khác n a mà dư i ñây là m t ví d ñ i v i kho d li u cư c ñi n tho i c a công ty VMS Mobifone. Đây cũng chính là vi c áp d ng th nghi m vi c phân l p s d ng cây quy t ñ nh trong khuôn kh lu n văn này. Bài toán ñ t ra phân tích nh ng ñ c trưng c a ngành vi n thông và công c khai phá d li u ñ phân tích xu hư ng, d ñoán nh ng ngư i có kh năng r i b và d ñoán tăng trư ng s thuê h ng năm. Trong quá trình th c hi n ñ tài dư i s tham kh o và tìm hi u c a công ty VMS Mobifone, căn c vào các giá tr v cu c g i chi ti t và b ng tính ti n và qu n lí khách hàng ñ ñưa ra t p d li u hu n luy n. Áp d ng thu t toán phân l p cây quy t ñ nh và Bayes ñ ñưa ra phân tích xu hư ng c a m i khách hàng. S d ng phân tích h i quy ñ d ñoán s tăng trư ng s thuê bao h ng năm. Trong khuôn kh c a ñ tài này 3.3. XÂY D NG DEMO 3.3.1 Giao di n chính
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
3=>0