intTypePromotion=1

Luận văn thạc sĩ: Xây dựng hệ thống thu nhận và xử lý thông tin điện văn phục vụ công tác kiểm tra, thống kê tại trung tâm quản lý bay miền Trung

Chia sẻ: Sdfas Vfdtg | Ngày: | Loại File: PDF | Số trang:14

0
58
lượt xem
7
download

Luận văn thạc sĩ: Xây dựng hệ thống thu nhận và xử lý thông tin điện văn phục vụ công tác kiểm tra, thống kê tại trung tâm quản lý bay miền Trung

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Xây dựng hệ thống thu nhận và xử lý thông tin điện văn phục vụ công tác kiểm tra, thống kê tại trung tâm quản lý bay miền Trung nhằm trích lọc các thông tin điện tử có trong hệ thống AMSS.

Chủ đề:
Lưu

Nội dung Text: Luận văn thạc sĩ: Xây dựng hệ thống thu nhận và xử lý thông tin điện văn phục vụ công tác kiểm tra, thống kê tại trung tâm quản lý bay miền Trung

  1. 1 2 Công trình ñư c hoàn thành t i B GIÁO D C VÀ ĐÀO T O Đ I H C ĐÀ N NG Đ I H C ĐÀ N NG Ngư i hư ng d n khoa h c: PGS.TS. Võ Trung Hùng LÊ MINH TRÍ Ph n bi n 1:........................................................................ XÂY D NG H TH NG THU NH N VÀ X LÝ THÔNG TIN ĐI N VĂN PH C V CÔNG TÁC KI M TRA, TH NG KÊ Ph n bi n 2:……………………………………………… T I TRUNG TÂM QU N LÝ BAY MI N TRUNG Chuyên ngành : KHOA H C MÁY TÍNH Mã s : 60.48.01 Lu n văn s ñư c b o v trư c H i ñ ng ch m Lu n văn t t nghi p Th c sĩ Khoa h c Máy tính h p t i Đ i h c Đà N ng vào ngày…..tháng….năm 2011 TÓM T T LU N VĂN TH C SĨ K THU T Đà N ng – Năm 2011 Có th tìm hi u lu n văn t i: - Trung tâm Thông tin - H c li u, Đ i h c Đà N ng - Trung tâm H c li u, Đ i h c Đà N ng
  2. 3 4 M Đ U 3. Đ i tư ng và ph m vi nghiên c u 1. Lý do ch n ñ tài Đ i tư ng nghiên c u c a ñ tài g m nh ng t p tin ñi n văn Hi n nay, các thông tin trong lĩnh v c hàng không ñ u ñư c trao trong h th ng AMSS, k thu t trích l c thông tin. Ph m vi nghiên c u ñ i trên m t h th ng, h th ng ñó ñư c g i là AMSS (Automatic c a ñ tài là h th ng chuy n ti p ñi n văn t ñ ng AMSS, nhu c u tra Message Switching System) hay còn g i là h th ng chuy n ti p ñi n c u thông tin l p báo cáo c a ki m soát viên không lưu thu c Trung văn t ñ ng. Các thông tin ñư c trao ñ i bao g m thông tin v k ho ch tâm Qu n lý bay mi n Trung. bay, th i ti t, thông tin v các chuy n bay…và ñư c chuy n ñi dư i 4. Phương pháp nghiên c u ñ nh d ng text. H th ng này ñư c phát tri n và ñóng gói ñ cài ñ t Phương pháp ñư c s d ng trong ñ tài là d a vào các t p tin cho các trung tâm ñi u hành bay các khu v c và các trung tâm.Tuy trong h th ng AMSS, k thu t trích l c thông tin, khai phá d li u, tra nhiên, ngư i dùng không th can thi p vào mã ngu n h th ng ñ s a c u thông tin. T ñó t o mô-dun ñ c d li u ñi n văn, trích l c các ñ i, b sung nh ng tính năng mà h c n. Vì v y vi c th ng kê báo cáo thông tin ch a trong các ñi n văn t h th ng AMSS ñ xây d ng ph n v m t s thông tin như: các chuy n bay ñi, ñ n, quá c nh qua khu v c m m cho phép ngư i s d ng có th tra c u thông tin c n thi t trên ñó. mi n Trung… ñi u ñư c th ng kê b ng th công, d a vào các t p tin 5. Ý nghĩa khoa h c và th c ti n c a ñ tài ñi n văn ñã ñư c in ra trong ngày ñ t p trung l i. Sau quá trình th c hi n ñ tài, tôi ñã nghiên c u và ng d ng V n ñ ñ t ra là làm th nào ñ có th trích l c các thông tin có thành công h th ng thu nh n và x lý thông tin ñi n văn. H th ng trong ñi n văn t h th ng AMSS và t ng h p l i ñ có th giúp cho ñư c s d ng t i Trung tâm Qu n lý bay mi n Trung nh ng ki m soát viên không lưu có th d dàng th ng kê, theo dõi theo 6. C u trúc c a lu n văn m t th i gian nào ñó mà ta mu n. Lu n văn ñư c t ch c thành 3 chương như sau: V i nh ng lý do như trên và là ngư i hi n ñang công tác t i Chương 1: Nghiên c u t ng quan: chương này trình bày khái Trung tâm Qu n lý bay mi n Trung, tôi ch n ñ tài “ Xây d ng h ni m v m ng vi n thông c ñ nh hàng không, h th ng chuy n ti p th ng thu nh n và x lý thông tin ñi n văn ph c v công tác ki m ñi n văn t ñ ng AMSS. Cơ s lý thuy t v k thu t trích l c thông tin, tra, th ng kê t i Trung tâm Qu n lý bay mi n Trung”. khai phá d li u. 2. M c ñích nghiên c u Chương 2: Gi i pháp ñ xu t: chương này mô t các yêu c u H th ng ñư c xây d ng v i m c ñích trích các thông tin t các ñ i v i h th ng, ki n trúc t ng th và mô hình ho t ñ ng c a h th ng. t p tin ñi n văn, ñ ñưa ra các thông tin c n thi t. T ñó, ta s t ng h p Gi i pháp ñ tri n khai h th ng. t t c các thông tin ñó l i v i nhau, và ñưa ra nh ng báo cáo v các Chương 3: Phát tri n ng d ng: chương này trình bày công c thông tin mà ngư i dùng yêu c u (th i ti t m t ngày nào ñó, t ng s ñ phát tri n h th ng, xây d ng các mô-dun trích l c thông tin, xây chuy n bay ñi và ñ n trong m t tháng…). d ng giao di n hi n th thông tin và cho phép ngư i s d ng tra c u thông tin. Quá trình cài ñ t, th nghi m ng d ng và ñánh giá k t qu .
  3. 5 6 CHƯƠNG 1:NGHIÊN C U T NG QUAN 1.2. H th ng chuy n ti p ñi n văn t ñ ng AMSS Trong chương này, tôi t p trung trình bày v khái ni m v h 1.2.1. Gi i thi u th ng thông tin ñi n văn trong lĩnh v c hàng không, h th ng chuy n H th ng AMSS (Automatic Messages Switch System) hay còn ti p ñi n văn t ñ ng AMSS, k thu t trích l c thông tin, khai phá d g i là h th ng chuy n ti p ñi n văn t ñ ng. H th ng có ch c năng li u. Nh ng n i dung trong chương này là cơ s ñ th c hi n các thu nh n và x lý ñi n văn trong m ng AFTN. M t h th ng AMSS chương ti p theo. thu n tuý th c hi n ñúng ch c năng chuy n ti p ñi n văn AFTN. Đ ng 1.1. H th ng thông tin ñi n văn trong lĩnh v c hàng không th i, ñ m b o cho h th ng AMSS có giao ti p m cho phép k t n i Trung tâm Qu n lý bay dân d ng Vi t Nam là ñơn v có nhi m m m d o v i các h th ng x lý d li u khác có liên quan như: x lý s v qu n lý m ng AFTN qu c gia, ñ m b o duy trì thông tin liên l c li u bay, s li u th i ti t, s v hàng không… ñi n văn ph c v công tác ñi u hành bay m t cách liên t c và an toàn. H th ng có kh năng ho t ñ ng ch ñ d phòng nóng. Hai AFTN là lo i d ch v chuy n b n tin lo i store-and-forward (là lo i máy ch ho t ñ ng song song. Khi máy chính có s c , h th ng s t chuy n ñi n văn mà các node trung gian s nh n ñ y ñ m t b n tin trư c ñ ng chuy n sang máy d phòng và c nh báo ñ k thu t viên x lý. H khi chuy n ti p ñ n node khác. Lo i chuy n ñi n văn này s yêu c u nhi u th ng ñư c thi t k ñáp ng ñư c lưu lư ng 30,000 ñi n văn m t ngày. b nh hơn t i các node trung gian) ñ chuy n các b n tin ký t . Các b n Có kh năng k t n i và qu n lý 40 kênh truy n AFTN. tin AFTN ñư c chuy n theo t ng bư c nh y theo nh ng tuy n ñư c c u Có kh năng ki m soát tình tr ng ho t ñ ng c a t t c các kênh hình trư c ñ chuy n t i ñ a ch trong th i gian ng n nh t. và thi t b trong h th ng. Đ m b o kh năng ki m soát m ch 1.1.1. M ng vi n thông c ñ nh hàng không AFTN UP/DOWN. 1.1.2. Đi n văn hàng không Có kh năng s d ng hai lo i Modem là t ñ ng k t n i và quay Đi n văn hàng không là các b n tin ñư c chuy n ñi trên m ng s (leased line , dialup). T c ñ kênh truy n ñ n các ñ u cu i có th vi n thông c ñ nh hàng không. Các b n tin này ch a t t c các thông thi t l p t 50 bauds ñ n 230 kbps theo t ng m c ñ i v i các ñ u cu i tin liên quan ñ n lĩnh v c hàng không như: s d ng c ng RS-232, 10/100 Mbs ñ i v i ñ u cu i trong m ng LAN. • Đi n văn k ho ch bay: bao g m thông tin c a m t Có các t p nh t ký ghi nh n các s ki n trong quá trình ho t ñ ng c a chuy n bay s p kh i hành ho ch s p h cánh. t t c các v trí trong h th ng. Các s ki n ñư c ghi vào t p Log. • Đi n văn khí tư ng: bao g m các thông tin v d báo H th ng có kh năng ñ nh c u hình tr c tuy n v i m c ñ tham th i ti t sân bay ñ n, d báo khu v c và ñư ng bay. s hoá cao cho các tác v mà không ph i Reset l i h th ng. Ngoài ra còn nh ng lo i ñi n văn như: ñi n văn d ch v không H th ng có cơ ch qu n lý ngư i dùng và an ninh ñ ñ m b o ñ báo hàng không, ñi n văn hàng chính hàng không, các ñi n văn s v . n ñ nh và an toàn c a toàn cho h th ng.
  4. 7 8 1.2.2. Nh ng ch c năng chính c a h th ng AMSS t n trình khai phá tri th c t cơ s d li u, các tri th c này h tr trong 1.2.2.1. X lý ñi n văn vi c ra quy t ñ nh trong khoa h c và kinh doanh. Đ hình dung v n ñ 1.2.2.2. Lưu tr ñi n văn này, ta có th s d ng m t ví d ñơn gi n sau: khai phá d li u ñư c ví 1.2.2.3. Truy xu t ñi n văn như tìm m t cây kim trong ñ ng c khô. 1.2.2.4. Th ng kê 1.4.2. Quá trình khai phá d li u 1.3. K thu t trích l c thông tin (Information Extraction) M t quá trình khai phá d li u bao g m 6 giai ño n chính như 1.3.1. Gi i thi u v trích l c thông tin sau: Đánh giá lu t Trích l c thông tin là k thu t ñư c s d ng sau khi thông tin qua Khai phá d li u tác v thu th p ñã ñư c l y v , vi c ti p theo là ph i l y ra ñư c nh ng Chuy n ñ i d li u thông tin c n thi t và ch là nh ng thông tin mà mình c n m t cách t Làm s ch, ti n x lý ñ ng không c n t i s thao tác c a ngư i s d ng. H u h t các thu t d li u Tri th c toán trích l c thông tin hi n nay ñ u d a vào các công c khác nhau Trích l c d li u Mô hình trên n n k thu t “Wrapper”. Wrapper có th ñư c hi u là nh ng hàm D li u ñã Gom d li u ñ tách thông tin t các tài nguyên. Các hàm này ñư c vi t d a trên các chuy n ñ i D li u lu t (quy lu t) ñã ñư c ñúc rút ra sau khi kh o sát các b n văn ch a ñã làm D li u s ch, ti n thông tin c n l y. Các Wrapper có th xây d ng d a trên r t nhi u quy D li u ñích x lý thô,... lu t khác nhau và tuỳ thu c vào m c ñích c a ngư i s d ng. D li u 1.3.2. Các d ng trích l c thông tin Vi c trích l c n i dung văn b n ph thu c vào ñ nh d ng t p tin mà Hình 1.1: Quá trình phát hi n tri th c ngư i dùng ñ nh nghĩa cho phép nh n di n. Các t p tin này ph i ñư c a. Gom d li u (Gathering) khai báo trư c và có cách ñ c cũng như cách trích l c khác nhau. Sau ñây b. Trích l c d li u là các bư c trích l c n i dung văn b n c a t ng ñ nh d ng t p tin. c. Làm s ch, ti n x lý và chu n b trư c d li u 1.3.2.1. Đ i v i t p tin HTML d. Chuy n ñ i d li u 1.3.2.1. Đ i v i t p tin PPT e. Phát hi n và trích m u d li u 1.4. Khai phá d li u ( Data Mining) f. Đánh giá k t qu m u 1.4.1. Gi i thi u v khai phá d li u Trên ñây là 6 giai ño n trong quá trình khai phá d li u, trong ñó Khai phá d li u là m t khái ni m ra ñ i vào nh ng năm cu i giai ño n 5 là giai ño n ñư c quan tâm nhi u nh t hay còn g i là Data c a th p k 1980. Nó là quá trình khám phá thông tin n ñư c tìm th y Mining trong các cơ s d li u và có th xem như là m t bư c trong quá trình khám phá tri th c. Khai phá d li u là giai ño n quan tr ng nh t trong
  5. 9 10 1.4.3. Các ki u khai phá d li u d báo nhu c u c a ngư i tiêu dùng ñ i v i m t s n ph n m i d a trên 1.4.3.1. Khai phá d li u d ñoán ho t ñ ng qu ng cáo tiêu dùng. Nhi m v c a khai phá d li u d ñoán là ñưa ra các d ñoán 1.4.3.2. Khai phá d li u mô t d a vào các suy di n trên d li u hi n th i. Nó s d ng các bi n hay K thu t này có nhi m v mô t v các tính ch t ho c các ñ c các trư ng trong cơ s d li u ñ d ñoán các giá tr không bi t hay các tính chung c a d li u trong CSDL hi n có. Bao g m các k thu t: giá tr tương lai. Bao g m các kĩ thu t: phân lo i (classification), h i phân c m (clustering), phân tích lu t k t h p (association rules)... quy (regression)... a. Phân c m a. Phân lo i M c tiêu chính c a phương pháp phân c m d li u là nhóm các M c tiêu c a phương pháp phân lo i d li u là d ñoán nhãn l p ñ i tư ng tương t nhau trong t p d li u vào các c m sao cho các ñ i cho các m u d li u. Quá trình phân lo i d li u thư ng g m 2 bư c: tư ng thu c cùng m t c m là tương ñ ng còn các ñ i tư ng thu c các xây d ng mô hình và s d ng mô hình ñ phân lo i d li u. c m khác nhau s không tương ñ ng. Phân c m d li u là m t ví d c a Bư c 1: Xây d ng mô hình d a trên vi c phân tích các m u d phương pháp h c không giám sát. Không gi ng như phân lo i d li u, li u cho trư c. M i m u thu c v m t l p, ñư c xác ñ nh b i m t thu c phân c m d li u không ñòi h i ph i ñ nh nghĩa trư c các m u d li u tính g i là thu c tính l p. Các m u d li u này còn ñư c g i là t p d hu n luy n. Vì th , có th coi phân c m d li u là m t cách h c b ng li u hu n luy n. Các nhãn l p c a t p d li u hu n luy n ñ u ph i ñư c quan sát (learning by observation), trong khi phân lo i d li u là h c xác ñ nh trư c khi xây d ng mô hình, vì v y phương pháp này còn b ng ví d (learning by example). Trong phương pháp này ta s không ñư c g i là h c có giám sát. th bi t k t qu các c m thu ñư c s như th nào khi b t ñ u quá trình. Bư c 2: S d ng mô hình ñ phân lo i d li u. Trư c h t chúng Vì v y, thông thư ng c n có m t chuyên gia v lĩnh v c ñó ñ ñánh giá ta ph i tính ñ chính xác c a mô hình. N u ñ chính xác là ch p nh n các c m thu ñư c. Phân c m d li u ñư c s d ng nhi u trong các ng ñư c, mô hình s ñư c s d ng ñ d ñoán nhãn l p cho các m u d d ng v phân ño n th trư ng, phân ño n khách hàng, nh n d ng m u, li u khác trong tương lai. phân lo i trang Web… Ngoài ra phân c m d li u còn có th ñư c s Hay nói cách khác, phân lo i là h c m t hàm ánh x m t m c d d ng như m t bư c ti n x lí cho các thu t toán khai phá d li u khác. li u vào m t trong s các l p cho trư c. b. Lu t k t h p b. H i qui M c tiêu c a phương pháp này là phát hi n và ñưa ra các m i Phương pháp h i qui khác v i phân lo i d li u ch , h i qui liên h gi a các giá tr d li u trong CSDL. M u ñ u ra c a gi i thu t dùng ñ d ñoán v các giá tr liên t c, còn phân lo i d li u thì ch khai phá d li u là t p lu t k t h p tìm ñư c. Khai phá lu t k t h p dùng ñ d ñoán các giá tr r i r c. ñư c th c hi n qua 2 bư c: H i quy là h c m t hàm ánh x m t m c d li u vào m t bi n d • Bư c 1: tìm t t c các t p m c ph bi n, m t t p m c báo giá tr th c. Các ng d ng h i quy có nhi u, ví d như ñánh giá xác ph bi n ñư c xác ñ nh qua tính ñ h tr và th a mãn xu t m t b nh nhân s ch t d a trên t p k t qu xét nghi m ch n ñoán, ñ h tr c c ti u.
  6. 11 12 • Bư c 2: sinh ra các lu t k t h p m nh t t p m c ph ñ c trưng. Phép phân tích này giúp phân lo i hi u qu và bi n, các lu t ph i th a mãn ñ h tr c c ti u và ñ tin nâng cao kh năng m r ng. c y c c ti u. • Bi n ñ i d li u: D li u có th ñư c t ng quát hoá t i các Phương pháp này ñư c s d ng r t hi u qu trong các lĩnh v c m c khái ni m cao hơn. Đi u này r t h u ích cho các thu c như marketing có ch ñích, phân tích quy t ñ nh, qu n lí kinh doanh,… tính có giá tr liên t c. Ví d , các giá tr s c a thu c tính thu 1.4.4. K thu t phân lo i trong khai phá d li u nh p ñư c t ng quát hoá sang các ph m vi r i r c như th p, Các cơ s d li u v i r t nhi u thông tin n có th ñư c s d ng trung bình và cao. Tương t , các thu c tính giá tr tên như ñ t o nên các quy t ñ nh kinh doanh thông minh. Phân lo i là m t ñư ng ph ñư c t ng quát hoá t i khái ni m m c cao hơn d ng c a phân tích d li u, nó dùng ñ trích ra các mô hình mô t các như thành ph . Nh ñó các thao tác vào/ra trong quá trình l p d li u quan tr ng hay ñ d ñoán các khuynh hư ng d li u tương h c s ít ñi. lai. Phân lo i dùng ñ d ñoán các nhãn xác th c (hay các giá tr r i b. So sánh các phương pháp phân lo i r c). Nhi u phương pháp phân lo i ñư c ñ xu t b i các nhà nghiên 1.4.4.3. Phân lo i b ng cây quy t ñ nh quy n p c u các lĩnh v c như h c máy, h chuyên gia, th ng kê... H u h t các Cây quy t ñ nh là c u trúc cây có d ng bi u ñ lu ng, m i nút gi i thu t dùng v i gi thi t kích thư c d li u nh . Các nghiên c u trong là ki m ñ nh trên m t thu c tính, m i nhánh ñ i di n cho m t k t khai phá cơ s d li u g n ñây ñã phát tri n, xây d ng m r ng các k qu ki m ñ nh, các nút lá ñ i di n cho các l p. Nút cao nh t trên cây là thu t phân lo i có kh năng s d ng d li u thư ng trú trên ñĩa l n. Các nút g cĐ phân lo i m t m u chưa bi t, các giá tr thu c tính c a m u k thu t này thư ng ñư c xem xét x lý song song và phân tán. s ñư c ki m ñ nh trên cây. Đư ng ñi t g c t i m t nút lá cho bi t d 1.4.4.1. Khái ni m v phân lo i ñoán l p ñ i v i m u ñó. Cây quy t ñ nh có th d dàng chuy n ñ i 1.4.4.2. Các v n ñ quan tâm c a phân lo i thành các lu t phân lo i. Gi i thu t n n t ng c a cây quy t ñ nh quy n p a. Chu n bi d li u ñ phân lo i là ID3, m t gi i thu t cây quy t ñ nh quy n p n i ti ng. Các bư c ti n x lý d li u sau ñây giúp c i thi n ñ chính xác, a. Chi n lư c cơ b n c a ID3 hi u su t và kh năng m r ng c a phân lo i. Gi i thu t cây quy t ñ nh quy n p bao g m các chi n lư c sau: • Làm s ch d li u: Đây là quá trình thu c v ti n x lý d • Cây b t ñ u là m t nút ñơn ñ i di n cho các m u hu n luy n. li u ñ g b ho c làm gi m nhi u và cách x lý các giá tr • N u t t c các m u cùng l p thì nút tr thành m t lá và khuy t. Bư c này giúp làm gi m s m p m khi h c. ñư c g n nhãn v i l p ñó. • Phân tích s thích h p: Nhi u thu c tính trong d li u có th Ngư c l i, gi i thu t s d ng m t phép ño Entropy ñ l a ch n không thích h p hay không c n thi t ñ phân lo i. Vì v y, thu c tính. Đây là thu c tính s phân tách t t nh t các m u vào trong phép phân tích s thích h p ñư c th c hi n trên d li u v i các l p riêng bi t. Thu c tính này tr thành thu c tính "ki m ñ nh" hay m c ñích g b b t kỳ nh ng thu c tính không thích h p hay "quy t ñ nh" t i nút ñó. Trong version này c a gi i thu t, t t c các không c n thi t. Trong h c máy, bư c này g i là trích ch n
  7. 13 14 thu c tính ñ u là xác th c, t c là giá tr r i r c. Các thu c tính giá tr trên kho ng cách. Các công c phân tích c m d a trên k-means, k-medoids liên t c ph i ñư c r i r c hóa. và m t s các phương pháp khác cũng ñư c xây d ng trong nhi u gói ph n M t nhánh ñư c t o l p cho t ng giá tr ñã bi t c a thu c tính m m hay h th ng phân tích th ng kê như S-Plus, SPSS và SAS. ki m ñ nh và các m u ñư c phân chia m t cách phù h p. 1.4.5.2. Các ki u d li u trong ghép phân c m Gi i thu t s d ng cùng x lý ñ quy ñ hình thành nên cây 1.4.5.3. Đ tương ñ ng và không tương ñ ng quy t ñ nh cho các m u t i m i l n phân chia. 1.4.5.4. Phân lo i các phương pháp phân c m chính Phân chia ñ quy này d ng khi m t trong nh ng ñi u ki n sau là Hi n có m t s lư ng l n các gi i thu t phân c m trong các tài ñúng: li u. Vi c l a ch n gi i thu t phân c m tuỳ thu c vào ki u d li u cho • T t c các m u thu c v cùng m t l p s n, m c ñích riêng và ng d ng. N u như phép phân tích c m ñư c • Không còn thu c tính nào ñ ti p t c phân chia các m u. dùng như m t công c mô t hay thăm dò thì có th th m t vài gi i Trong trư ng h p này, l a ch n theo s ñông (majority thu t trên cùng d li u ñ xem xem d li u có th th hi n ñư c ñi u gì. voting) ñư c dùng. Lúc này nút ñư c t o tr thành lá v i Nhìn chung, các phương pháp phân c m chính ñư c phân thành các nhãn là l p ñã l a ch n theo s ñông. lo i như sau. • Không còn m u nào cho nhánh test-attribute = ai. Lúc này, a. Các phương pháp phân chia m t lá ñư c t o v i nhãn là l p chi m ña s trong các m u. b. Các phương pháp phân c p b. Phép ño l a ch n thu c tính c. Các phương pháp d a trên m t ñ 1.4.5. K thu t phân c m trong khai phá d li u d. Phương pháp d a trên lư i 1.4.5.1. Khái ni m v phân c m M t phương pháp d a trên lư i lư ng t hoá không gian ñ i X lý nhóm m t t p các ñ i tư ng vào trong các l p các ñ i tư ng vào trong m t s h u h n các ô hình thành nên m t c u trúc lư i. tư ng gi ng nhau ñư c g i là phân c m. M t c m là m t t p h p các Sau ñó nó th c hi n t t c các thao tác phân c m trên c u trúc lư i (t c ñ i tư ng d li u gi ng nhau trong ph m vi cùng m t c m và không là trên không gian ñã lư ng t hoá). Thu n l i chính c a ti p c n này là gi ng nhau v i các ñ i tư ng trong các c m khác. Phép phân tích c m th i gian x lý nhanh chóng c a nó ñ c l p v i s các ñ i tư ng d li u là m t ho t ñ ng quan tr ng. B ng phân c m, ta có th nh n bi t các và ch tuỳ thu c vào s lư ng các ô trong m i chi u c a không gian vùng ñông ñúc và thưa th t, b i v y tìm ra toàn b các m u phân b và lư ng t . các tương quan thú v gi a các thu c tính d li u. Trong kinh doanh, phân c m có th giúp cho các nhà nghiên c u th trư ng tìm ra các CHƯƠNG 2: GI I PHÁP Đ XU T nhóm riêng bi t d a trên khách hàng c a h và mô t các nhóm khách Đây là m t trong nh ng chương quan tr ng c a ñ tài. Trong hàng d a trên các m u mua s m. chương này trình bày các n i dung sau: bài toán ñ t ra, mô t h th ng Như là m t nhánh c a th ng kê, phép phân tích c m ñư c nghiên bao g m: xác ñ nh yêu c u ñ i v i h th ng, ki n trúc t ng th và mô c u m r ng ñã nhi u năm, t p trung chính trên phép phân tích c m d a hình ho t ñ ng c a h th ng; t hi n tr ng h th ng ph c v tra c u
  8. 15 16 thông tin t t p tin ñi n văn ta thi t k cơ s d li u và cu i cùng là Bài toán ñ t ra ñây là t nh ng t p tin ñi n văn ban ñ u ñư c thi t k các ch c năng. lưu tr trong h th ng AMSS, ta s d ng k thu t bóc tách thông tin, 2.1. Mô t bài toán chia nh t p tin ñi n văn ñó ra thành nhi u t p tin text nh ch a thông Hi n nay, t i Đài ch huy c t h cánh sân bay Đà N ng, nh ng tin mà ta c n và ñưa vào cơ s d li u. Ti p ñó ta s ti n hành khai phá thông tin thu c lĩnh v c hàng không dân d ng mà các ki m soát viên d li u trên cơ s d li u ñó và ñưa ra ñư c nh ng thông tin mà ngư i không lưu khai thác ñ u t nh ng ñi n văn ñư c chuy n ñi trên h th ng s d ng yêu c u thông qua ph n m n tra c u thông tin. AMSS. Nh ng ñi n văn này bao g m t t c các thông tin liên quan ñ n - H th ng ñư c xây d ng bao g m 3 ph n chính: lĩnh v c hàng không dân d ng như: k ho ch bay, ñi n văn th i ti t, ñi n • Sưu t p d li u: ph n n y, ta s ti n hành l y d li u văn s v ….. Vì thông tin ñi n văn ch hi n th theo m u s n, trong m t t h th ng AMSS, c th là l y t t c các t p tin ñi n vài trư ng h p ñi u này có th d n ñ n sai sót khi ki m soát viên không văn liên quan mà ta c n phân tích. lưu ñ c không chính xác các thông tin có trong ñi n văn. • Xây d ng cơ s d li u: ph n này, ta s d ng k thu t Dư i ñây là giao di n ph n m m khai thác ñi n văn mà các ki m trích l c thông tin ñ l y các thông tin trong t p tin ñi n soát viên không lưu s d ng. Giao di n này g m 2 ph n chính: văn mà ta c n. T o m t cơ s d li u ñ lưu tr các • Ph n bên trái: ñây là ph n so n th o ñi n văn c a ph n thông tin ñã ñư c trích l c. m m. • Khai phá thông tin: t i ph n này, d a trên yêu c u • Ph n bên ph i: ñây là ph n hi n th các ñi n văn mà ñ u ngư i dùng. Xây d ng giao di n tra c u thông tin mà cu i ñó nh n ñư c. ngư i dùng c n xem. Ngoài ra, ph n m m còn hi n th t ng s ñi n văn ñã ñư c g i ñi - Dư i ñây là mô hình h th ng x lý thông tin ñi n văn: và nh n v c a ñ u cu i ñó. Hình 2.1: Giao di n ph n m m khai thác ñi n văn t i ñ u cu i
  9. 17 18 2.2.1. Sưu t p các thông tin ñi n văn T p tin ñi n văn ban ñ u --- Trong h th ng AMSS có r t nhi u kênh truy n khác nhau, m i --- --- --- Quá trình sưu t p H th ng … --- --- --- --- d li u kênh truy n ch truy n ñi m t vài ki u ñi n văn riêng (ví d : kênh MET AMSS --- --- --- --- ch chuy n các ñi n văn v khí tư ng,…). Đ t p trung các thông tin mà chúng ta mu n có, ta t o thêm m t kênh truy n m i. Thông tin ñư c chuy n trên h th ng AMSS d a vào ñ a ch c a ñ u cu i ñ nh n và Modul trích l c chuy n ti p ñi n văn, vì th t i d i ñ a ch c a kênh truy n m i ñư c thông tin t o ra, ta nh p t t c các ñ a ch ñ u cu i có thu nh n ñi n văn liên quan mà ta c n ph i l y. Quá trình xây d ng T p tin ñi n văn ñã CSDL ñư c tách --- - ---- Kho d li u B khai phá d li u Quá trình khai phá d li u Hình 2.3: B ng giám sát các kênh truy n c a h th ng AMSS Giao di n ngư i Đ có th ñ c ñư c các gói tin ñi qua c ng RJ 45, ta ti n hành dùng t o 1 mô-dun thu th p d li u, mô-dun này ñư c tích h p th ng vào chương trình. mô-dun này ñóng vai trò ñ c t t c các gói tin ñi qua Ngư i s d ng c ng RJ45. Vì các gói tin qua c ng RJ45 này là t t c các d li u ñi n văn Hình 2.2: Sơ ñ h th ng x lý thông tin ñi n văn mà ta thi t l p ñi qua kênh truy n m i ñư c t o ra. Các ñi n văn này 2.2. Quy trình x lý bao g m r t nhi u lo i khác nhau, có nh ng ñi n văn ch a nh ng thông D a vào mô hình c a h th ng, ta ti n hành xây d ng l n lư t tin mà ta không s d ng, nên mô-dun này ch ñ c các gói tin ñi qua t ng bư c x lý như sau: c ng RJ 45 c a kênh truy n ñó và chuy n chúng vào b ñ m. T i b ñ m, mô-dun trích l c thông tin s ti n hàng l c và tách nh ng thông
  10. 19 20 tin mà chúng ta c n ñ ñưa vào cơ s d li u. 2.2.2.2. M t s qui lu t dùng ñ bóc tách thông tin t ñi n văn 2.2.2. Bóc tách thông tin t t p tin ñi n văn V i nh ng thông tin ch a trong t p tin ñi n văn và theo kh o Vì ñi n văn ñư c chuy n trong h th ng AMSS theo m t m u sát yêu c u ngư i dùng. Ph n trích l c thông tin, báo cáo ch t p trung nh t ñ nh, vì th ta ch c n quan tâm n i dung c a ñi n văn. vào các ñi n văn k ho ch bay và ñi n văn th i ti t. D li u sau khi 2.2.2.1. Các m u ñi n văn không lưu trích l c ñư c t ng h p b ng vi c trích l c nh ng thông tin mô t và Đi n văn không lưu là nh ng ñi n văn ñư c s d ng ñ trao ñ i lưu vào cơ s d li u tin t c gi a nh ng ngư i s d ng qua m ng vi n thông hàng không c Đ i v i ñi n văn k ho ch bay, ph n ñ u m i ñi n văn là như ñ nh (AFTN) và di ñ ng. nhau, ta ch căn c vào t khóa FPL ñ ti n hành tách n i dung trong • M i ñi n văn không lưu g m có: Mã ñi n văn; ký hi u ch ñ ñó và khi nào g p ký t k t thúc thì ta d ng. kh n (ưu tiên); nhóm ñ a ch nơi g i, nơi nh n và th i gian; Đ i v i ñi n văn khí tư ng, ph n ñ u m i ñi n văn là như các thành ph n d li u ñư c t ch c thành t ng nhóm (field). nhau, ta căn c vào hai d ng t khóa ñó là Metar và Speci ñ ti n hành • Căn c theo m c ñích s d ng, ñi n văn không lưu ñư c tách n i dung v th i ti t. chia thành các lo i ñi n văn v i các ñ kh n tương ng. 2.2.3. Quá trình khai phá d li u • Các ñi n văn liên quan ñ n vi c cung c p d ch v không T d li u ñã trích l c ñư c t t p tin ñi n văn, ta ti n hành khai lưu s do các cơ s cung c p d ch v không lưu ñư c ch phá d li u ñó. Quá trình khai phá d li u này bao g m các bư c sau: ñ nh phát. 2.2.3.1. Kh o sát yêu c u ngư i dùng • Các ñi n văn liên quan ñ n các ho t ñ ng và ki m soát; Vì chương trình nh m ph c v cho các ki m soát viên không lưu ñi n văn thông báo tin t c v chuy n bay mà không vì m c nên quá trình kh o sát ch t p trung vào nhu c u khai thác ñi n văn ñích cung c p d ch v không lưu s do t lái, hãng hàng thu c k ho ch bay, th i ti t t i khu v c Đà N ng. M t s yêu c u không ho c ñ i di n nhà khai thác phát. chính sau khi ñã ti n hành kh o sát: • Các ñi n văn k ho ch bay; s a ñ i ho c h y b k ho ch • Hi n th thông tin ch a trong m t ñi n văn k ho ch bay bay ch ñư c g i ñ n các cơ s cung c p d ch v có liên như: mã hi u chuy n bay, tên chuy n bay, sân bay xu t quan. phát, sân bay ñ n, sân bay d b khi c n h cánh kh n c p, a. Đi n văn k ho ch bay không lưu (FPL) phương th c bay, th i gian bay… b. Đi n văn c t cánh (DEP - Departure • Hi n th thông tin ch a trong ñi n văn th i ti t như: th i ti t t i c. Đi n văn h cánh (Arr – Arrival) khu v c sân bay Đà N ng trong t ng th i ñi m c th . d. Đi n văn h y b k ho ch bay • T ng h p các chuy n bay ñi, bay ñ n ph c v cho vi c e. Đi n văn k ho ch bay hi n hành th ng kê s n lư ng bay hàng tháng. f. Đi n văn khí tư ng Metar 2.2.3.2. Xây d ng các lu t truy v n
  11. 21 22 2.3. Nh n xét d. B ng ghi TB_DSSANBAY: b ng này dùng ñ lưu thông tin v Gi i pháp ñã ñáp ng ñư c yêu c u mà bài toán ñ t ra trong ñ các sân bay có trong ñi n văn mà chúng ta trích l c ñư c. Nó ph c v tài. Nó giúp cho vi c di n gi i các thông tin có trong các ñi n văn k cho công tác th ng kê s n lư ng bay ho ch bay, ñi n văn th i ti t ñư c rõ ràng hơn so v i vi c ph i ñ c toàn Các b ng ghi sau khi ñã ñư c t o hoàn t t: b ñi n văn. Giao di n tương tác ngư i dùng ñư c thi t k giúp ngư i s d ng d dàng tương tác v i ng d ng, nó hi n th thông tin rõ ràng d ñ c. CHƯƠNG 3: PHÁT TRI N NG D NG Trong chương này t p trung trình bày v ngôn ng phát tri n ng d ng, t o cơ s d li u và các mô-dun c a ng d ng. Quá trình cài ñ t ng d ng. 3.1. Công c phát tri n ng d ng 3.1.1. Lưu tr cơ s d li u Hình 3.1: Các b ng ghi c a chương trình 3.1.2. Ngôn ng phát tri n ng d ng 3.3. Xây d ng các mô-dun c a ng d ng Visual Studio.Net là 1 s n ph m công ngh .NET c a Microsoft 3.3.1. mô-dun trích l c thông tin v i nhi u ngôn ng l p trình: C++.Net, Visual Basic.Net, ASP.Net, C#, mô-dun này ñư c xây d ng và tích h p th ng vào chương trình, J#, giúp chúng ta có th d dàng t o ra nh ng giao di n d dàng, nhanh nó s ñ c d li u ñi n văn t b ñ m và phân tích d li u ñó. Trong quá chóng v i nh ng công c h tr ñi kèm. Trong ñ tài này tôi ch n công trình ñ c d li u, nó tách riêng t ng ñi n văn d a vào 2 t khóa: b t ngh .NET v i ngôn ng C# ñ phát tri n ng d ng. ñ u ñi n văn (ZCZC) và k t thúc ñi n văn (NNNN). Ti p theo nó s 3.2. Xây d ng cơ s d li u phân tích n i dung ñi n văn ñ tìm nh ng ñi n văn k ho ch bay và D a vào nh ng thành ph n c a t p tin ñi n văn sau khi ñã ñư c th i ti t mà chúng ta c n d a vào t khóa FPL, Metar, Speci. Nh ng trích l c, ta xây d ng cơ s d li u c a chương trình bao g m các b ng ñi n văn có ch a nh ng t khóa ñó s ñư c ti p t c trích l c n i dung ghi sau: và ñưa vào cơ s d li u, nh ng ñi n văn nào không ch a các t khóa a. B ng ghi BANG_TIN: dùng ñ lưu n i dung c a ñi n văn. B ng ñó s ñư c lo i b . này g m 2 trư ng ID và NOI_DUNG 3.3.2. mô-dun khai phá d li u b. B ng ghi KE_HOACH_BAY: dùng ñ lưu n i dung ñi n văn k Modun khai phá d li u s d ng nh ng lu t truy v n ñư c trình ho ch bay sau khi ñã trích l c thông tin. bày trên ñ ñưa ra k t qu khi ngư i s d ng yêu c u. Nó ñư c tích c. B ng ghi TB_THOI_TIET: dùng ñ lưu các thông tin liên quan h p vào giao di n ngư i dùng. Dư i ñây là nh ng giao ñi n chính c a ñ n th i ti t t i khu v c mi n Trung sau khi ñã trích l c thông tin. chương trình:
  12. 23 24 - Giao di n l y tin c a chương trình 3.4. Cài ñ t và th nghi m Chương trình có th ch y trên các h ñi u hành Windown. Vì chương trình s d ng h qu n tr CSDL SQL Server 2005, nên ñ ch y chương trình ta c n cài SQL Server 2005 và n p l i cơ s d li u cho chương trình. Sau khi ñã n p thành công cơ s d li u, ta ch y chương trình b ng t p tin KeHoachBay.exe ñư ng d n sau: demo->KeHoachBay- >Bin->Release. Khi ch y chương trình, giao di n tương tác v i ngư i dùng như hình dư i : Giao di n g m 4 tab: L y tin, Tìm ĐV k ho ch bay, Tìm ĐV th i ti t, Th ng kê chuy n bay. Hình 3.3: Giao di n chính c a chương trình c a s bên trái là ph n l y tin c a ng d ng, c a s bên ph i là ph n hi n th n i dung ñi n văn sao khi ñư c trích l c. Sau khi thi t l p ñ y ñ các thông s cho chương trình, nó s t ñ ng ch n nh ng t p tin ñi n văn c n phân tích và ñưa ra k t qu màn hình bên ph i như hình bên dư i: Hình 3.8: Giao di n tương tác ngư i dùng Đ k t n i v i h th ng AMSS, ta ch n Listen r i ch n Connect. Chương trình s t ñ ng phân tích nh ng ñi n văn k ho ch bay và th i ti t nh n ñư c t h th ng AMSS. Ngoài ra, ngư i dùng cũng có th ch n ph n L y tin ñ ch n ñi n văn c n xem l i. Hình dư i bi u th ñi n văn k ho ch bay ñã ñư c trích l c b ng ng d ng. Hình 3.4: Giao di n trích l c thông tin ñi n văn
  13. 25 26 Hình 3.9: Giao di n trích l c ñi n văn k ho ch bay Hình 3.15: Giao di n th ng kê s n lư ng bay Ngoài các ch c năng trích l c thông tin t ñi n văn k ho ch bay, 3.5. Đánh giá k t qu th i ti t, chương trình còn có nh ng ch c năng khác như: Trong quá trình th c hi n chương này, tôi ñã áp d ng thành công - Đ tìm ñi n văn k ho ch bay ta chon tab Tìm ĐV k ho ch các k thu t trích l c thông tin, khai phá d li u vào ng d ng. D a vào bay, ch n ngày ho c s th t c a ñi n văn ñ tìm nhu c u tra c u thông tin, th ng kê s n lư ng bay c a các ki m soát viên không lưu ñang công tác t i Đài ch huy c t h cánh Đà N ng ñ t ñó xây d ng “H th ng thu nh n và x lý các thông tin ñi n văn” ñ h tr trong công tác ki m tra, th ng kê, l p báo cáo v các thông tin hàng không t i Trung tâm Qu n lý bay Đà N ng. Tuy nhiên, trong ng d ng v n còn t n t i nh ng h n ch là chưa th ñ c và phân tích t ng c m t c th có trong ñi n văn k ho ch bay hay ñi n văn th i ti t ñ ñưa ra chi ti t ý nghĩa c a t ng c m t ñó. Hình 3.10: Giao di n tìm ñi n văn k ho ch bay theo ngày - Ngoài các ch c năng tìm và trích l c thông tin t ñi n văn k ho ch bay, ñi n văn th i ti t, ng d ng còn có th th ng kê s n lư ng bay bao g m các chuy n bay ñi, bay ñ n sân bay Đà N ng theo ngày ho c tháng d a vào các lo i ñi n văn trên. Dư i ñây là giao di n th ng kê s n lư ng bay.
  14. 27 K T LU N V i m c tiêu gi m thi u ñ n m c t i ña các sai sót không ñáng có c a ki m soát viên không lưu nh m ph c v công tác ñi u hành bay an toàn tuy t ñ i. Sau quá trình th c hi n ñ tài, bư c ñ u tôi ñã áp d ng k thu t trích l c thông tin, khai phá d li u ñ xây d ng thành công “ H th ng thu nh n và x lý thông tin ñi n văn”, và ñã ñư c ñưa vào s d ng. ng d ng ñã ph n nào giúp ích cho các ki m soát viên không lưu trong vi c khai thác thông tin trong m ng vi n thông c ñ nh hàng không. Ngoài ra nó còn giúp cho vi c th ng kê s n lư ng bay tr nên d dàng thu n l i hơn. ng d ng ñã ph n nào giúp ích cho các ki m soát vi n không lưu ph n trong vi c xem các ñi n văn k ho c bay ho c th i ti t m t cách d dàng hơn. Nó còn giúp cho vi c th ng kê s n lư ng bay tr nên nhanh chóng và chính xác hơn so v i vi c th ng kê b ng tay M c dù ñã xây d ng h th ng thành công nhưng nh ng gì tôi làm ñư c v n ch là bư c ñ u và còn có nhi u gi i h n. ng d ng chưa ñáp ng ñư c trong vi c tra c u t t c các thông tin ñư c chuy n t i trên m ng AFTN mà các ki m soát viên không lưu c n. Tôi hy v ng r ng nh ng nghiên c u và s n ph m c a tôi s ñư c ti p t c phát tri n và th t s có ích hơn n a cho các ki m soát viên không lưu ñang công tác t i Đài ch huy c t h cánh sân bay Đà N ng. Đ ng d ng th c s hoàn ch nh, có th ti p t c phát tri n h th ng nh m tra c u ñư c t t c các thông tin khác liên quan ñ n lĩnh v c hàng không. D a vào các thông tin có trong k ho ch bay ñ ñưa ra các c nh báo cho ki m soát viên không lưu như: hai máy bay có cùng m c bay g n nhau, hai máy bay cùng trên m t ñư ng bay nhưng t c ñ bay khác nhau, thông tin d báo v nh ng hi n tư ng th i ti t b t thư ng s p x y ra.
ADSENSE
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2