ĐẠI HC QUC GIA HÀ NI
TRƯỜNG ĐẠI HC CÔNG NGH
TRNH BÁ QUÝ
PHÂN TÍCH VÀ MÔ PHNG TÌNH TRNG GIAO THÔNG
DA VÀO KHAI PHÁ D LIU CỦA PHƯƠNG TIỆN VN TI
LUẬN VĂN THẠC SĨ KHOA HC MÁY TÍNH
HÀ NI - 2018
ĐẠI HC QUC GIA HÀ NI
TRƯỜNG ĐẠI HC CÔNG NGH
TRNH BÁ QUÝ
PHÂN TÍCH VÀ MÔ PHNG TÌNH TRNG GIAO THÔNG
DA VÀO KHAI PHÁ D LIU CỦA PHƯƠNG TIỆN VN TI
Ngành: Khoa hc máy tính
Chuyên ngành: Khoa hc máy tính
Mã S: 8480103.01
LUẬN VĂN THẠC SĨ KHOA HC MÁY TÍNH
NGƯỜI HƯỚNG DN KHOA HC: PGS.TS PHAN XUÂN HIU
TS. NGUYỄN VĂN TĂNG
HÀ NI - 2018
i
MC LC
LỜI CẢM ON ..................................................................................................... iii
LỜI CAM ĐOAN ............................................................................................... iv
DANH MC HÌNH V ...................................................................................... v
DANH MC BNG .......................................................................................... vii
M ĐẦU ........................................................................................................... viii
Chương 1: Khái quát bài toán khai phá dữ liệu phương tiện vn ti ............ 1
1.1 Tng quan v d liu GPS ........................................................................ 1
1.1.1 Phn không gian.................................................................................... 2
1.1.2 Phn kim soát ...................................................................................... 2
1.1.3 Phn s dng ......................................................................................... 3
1.2 D liệu phương tiện vn ti ...................................................................... 3
1.3 Các ng dng ca khai phá d liệu phương tiện vn ti ....................... 5
Chương 2: Một s nghiên cu v phân tích, mô phng tình trng giao thông
............................................................................................................................... 7
2.1 Thut toán phân cm TRACLUS ............................................................ 8
2.1.1 Phân vùng quãng đường ..................................................................... 10
2.1.2 Phân cm ............................................................................................. 12
2.2 Mô hình giao thông dựa trên “PageRank ........................................... 15
2.2.1 Xếp hng bng duyt web................................................................... 15
2.2.2 Damping factor trong PageRank ........................................................ 16
2.2.3 PageRank có trng s ......................................................................... 17
2.2.4 Xếp hng bng taxi ............................................................................. 18
2.3 S dng xích Markov trong d đoán điểm đến tiếp theo .................... 19
2.3.1 Xích Markov ....................................................................................... 19
2.3.2 Xích Markov di động (Mobility Markov Chain - MMC) .................. 22
ii
2.3.3 S dng n-MMC để d đoán điểm đến tiếp theo ............................... 24
Chương 3: Xây dựng h thng phân tích, mô phng tình trng giao thông 28
3.1 Các đề xut ............................................................................................... 28
3.1.1 Đề xut phân vùng bản đồ Hà Ni ..................................................... 28
3.1.2 Cách tính xếp hng cho PageRank có trng s .................................. 29
3.1.3 S dng mô hình n-MMC vi các nhãn v xếp hng ......................... 29
3.2 Tng quan h thng ................................................................................. 30
Chương 4: Th nghiệm và đánh giá ................................................................ 33
4.1 Tng quan v d liu s dụng trong đềi ........................................... 33
4.1.1 Định dng d liu ............................................................................... 33
4.1.2 D liu t thiết b giám sát hành trình ................................................ 33
4.1.3 D liu t ng dụng đặt taxi, điều phi taxi ....................................... 35
4.1.4 D liu x lý trong h thng ............................................................... 36
4.2 La chn công ngh ................................................................................. 37
4.2.1 Ngôn ng Nodejs ................................................................................ 37
4.2.2 Ngôn ng python ................................................................................ 38
4.2.3 Cơ sở d liu Mongo .......................................................................... 38
4.2.3.2 Kiến trúc ca MongoDB .................................................................. 40
4.3 Kết qu thu được ..................................................................................... 41
4.3.1 Môi trường th nghim ....................................................................... 41
4.3.2 Kết qu th nghim............................................................................. 42
4.4 Tính chính xác ca d liu d đoán ...................................................... 46
KT LUN ........................................................................................................ 48
TÀI LIU THAM KHO ................................................................................ 49
iii
LỜI CẢM ON
Lời đầu tiên, tôi xin bày t s cm ơn chân thành đối vi Thy giáo, Tiến
Phan Xuân Hiếu và Thy giáo, Tiến Nguyễn Văn Tăng hai giáo viên ng
dn ca tôi. Hai thy đã cho tôi những gi ý và ch dẫn quý báu, cũng như nguồn
d liệu để thc nghiệm trong đề tài, tôi đã không thể hoàn thành luận văn nếu
không có s ch bo ca hai thy.
Tôi xin cảm ơn Công ty Trách nhiệm hu hn phát trin Công ngh Đin
t Bình Anh Công ty C phn Công ngh AIB Việt Nam đã cung cp d liu
phc v cho nghiên cu trong luận văn.
Tôi xin gi li cảm ơn tới các Thy trong khoa Công ngh thông tin,
trường Đại hc Công nghệ, Đại hc Quc gia Hà Nội đã dìu dắt, hướng dn, dy
d cũng như chỉ bo tạo điều kin cho tôi hc tp nghiên cu tại trường
trong sut thi gian va qua.
Tôi xin cảm ơn những người thân trong gia đình, bạn bè, đng nghiệp đã
quan tâm, động viên giúp đ, tạo điều kin cho tôi trong thi gian hc tp
nghiên cu luận văn tốt nghip.
Mặc đã cố gng hoàn thành luận văn nhưng chắc chn s không tránh
khi nhng sai sót, tôi kính mong nhận được s thông cm ch bo ca các
thy cô và các bn.
Xin chân thành cảm ơn.