intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Xây dựng cơ sở dữ liệu giao thông sử dụng phương pháp phân tích tương quan

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:3

12
lượt xem
5
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết này giới thiệu phương pháp xây dựng CSDL giao thông sử dụng phân tích tương quan theo thời gian giữa các đặc trưng của dòng xe sử dụng dữ liệu lưu lượng xe trên một đoạn đường cao tốc của Singapore.

Chủ đề:
Lưu

Nội dung Text: Xây dựng cơ sở dữ liệu giao thông sử dụng phương pháp phân tích tương quan

  1. Tuyển tập Hội nghị Khoa học thường niên năm 2023. ISBN: 978-604-82-7522-8 XÂY DỰNG CƠ SỞ DỮ LIỆU GIAO THÔNG SỬ DỤNG PHƯƠNG PHÁP PHÂN TÍCH TƯƠNG QUAN Trịnh Đình Toán Trường Đại học Thủy lợi, email: trinhdinhtoan@tlu.edu.vn 1. TỔNG QUAN đường cao tốc của Singapore. Tác giả là người trực tiếp thực hiện việc thu thập và Để thiết lập các biện pháp quản lý và tổ phân tích dữ liệu, sử dụng công thức tính hệ chức giao thông cần phải xây dựng một cơ sở số tương quan, môt chỉ số thống kê đo lường dữ liệu (CSDL) đầy đủ về các đặc tính dòng mức độ mạnh yếu của mối quan hệ giữa hai xe như tốc độ, mật độ, lưu lượng và thời gian đại lượng. xe chạy trên các cung đường của mạng lưới giao thông. Các CSDL thường tồn tại dưới 2. PHƯƠNG PHÁP PHÂN TÍCH TƯƠNG hai dạng: CSDL lịch sử (HDB) và CSDL thời QUAN gian thực (RTDB) [1]. HDB lưu trữ dữ liệu về các đặc tính dòng xe, thông tin sự cố và Hệ số tương quan ξ giữa hai mẫu ngẫu các thuộc tính mạng lưới, phục vụ cho các nhiên X và Y được thống kê như sau: mục tiêu dài hạn và trung hạn như quy hoạch cov( X , Y )   corr( X , Y )  (1) và quản lý giao thông, RTDB lưu trữ dữ liệu var( X )var(Y ) về dòng xe theo thời gian thực, chủ yếu phục trong đó: cov(X,Y) = E(XY)  E(X)E(Y), là hiệp vụ cho các mục tiêu ngắn hạn là tổ chức giao phương sai của hai mẫu ngẫu nhiên X và Y; thông [2]. Các HDB và RTDB thường có tùy var(X) và var(Y) lần lượt biểu thị phương sai chọn sử ngôn ngữ có cấu trúc (SQL) tiêu của các mẫu X và Y. chuẩn để truy vấn và duy trì cơ sở dữ liệu. Hệ số tương quan ξ biến thiên trong khoảng Để đảm bảo các chức năng trên cần xây từ 1 đến 1. Các giá trị gần bằng 1 cho thấy dựng một cơ sở giàu dữ liệu theo thời gian và các mẫu có mối tương quan thuận chặt chẽ, không gian, khả dụng cho mọi tình huống. các giá trị gần 0 biểu thị mức độ tương quan Tuy nhiên trên thực tế không phải lúc nào (thuận, nghịch) thấp, các giá trị gần 1 biểu cũng có đủ hệ thống quan trắc và thu thập dữ thị mối tương quan nghịch chặt chẽ. liệu, do vậy cần áp dụng các giải pháp khác Một trong những ứng dụng của phương nhau để làm giàu các CSDL. Các nghiên cứu pháp này là xác lập mức độ tương quan giữa xưa nay chỉ ra rằng dữ liệu dòng xe có xu các đại lương theo chuỗi thời gian. Trên thực hướng lặp lại theo thời gian, đặc biệt là theo tế, các số liệu giao thông thường được cung ngày trong tuần, và giữa chúng có mối liên cấp bởi các hệ thống quan trắc dữ liệu với độ hệ khá chặt chẽ, và phân tích tương quan là phân giải khoảng 5-10 phút cập nhật một lần một công cụ hữu hiệu để xác định các mối theo phương thức 24/7, vì vậy số liệu giao liên hệ giữa các đặc tính giao thông, cho phép thông trong một ngày hình thành một biểu đồ giảm thiểu số lượng quan trắc [1,2]. Bài viết có tính chất lặp lại theo chu kỳ từ ngày này này giới thiệu phương pháp xây dựng CSDL qua ngày khác, vì vậy giữa chúng có mối giao thông sử dụng phân tích tương quan tương quan. Điều đó cho phép hợp nhất và theo thời gian giữa các đặc trưng của dòng xe hiển thị một lượng dữ liệu khổng lồ qua các sử dụng dữ liệu lưu lượng xe trên một đoạn biểu đồ dòng xe. 161
  2. Tuyển tập Hội nghị Khoa học thường niên năm 2023. ISBN: 978-604-82-7522-8 3. ÁP DỤNG PHÂN TÍCH TƯƠNG QUAN ứng với các dãy dữ liệu trong hai ngày nhất CHO LƯU LƯỢNG XE định của CSDL. Bảng 1 tổng hợp các hệ số tương quan Phần này trình bày việc áp dụng phân tích trung bình của lưu lượng truy cập trên phân tương quan giữa các biểu đồ lưu lượng xe đoạn #80007762 cho hai trường hợp: "trong chạy trên đoạn #80007762 (Hình 1) thuộc cùng ngày" và "giữa các ngày” trong tuần. đường cao tốc Pan Island Expressway (PIE) ở Trường hợp thứ nhất phản ánh mối tương Singapore do Tổng cục Đường bộ (LTA) quan giữa một ngày làm việc bất kỳ (từ Thứ Singapore cung cấp qua mạng dưới dạng Hai đến thứ Sáu) với các ngày khác có cùng Ngôn ngữ XML (Extensible Markup thứ trong tuần, ví dụ giữa một ngày thứ Hai Language). Dữ liệu thời gian thực, được cập với các ngày thứ Hai khác trong dữ liệu được nhật 5 phút một lần, bao gồm dữ liệu về lưu phân tích. Trường hợp thứ hai biểu thị mối lượng và vận tốc xe, tin tức giao thông, thông tương quan giữa một ngày nhất định với các tin sự cố và tệp hình ảnh từ các vị trí camera ngày khác trong tuần, ví dụ giữa ngày thứ khác nhau. Thông qua các cảm biến giao Hai với ngày thứ Ba hoặc thứ Tư, … Kết quả thông và camera giám sát, người vận hành có cho thấy hệ số tương quan là khá cao trong được dữ liệu và hình ảnh thời gian thực cần trường hợp "trong cùng ngày", từ 0,93 đến thiết để giám sát hệ thống. Các dữ liệu có thể 0,95. Trong trường hợp "giữa các ngày” được thu thập để xây dựng các CSDL HDB và trong tuần, các giá trị nằm trong khoảng từ RTDB. Các dữ liệu thuộc HDB có thể được 0,90 đến 0,94 cho mối tương quan giữa các sử dụng để thiết lập các biểu đồ lưu lượng xe ngày làm việc và từ 0,76 đến 0,77 cho mối chạy cho các đoạn đường khác nhau theo các tương quan ngày làm việc - ngày nghỉ (thứ ngày làm việc và ngày nghỉ trong tuần. Bảy, Chủ Nhật). Đặc biệt, hệ số tương quan giữa các ngày làm việc với ngày Thứ Bảy thay đổi trong khoảng 0,8147 - 0,8678, và giữa các ngày làm việc và ngày Chủ Nhật thay đổi trong khoảng 0,7579 - 0,7957, có lẽ do thực tế vẫn có một bộ phận công chức đi làm vào ngày Thứ Bảy, trong khi Chủ Nhật là ngày nghỉ hoàn toàn. Lưu ý rằng dữ liệu trong phân tích tương quan (vectơ X và Y, biểu thức (1)) là độc lập, do đó các hệ số trong đường chéo không chính xác bằng 1. Hình 1. Đoạn nghiên cứu (#80007762, PIE) Bảng 1. Phân tích tương quan của lưu lượng giao thông theo chuỗi thời gian Một phân tích tương quan sử dụng dữ liệu (n là số tuần trong giai đoạn phân tích) về lưu lượng xe chạy cho đoạn #80007762 Chủ Thứ Hai Ba Tư Năm Sáu Bảy trong toàn bộ thời gian 12 tháng của năm nhật 2020 đã được tiến hành để đánh giá mức độ Hai 0,9348 tương quan giữa các biểu đồ lưu lượng. Lưu Ba 0,9316 0,9475 lượng xe trong một ngày được cập nhật 5 Tư 0,9356 0,9356 0,9427 phút một lần từ hệ thống, tạo thành một mẫu Năm 0,9367 0,9389 0,9345 0,9443 chuỗi thời gian bao gồm 288 khoảng thời Sáu 0,9378 0,9385 0,8988 0,9406 0,9368 gian liên tiếp. Hệ số tương quan ξ giữa hai Bảy 0,8207 0,8389 0,8147 0,8537 0,8678 0,9301 mẫu ngẫu nhiên X và Y được xác lập sử dụng Chủ 0,7694 0,7746 0,7665 0,7579 0,7957 0,7865 0,9305 biểu thức (1), trong đó các mẫu X và Y tương nhật 162
  3. Tuyển tập Hội nghị Khoa học thường niên năm 2023. ISBN: 978-604-82-7522-8 Hình 2 biểu thị các biểu đồ lưu lượng xe biệt là trường hợp “trong cùng ngày” và trên đoạn 80007762. Có thể nhận thấy tính tương quan cao trong trương hơp “giữa các chất lặp lại rất rõ ràng của các biểu đồ lưu ngày”. Điều đó cho thấy phân tích tương lượng, đặc biệt là những ngày làm việc. Ngày quan là một công cụ hữu hiệu trong việc xây chủ nhật có biểu đồ khác hẳn các ngày làm dựng và khai thác các CSDL giao thông, đặc việc trong tuần và không thể hiện rõ các giờ biệt là ở Việt Nam khi các CSDL giao thông cao điểm sáng và chiều. còn thiếu do các hệ thống quan trắc chưa đẩy đủ và chưa đồng bộ. Tuy nhiên, phân tích ở 9000 trên mới chỉ áp dụng cho đường cao tốc, một 8000 loại đường có đặc thù giao thông chạy đường 7000 dài, liên tục, tính cơ động cao. Với các hệ Flow rate (Veh./h) 6000 5000 thống giao thông đô thị cần có các nghiên 4000 Monday cứu chuyên sâu. Tuesday 3000 2000 Wednesday Thursday Ngoài ra, mức độ tương quan cao của các 1000 Friday Saturday mẫu lưu lượng xe cho thấy rằng các dữ liệu Sunday 0 lịch sử, ở một mức độ nào đó, có thể được sử 120 150 180 210 240 270 30 60 90 0 ThờiTime of day (5 min.) phút) gian trong ngày (5 dụng làm cơ sở để dự báo lưu lượng giao thông ngắn hạn trong trường hợp dữ liệu thời Hình 2. Các biểu đồ lưu lượng gian thực bị thiếu hoặc bị bội nhiễm. trên phân đoạn #80007762 5. TÀI LIỆU THAM KHẢO 4. KẾT LUẬN [1] Toan, T. D. 2008. “Development of a fuzzy Bài viết này giới thiệu phương pháp làm knowledge-based system for local traffic control for incident management”. PhD giàu các CSDL sử dụng phân tích tương Thesis. School of Civil & Environmental quan, tận dụng tính chất lặp lại theo chu kỳ Engineering, Nanyang Technological theo ngày của dòng giao thông. Tính chất University. tương quan được áp dụng cho phân tích các [2] Toan, T. D., and V. H. Truong. 2021. biểu đồ lưu lượng xe chạy trên một đoạn “Support vector machine for short-term traffic thuộc đường cao tốc Pan Island Expressway flow prediction and improvement of its model ở Singapore. Kết quả cho thấy mức tương training using nearest neighbor approach”. quan chặt chẽ giữa các ngày làm việc và, đặc Transp. Res. Rec. 2675(4) 362-373. 163
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
21=>0