intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn Thạc sĩ Khoa học máy tính: Trực quan hoá trạng thái giao thông Hà Nội trên nền bản đồ số

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:77

10
lượt xem
3
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Nội dung luận văn được trình bày trong các chương chính sau: Chương 1 – Khái quát về Trực quan hóa và bài toán trực quan hóa trạng thái giao thông Hà Nội; Chương 2 - Một số hỗ trợ trực quan hóa trạng thái giao thông Hà Nội trên nền bản đồ số; Chương 3 - Thực nghiệm và đánh giá hệ thống Trực quan hóa trạng thái giao thông Hà Nội. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Luận văn Thạc sĩ Khoa học máy tính: Trực quan hoá trạng thái giao thông Hà Nội trên nền bản đồ số

  1. ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG Nguyễn Văn Thịnh TRỰC QUAN HOÁ TRẠNG THÁI GIAO THÔNG HÀ NỘI TRÊN NỀN BẢN ĐỒ SỐ LUẬN VĂN THẠC SỸ CHUYÊN NGÀNH KHOA HỌC MÁY TÍNH THÁI NGUYÊN - 2015
  2. ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG Nguyễn Văn Thịnh TRỰC QUAN HOÁ TRẠNG THÁI GIAO THÔNG HÀ NỘI TRÊN NỀN BẢN ĐỒ SỐ Chuyên ngành: Khoa học máy tính Mã số: 60 48 0101 LUẬN VĂN THẠC SỸ CHUYÊN NGÀNH KHOA HỌC MÁY TÍNH Giáo viên hướng dẫn: TS. Nguyễn Ngọc Hóa THÁI NGUYÊN - 2015
  3. LỜI CẢM ƠN Trong quá trình học tập và hoàn thành luận văn tốt nghiệp, tôi đã nhận được rất nhiều sự giúp đỡ, động viên nhiệt tình từ thầy cô, gia đình và bạn bè. Và đó đã trở thành một nguồn động lực lớn giúp tôi có thể thực hiện được luận văn nghiên cứu được giao. Với tất cả sự cảm kích và trân trọng, tôi xin được gửi lời cảm ơn sâu sắc đến tất cả mọi người. Tôi xin bày tỏ sự cám ơn đặc biệt tới thầy TS Nguyễn Ngọc Hóa, người đã định hướng cho tôi trong lựa chọn đề tài luận văn, đưa ra những nhận xét quý giá và trực tiếp hướng dẫn tôi trong suốt quá trình nghiên cứu và hoàn thành luận văn tốt nghiệp. Tôi xin cảm ơn các thầy cô trong Trường Đại học Công Nghệ Thông Tin và truyền thông – Đại học Thái Nguyên đã dạy bảo tận tình cho tôi trong suốt khoảng thời gian học tập tại trường. Xin được gửi lời cảm ơn sâu sắc nhất tới gia đình của mình, nguồn động viên và cổ vũ lớn lao và là động lực giúp tôi thành công trong công việc và trong cuộc sống. Cuối cùng, xin cảm ơn tập thể lớp cao học CNTT K12E và đặc biệt những người bạn tốt đã ở bên tôi, khuyến khích, động viên tôi và cho tôi những lời khuyên chân thành trong cuộc sống và học tập. Xin trân trọng cảm ơn! Thái Nguyên, ngày 25 tháng 08 năm 2015 Học viên Nguyễn Văn Thịnh i
  4. LỜI CAM ĐOAN Tôi xin cam đoan kết quả đạt được trong luận văn là sản phẩm của riêng cá nhân tôi. Những điều được trình bày trong toàn bộ nội dung của luận văn, hoặc là của cá nhân hoặc là được tổng hợp từ nhiều nguồn tài liệu. Tất cả các tài liệu tham khảo đều có xuất xứ rõ ràng và được trích dẫn hợp pháp. Tôi xin hoàn toàn chịu trách nhiệm theo quy định cho lời cam đoan của mình. Thái Nguyên, ngày 25 tháng 08 năm 2015 Học viên Nguyễn Văn Thịnh ii
  5. MỤC LỤC LỜI CẢM ƠN..................................................................................................... i LỜI CAM ĐOAN .............................................................................................. ii MỤC LỤC ......................................................................................................... ii DANH MỤC CÁC HÌNH VẼ ............................................................................v DANH MỤC BẢNG BIỂU .............................................................................. vi LỜI MỞ ĐẦU ....................................................................................................1 CHƯƠNG 1: KHÁI QUÁT VỀ TRỰC QUAN HOÁ VÀ BÀI TOÁN TRỰC QUAN HÓA TRẠNG THÁI GIAO THÔNG HÀ NỘI ....................................2 1.1. Khái quát trực quan hóa...........................................................................2 1.1.1. Trực quan hóa ...................................................................................2 1.1.2. Trực quan hóa dữ liệu.......................................................................6 1.1.3. Trực quan hóa dữ liệu biểu diễn trạng thái giao thông ..................18 1.2. Bài toán trực quan Hóa trạng thái giao thông Hà Nội ...........................29 1.2.1. Bối cảnh hệ thống giao thông hiện nay của nước ta ..........................29 1.2.2. Bài toán trực quan hóa trạng thái hóa giao thông Hà Nội trên nền bản đồ số ........................................................................................................30 1.2.3. Mô hình trực quan hóa trạng thái giao thông .....................................31 1.2.4. Mô hình kiến trúc hệ thống giải pháp trực quan hoá trạng thái giao thông ........................................................................................................33 CHƯƠNG 2: MỘT SỐ HỖ TRỢ TRỰC QUAN HÓA TRẠNG THÁI GIAO THÔNG HÀ NỘI TRÊN NỀN BẢN ĐỒ SỐ .................................................34 2.1.Kỹ thuật và thuật toán ứng dụng trực quan hóa trạng thái giao thông ...34 2.1.1. Heatmap trực quan hóa tình trạng trên tuyến đường giao thông .34 2.1.2. Xây dựng biểu đồ thống kê dữ liệu trạng thái giao thông ...........40 2.1.3. D3JS .............................................................................................41 iii
  6. 2.1.4. Vẽ đồ họa thực hiện trực quan hóa .................................................43 2.2. Giải pháp trong quá trình triển khai ......................................................46 2.2.1. Kết hợp Leaflet và Heatmap ...........................................................46 2.2.2. Thao tác với dữ liệu dạng GeoJSON ..............................................46 2.2.3. Kết nối cơ sở dữ liệu.......................................................................47 2.2.4. Cập nhật dữ liệu thời gian thực ......................................................47 2.3. Công cụ hỗ trợ trực quan hoá trạng thái giao thông ..............................47 2.3.1. Google Maps...................................................................................47 2.3.2. Google Maps API ...........................................................................47 2.3.3. PostgreSQL/PostGIS ......................................................................48 2.3.4. Apache ............................................................................................50 2.3.5. Leaflet .............................................................................................51 CHƯƠNG 3: THỰC NGHIỆM VÀ ĐÁNH GIÁ HỆ THỐNG TRỰC QUAN HÓA TRẠNG THÁI GIAO THÔNG HÀ NỘI ................................................52 3.1. Phân tích thiết kế hệ thống ....................................................................52 3.1.1. Kiến trúc hệ thống ..........................................................................52 3.1.2. Chức năng hệ thống ........................................................................53 3.1.3. Lược đồ cơ sở dữ liệu .....................................................................55 3.2. Xây dựng ứng dụng và thử nghiệm .......................................................60 3.2.1. Môi trường ứng dụng ......................................................................60 3.2.2. Dữ liệu thử nghiệm .........................................................................60 3.3. Kết quả thử nghiệm ...............................................................................61 3.4. Đánh giá .................................................................................................65 KẾT LUẬN ......................................................................................................66 TÀI LIỆU THAM KHẢO ................................................................................68 iv
  7. DANH MỤC CÁC HÌNH VẼ Hình 1.1: Trực quan hóa khoa học mô phỏng sự bất ổn định Raleigh-Taylor bởi sự hòa trộn giữa 2 chất lưu. .........................................................................................3 Hình 1.2 : Trực quan hóa dữ liệu là một trong các bước trong phân tích và trình diễn dữ liệu. .................................................................................................................7 Hình 1.3: Mô hình khái niệm của trực quan hóa .............................................10 Hình 1.4: Vai trò của mô hình dữ liệu trong phần mềm trực quan hóa ..........10 Hình 1.5: Sơ đồ mô tả mô hình tham khảo trực quan hóa thông tin ...............11 Hình 1.6: Một trực quan hóa dữ liệu mạng xã hội ...........................................13 Hình 1.7: Bản chất của trực quan hóa dựa vào đánh giá mối quan hệ giữa 3 thành phần. ................................................................................................................15 Hình 2.1: Mô hình trực quan hóa trạng thái giao thông ...................................31 Hình 2.2: Mô hình kiến trúc hệ thống WebGIS ...............................................33 Hình 2.3 : kết quả hiển thị các điểm trên bản đồ ..............................................36 Hình 2.4 : Kết quả vẽ theo phương pháp “đóng hộp” ......................................36 Hình 2.5 : Kết quả vẽ theo phương pháp mật độ nhân .....................................38 Hình 2.6 : Tập các điểm biểu diễn trên tuyến đường .......................................39 Hình 2.7 : Luật vẽ trực giao .............................................................................44 Hình 3.1: Mô hình kiến trúc .............................................................................52 Hình 3.2 : Sơ đồ áp dụng mô hình trực quan hóa.............................................54 Hình 3.3: Lược đồ cơ sở dữ liệu .......................................................................56 Hình 3.4: Màn hình chương trình thử nghiệm .................................................62 Hình 3.5: Biểu đồ tổng hợp trạng thái giao thông theo thời điểm....................63 Hình 3.6: Biểu đồ tổng hợp trạng thái giao thông theo ngày ...........................63 Hình 3.7: Biểu đồ tổng hợp trạng thái giao thông theo tuần ............................64 Hình 3.8: Biểu đồ tổng hợp trạng thái giao thông theo tháng ..........................64 Hình 3.9: Trực quan trạng thái giao thông trên bản đồ theo thời điểm chọn ...65 v
  8. DANH MỤC BẢNG BIỂU Bảng 3.1: Trường dữ liệu thông tin trạng thái giao thông...............................57 Bảng 3.2: Trường dữ liệu thông tin tuyến đường giao thông..........................58 Bảng 3.3: Trường dữ liệu thống kê trạng thái giao thông theo ngày ...............58 Bảng 3.4: Trường dữ liệu thống kê trạng thái giao thông theo tuần ................59 Bảng 3.5: Trường dữ liệu thống kê trạng thái giao thông theo tháng ..............59 Bảng 3.6: Trường dữ liệu thống kê trạng thái giao thông theo năm ................60 vi
  9. LỜI MỞ ĐẦU Giao thông là một vấn đề quan trọng, trong đó ùn tắc giao thông vẫn là vấn đề “nóng” của các đô thị lớn, để giải quyết tình trạng ùn tắc giao thông trên địa bàn Hà Nội, ngành giao thông cần đẩy mạnh việc ứng dụng CNTT một cách tổng thể. Đó là các giải pháp thu thập thông tin giao thông; quy hoạch, điều tiết đường sá; điều khiển giao thông; xác định lưu lượng và cung cấp thông tin giao thông tới người tham gia giao thông, cảnh báo sớm cho người tham gia giao thông về tình trạng ùn tắc tại các tuyến phố, để người dân chủ động thay đổi phương tiện, hướng đi trên đường … Thực trạng đó chính là động lực chính để em chọn đề tài luận văn là “Trực quan hoá trạng thái giao thông Hà Nội trên nền bản đồ số” để thực hiện luận văn Cao học. Trong luận văn nghiên cứu mã số 01C-04/08-2014-2 của Sở KH-CN Hà Nội về “Hệ thống thông tin trạng thái giao thông thành phố Hà Nội: Thực trạng và giải pháp”, xây dựng thu thập và cung cấp thông tin trạng thái giao thông của một số tuyến phố chính Hà Nội. Dựa vào những kết quả thu thập được dữ liệu trạng thái giao thông Hà Nội từ các nguồn khác nhau (từ VOV giao thông, từ cộng đồng, từ các hệ thống camera giám sát giao thông, …). Với mục tiêu của cụ thể cần làm là ta hiển thị bản đồ các tuyến đường giao thông Hà Nội dựa trên nền bản đồ số, trên bản đồ này trực quan hình ảnh giao thông thời gian thực và hiển thị biểu đồ thống kê các mức độ tắc nghẽn giao thông tại các thời điểm. Từ đó cho phép người tham gia giao thông, cán bộ quản lý giao thông đô thị,… có thể quan sát, nắm bắt phân tích được một cách đầy đủ và dễ hình dung, dễ đánh giá, so sánh trạng thái các điểm nóng giao thông trong thành phố. Nội dung luận văn được trình bày trong các chương chính sau: Chương 1 – Khái quát về Trực quan hóa và bài toán trực quan hóa trạng thái giao thông Hà Nội Chương 2 - Một số hỗ trợ trực quan hóa trạng thái giao thông Hà Nội trên nền bản đồ số Chương 3 - Thực nghiệm và đánh giá hệ thống Trực quan hóa trạng thái giao thông Hà Nội 1
  10. CHƯƠNG 1: KHÁI QUÁT VỀ TRỰC QUAN HOÁ VÀ BÀI TOÁN TRỰC QUAN HÓA TRẠNG THÁI GIAO THÔNG HÀ NỘI 1.1. Khái quát trực quan hóa 1.1.1. Trực quan hóa Trực quan hóa (visualization) là kỹ thuật tạo ra những hình ảnh, biểu đồ để diễn tả thông điệp. Trực quan hóa nghiên cứu trình bày một cách trực quan, tương tác khối dữ liệu trừu tượng để tăng cường nhận thức của con người. Trực quan hóa thông qua những hình tượng trực quan đã diễn tả những ý tưởng trừu tượng và cụ thể từ thủa sơ khai của loài người. Những ví dụ trong lịch sử như những hình vẽ trong hang động, chữ tượng hình Ai Cập, hình học Hi Lạp và những phương pháp mang tính cách mạng của những bản vẽ kỹ thuật dành cho mục tiêu khoa học và công nghệ của Leonardo da Vinci [4]. Ngày nay, trực quan hóa đã mở rộng ứng dụng trong các ngành khoa học, đào tạo, công nghệ, môi trường tương tác, dược, .... điển hình của ứng dụng trực quan hóa là sử dụng đồ họa máy tính. Việc phát minh ra đồ họa máy tính có thể là sự phát triển quan trọng nhất của trực quan hóa kể từ khi phát minh ra cách phối cảnh trung tâm từ thời kỳ Phục Hưng. Và sự phát triển của animation cũng giúp gia tăng trực quan hóa. Việc sử dụng trực quan hóa để biểu diễn dữ liệu không phải là hiện tượng mới. Nó đã được sử dụng trong bản đồ, bản vẽ khoa học, những sơ đồ dữ liệu từ hàng ngàn năm trước. Đồ họa máy tính ngay từ khi ra đời đã được sử dụng để nghiên cứu các vấn đề khoa học. Tuy nhiên, trong những ngày đầu sự thiếu năng lực đồ họa đã hạn chế lợi ích của chúng. Tầm quan trọng của trực quan hóa như hiện nay bắt đầu từ năm 1987 khi xuất bản cuốn “Visualization in Scientific Computing, a special issue of Computer Graphics”. Từ đó đã có vài hội nghị, hội thảo đã được bảo trợ bởi IEE Computer Society và ACM SIGGRAPH dành cho những chủ đề thông thường và những lĩnh vực đặc biết như trực quan hóa khối lượng. 2
  11. Hầu hết mọi người thấy gần gũi với những hoạt họa số được sinh ra để biểu diễn dữ liệu khí tượng trong những bản tin thời tiết trên tivi, qua đó có thể phân biệt giữa những mô hình thực tế với những ảnh vệ tinh được thể hiện trong chương trình. Trên TV cũng thường có những trực quan hóa khoa học như thể hiện hoạt động của máy tính, hay những sự tái hiện hoạt động của phố xá hoặc những tai nạn máy bay, hay là những hoạt động của tàu vũ trụ. Một dạng động khác của trực quan hóa là những hoạt họa giáo dục hoặc những biểu diễn theo thời gian có khả năng làm nổi bật sự hiểu biết về hệ thống biến đổi theo thời gian. Trực quan hóa khoa học thường được thực hiện bởi những phần mềm chuyên biệt. Một số phần mềm chuyên biệt đó được phát hành dưới dạng mã mở và thường là bắt nguồn từ các trường đại học, trong môi trường học thuật thì việc chia sẻ công cụ phần mềm và cho phép sử dụng mã nguồn là bình thường. Bên cạnh đó, cũng có nhiều phần mềm bản quyền trực quan hóa khoa học. Hình 1.1: Trực quan hóa khoa học mô phỏng sự bất ổn định Raleigh-Taylor bởi sự hòa trộn giữa 2 chất lưu.  Trực quan hóa khoa học (Scientific visualization) Trực quan hóa khoa học là sự biến đổi, lựa chọn và biểu diễn dữ liệu từ thử nghiệm hoặc mô phỏng với cấu trúc hình học tuyệt đối hoặc rõ ràng để cho phép khảo sát, phân tích và hiểu dữ liệu. Trực quan hóa khoa học quan tâm và nhấn mạnh sự biểu diễn dữ liệu và sử dụng chủ yếu là kỹ thuật đồ họa và hoạt 3
  12. họa. Phần quan trọng nhất của trực quan hóa khoa học là biểu diễn trực quan các thí nghiệm và hiện tượng như nó đã xảy ra. Những khu vực truyền thống của trực quan hóa khoa học là: trực quan hóa dòng chảy, y khoa, thiên văn, hóa học  Trực quan hóa thông tin (Information visualization) Trực quan hóa thông tin tập trung những công cụ máy tính hỗ trợ để khảo sát lượng lớn dữ liệu trừu tượng. Cụm từ “information visualization” bao hàm lựa chọn, định dạng và biểu diễn dữ liệu theo dạng dễ hiểu và tham khảo cho người sử dụng. Điều quan trọng trong trực quan hóa thông tin là cường độ trực quan và tính tương tác. Những công nghệ mạnh mẽ cho phép người sử dụng thay đổi trực quan trong thời gian thực tạo ra khả năng tuyệt vời cảm nhận về nguyên mẫu và mối quan hệ cấu trúc với dữ liệu trừu tượng ban đầu.  Trực quan hóa giáo dục (Educational visualization) Trực quan hóa giáo dục ít khi sử dụng bộ giả lập mà thường tạo trước ở máy tính các hình ảnh về cái gì đó để phục vụ cho giáo dục. Nó rất hữu ích khi dạy những chủ đề khó như cấu trúc nguyên tử bởi vì nguyên tử quá nhỏ để nghiên cứu dễ dàng mà không tốn kém và rất khó có điều kiện để sử dụng những trang bị kỹ thuật cao cấp khi nghiên cứu  Trực quan hóa tri thức (Knowledge visualization) Là sử dụng biểu diễn trực quan hóa để chuyển đổi tri thức giữa ít nhất 2 người để cải thiện cách thức truyền tri thức bằng cách sử dụng các phương thức trực quan hóa sử dụng máy tính và không sử dụng máy tính bổ sung nhau. Một số định dạng trực quan như: trực quan hóa bằng bảng phác thảo, biểu đồ, hình ảnh, đối tượng, tương tác, các ứng dụng trực quan hóa thông tin và trực quan hóa ảo.  Trực quan hóa sản phẩm (Product visualization) Trực quan hóa sản phẩm bao gồm các công nghệ phần mềm trực quan để quan sát và vận hành mô hình 3D, bản vẽ kỹ thuật và những tài liệu liên quan khác của các thành phần sản xuất và khối lượng lớn các sản phẩm. Đó là 4
  13. một phần chủ chốt trong quản lý vòng đời sản phẩm. Phần mềm trực quan hóa sản phẩm điển hình cung cấp hình ảnh thực cấp độ cao của sản phẩm đó trước khi sản xuất. Mục đích của chức năng này xuyên suốt từ thiết kế và tạo kiểu dáng đến bán hàng và tiếp thị. Trực quan hóa sản phẩm là một hướng quan trọng của quá trình phát triển sản phẩm.  Truyền thông trực quan (Visual communication) Truyền thông trực quan là phương pháp truyền những ý tưởng thông qua hiển thị trực quan thông tin. Căn bản nó liên quan đến ảnh 2 chiều, nó bao gồm: chữ và số, nghệ thuật, ký hiệu và các tài nguyên điện tử. Nghiên cứu hiện nay hướng đến thiết kế web và tiện ích hướng đồ họa.  Phân tích trực quan (Visual analytics) Phân tích trực quan tập trung vào sự tương tác giữa con người với hệ thống trực quan hóa như một phần của quá trình phân tích dữ liệu. Phân tích trực quan được định nghĩa như là “môn khoa học phân tích được hỗ trợ bởi giao diện tương tác trực quan”. Trọng tâm của nó là sự trình bày thông tin trong không gian thông tin lớn và thay đổi liên tục. Nghiên cứu phân tích trực quan tinh lọc những sự vận hành thực tế và tri giác khiến cho người dùng xác định được những kết quả định trước và khám phá những kết quả không định trước không không gian thông tin phức tạp. Để trình bày dữ liệu một cách hiệu quả, việc trực quan hóa dữ liệu nên: - Hiển thị dữ liệu - Tạo cho người xem có những suy nghĩ về chất hơn là về các phương pháp luận, thiết kế đồ họa, công nghệ sản xuất đồ họa hay những thứ khác - Tránh bóp méo dữ liệu - Trình bày nhiều số trong một không gian nhỏ - Làm dữ liệu lớn trở nên mạch lạc - Kích thích mắt để so sánh các phần khác nhau của dữ liệu - Trình bày dữ liệu chi tiết ở nhiều cấp độ, từ tổng quan đến chi tiết 5
  14. - Được tích hợp chặt chẽ với các mô tả thống kê và lời nói của một tập dữ liệu 1.1.2. Trực quan hóa dữ liệu Trực quan hóa dữ liệu (data visualization hay data visualization) là một phân nhánh của trực quan hóa với những thống kê được trình bày bằng đồ họa và các thông tin địa lý hoặc dữ liệu không gian (như những bản đồ chuyên đề) được phân tán trong các dạng biểu đồ. Trực quan hóa dữ liệu được quan niệm bởi nhiều ngành lý thuyết tương đương như một mô hình hiện đại của truyền thông trực quan. Nó không thuộc riêng một lĩnh vực nào mà là sự giao thoa của nhiều ngành. Một số người quan niệm nó như một nhánh hiện đại của thống kê mô tả, một số khác coi nó là công cụ phát triển lý thuyết nền. Nó bao gồm sự sáng tạo và nghiên cứu phương thức trình diễn trực quan dữ liệu. Mục tiêu chính của trực quan hóa dữ liệu là truyền thông tin rõ ràng và hiệu quả cho người sử dụng thông qua đồ họa được lựa chọn như bảng biểu hoặc biểu đồ. Một trực quan hóa hiệu quả giúp cho người dùng đưa ra các phân tích và luận điểm về dữ liệu và luận cứ. Nó khiến dữ liệu phức tạp trở thành dễ hiểu và dễ sử dụng hơn. Người sử dụng có thể có những động tác phân tích đặc biệt như tạo phép so sánh, nhân quả và áp dụng thiết kế đồ họa (để hiển thị so sánh, nhân quả…). Bảng biểu thường được dùng khi xem xét phép đo lường của một biến và các loại biểu đồ sẽ hiển thị kết quả hoặc liên hệ với dữ liệu của một hay nhiều biến. Trực quan hóa dữ liệu có cả tính khoa học và nghệ thuật. Tốc độ dữ liệu sinh ra ngày càng lớn cùng với sự gia tăng của nền kinh tế phụ thuộc vào thông tin. Dữ liệu được tạo bởi hoạt động internet và sự tăng khối lượng cảm biến môi trường như dữ liệu vệ tinh và camera giao thông dẫn đến “Big Data”. Gia công, phân tích và liên kết dữ liệu hiện có ở nhiều định dạng khác nhau là thách thức lớn cho trực quan hóa dữ liệu. 6
  15. a) Tổng quan. Hình 1.2 : Trực quan hóa dữ liệu là một trong các bước trong phân tích và trình diễn dữ liệu. Trực quan hóa dữ liệu hướng đến những công nghệ sử dụng để truyền dữ liệu hoặc thông tin bằng cách chuyển đổi chúng thành các đối tượng trực quan được trình bày bằng đồ họa. Mục đích chính là làm cho thông tin rõ ràng và hiệu quả khi sử dụng. Nó là một trong các bước trong phân tích dữ liệu hoặc khoa học dữ liệu. Theo Friedman (2008) thì “Mục tiêu chính của trực quan hóa dữ liệu để làm thông tin rõ ràng và hiệu quả thông qua phương tiện đồ họa. Nó không có nghĩa trực quan hóa dữ liệu cần phải trông thật tẻ nhạt vì mục đích hiệu quả hay là trông thật phức tạp vì mục đích làm đẹp. Để truyền tải tính hiệu quả thì thẩm mỹ và chức năng phải đi cùng nhau, cung cấp cái nhìn vào bên trong khối dữ liệu phức tạp và rải rác bằng cách liên kết các khía cạnh chính của nó bằng cách trực quan hơn. Do đó, người thiết kế thường thất bại khi cố gắng đạt sự cân bằng giữa hình thức và chức năng, tạo nên sản phẩm đẹp tuyệt vời nhưng lại không chứa đựng được mục tiêu chính của nó là truyền tải thông tin” Bởi vậy, Fernanda Viegas và Martin M. Wattenberg đã đề xuất một ý tưởng trực quan hóa không chỉ là truyền tải thông tin rõ ràng mà còn khiến cho người xem chú ý và chờ đợi. 7
  16. Trực quan hóa dữ liệu liên hệ gần với trình bày dữ liệu bằng đồ họa, trực quan hóa thông tin, trực quan hóa khoa học, phân tích khảo sát dữ liệu và thống kê đồ họa. Trong thiên niên kỷ mới, trực quan hóa dữ liệu đa trở thành lĩnh vực năng động trong nghiên cứu, giảng dạy và phát triển. Trực quan hóa dữ liệu đã liên kết trực quan hóa khoa học và trực quan hóa thông tin. b) Những đặc điểm hiển thị hiệu quả bằng đồ họa Sơ đồ Charles Joseph Minard của Napoleon vào tháng Ba năm 1862 - một ví dụ đầu tiên của một đồ họa thông tin Người sử dụng của hiển thị dữ liệu thực thi những công tác phân tích cụ thể như tạo sự so sánh hay xác định nguyên nhân sự việc. Nguyên tắc thiết kế của hiện thị dữ liệu bằng đồ họa là cân phải hỗ trợ các công tác phân tích đó. Nó tuân theo nguyên tắc sau: Một thống kê trình bày bằng đồ họa xuất sắc bao gồm rất nhiều ý tưởng phức tạp để truyền tải một cách đúng đắn, chính xác và hiệu quả. Hiển thị bằng đồ họa cần phải: - Hiển thị được dữ liệu - Hiển thị thực chất dữ liệu hơn là phương pháp, thiết kế đồ hoạc hay công nghệ xây dựng đồ họa. - Tránh bóp méo ý nghĩa của dữ liệu - Hiển thị nhiều chữ số trong không gian nhỏ - Tạo sự liên kết trong khối dữ liệu lớn - Khuyến khích thị giác so sánh giữa các phần dữ liệu 8
  17. - Bộc lộ dữ liệu ở một vài cấp chi tiết, từ tổng quan tới cấu trúc tinh - Phục vụ một mục đích rõ ràng vừa phải: Diễn tả, khảo sát, sắp xếp dữ liệu hoặc biểu diễn, trang trí. - Kết hợp chặt chẽ giữa thống kê với diễn tả bằng lời về khối dữ liệu. 1.1.2.1. Kiến trúc và mô hình trực quan hóa dữ liệu a) Mô hình khái niệm [6,7] Mặc dụ trực quan hóa đã thay đổi nhanh chóng trong những thế kỷ gần đây, những công cụ và hệ thống hỗ trợ cho nó được phát triển đặc trưng hơn là được thiết kế chính thức. Thêm vào đó, có 2 phương hướng trực quan hóa song hành nhau. Thứ 1 là do sự tăng trưởng dữ liệu kèm theo sự giảm giá của thiết bị phần cứng hỗ trợ; Khi đó trực quan hóa thể hiện ở dạng quan trọng hơn trước kia đặc biệt là trong các lĩnh vực ứng dụng. Tuy nhiên, công nghệ hỗ trợ thường không áp dụng được cho nhiều ứng dụng. Xu hướng thứ 2 xuất phát từ sự dư thừa trong dữ liệu. Một cách tiếp cận không định trước tiêu biểu không định trước được độ lớn và phức tạp của vấn đề. Thay vì yêu cầu tính toán, sự truy cập dự liệu là trở ngại thông thường. Bước đầu tiên để phân tích trực quan hóa thành các tập chuyển đổi có thể làm nổi bật những giới hạn được xác định bằng mô hình khái niệm và phép phân loại phát triển. - Mô hình dữ liệu: Biểu diễn sự hiển thị dữ liệu - Mô hình người dùng: biểu diễn yêu cầu mà người dùng cần đáp ứng. - Mô hình tương tác: Biểu diễn sự tương tác giữa người dùng và hệ thống trực quan hóa. - Mô hình tính toán: Biểu diễn công thức tính toán - Mô hình truyền thông: Biểu diễn sự tương tác giữa các thành phần trong hệ thống. - Mô hình hiển thị: Biểu diễn kết quả thực thi các thuật toán biểu diễn dữ liệu. Mặc dù ý tưởng này đã được đề xuất từ trước đây nhưng cũng có những giới hạn khi chúng được xem như một tập các lớp. Hình bên trái thể hiện sự tương tác giữa các lớp của một trực quan hóa điển hình được hiển thị bao gồm các mũi tên có màu sắc khác nhau. Hình bên phải thể hiện rõ hơn vai trò của mô hình dữ liệu. 9
  18. Hình 1.3: Mô hình khái niệm của trực quan hóa  Các mô hình dữ liệu Mô hình dữ liệu là sự biểu diễn của dữ liệu, nó mô tả dữ liệu và cách sử dụng dữ liệu. Như tại hình 1.4 thể hiện mô hình dữ liệu là lớp biểu diễn logic và nằm ở giữa lớp biểu diễn vật lý và biểu diễn trực quan Hình 1.4: Vai trò của mô hình dữ liệu trong phần mềm trực quan hóa Trong trường hợp đặc biệt, lớp này cung cấp công cụ thông thường cho tất cả ứng dụng cho định dạng dữ liệu, cung cấp siêu dữ liệu. tạo công thức, thực thi. Lớp này cung cấp khả năng tính toán, phân tích và công cụ trực quan hóa, cung cấp hạ tầng để truy cập và biểu diễn dữ liệu. Giống như một hệ thống quản lý dựa trên dữ liệu, nó sẽ ở bên trên hệ điều hành và cho phép xây dựng các ứng dụng. Từ đó, mô 10
  19. hình dữ liệu sẽ ẩn đằng sau hệ thống tính toán ở bên dưới để mô phỏng, phân tích và trực quan hóa để người dùng tập trung vào nhận thức dữ liệu thông qua các cơ chế thông thường để truy cập, sử dụng và trao đổi. b) Mô hình tham khảo trực quan hóa thông tin Mô hình tham khảo trực quan hóa thông tin là một kiến trúc phần mềm mẫu phá vỡ quy trình trực quan hóa thành chuỗi các bước riêng rẽ, từ thu nhận dữ liệu và mô hình hóa đến mã hóa trực quan dữ liệu thành sự biểu diễn các hiển thị tương tác. Quá trình này được minh họa ở hình sau. Hình 1.5: Sơ đồ mô tả mô hình tham khảo trực quan hóa thông tin Dữ liệu nguồn được ánh xạ đến các bảng dữ liệu phía sau trực quan hóa. Những bảng dữ liệu phía sau này sau đó được sử dụng để xây dựng trừu tượng trực quan của dữ liệu, mô hình hóa các tính chất trực quan như vị trí, màu sắc, hình dáng,…Trừu tượng trực quan này sau đó được dùng để tạo cái nhìn tương tác với dữ liệu, với người sử dụng sự tương tác có khả năng thay đổi hiệu quả tại tất cả các mức của hệ thống. - Bước đầu tiên là tập hợp dữ liệu nguồn để tiến hành trực quan. Chúng có thể là bảng các hình, các đồ họa mạng xã hội, cấu trúc file hoặc bất kỳ tập dữ liệu nào đó. - Dữ liệu nguồn này sau đó được dùng để xây dựng các bảng dữ liệu, đó là những đặc trưng bên trong của dữ liệu khi nó được trực quan. Tiến trình chuyển đổi 11
  20. từ dữ liệu nguồn sang bảng dữ liệu có thể chỉ tập trung vào đọc dữ liệu ở file hoặc cơ sở dữ liệu nhưng cũng có thể bao gồm cả chuyển đổi dữ liệu. - Những bảng kết quả (cỏ thể biểu diễn cấu trúc dữ liệu theo hệ thống như biểu đồ hoặc cây) sau đó được ánh xạ trực quan để tạo ra trừu tượng trực quan là một mô hình dữ liệu bao gồm các đặc trưng trực quan như các lớp không gian, màu sắc, kích thước, hình thể. Những trừu tượng trực quan này có nhiệm vụ chứa đầy đủ thong tin cần thiết để biểu diễn trực quan dữ liệu. - Hành động biểu diễn dữ liệu trong trừu tượng trực quan được thực hiện thông qua tiến trình chuyển đổi quang cảnh, trong đó các thành phần biểu diễn sẽ vẽ ra nội dung của trừu tượng trực quan thành các quang cảnh tương tác. Những quang cảnh này có thể cung cấp những cách nhìn khác nhau của dữ liệu, ví dụ như cung cấp cách di chuyển và zoom đến khu vực đặc biệt bằng cách sử dụng chuỗi các hiển thị nhỏ và phức tạp để hiển thị các hình ảnh nhanh của dữ liệu thay đổi liên tục. - Người sử dụng tương tác với trực quan hóa (thường thông qua đầu vào là chuột và bàn phím) có thể phản hồi vào tiến trình này, gây ra sự thay đổi hoặc cập nhật bất cứ trạng thái nào của trực quan hóa. Ví dụ như kéo một đối tượng, phóng đến một quang cảnh hoặc mở một file dữ liệu khác. Mô hình tham khảo trình bày ở trên khá giống với mẫu mô hình hiển thị điều khiển (model-view-controller) thiết kế để thực thi giao diện người sử dụng.Mẫu này phân chia thành phần giao diện người sử dụng thành: - Một mô hình chứa những dữ liệu trả về - Một hoặc nhiều hướng nhìn thể hiện nội dung của mô hình - Bộ phận điều khiển cho phép người sử dụng bổ sung, cập nhập mô hình và hướng nhìn theo đáp ứng. Mô hình trực quan hóa tham chiếu này mở rộng mẫu thông thường bằng cách thêm vào các mức. Những bảng dữ liệu chứa những mô hình dữ liệu cơ bản cho rất nhiều loại trực quan hóa mà mỗi sự trừu tượng trực quan chưa một mô hình trực quan riêng với hướng nhìn và điều khiển của chính nó. 12
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2