ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
HOÀNG XUÂN PHƯƠNG
XÂY DỰNG QUY TRÌNH VÀ CÔNG CỤ BIÊN TẬP DỮ LIỆU BIÊN GIỚI, ĐỊA GIỚI CHO NỀN TẢNG CUNG CẤP DỊCH VỤ ĐỊA CHỈ VIỆT NAM
LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN
Hà Nội – 10/2020
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Hoàng Xuân Phương
XÂY DỰNG QUY TRÌNH VÀ CÔNG CỤ BIÊN TẬP DỮ LIỆU BIÊN GIỚI, ĐỊA GIỚI CHO NỀN TẢNG CUNG CẤP DỊCH VỤ ĐỊA CHỈ VIỆT NAM
Ngành: Hệ thống thông tin
Chuyên ngành: Hệ thống thông tin
Mã Số: 8480104.01
LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS. Bùi Quang Hưng
Hà Nội – 10/2020
i
Mục lục
LỜI CẢM ƠN ............................................................................................... III
LỜI CAM ĐOAN ......................................................................................... IV
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT .................................. V
DANH MỤC BẢNG BIỂU .......................................................................... VI
DANH MỤC HÌNH VẼ .............................................................................. VII
CHƯƠNG 1:GIỚI THIỆU ............................................................................. 1
1.1 ĐẶT VẤN ĐỀ, ĐỊNH HƯỚNG NGHIÊN CỨU ................................................ 1 1.2 MỤC TIÊU CỦA LUẬN VĂN ...................................................................... 2 1.3 PHẠM VI NGHIÊN CỨU CỦA LUẬN VĂN .................................................... 2 1.4 NỘI DUNG CỦA LUẬN VĂN ...................................................................... 2
CHƯƠNG 2: .. TỔNG QUAN VỀ DỮ LIỆU BIÊN GIỚI ĐỊA GIỚI CHO NỀN TẢNG CUNG CẤP DỊCH VỤ ĐỊA CHỈ ............................................ 4
2.1 NỀN TẢNG CUNG CẤP DỊCH VỤ ĐỊA CHỈ VIỆT NAM ................................. 4 2.1.1 Giới thiệu ...................................................................................... 4 2.1.2 Bản đồ số ...................................................................................... 7 2.1.3 Loại dữ liệu trên bản đồ số ........................................................... 7 2.2 DỮ LIỆU BIÊN GIỚI, ĐỊA GIỚI ................................................................... 9 2.2.1 Bản đồ địa hình ............................................................................. 9 2.2.2 Biên giới ...................................................................................... 12 2.2.3 Địa giới ....................................................................................... 13 2.2.4 Bản đồ địa hình 1/50.000 ............................................................ 14 2.2.5 Hệ quy chiếu VN2000 ................................................................. 14 2.2.6 OSM ............................................................................................ 15
CHƯƠNG 3: .. XÂY DỰNG QUY TRÌNH VÀ CÔNG CỤ BIÊN TẬP DỮ LIỆU BIÊN GIỚI ĐỊA GIỚI ....................................................................... 16
3.1 QUY TRÌNH BIÊN TẬP DỮ LIỆU BIÊN GIỚI ĐỊA GIỚI ................................. 17 3.2 TRÍCH XUẤT DỮ LIỆU BIÊN GIỚI QUỐC GIA VÀ DỮ LIỆU ĐỊA GIỚI HÀNH CHÍNH TỪ TẬP DỮ LIỆU BẢN ĐỒ ĐỊA HÌNH ..................................................... 18 3.3 GỘP CÁC MẢNH BẢN ĐỒ THEO CẤP HÀNH CHÍNH: XÃ, HUYỆN, TỈNH ...... 23 3.3.1 Gộp các mảnh rời rạc lại thành một mảnh thống nhất: ............. 23
ii
3.3.2 Loại bỏ đường chia cắt của các mảnh sau khi gộp: ................... 25 3.4 BỔ SUNG THÔNG TIN HÀNH CHÍNH CẤP HUYỆN, TỈNH ........................... 26 3.5 SỬA LỖI SAU KHI GỘP ........................................................................... 30 3.6 CHUYỂN ĐỔI HỆ QUY CHIẾU TỪ VN2000 SANG WGS84 ...................... 39 3.6.1 Tham số chuyển đổi và lưới chiếu .............................................. 39 3.6.2 Thêm phương pháp chuyển đổi hệ quy chiếu: ............................ 41 3.6.3 Chuyển đổi hệ quy chiếu của dữ liệu: ........................................ 43
3.7 XÂY DỰNG CÔNG CỤ CHUYỂN ĐỔI DỮ LIỆU TỪ SHAPEFILE SANG ĐƯỜNG BOUNDARIES TRÊN OSM ............................................................................. 44 3.7.1 Cấu trúc của một tập tin tin OSM ............................................... 45 3.7.2 Các bước tiền xử lý dữ liệu shapefile ......................................... 47 3.7.3 Quy trình xây dựng chương trình xử lý ...................................... 51
CHƯƠNG 4:KẾT QUẢ VÀ ĐÁNH GIÁ ................................................... 53
KẾT LUẬN .................................................................................................... 61
TÀI LIỆU THAM KHẢO ............................................................................ 62
iii
LỜI CẢM ƠN
Trước tiên tôi xin dành lời cảm ơn chân thành và sâu sắc đến thầy giáo, TS. Bùi Quang Hưng – người đã hướng dẫn, khuyến khích, chỉ bảo và tạo cho tôi những điều kiện tốt nhất từ khi bắt đầu cho tới khi hoàn thành công việc của mình.
Tôi xin dành lời cảm ơn chân thành tới các thầy cô giáo khoa Công nghệ thông tin, trường Đại học Công nghệ, ĐHQGHN đã tận tình đào tạo, cung cấp cho tôi những kiến thức vô cùng quý giá và đã tạo điều kiện tốt nhất cho tôi trong suốt quá trình học tập, nghiên cứu tại trường.
Đồng thời tôi xin cảm ơn tất cả những người thân trong gia đình tôi cùng toàn thể bạn bè những người đã luôn giúp đỡ, động viên tôi những khi vấp phải những khó khăn, bế tắc.
Cuối cùng, tôi xin chân thành cảm ơn các đồng nghiệp của tôi tại Trung tâm tích hợp liên ngành và giám sát hiện trường - FIMO đã giúp đỡ, tạo điều kiện thuận lợi cho tôi học tập và nghiên cứu chương trình thạc sĩ tại Đại học Công nghệ, ĐHQGHN.
Luận văn này được hỗ trợ bởi đề tài nghiên cứu ứng dụng và phát triển công nghệ cấp quốc gia: "Nghiên cứu xây dựng Nền tảng cung cấp dịch vụ dữ liệu địa chỉ Việt Nam phục vụ phát triển các ứng dụng dân sinh”, Mã số: ĐTCT-KC-4.0-03/19/25.
iv
LỜI CAM ĐOAN
Tôi xin cam đoan rằng luận văn thạc sĩ hệ thống thông tin “Xây dựng quy trình và công cụ biên tập dữ liệu biên giới, địa giới cho nền tảng cung cấp dịch vụ địa chỉ Việt Nam” là công trình nghiên cứu của riêng tôi, không sao chép lại của người khác. Trong toàn bộ nội dung của luận văn, những điều đã được trình bày hoặc là của chính cá nhân tôi hoặc là được tổng hợp từ nhiều nguồn tài liệu. Tất cả các nguồn tài liệu tham khảo đều có xuất xứ rõ ràng và hợp pháp.
Tôi xin hoàn toàn chịu trách nhiệm và chịu mọi hình thức kỷ luật theo
quy định cho lời cam đoan này.
Hà Nội, ngày 01 tháng 10 năm 2020
Hoàng Xuân Phương
v
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
Thuật ngữ, khái niệm Định nghĩa Ghi chú
Các từ viết tắt CSDL OSM
NĐL GIS
ArcMap
Merge
Dissolve
VNPost APIs
Cơ sở dữ liệu. Open Street Map – Nền tảng bản đồ mở. Nền địa lý. Geographic information system – Hệ thống thông tin địa lý. Là một chương trình trong bộ phần mềm ArcGIS. ArcMap cho phép người sử dụng thực hiện các chức năng: hiển thị trực quan, tạo lập bản đồ, trợ giúp quyết định, trình bày, … Gộp 2 hoặc nhiều lớp bản đồ lại thành một lớp bản đồ duy nhất. Chập các đối tượng kề nhau thành một đối tượng duy nhất thông qua một hoặc nhiều thuộc tính chung. Tổng công ty bưu điện Việt Nam Application Programing Interface – Giao diện lập trình ứng dụng.
Node
Way
Relation
admin_level
Một điểm trên OSM được xác định bằng kinh độ, vĩ độ và ID. Được sử dụng trên OSM xác định bằng các Node để xác định các đối tượng dạng đường và ranh giới khu vực. Được sử dụng trên OSM để xác định mối quan hệ giữa các đối tượng Node, Way. Được sử dụng trong OSM để xác định cấp độ của đường boundaries.
vi
DANH MỤC BẢNG BIỂU
Bảng 1. Số lượng đơn vị địa giới hành chính tính đến 01/10/2020 ................ 13
Bảng 3-1. Bảng luật topology trong ArcMap ................................................. 31
Bảng 3-2. Bảng múi chiếu .............................................................................. 40
Bảng 4-1. Dữ liệu biên giới địa giới đã được biên tập từ csdl địa hình 1/50.000 .......................................................................................................... 53
Bảng 4-2. Địa danh hành chính việt nam tính tới 01/10/2020 ....................... 59
vii
DANH MỤC HÌNH VẼ
Hình ảnh 2.1. Kiến trúc tổng thể của nền tảng cung cấp dịch vụ dữ liệu địa chỉ Việt Nam ..................................................................................................... 5
Hình ảnh.2.2. Giao diện OSM ........................................................................ 15
Hình ảnh 3.1. Kiến trúc tổng quan của nền tảng cung cấp dịch vụ địa chỉ .... 16
Hình ảnh 3.2. Các bước biên tập dữ liệu biên giới địa giới của Việt Nam .... 18
Hình ảnh 3.3. Cấu trúc dữ liệu của bản đồ địa hình 1/50.000 ........................ 19
Hình ảnh 3.4. VN2000 múi 30 cho FME ......................................................... 20
Hình ảnh 3.5. Chuyển đổi dữ liệu sang shapefile ........................................... 21
Hình ảnh 3.6. Các shapefile thu được ............................................................. 22
Hình ảnh 3.7. Các bước gộp dữ liệu ............................................................... 23
Hình ảnh 3.8. Công cụ Merge của ArcMap .................................................... 24
Hình ảnh 3.9. Kết quả sau khi Merge ............................................................. 24
Hình ảnh 3.10. Công cụ Dissolve của ArcMap .............................................. 25
Hình ảnh 3.11. Kết quả sau khi Dissolve........................................................ 26
Hình ảnh 3.12. Bảng dữ liệu của ranh giới địa giới cấp xã sau khi gộp ......... 27
Hình ảnh 3.13. Bảng dữ liệu của ranh giới địa giới cấp huyện sau khi gộp ... 27
Hình ảnh 3.14. Bảng dữ liệu của ranh giới địa giới cấp tỉnh sau khi gộp ...... 28
Hình ảnh 3.15. Join sử dụng ArcMap ............................................................. 29
Hình ảnh 3.16. Kết quả thu được sau khi join ................................................ 30
Hình ảnh 3.18. Luật must not have gaps ........................................................ 36
Hình ảnh 3.19 Các vùng bị lỗi topology ......................................................... 37
Hình ảnh 3.20. Lỗi chồng đè giữa 2 polygon ................................................. 38
Hình ảnh 3.21. Lỗi polygon không khép kín .................................................. 38
Hình ảnh 3.22. Lỗi đường phân chia ranh giới giữa các mảnh ...................... 39
Hình ảnh 3.23. Lý lịch bản đồ ........................................................................ 40
Hình ảnh 3.24. Công cụ projections and transformation ................................ 41
Hình ảnh 3.25. Thiết lập tham số cho projections and transformation........... 42
viii
Hình ảnh 3.26. Thiết lập tham số cho projections and transformation........... 43
Hình ảnh 3.27. Chuyển đổi hệ quy chiếu........................................................ 43
Hình ảnh 3.28. Kết quả sau khi chuyển đổi .................................................... 44
Hình ảnh 3.29. Bảng admin boundaries của Việt Nam trên OSM ................. 45
Hình ảnh 3.30 . Cấu trúc của một tập tin OSM .............................................. 46
Hình ảnh 3.31. Polygon sang lines của QGIS ................................................ 48
Hình ảnh 3.32. v.clean của QGIS ................................................................... 48
Hình ảnh 3.33. Trước khi sử dụng v.clean ..................................................... 49
Hình ảnh 3.34. Sau khi sử dụng v.clean ......................................................... 50
Hình ảnh 3.35. Dữ liệu gốc ............................................................................. 50
Hình ảnh 3.36. Dữ liệu sau khi chạy v.clean .................................................. 51
Hình ảnh 3.37. Tập tin OSM chứa thông tin về các đường biên giới địa giới Việt Nam. ........................................................................................................ 52
Hình ảnh 4.1. Nội dung trong tập tin OSM .................................................... 54
Hình ảnh 4.2. Bản đồ số việt bản đồ ............................................................... 55
Hình ảnh 4.3. Chồng lớp nền bản đồ Việt bản đồ .......................................... 56
Hình ảnh 4.4. Bản đồ số GIS Chính phủ ........................................................ 57
Hình ảnh 4.5. Chồng lớp nên bản đồ GIS Chính phủ ..................................... 58
1
CHƯƠNG 1: GIỚI THIỆU
1.1 Đặt vấn đề, định hướng nghiên cứu
Đề án Phát triển Hệ tri thức Việt số hóa: Phát triển Hệ tri thức Việt số hóa, là đề án của Chính phủ Việt Nam được phê duyệt theo Quyết định số 677/QĐ-TTg[1] của Thủ tướng Chính phủ ngày 18/05/2017. Đề án có mục tiêu xây dựng một hệ tri thức tổng hợp trong mọi lĩnh vực, góp phần thúc đẩy, tạo điều kiện để mọi người dân học tập suốt đời, làm chủ tri thức, tăng cường nghiên cứu sáng tạo, ứng dụng tiến bộ khoa học công nghệ, thúc đẩy phát triển đất nước. Đề án được xây dựng và cập nhật theo hình thức xã hội hóa, thu hút và khuyến khích mọi người dân và doanh nghiệp tham gia, với vai trò vừa khai thác vừa đóng góp để làm giàu các tài nguyên tri thức số hóa của Việt Nam. Góp phần khơi dậy, lan toả niềm đam mê khoa học và công nghệ, khát vọng sáng tạo, cống hiến của mọi người trong việc tạo lập và phổ biến tri thức. Đề án hướng tới phổ cập thông tin khoa học và công nghệ cho mọi tầng lớp người dân trong xã hội, nhất là các vùng nông thôn, vùng sâu, vùng xa; học sinh, sinh viên, người lao động.
Một trong những nội dung quan trọng của Đề án là Nghiên cứu xây dựng Nền tảng cung cấp dịch vụ dữ liệu địa chỉ của Việt Nam phục vụ phát triển các ứng dụng dân sinh do Đại học Quốc gia Hà Nội chủ trì. Nền tảng cung cấp dịch vụ dữ liệu địa chỉ Việt Nam sẽ là nền tảng cơ bản để trên đó các nhà phát triển xây dựng các ứng dụng dân sinh phục vụ các nhu cầu khác nhau của cộng đồng như tìm kiếm vị trí, địa điểm, địa chỉ, du lịch, văn hóa, giáo dục, y tế, …
Trong các công việc đó, việc xây dựng lớp dữ liệu biên giới địa giới là nhiệm vụ đầu tiên cần phải thực hiện và cũng là dữ liệu đóng vai trò cơ sở cho các lớp dữ liệu địa chỉ. Việc xây dựng dữ liệu dữ liệu bản đồ cho biên giới địa giới Việt Nam có thể được tổng hợp và biên tập từ nhiều mảnh bản đồ có các độ phân giải khác nhau, dẫn đến dữ liệu khi được tổng hợp thành một thể thống nhất sẽ có nhiều vùng bị khuyết dữ liệu hoặc các vùng không được liền mạch. Bài toán đặt ra cần phải chỉnh sửa hoặc cập nhật lại các vùng dữ liệu bị khuyết đó.
2
1.2 Mục tiêu của luận văn
Đứng trước các nhu cầu cấp thiết đó tôi đã quyết định chọn đề tài “Xây dựng quy trình và công cụ biên tập dữ liệu biên giới, địa giới cho Nền tảng cung cấp dịch vụ địa chỉ Việt Nam” làm đề tài nghiên cứu của mình.
Đề tài này nhằm mục đích nghiên cứu và Xây dựng quy trình và công cụ biên tập dữ liệu biên giới, địa giới cho Nền tảng cung cấp dịch vụ địa chỉ Việt Nam.
1.3 Phạm vi nghiên cứu của luận văn
Công việc thực hiện xây dựng quy trình và biên tập dữ liệu biên giới, địa giới tích hớp vào nền tảng cung cấp dịch vụ địa chỉ, là một công việc phức tạp yêu cầu nhiều kiến thức chuyên môn khác nhau và cần nhiều thời gian để thực hiện. Vì vậy trong luận văn này tôi chỉ tập chung chính vào một số công việc như sau:
- Xây dựng quy trình gộp các mảnh bản đồ 1:50.000.
- Lỗi và phương pháp xử lý lỗi khi gộp các mảnh bản đồ lại với nhau.
- Xây dựng công cụ chuyển đổi dữ liệu từ dữ liệu shapefile sang định
dạng tập tin OSM.
- Chỉnh sửa dữ liệu tập tin OSM sau khi chuyển đổi.
1.4 Nội dung của luận văn
Luận văn thực hiện xuyên suốt trong quá trình từ khi hình thành các khái niệm, ý tưởng nghiên cứu, cho đến khi xây dựng được quy trình và công cụ biên tập dữ liệu biên giới, địa giới cho Nền tảng cung cấp dịch vụ địa chỉ Việt Nam. Nội dung chính bao gồm các phần sau:
• Chương 1: Mở Đầu, đặt ra vấn đề, mục tiêu và giải pháp cho bài
toán “Xây dựng quy trình và công cụ biên tập dữ liệu biên giới,
địa giới cho Nền tảng cung cấp dịch vụ địa chỉ Việt Nam”.
• Chương 2: trình bày các khái niệm cơ bản phục vụ cho nghiên
cứu của đề tài.
• Chương 3: Quy trình và phương pháp thực hiện sẽ được trình
bày trong chương này.
3
• Chương 4: Giới thiệu về công nghệ sử dụng và kết quả thực
nghiệm.
• Cuối cùng là phần kết luận, định hướng nghiên cứu tiếp theo.
4
CHƯƠNG 2: TỔNG QUAN VỀ DỮ LIỆU BIÊN GIỚI ĐỊA GIỚI
CHO NỀN TẢNG CUNG CẤP DỊCH VỤ ĐỊA CHỈ
2.1 Nền tảng cung cấp dịch vụ địa chỉ Việt Nam
2.1.1 Giới thiệu
Luật đo đạc và bản đồ ban hành ngày 14/6/2018 và có hiệu lực từ ngày 1/1/2019[2] chỉ rõ chính sách của Nhà nước về nghiên cứu và phát triển Hạ tầng dữ liệu không gian địa lý quốc gia là tập hợp chính sách, thể chế, tiêu chuẩn, công nghệ, dữ liệu và nguồn lực nhằm chia sẻ, sử dụng hiệu quả dữ liệu không gian địa lý trong cả nước. Nội dung xây dựng hạ tầng dữ liệu không gian địa lý quốc gia bao gồm: (i) Xây dựng chiến lược phát triển, kế hoạch triển khai thực hiện hạ tầng dữ liệu không gian địa lý quốc gia; (ii) Xây dựng cơ chế, chính sách, nguồn lực để tổ chức triển khai thực hiện chiến lược phát triển, kế hoạch triển khai thực hiện hạ tầng dữ liệu không gian địa lý quốc gia; (iii) Lựa chọn và phát triển công nghệ, xây dựng tiêu chuẩn, quy chuẩn kỹ thuật về hạ tầng dữ liệu không gian địa lý quốc gia; (iv) Xây dựng, tích hợp dữ liệu không gian địa lý; (v) Xây dựng, vận hành Cổng thông tin không gian địa lý Việt Nam và các ứng dụng, dịch vụ dữ liệu không gian địa lý.
Việc nghiên cứu phát triển Nền tảng dịch vụ dữ liệu địa chỉ Việt Nam có thể coi như là một nghiên cứu thử nghiệm cho việc xây dựng, vận hành Cổng thông tin không gian địa lý Việt Nam và các ứng dụng, dịch vụ dữ liệu không gian địa lý.
5
Hình ảnh 2.1. Kiến trúc tổng thể của Nền tảng cung cấp dịch vụ dữ liệu
địa chỉ Việt Nam
Hình trên mô tả kiến trúc tổng thể của Nền tảng cung cấp dịch vụ dữ liệu
địa chỉ Việt Nam. Nền tảng này gồm các thành phần sau:
❖ Biên giới, địa giới hành chính tỉnh, huyện, xã:
o Dữ liệu biên giới và địa giới hành chính toàn quốc (tỉnh,
huyện, xã): sử dụng CSDL nền địa lý tỉ lệ 1:50.000 của Cục
Đo đạc, Bản đồ và Thông tin địa lý Việt Nam, Bộ Tài nguyên
và Môi trường. CSDL nền địa lý 1:50.000 toàn quốc đã được
Trường Đại học Công nghệ, ĐHQGHN mua năm 2014 trong
6
khuôn khổ một dự án nghiên cứu về Công nghệ tích hợp liên
ngành Giám sát hiện trường.
❖ Đường, phố:
o Dữ liệu đường toàn quốc sử dụng các nguồn dữ liệu sau: o Dữ liệu đường của cơ sở dữ liệu nền địa lý tỉ lệ 1:50.000 của
cục đo đạc, bản đồ và thông tin địa lý Việt Nam o Dữ liệu đường của Open Street Map (OSM) [3] o Dữ liệu đường cho thành phố hà nội sử dụng các nguồn dữ
liệu sau:
▪ Dữ liệu đường của csdl nền địa lý tỉ lệ 1:10.000 cho
thành phố Hà Nội.
▪ Dữ liệu đường của OSM.
o Dữ liệu đường cho thành phố hồ chí minh sử dụng các nguồn
dữ liệu sau:
▪ Dữ liệu đường của cơ sở dữ liệu nền địa lý tỉ lệ
1:10.000 cho thành phố Hồ Chí Minh.
▪ Dữ liệu đường của OSM.
❖ Dữ liệu địa chỉ:
o Cơ sở dữ liệu địa chỉ đã được thu thập được bởi tổng công ty
bưu điện Việt Nam (VNPost).
o Cơ sở dữ liệu địa chỉ các cơ sở giáo dục đã được thu thập bởi
Bộ Giáo dục và Đào tạo.
o Cơ sở dữ liệu địa chỉ các cơ sở y tế đã được thu thập bởi Bộ
Y tế.
o Cơ sở dữ liệu địa chỉ các cơ sở lưu trú đã được thu thập bởi
Bộ Văn hóa – Thể thao – Du lịch.
❖ Các thuật toán (tìm kiếm địa chỉ, tìm đường) và quản lý, biên tập dữ
liệu:
o Thuật toán tìm kiếm địa chỉ (geocoding). o Thuật toán tìm đường (route planning). o Bộ công cụ quản lý và biên tập dữ liệu địa chỉ.
❖ APIs cung cấp bộ giao diên lập trình ứng dụng (application
programing interface).
❖ Các ứng dụng:
o Ứng dụng web cho nền tảng dịch cung cấp dịch vụ bản đồ
Việt Nam.
7
o Ứng dụng di động cho nền tảng dịch cung cấp dịch vụ bản đồ
Việt Nam (Android và iOS).
o Các ứng dụng khác được phát triển dựa trên các APIs cung cấp bởi nền tảng dịch cung cấp dịch vụ bản đồ Việt Nam.
❖ Người dùng của nền tảng dịch cung cấp dịch vụ bản đồ Việt Nam
bao gồm các nhóm sau:
o Nhóm người dùng cá nhân: Các chức năng để khai thác, tìm kiếm địa chỉ, tìm đường đi cho các loại phương tiện giao thông và người đi bộ.
o Nhóm chuyên gia dữ liệu địa chỉ: Các chức năng chỉnh sửa,
cập nhật, kiểm tra, phân tích dữ liệu địa chỉ.
o Nhóm các nhà phát triển các ứng dụng dân sinh phục vụ công tác nghiệp vụ của tổng công ty bưu điện Việt Nam và đề án hệ tri thức việt số hóa: cung cấp bộ APIs để các nhà phát triển phần mềm sử dụng trong việc xây dựng ứng dụng dân sinh.
Phần trên giải thích tính cấp thiết và mô tả kiến trúc tổng quan của Nền
tảng dịch cung cấp dịch vụ bản đồ Việt Nam.
2.1.2 Bản đồ số
Bản đồ số là một tập hợp có tổ chức, lưu trữ các dữ liệu bản đồ trên thiết bị có khả năng đọc bằng máy tính và được thể hiện dưới dạng hình ảnh bản đồ.
Bản đồ số giúp biểu diễn các trực quan về thế giới. Chúng thường thể hiện các ý tưởng tốt hơn là từ ngữ. Cách này sẽ giúp chúng ta trả lời được nhiều câu hỏi. Trường học hoặc bệnh viện nào là gần nhất? Ai là người tiếp cận với những cơ sở này khó khăn nhất? Khu vực nào là khu vực nghèo nhất? Những câu hỏi đó có thể được thể hiện tốt nhất thông qua các bản đồ và bản đồ có thể trả lời cho những câu hỏi như vậy.
Bản đồ số hàm chứa nhiều thông tin. Bên cạnh đó bản đồ số có thể mô tả thông tin cho các đối tượng khác nhau ở những khu vực khác nhau, giải quyết các vấn đề của cộng đồng, hoặc đơn thuần là giúp ai đó tìm đường đi.
2.1.3 Loại dữ liệu trên bản đồ số
Bản đồ số lưu theo loại đối tượng dưới đây:
8
- Điểm (Points): Đối tượng đơn có vị trí. Ví dụ: Trường học, hiệu
thuốc, nhà hàng, …
- Đường (Arcs): Các đối tượng dạng tuyến. Ví dụ: đường sá, sông,
đường tàu, …
- Vùng (Polygons): Vùng có diện tích, định nghĩa bởi đường bao. Ví
dụ thửa loại đất
Để phản ánh toàn bộ các thông tin cần thiết của bản đồ dưới dạng đối tượng số, các đối tượng địa lý còn được phản ánh theo cấu trúc phân mảnh và phân lớp thông tin.
Cấu trúc phân mảnh: Một đối tượng địa lý về mặt không gian có thể liên tục trên một phạm vi rộng. Tuy nhiên trong cơ sở dữ liệu GIS, do hạn chế về các lý do kỹ thuật như khả năng lưu trữ, xử lý, quản lý dữ liệu mà các đối tượng địa lý lưu trữ dưới dạng cách mảnh (mapsheet, tile). Tuy nhiên khái niệm chia mảnh trong cơ sở dữ liệu GIS không hoàn toàn đồng nhất với khái niệm chia mảnh bản đồ thông thường. Một mảnh (tile) trong cơ sở dữ liệu GIS có thể có hình dạng bất kỳ miễn sau cho phù hợp với khả năng quản lý và xử lý của hệ thống. Trong một số hệ thống GIS đã có, người dùng phải tự quản lý cách chia mảnh của mình. Tuy nhiên xu hướng hiện nay, các hệ thống GIS đã cung cấp những công cụ cho phép người sử dụng tự động quản lý các mảnh trong cơ sở dữ liệu. Một số GIS tiến bộ hơn, dựa trên các kỹ thuật mới của công nghệ hướng đối tượng, về mặt vật lý, các đối tượng địa lý bị chia cắt theo từng mảnh, nhưng đối với người sử dụng, các đối tượng là liên tục không bị chia cắt.
Cấu trúc phân lớp thông tin: Một trong những bước quan trọng xây dựng cơ sở dữ liệu GIS là phân loại các lớp thông tin (layer, class). Hệ thống GIS lưu trữ các đối tượng địa lý theo các lớp thông tin. Mỗi lớp thông tin lưu trữ một loại các đối tượng có chung một tính chất, đặc điểm giống nhau. Thiết kế các lớp thông tin rất quan trọng đối với bất kỳ một hệ thống GIS nào. Cách phân lớp thông tin sẽ ảnh hưởng rất lớn đến tính hiệu quả, khả năng xử lý và sử dụng lâu dài của cơ sở dữ liệu không gian.
Một số nguyên tắc khi thiết kế các lớp thông tin:
9
❖ Có các lớp thông tin cơ bản: các ứng dụng khác nhằm cần đến
những lớp thông tin cơ bản (thông tin nền) Ví dụ như:
- Lớp thông tin cơ sở toán học bản đồ: điểm khống chế, khung,
điểm độ cao, trắc địa nhà nước, …
- Lớp thông tin về địa hình
- Lớp thông tin về hệ thống thuỷ văn
- Lớp thông tin về hệ thống đường giao thông
❖ Đủ các lớp thông tin chuyên đề: Tuỳ từng ứng dụng và yêu cầu cụ
thể trước mắt, việc chọn lựa các lớp thông tin chuyên đề được lưu
trữ trong cơ sở dữ liệu và thứ tự nhập vào là quan trọng. Nó ảnh
hưởng trực tiếp đến giá thành và thời gian xây dựng cơ sở dữ liệu
GIS
2.2 Dữ liệu biên giới, địa giới
Các dữ liệu về biên giới địa giới trong luận văn này sẽ được biên tập
dựa trên dữ liệu bản đồ địa hình 1:50.000 của Việt Nam.
2.2.1 Bản đồ địa hình
Bản đồ địa hình: Là loại bản đồ chuyên đề có tỉ lệ: 1:1.000.000 hoặc lớn hơn trên bản đồ, địa hình và địa vật một khu vực bề mặt trái đất được thể hiện một cách chính xác và chi tiết bằng hệ thống các qui ước ký hiệu thích hợp. Ví dụ: Địa hình rừng núi, sông suối, biển; Địa vật nhứ nhà máy – sân bay – bến cảng nhà ga, đình, chùa, cây to độc lập.
Ý nghĩa của bản đồ địa hình: Bản đồ địa hình trong đời sống xã hội có một ý nghĩa rất to lón trong việc giải quyết các vấn đề khoa học và thực tiễn, nhũng vấn đề có liên quan đến nghiên cứu địa hình, lợi dụng địa hình để tiến hành thiết kế, xây dựng các công trình trên thực địa. Trong quân sự: Bản đồ địa hình giúp người chỉ huy nắm chắc các yếu tố để chỉ đạo tác chiến trên đất liền, trên biển và trên không. Trong thực tế không phải lúc nào cũng ra thực địa để quan sát trực tiếp bằng mắt. Tuy có cụ thể hơn chính xác hơn nhưng rất hạn chế về tầm nhìn, do tính chất của địa hình, do tình hình địch v.v…
10
chính vì vậy bản đồ địa hình là phương tiện không thể thiếu của người chỉ huy.
Phân loại đặc điểm, công dụng của bản đồ địa hình: Trong phân loại
thông thường bản đồ được phân ra 2 loại:
- Bản đồ địa lý cơ bản. - Bản đồ chuyên dùng: quân sự, kinh tế, văn hóa, xã hội, khoáng sản,
…
Đặc điểm khung bản đồ và ghi chú xung quanh: Khung bản đồ: dùng để trang trí bản đồ, là những đường giới hạn diện tích của mỗi mảnh bản đồ. Khung bản đồ được gọi tên khung bắc, nam, đông, tây. Ghi chú xung quanh khung bản đồ: nhằm thuyết minh giải thích cho người sử dụng bản đồ biết cách gọi tên và sử dụng các ký hiệu trên bản đồ.
Về nguyên tắc ghi chú xung quanh của bản đồ Gauss và bản đồ UTM về cơ bản giống nhau chỉ khác cách sắp xếp vị trí, cách ghi, cách trình bày (hiện nay thống nhất cả nước ta sử dụng bản đồ theo phép chiếu Gauss).
- Khung bắc: ghi tên bản đồ, ghi địa danh hành chính cấp cao nhất được thể hiện trong bản đồ, hoặc địa danh nổi tiếng trong vùng dân cư dưới tên bản đồ ghi số hiệu của mảnh bản đồ (xác định mảnh bản đồ này nằm ở vị trí nào trên trái đất).
- Bên trái tên bản đồ ghi tên vị trí địa chỉ 1 khu vực, địa chỉ tổng quát
1 huyện, 1 tỉnh.
- Khung nam: ghi tỷ lệ số, tỷ lệ thước, tỷ lệ chữ, phía dưới tỷ lệ chữ ghi chú khoảng cao đều của đường biên độ cơ bản, tùy theo tỷ lệ bản đồ mà ghi chú này thay đổi – lược đồ bản chắp: giúp người sử dụng biết các mảnh bản đồ cần chắp với các mảnh bản đồ đang dùng.
- Tiếp theo là phần chỉ dẫn các ký hiệu giúp người sử dụng tra cứu
khi sử dụng bản đồ.
Cơ sở toán học của bản đồ địa hình:
Tỉ lệ bản đồ: là yếu tố toán học quan trọng để xác định mức độ thu nhỏ, độ dài khi chuyển từ mặt cong của trái đất lên mặt phẳng của bản đồ; là tỷ số
11
giữa độ dài trên bản đồ và độ dài ngoài thực địa; là mức độ thu nhỏ chiều dài nằm ngang của các đường trên thực địa khi biểu thị chúng trên bản đồ. Tỷ lệ bản đồ được biểu diễn dưới dạng phân số 1/M (Tử số là độ dài trên bản đồ, M là độ dài trên thực địa).
Tỉ lệ bản đồ được biểu diễn dưới 3 dạng
- Tỉ lệ số: tỉ lệ dạng phân số, ví dụ 1: 50.000; 1/50.000… - Tỉ lệ chữ: thường được ghi rõ dưới khung nam bản đồ, ví dụ: 1cm
bằng 500m ngoài thực địa (bản đồ tỉ lệ 1: 50.000)
- Tỉ lệ thước: trên mỗi tờ bản đồ đều có một thước tỉ lệ thẳng đã tính
ra cự ly thực địa.
Phép chiếu: Hiện tại ta có hai phép chiếu để thể hiện trái đất lên mặt
bản đồ.
- Phép chiếu GAUSS của nhà bác học người Đức - Phép chiếu UTM của quân đội Mỹ.
Cả hai phép chiếu là cách chiếu hình kinh tuyến và vĩ tuyến từ mặt trái đất lên mặt phẳng giấy bằng phương pháp toán học (hiện tại ta thống nhất sử dụng bản đố theo phương pháp chiếu GAUSS).
Cách chia mảnh và ghi số bản đồ: Tùy theo phương pháp chiếu đồ để
thực hiện việc chia mảnh và ghi số hiệu bản đồ.
Theo phương pháp chiếu Gauss:
- Bản đồ tỷ lệ 1:1.000.000:
▪ Chia mặt trái đất thành 60 dải chiếu đồ đánh số thứ tự từ 1 – 60. Dải số 1 từ 180 độ đến 174 độ tây và tiến dần về phía đông đến dải số 60 mỗi dải cách nhau 6 độ. Việt Nam nằm ở dải số 48 và 49.
▪ Chia dải chiếu đồ theo vĩ độ từng khoảng 4 độ kể từ xích đạo trở lên phía Bắc cực và xuống Nam cực, đánh thứ tự A, B, C, D, …tính từ xích đạo. Việt Nam thuộc 4 khoảng C, D, E, F. ▪ Mổi hình thang cong (6 độ vĩ tuyến và 4 độ kinh tuyến) là
khuôn khổ một mảnh bản đồ tỷ lệ 1:1000.000
12
▪ Dùng cặp chữ trước số sau để ghi số hiệu cho một mảnh bản
đồ. Hà Nội nằm ở mảnh F- 48.
- Bản đố tỷ lệ: 1:100.000:
▪ Chia mảnh bản đồ tỷ lệ 1.000.000 thành 144 ô nhỏ, mổi ô dọc 20’ ngang 30’ là khuôn khổ một mảnh bản đồ tỷ lệ 1:100.000.
▪ Số hiệu đánh từ 1 – 144 (từ trái qua phải, từ trên xuống dưới)
ghi vào sau số hiệu mảnh bản đồ tỷ lệ 1:1000.000.
▪ Ví dụ: F – 48 – 116.
- Bản đồ tỷ lệ: 1:50.000
▪ Chia mảnh bản đồ tỷ lệ 1: 100.000 thành 4 ô nhỏ mỗi ô dọc 10’ ngang 15’ đánh số A, B, C, D (từ trái qua phải từ trên xuống dưới), ghi sau số hiệu mảnh bản đồ tỷ lệ 1: 100.000 Ví dụ: F48 – 116 – B.
- Bản đồ tỷ lệ: 1:25.000:
▪ Chia mảnh bản đồ tỷ lệ 1: 50.000 thành 4 ô nhỏ mỗi ô dọc 5’ ngang 7’ 30’’ đánh số a, b, c, d (từ trái qua phải từ trên xuống dưới), ghi sau số hiệu mảnh bản đồ tỷ lệ 1: 50.000 Ví dụ: F48 – 116 – B - a.
Bản đồ, lưới toạ độ quốc gia và các trạm GPS là những tài liệu điều tra cơ bản được xây dựng theo chuẩn thống nhất, đảm bảo cung cấp thông tin nhanh, chính xác cho mọi hoạt động quản lý nhà nước, phát triển kinh tế, xã hội, bảo vệ đất nước, nghiên cứu khoa học...
2.2.2 Biên giới
Đường biên giới Quốc gia được xác định rất rõ, nó là hàng rào pháp lý xác định giới hạn vùng đất, vùng nước, vùng biển, vùng trời và lòng đất thuộc chủ quyền quốc gia; là nới phân chia chủ quyền lãnh thổ của một quốc gia này với một quốc gia khác và hoặc với các vùng biển thuộc quyền chủ quyền và quyền tài phán của quốc gia đó. Nước ta có đường biên giới đất liền dài 4.516 km, tiếp giáp với 3 nước láng giềng (Trung Quốc, Lào, Căm-pu- chia); có bờ biển dài khoảng 3.260 km. Nói một cách khác, đường biên giới quốc gia chính là giới hạn ngăn cách lãnh thổ quốc gia này với quốc gia khác, ngăn cách lãnh hải với vùng đặc quyền kinh tế và thềm lục địa của một quốc gia.
13
Trong điều 1, Luật Biên giới quốc gia năm 2003 của ta nêu rõ “Biên giới quốc gia của nước Cộng hoà xã hội chủ nghĩa Việt Nam là đường và mặt thẳng đứng theo đường đó để xác định giới hạn lãnh thổ đất liền, các đảo, các quần đảo trong đó có quần đảo Hoàng Sa và Trường Sa, vùng biển, lòng đất, vùng trời của nước Cộng hoà xã hội chủ nghĩa Việt Nam.
Trong nội dung luận văn này về phần xác định đường biên giới Quốc
gia chỉ giới hạn với vùng biên giới trên đất liền.
2.2.3 Địa giới
Địa giới hành chính là đường ranh giới phân chia các đơn vị hành chính, là cơ sở pháp lý phân định phạm vi trách nhiệm của bộ máy hành chính nhà nước trong việc quản lý dân cư, đất đai, kinh tế, chính trị, văn hóa, xã hội ở địa phương. Địa giới hành chính được xác định bằng các mốc giới cụ thể, thể hiện tọa độ của vị trí đó. Việt Nam có 4 cấp hành chính đó là: cấp trung ương, cấp tỉnh, cấp huyện và cấp xã. Địa giới hành chính chỉ được xác lập ở 3 cấp: tỉnh, huyện, xã.
Mỗi địa giới hành chính là một thực thể trong nền hành chính Nhà nước. Mỗi đơn vị địa giới hành chính cần phải được xác định cụ thể về: địa lý, dân cư. Trong quản lý của nhà nước cần phải xác định rõ không gian tác động của hoạt động quản lý. Hay nó cách khác với mỗi đơn vị địa giới hành chính cần phải được xác định rõ giới hạn và không gian, địa bàn cụ thể.
Bảng 1. Số lượng đơn vị địa giới hành chính tính đến 01/10/2020(1)
STT Nội dung Tổng số
Cấp tỉnh 1
Tỉnh 63 58
Thành phố trực thuộc Trung ương 5
Cấp huyện 707 2
Thành phố 77
Thị xã 49
1. https://www.moha.gov.vn/danh-muc/linh-vuc-chinh-quyen-dia-phuong-dia-gioi-hanh-chinh-26074.html
Quận 49
14
Huyện 532
Cấp xã 10.614 3
Xã 8.324
Phường 1.680
Thị trấn 610
Chính vì thế, các đơn vị hành chính cấp xã, cấp huyện, cấp tỉnh cần xác
định rõ “đường biên” hay “ranh giới” và được lưu trữ quản lý.
2.2.4 Bản đồ địa hình 1/50.000
Bản đồ địa hình 1/50.000[3] của Việt Nam: Bộ bản đồ địa hình phủ trùm toàn bộ lãnh thổ Viêt Nam gồm 740 mảnh trong đó gồm: 573 mảnh bản đồ số, 98 mảnh bản đồ địa hình biên giới Việt - Lào, Việt Nam - Trung Quốc, và 69 mảnh bản đồ địa hình đáy biển. Các mảnh bản đồ số này bao gồm 7 tập tin cho phép người sử dụng có thể tìm hiểu thông tin về cơ sở toán học, thủy hệ, địa hình, giao thông, dân cư, ranh giới, thực vật và có thể tạo mô hình không gian 3 chiều cho bề mặt địa hình.
2.2.5 Hệ quy chiếu VN2000
Theo nội dung của thông tư 973/2001/TT-TCĐC[4] của Tổng cục Địa chính: hệ quy chiếu và Hệ toạ độ quốc gia VN-2000 (gọi tắt là VN-2000) được áp dụng thống nhất để xây dựng hệ thống toạ độ các cấp hạng, hệ thống bản đồ địa hình cơ bản, hệ thống bản đồ nền, hệ thống bản đồ địa chính, hệ thống bản đồ hành chính quốc gia và các loại bản đồ chuyên đề khác. Trong hoạt động đo đạc và bản đồ chuyên dụng, khi cần thiết được áp dụng các hệ quy chiếu khác phù hợp với mục đích riêng.
Các tham số được sử dụng trong VN2000:
- Ellipsoid quy chiếu quốc gia là ê-líp-xô-ít WGS-84 toàn cầu với
kích thước:
▪ Bán trục lớn: a = 6378137,0m ▪ Độ dẹt: f = 1: 298,257223563 ▪ Tốc độ góc quay quanh trục: ▪ Hằng số trọng trường Trái đất: = 7292115,0x10-11 rad/s GM= 3986005.108m3s-2
15
- Vị trí Ellipsoid quy chiếu quốc gia: Ellipsoid WGS-84 toàn cầu được xác định vị trí (định vị) phù hợp với lãnh thổ Việt Nam trên cơ sở sử dụng điểm GPS cạnh dài có độ cao thuỷ chuẩn phân bố đều trên toàn lãnh thổ.
- Điểm gốc toạ độ quốc gia: Điểm N00 đặt tại Viện Nghiên cứu Địa chính thuộc Tổng cục Địa chính, đường Hoàng Quốc Việt, Hà Nội.
2.2.6 OSM
OpenStreetMap[5] được viết tắt OSM là một dự án cộng đồng, với mục đích tạo ra một bản đồ thế giới miễn phí và bất cứ ai đều có thể tham gia đóng góp hoặc chỉnh sửa dữ liệu. Với việc thuận tiện và dễ dàng tham gia đóng góp xây dựng bản đồ, nên mỗi ngày có hàng ngàn tình nguyện viên tích cực tham gia đóng góp để cải thiện chất lượng bản đồ.
Các thành viên tình nguyện có thể tham gia đo vẽ dữ liệu đường phố, các điểm tiện ích quan tâm (POI) và một số thông tin địa lý liên quan. Toàn bộ dữ liệu được chia sẻ và cho phép tất cả những ai có nhu cầu tải về tại www.openstreetmap.org để phục vụ cho mục đích riêng của mình mà không phải trả bất kì khoản phí nào cả. Ngoài ra dữ liệu từ OSM còn được dùng trong một số ứng dụng thương mại và miễn phí trên các nền tảng.
Hình ảnh.2.2. Giao diện OSM
16
CHƯƠNG 3: XÂY DỰNG QUY TRÌNH VÀ CÔNG CỤ BIÊN TẬP
DỮ LIỆU BIÊN GIỚI ĐỊA GIỚI
Dữ liệu biên giới địa giới của nền tảng cung cấp dịch vụ địa chỉ được biên tập từ dữ liệu bản đồ địa hình. Dữ liệu sau khi được biên tập và chuẩn hóa sẽ được nạp vào trong CSDL, từ dữ liệu đó sẽ đóng vai trò cho việc xuất bản dịch vụ bản đồ nền về ranh giới địa giới Việt Nam. Và đóng vai trò cung cấp thông tin bổ sung cho các API truy vấn về sau.
Hình ảnh 3.1. Kiến trúc tổng quan của nền tảng cung cấp dịch vụ địa chỉ
17
3.1 Quy trình biên tập dữ liệu biên giới địa giới
Bản đồ địa hình Việt Nam 1/50.000 thuộc hệ thống bản đồ địa hình quốc gia, được thành lập cho phần đất liền, phần hải đảo và thềm lục địa của Việt Nam trong hệ quy chiếu và hệ tọa độ quốc gia VN-2000, hệ độ cao quốc gia Việt Nam. Các mảnh bản đồ địa hình gốc dạng số được lưu trữ dưới dạng MicroStation (*.dgn).
Quy trình biên tập dữ liệu biên giới địa giới được thực hiện từ việc chuyển đổi dữ liệu thô đến bước xây dựng công cụ chuyển đổi và bổ sung thông tin vào dữ liệu kết quả.
Để biên tập dữ liệu biên giới địa giới của Việt Nam sẽ được thực hiện
thông qua các bước như sau:
- Bước 1: Trích xuất dữ liệu biên giới quốc gia và dữ liệu địa giới
hành chính từ tập dữ liệu bản đồ địa hình.
- Bước 2: Gộp các mảnh mảnh bản đồ theo cấp hành chính: xã,
huyện, tỉnh
- Bước 3: Sửa lỗi sau khi gộp - Bước 3: Bổ sung thông tin hành chính cấp tỉnh, cấp huyện vào ranh
giới hành chính cấp xã.
- Bước 4: Chuyển đổi hệ quy chiếu từ VN2000 sang WGS84. - Bước 5: Chuyển đổi dữ liệu từ shapefile sang tập tin OSM thông
qua công cụ chuyển đổi.
18
Hình ảnh 3.2. Các bước biên tập dữ liệu biên giới địa giới của Việt Nam
Nội dung các bước thực hiện sẽ được trình bày chi tiết ở các mục tiếp
theo.
3.2 Trích xuất dữ liệu biên giới quốc gia và dữ liệu địa giới hành chính từ tập
dữ liệu bản đồ địa hình
Bản đồ địa hình 1/50.000 là các tập tin dữ liệu MicroStation gồm các dữ liệu về vị trí và hình học của các đối tượng đia lý và các thông tin khác có liên quan tới đối tượng địa lý đó. Mỗi một mảnh dữ liệu địa hình 1/50.000 bao gồm các lớp dữ liệu sau:
- Cơ sở đo đạc - Biên giới địa giới - Địa hình - Thủy hệ
19
- Giao thông - Dân cư cơ sở hạ tầng - Phủ bề mặt
Hình ảnh 3.3. Cấu trúc dữ liệu của bản đồ địa hình 1/50.000
Trong nội dung của luận văn này tác giả chỉ sử dụng lớp dữ liệu biên
giới địa giới.
Định dạng tập tin *.DGN là tên được sử dụng cho các định dạng tập tin CAD hỗ trợ bởi Bentley Systems, chương trình MicroStation CAD. Định dạng DGN được sử dụng trong các dự án xây dựng, bao gồm các tòa nhà, đường cao tốc, cầu cống, nhà máy xử lý, đóng tàu. DGN là một định dạng cạnh tranh để DWG của Autodesk.
Định dạng shapefile (SHP) là một định dạng dữ liệu vector không gian địa lý cho hệ thống thông tin địa lý phần mềm (GIS). Nó được phát triển và quy định của ESRI như một đặc điểm kỹ thuật chủ yếu là mở cửa cho khả năng tương tác dữ liệu giữa các ESRI và các sản phẩm phần mềm GIS khác. Định dạng shapefile không gian có thể mô tả các tính năng vector: điểm,
20
đường và đa giác, đại diện, ví dụ, giếng nước, sông, hồ. Mỗi mục thường có thuộc tính mô tả nó, chẳng hạn như tên hoặc nhiệt độ.
Để thực hiện chuyển đổi dữ liệu bản đồ địa hình sang shapefile trong luận văn này tác giả sử dụng phần mềm FME[6]. FME hỗ trợ chuyển đổi nhanh định dạng các tập tin địa lý.
Do dữ liệu gốc ở hệ quy chiếu VN2000 múi 30 nhưng trong hệ chuyển đổi của FME không có, do vậy trước khi chuyển đổi dữ liệu cần thiết lập cho FME hỗ trợ chuyển đổi đối VN2000 múi 30. Mở tập tin cấu hình MyCoordSysDefs.fme bổ sung thêm config VN2000 múi 30 như sau:
Hình ảnh 3.4. VN2000 múi 30 cho FME
Sau khi đã thêm thiết lập cho FME sẽ tiến hành chuyển đổi dữ liệu
MicroStation bằng công cụ Quick Translation của FME như sau:
21
Hình ảnh 3.5. Chuyển đổi dữ liệu sang shapefile
Dữ liệu đầu vào sẽ bao gồm:
- Format: Bentley MicroStation Design (V7) - Dataset: Đường dẫn tới tập tin dữ liệu cần chuyển đổi - Coord.System: VN2000-105-Mui_3do - Output Format: Lựa chọn Esri Shapefile
Kết quả sau khi chuyển đổi từ tập tin dữ liệu MicroStation sang shapefile sẽ thu được các tập tin shapefile bao gồm: DiaPhanTinh, DiaPhanHuyen, DiaPhanXa, MocBienGioi.
22
Hình ảnh 3.6. Các shapefile thu được
Từ các shapefile thu được sẽ được tiền xử lý qua các công cụ ArcMap[7][8], QGIS[9][10][11], JOSM[12][13] để giúp tăng chất lượng dữ liệu hoặc chuyển đổi qua các định dạng có thể xử lý về sau.
23
3.3 Gộp các mảnh bản đồ theo cấp hành chính: xã, huyện, tỉnh
Kết thúc quá trình chuyển đổi định dạng dạng dữ liệu sẽ thu được 740 mảnh dữ liệu ranh giới cấp xã, 740 mảnh dữ liệu ranh giới cấp huyện, 740 mảnh dữ liệu cấp tỉnh.
Từ các mảnh dữ liệu đó tác giả sẽ thực hiện các bước sau:
- Gộp các mảnh rời rạc lại thành một mảnh thống nhất - Loại bỏ đường chia cắt giữa các mảnh sau khi gộp - Sửa lỗi sau khi gộp - Bổ sung thông tin hành chính sau khi gộp
Hình ảnh 3.7. Các bước gộp dữ liệu
3.3.1 Gộp các mảnh rời rạc lại thành một mảnh thống nhất:
Để gộp các mảnh bản đồ ranh giới cấp xã lại thành một mảnh thống
nhất sử dụng công cụ Merge của ArcMap[14]
24
Hình ảnh 3.8. Công cụ Merge của ArcMap
Kết quả sau khi sau khi Merge các mảnh dữ liệu lại với nhau sẽ bao gồm các polygon ranh giới, thông tin của từng đơn vị xã/phường/thị trấn và đường phân chia của các mảnh:
Hình ảnh 3.9. Kết quả sau khi Merge
Bước kế cần phải thực hiện loại bỏ các đường phân chia của các mảnh.
25
3.3.2 Loại bỏ đường chia cắt của các mảnh sau khi gộp:
Để loại bỏ các đường phân chia của các mảnh sau khi gộp thông qua
công cụ Dissolve của ArcMap.
Hình ảnh 3.10. Công cụ Dissolve của ArcMap
Kết quả sau khi thực hiên Dissolve các đường viền phân chia của các
mảnh dữ liệu đã được loại bỏ.
26
Hình ảnh 3.11. Kết quả sau khi Dissolve
Đối với các mảnh dữ liệu cấp huyện và cấp tỉnh cũng thực hiện các
bước tương tự.
Kết thúc quá trình gộp dữ liệu sẽ thu được 3 shapefile về ranh giới địa
3.4 Bổ sung thông tin hành chính cấp huyện, tỉnh giới cho cấp xã, cấp huyện và cấp tỉnh.
Bảng dữ liệu của ranh giới địa giới cấp xã sau khi gộp
27
Hình ảnh 3.12. Bảng dữ liệu của ranh giới địa giới cấp xã sau khi gộp
Bảng dữ liệu của ranh giới địa giới cấp huyện sau khi gộp
Hình ảnh 3.13. Bảng dữ liệu của ranh giới địa giới cấp huyện sau khi
gộp
Bảng dữ liệu của ranh giới địa giới cấp tỉnh sau khi gộp
28
Hình ảnh 3.14. Bảng dữ liệu của ranh giới địa giới cấp tỉnh sau khi gộp
Sau khi đã có các shapefile như trên, bước tiếp theo cần thêm các trường thông tin mã đơn vị hành chính (MDVHC) cấp huyện, tên huyện, mã đơn vị hành chính cấp tỉnh và tên tỉnh vào từng bản ghi một của shapefile ranh giới địa giới cấp xã.
Để có thể thực hiện việc thêm thông tin từ shapefile ranh giới địa giới cấp huyện, cấp tỉnh vào cấp xã cần sử dụng công cụ Join trên ArcMap với thiết lập như trong hình bên dưới để thực hiện việc Join giữa 2 shapefile dựa trên không gian của các polygon:
29
Hình ảnh 3.15. Join sử dụng ArcMap
Sau khi Join xong và loại bỏ những trường không cần thiết sẽ thu được một shapefile có cấu trúc như sau:
30
Hình ảnh 3.16. Kết quả thu được sau khi Join
3.5 Sửa lỗi sau khi gộp
Sau khi hoàn thiện việc gộp các mảnh bản đồ sẽ có một số lỗi ngoại lệ xuất hiện trên bản đồ cần phải sửa lại. Các lỗi gặp phải là những lỗi liên quan đến liên kết không gian trong Polygon hay còn gọi là những lỗi liên quan đến Topology.
Quan hệ không gian Topology trong GIS là mối quan hệ logic giữa vị trí của các đối tượng. Cấu trúc dữ liệu thuộc Topology cung cấp một cách tự động hóa để xử lý việc số hóa, xử lý lỗi; giảm dung lượng lưu trữ dữ liệu cho các vùng vì các ranh giới giữa những vùng nằm kề nhau được lưu trữ chỉ một lần; và cho phép chúng ta cấu trúc dữ liệu dựa trên các nguyên lý về tính kề cận (adjacency) và kết nối (connectivity) để xác định các quan hệ không gian.
Ngoài ra Topology là mô hình được sử dụng để mô tả làm thế nào các đối tượng chia sẻ hình học với nhau. Và cũng là cơ chế để xây dựng và duy trì quan hệ Topology giữa các đối tượng. ArcGIS thực thi quan hệ Topology thông qua một tập các quy tắc định nghĩa các đối tượng chia sẻ hình học với nhau theo cách nào và một tập các công cụ chỉnh sửa các đối tượng vi phạm quy tắc đề ra.
Một số lỗi gặp phải sau khi gộp bao gồm:
- Đường phân chia ranh giới giữa các mảnh chưa mất - Polygon không kín
31
- 2 Polygon bị chồng đè - Xuất hiện vùng chống giữa polygon
Sử dụng công cụ Topology trên ArcMap để validate và sửa lỗi dữ liệu, thiết lập các luật cho Topology để ArcMap để kiểm tra các lỗi có trong dữ liệu.
Bảng 3-1. Bảng luật Topology trong ArcMap[15]
Luật topology Mô tả Sử dụng Minh hoạ
Phải lớn hơn Vùng
dung sai
cluster
Trong trường hợp luật này bị vi phạm, trái của phần bên hình ban đầu sẽ không bị thay đổi. (must be
larger tolerance) Các đỉnh vi phạm luật này được xác định là không trùng khớp và được bắt vào nhau.
Luật này là bắt buộc topology trong một và có thể áp dụng cho tất cả các lớp đối tượng địa lý vùng
Dung sai cluster: là khoảng cách nhỏ nhất giữa 2 đỉnh của đối tượng địa lý.
Phải không Vùng
chồng xếp
(Must not
overlap)
Qui định bên trong các vùng trong lớp đối tượng địa lý là không chồng xếp. thể Các vùng có chung các cạnh hoặc đỉnh.
Luật này có ích trong việc mô hình hóa ranh giới hành chính, khu vực bầu cử và phân loại khu vực riêng như khu bầu cử không được che phủ trên vùng bao khu.
32
Phải không có khoảng trống
(Must not Vùng không có khoảng trống
hanve gaps)
Các vùng đất không thể bao gồm khoảng trống. Do vậy các đa giác phải bao phủ toàn bộ khu vực.
Luật qui định rằng không có bất kì khoảng trống nào bên trong một vùng hoặc giữa các vùng liền kề. Tất cả các vùng phải trải trên một bề mặt lên tục. Sẽ luôn tồn tại lỗi trên biên ngoài của vùng.
Phải không
chồng xếp với
( Must not
overlap vith) Hai vùng trong hai lớp đối tượng địa lý khác nhau.
rời Lỗi được tạo ra tại vị trí các đa giác của hai lớp đối tượng địa lý chồng xếp.
là 2
Qui định rằng trong một lớp đối tượng địa lý không được chồng xếp với vùng trong lớp đối tượng địa lý khác. Hai vùng có thể cùng các cạnh, các đỉnh hoặc rạc hoàn toàn. Luật này có ích khi chồng xếp 2 hệ thống riêng biệt với nhau của phân loại vùng. Lớp sông hồ và lớp đất trồng lớp đối tượng địa lý khác nhau do đó 2 lớp không được chồng xếp.
Hai vùng
trong 2 Phải được che phủ bởi lớp đối tượng địa lý
lớp đối
(Must be covered by feature class of) tượng địa lý Qui định một vùng trong một lớp đối tượng địa lý phải có diện tích hoàn toàn được che phủ trong vùng của lớp đối tượng địa lý khác.
Lỗi vùng được tạo ra với đa giác trong lớp đối tượng địa lý đầu tiên tại vị trí không được che phủ. khác nhau
Quận phải được che phủ bởi các phường.
33
Phải che phủ
lẫn nhau
(Must cover
each other) Hai vùng trong hai đối lớp tượng địa lý khác nhau
Tất cả các đa giác trong lớp đối tượng địa lý đầu tiên và tất cả các đa giác trong lớp đối tượng địa lý thứ 2 phải được che phủ lẫn nhau
Thực vật và đất trồng phải được che phủ lẫn nhau. Luật cũng có thể được áp dụng với các lớp đối tượng địa lý không phân cấp như kiểu đất trồng và lớpđộ dốc.
Qui định các vùng của một lớp đối tượng địa lý phải được chi phủ hoàn toàn trùng khít với vùng của lớp đối tượng địa lý khác. Các đa giác có thể chung cạnh hoặc đỉnh. Luật này được sử dụng khi 2 hệ thống phân loại được sử dụng cho cùng khu vực địa lý. Do đó, bất kỳ điểm nào được xác định trong một hệ thống cũng phải được xác định trong hệ thống kia và hai lớp đối tượng địa lý che phủ cùng khu vực như nhau.
Phải được che phủ bởi
(Must be coverd by)
Hai vùng trong hai lớp đối tượng địa lý khác nhau
Qui định vùng của một lớp đối tượng địa lý phải được che phủ bên trong vùng của lớp đối tượng địa lý khác. Các đa giác có thể chung các cạnh hoặc đỉnh.
Lỗi vùng được tạo ra trên vùng trong lớp đối tượng địa lý đầu tiên không được che phủ bởi vùng trong lớp đối tượng địa lý thứ 2.
Luật này sử dụng trong việc mô hình hoá các vùng là tập con của một vùng bao lớn, rộng quanh
34
chẳng hạn như quản lý các cụm cây trong rừng hoặc các khối nhà trong khu nhà.
Đường biên phải được che phủ bởi đường biên
(Area boundary Hai vùng trong hai lớp đối tượng địa lý khác nhau
must be coverd
by boundary of) Qui định đường biên của các đối tượng địa lý vùng trong một lớp đối tượng địa lý phải được che phủ bởi đường biên của các đối tượng địa lý vùng trong lớp đối tượng địa lý khác.
Lỗi xảy ra trên đường biên vùng trong lớp đối tượng địa lý đầu tiên không được che phủ bởi đường biên vùng trong lớpdt còn lại.
Luật này được sử dụng khi đối tượng địa lý vùng trong một lớp bao gồm nhiều vùng trong lớp khác.
Ví dụ: áp dụng trong trường hợp các vùng và đường bao cần thành hang.
Đường bao phải được che phủ bởi.
(Boundary Lỗi được tạo ra trên các đường biên vùng
Must be
Qui định đường biên của các đối tượng địa lý vùng phải được che phủ bằng các đường trong thẳng lớp đối tượng địa lý khác. covered by) Vùng và đường thẳng trong hai lớp đối tượng địa lý khác nhau.
không được phủ bởi đường thẳng của lớp đối tượng địa lý kia. Ví dụ: đường biểu diễn phần đường biên khối điều tra dân số.
Sử dụng khi đường biên các đối tượng địa lý vùng được đánh dấu và đường thẳng có tập thuộc tính là khác nhau.
35
Vùng và
điểm trong 2
đối tượng địa lý
khác nhau. Bao gồm điểm Qui định một vùng trong một lớp đối tượng địa lý chứa ít nhất một điểm của lớp đối tượng địa lý khác. Các điểm phải nằm trong đa giác và không trên nằm đường bao.
Lỗi được tạo ra trên các vùng không chứa ít nhất một điểm.
Luật sử dụng khi mọi vùng cần có ít nhất một điểm liên kết.
Ví dụ: các thửa đất phải chứa ít nhất 1 điểm tâm thửa.
Một điểm trên đường bao vùng không được coi trong là chứa vùng đó.
Khi chồng xếp các vùng, các đa giác có thể chung 1 điểm trong vùng chồng xếp.
Ở trong trường hợp này tác giả sử dụng 2 luật:
- Must Not Overlap
36
Hình ảnh 3.17. Luật Must Not Overlap
- Must Not Have Gaps
Hình ảnh 3.18. Luật Must Not Have Gaps
Kết quả sau khi kiểm tra
37
Hình ảnh 3.19 Các vùng bị lỗi Topology
Tiếp sau đó cần phải kiểm tra và sửa lại những vùng được màu đỏ. Bên dưới sẽ là một số Hình ảnh phóng to của vùng lỗi sau khi gộp các mảnh bản đồ:
38
Hình ảnh 3.20. Lỗi chồng đè giữa 2 Polygon
Hình ảnh 3.21. Lỗi Polygon không khép kín
39
Hình ảnh 3.22. Lỗi đường phân chia ranh giới giữa các mảnh
3.6 Chuyển đổi hệ quy chiếu từ VN2000 sang WGS84
3.6.1 Tham số chuyển đổi và lưới chiếu
Sau khi thực hiện việc gộp các mảnh bản đồ lại với nhau sẽ được một bản đồ ranh giới Việt Nam được chi tiết tới cấp xã. Để có thể tích hợp vào một hệ thống và sử dụng cho các chuẩn dữ liệu toàn cầu thì việc tiếp theo cần phải chuẩn hóa hoặc chuyển đổi các độ đo quan trọng trong dữ liệu. Đối với các hệ thống GIS thì tham số đóng vai trò quan trọng đó là hệ quy chiếu. Việc chuyển đổi hệ quy chiếu sang hệ quy chiếu toàn cầu cần là một việc quan trọng trước khi thực hiện bước tiếp theo[16][17][18].
Theo quyết định 05/2007/QĐ-BTNMT[19] Về việc sử dụng hệ thống tham số tính chuyển giữa Hệ tọa độ quốc tế WGS-84 và Hệ tọa độ quốc gia VN-2000 của bộ Tài nguyên môi trường, các thông số quan trọng sử dụng trong chuyển đổi hệ tọa độ như sau:
1. Tham số dịch chuyển gốc tọa độ:
-191,90441429 m -39,30318279 m -111,45032835 m
2. Góc xoay trục tọa độ:
-0,00928836” -39,30318279 m -111,45032835 m
3. Hệ số tỷ lệ chiều dài:
k = 1,000000252906278.
40
Khi đó trong công thức (1) X,Y,Z là tọa độ vuông góc không gian trên hệ tọa độ WGS-84 và X’,Y’,Z’ là tọa độ vuông góc không gian trên hệ tọa độ VN-2000.
Bên cạnh đó cần phải xác định lưới chiếu UTM của dữ liệu đầu vào trước khi chuyển đổi. Thông tin về múi chiếu và tọa độ kinh tuyến trục được quy định tại Thông tư 973/2001/TT-TCĐC[4] của Tổng cục địa chính như sau:
Bảng 3-2. Bảng Múi chiếu
Múi 60 Múi 30
Số hiệu múi Kinh tuyến trục
1050 48
1110 49
1170 50 Số hiệu múi 481 482 491 492 501 502 Kinh tuyến trục 1020 1050 1080 1110 1140 1170
Với mỗi mảnh dữ liệu 1/50.000 có thông tin mô tả về sản phẩm như
sau:
Hình ảnh 3.23. Lý lịch bản đồ
41
Khi đó sẽ xác định được tập tin dữ liệu ở múi chiếu 3 và kinh tuyến
trục là 105 → Số múi UTM sẽ là 48.
Sau khi xác định được các tham số đầu vào bước tiếp theo là cần chuyển đổi hệ quy chiếu của dữ liệu shapefile. Ở đây tác giả lựa chọn sử dụng công cụ Geographic Transformation trên ArcMap để chuyển đổi.
Để thực hiện việc chuyển đổi hệ quy chiếu bước đầu tiên là tiến hành thêm một phương pháp chuyển đổi và bước tiếp theo là thực hiện việc chuyển đổi hệ quy chiếu của dữ liệu.
3.6.2 Thêm phương pháp chuyển đổi hệ quy chiếu:
Để thêm một phương pháp chuyển đổi hệ quy chiếu trên phần mềm ArcMap như sau: Catalog → Toolboxes → System Toolboxes → Data Management Tools → Projections and Transformation → Create Custom Geographic Transformation
Hình ảnh 3.24. Công cụ Projections and Transformation
Sau khi lựa chọn Create Custom Geographic Transformation một bảng thiết lập tham số chuyển đổi sẽ xuất hiện và lựa chọn các thông số kỹ thuật phù hợp để chuyển đổi dữ liệu.
42
Hình ảnh 3.25. Thiết lập tham số cho Projections and Transformation
Một số thông số quan trọng của bảng thiết lập tham số:
- Geographic Transformation Name: Đặt tên cho phương pháp chuyển
-
đổi Input Geographic Coordinate System: Lựa chọn hệ quy chiếu của dữ liệu đầu vào. Ở đây lựa chon VN_2000_UTM_Zone_48N theo thông số dữ liệu đầu vào đã được đề cập trên.
lựa chọn - Output Geographic Coordinate System: Ở đây
WGS_1984_UTM_Zone_48N.
chọn method là - Custom Geographic Transformation: Lựa
COORDINATE_FRAME
Sử dụng các tham số chuyển đổi ở trên để thay vào bảng tham số chuyển
đổi như sau:
43
Hình ảnh 3.26. Thiết lập tham số cho Projections and Transformation
Chuyển đổi hệ quy chiếu của dữ liệu:
3.6.3 Để chuyển đổi hệ quy chiếu của dữ liệu trên phần mềm ArcMap như sau: Catalog → Toolboxes → System Toolboxes → Data Management Tools → Projections and Transformation → Project.
Hình ảnh 3.27. Chuyển đổi hệ quy chiếu
Ở cửa sổ ứng dụng lựa chọn đường dẫn input, ouput dữ liệu và phương
pháp chuyển đổi đã được tạo ở trên.
Kết quả dữ liệu shapefile sau khi chuyển đổi đã được đưa về đúng với
hệ quy chiếu mong muốn.
44
Hình ảnh 3.28. Kết quả sau khi chuyển đổi
3.7 Xây dựng công cụ chuyển đổi dữ liệu từ shapefile sang đường Boundaries
trên OSM
Trong OSM các dữ liệu về đường biên giới địa giới được gọi chung là admin boundaries với tham số admin_level từ 1 → 11 để phân biệt các cấp độ hành chính. Ứng với với mỗi quốc gia hoặc vùng lãnh thổ sẽ có những mức level cho các cấp độ hành chính khác nhau. Trên OSM các lớp thông tin về admin boundaries của Việt Nam hiện nay đang được sử dụng 4 giá trị chính[20]:
- admin_level = 2: đường ranh giới quốc gia - admin_level = 4: đường ranh giới tỉnh hoặc thành phố trực thuộc trung
ương
- admin_level = 6: đường ranh giới thuộc quận, huyện, thị xã, thành phố
thuộc tỉnh.
- admin_level = 8: đường ranh giới cho xã, phường, thị trấn
45
/
N/A N/A N/A N/A N/A
Vietnam
province border: Tỉnh, thành phố trực thuộc TW commune / town / ward border: phường, xã, thị trấn district township border: quận, huyện, thị xã, thành phố thuộc tỉnh
3 4 5 6 7 8 9 10
Country
admin_level
Hình ảnh 3.29. Bảng Admin boundaries của Việt Nam trên OSM
3.7.1 Cấu trúc của một tập tin tin OSM
Để xây dựng được công cụ chuyển đổi dữ liệu từ shapfile sang tập tin
OSM thì bước đầu tiên cần kiểm tra xem cấu trúc của một OSM ra làm sao và
các tham số nào được sử dụng trong OSM để xác định đó là một đường biên
giới địa giới.
Cấu trúc của một tập tin OSM được lưu trữ dưới dạng một tập tin
XML, các nội dung trong một tập tin OSM quy định bởi các thẻ node, way và
relation.
- Node: là đại diện cho một điểm cụ thể được xác định bởi kinh độ và
vĩ độ. Thông tin của mỗi một Node bao gồm ít nhất là id của Node
và tọa độ của node. Mỗi một Node có một id và id của Node là duy
nhất.
- Way: là một danh sách từ 2 → 2.000 node thành lập lên một
polyline. Way dùng để biểu thị các đối tượng địa lý dạng đường
như biên giới, địa giới, sông ngòi, đường xá, … Way có 2 loại là
đóng và mở, nếu một Way có điểm đầu và điểm cuối giống nhau
được gọi là Way đóng.
- Relation: Mô tả mối liên kết giữa 2 hoặc nhiều đối tượng khác như
(Node, Way hoặc là Relation khác).
46
Dưới đây là một cấu trúc mẫu mô tả đường bao quanh của một xã trên
OSM:
Hình ảnh 3.30 . Cấu trúc của một tập tin OSM
Đối với Node và Way các thông tin sẽ giống với mô tả ở trên, còn đối với
Relation thì một số thẻ bắt buộc để mô tả đó là đường biên giới địa giới sẽ
bao gồm:
47
- admin_level: Xác định cấp hành chính, các giá trị sẽ là 4 cho hành
chính cấp tỉnh/thành phố trực thuộc trung ương; 6 cho hành chính
cấp huyện/thị xã/thành phố trực thuộc tỉnh; 8 cho hành chính cấp
xã/phường/thị trấn …
- boundary: administrative
- name: Tên đơn vị hành chính
type: boundary -
3.7.2 Các bước tiền xử lý dữ liệu shapefile
Để dễ dàng trong việc xử lý dữ liệu trước tiên sẽ cần phải thực hiện
một số bước tiền xử lý dữ liệu shapefile:
- Bước 1: Mở shapefile bằng phần mềm QGIS - Bước 2: Chuyển đổi các Polygon sang line - Bước 3: Sử dụng v.clean để phá vỡ các liên kết giữa các vùng - Bước 4: Lưu tập tin kết quả lại dưới dạng GeoJson
Dữ liệu được lưu dưới dạng GeoJson sẽ dễ dàng trong việc xử lý hơn ở định dạng shapefile, tận dụng lợi thế đó với sự hỗ trợ của phần mềm QGIS sẽ giúp việc chuyển đổi dữ liệu từ shapefile sang GeoJson một cách dễ dàng.
Với việc xây dựng đường biên giới địa giới thì dữ liệu được quan tâm sẽ là những đường viền bao quanh của một Polygon do đó trước khi được chuyển đổi sang GeoJson cần chuyển đổi Polygon sang line. Trên QGIS đã cung cấp sẵn Toolbox cho việc đó có tên là Poligon to line:
48
Hình ảnh 3.31. Polygon sang lines của QGIS
Trong cấu trúc dữ liệu trên tập tin OSM, đối với các vùng biên giới địa giới sẽ không được phép lặp lại các Node hoặc Way do đó sẽ cần phải thực hiện việc loại bỏ sự trùng lặp đó trước khi chuyển đổi. Trên phần mềm QGIS cung cấp công cụ v.clean giúp phá vỡ sự liên giữa các đường biên giới địa giới đó và đồng thời giúp xóa bỏ sự trùng lặp dữ liệu:
Hình ảnh 3.32. v.clean của QGIS
49
Dưới đây là Hình ảnh trước và sau khi sử dụng v.clean
Hình ảnh 3.33. Trước khi sử dụng v.clean
50
Hình ảnh 3.34. Sau khi sử dụng v.clean
Và bước cuối cần lưu lại dữ liệu gốc và dữ liệu sau khi đã chạy xong
v.clean lưu lại dưới dạng GeoJson.
Hình ảnh 3.35. Dữ liệu gốc
51
Hình ảnh 3.36. Dữ liệu sau khi chạy v.clean
3.7.3 Quy trình xây dựng chương trình xử lý Xây dựng chương trình xử lý bằng python thực hiên theo quy trình:
- Đầu vào gồm 2 tập tin GeoJson bao gồm: tập tin dữ liệu thô được gọi là Raw_data và tập tin dữ liệu đã được v.clean được gọi là Preprocess_data.
- Duyệt tập tin để lấy tất cả các Node từ tập tin Preprocess_data. - Lưu thông tin các Node theo cấu trúc của tập tin OSM vào tập tin kết
quả
- Xây dựng các Way từ tập tin Preprocess_data. - Lưu thông tin các Way theo cấu trúc của tập tin OSM vào tập tin kết
quả.
- Xây dựng các Relation từ các Way trước đó, xác định Way đó sẽ thuộc về xã nào, huyện nào hoặc tỉnh nào bằng cách đối chiếu với các mã đơn vị hành chính ở Raw_data.
- Lưu lại thông tin Relation theo cấu trúc của tập tin OSM vào tập tin kết
quả
Sau khi kết thúc quá trình xử lý sẽ thu được kết quả là tập tin OSM chứa
thông tin về các đường biên giới địa giới Việt Nam[21].
52
Hình ảnh 3.37. Tập tin OSM chứa thông tin về các đường biên giới địa
giới Việt Nam.
53
CHƯƠNG 4: KẾT QUẢ VÀ ĐÁNH GIÁ
Kết quả của chương trình biên tập dữ liệu biên giới, địa giới cho Nền tảng
cung cấp dịch vụ địa chỉ Việt Nam sẽ được mô tả ở dưới đây:
Kết thúc quá trình chuyển đổi dữ liệu sang tập tin dữ liệu OSM, thu được
kết quả biên giới địa giới cho 63 tỉnh thành, 708 huyện và 11.161 xã.
Bảng 4-1. Dữ liệu biên giới địa giới đã được biên tập từ CSDL địa hình
1/50.000
STT Nội dung Tổng số
Cấp tỉnh 1
Tỉnh 63 58
Thành phố trực thuộc Trung ương 5
Cấp huyện 708 2 Thành phố 64
Thị xã 47
Quận 49
Huyện 548
Cấp xã 11.161 3
Xã 9.001
Phường 1.545
Toàn bộ đường ranh giới địa giới sau khi được biên tập được mô tả trong tập
tin OSM với:
Thị trấn 615
- 1.500.206 Node: riêng biệt, mô tả các tọa độ điểm ranh giới địa giới
trên tập tin OSM.
- 39.621 Way: riêng biệt, mô tả thông tin về đường ranh giới địa giới
trên tập tin OSM.
54
- 11.385 Relation: riêng biệt, mô tả thông tin về các liên kết của các
Way trên tập tin OSM
Hình ảnh 4.1. Nội dung trong tập tin OSM
Đối chiếu với một số dịch vụ bản đồ số ở trong nước như GIS Chính Phủ (http://gis.chinhphu.vn/) và Việt Bản đồ (http://maps.vietbando.com/) thấy rằng dữ liệu được chuyển đổi ra khớp và bao phủ toàn bộ Việt Nam
55
Hình ảnh 4.2. Bản đồ số Việt bản đồ
56
Hình ảnh 4.3. Chồng lớp nên bản đồ Việt Bản đồ
57
Hình ảnh 4.4. Bản đồ số GIS Chính Phủ
58
Hình ảnh 4.5. Chồng lớp nên bản đồ GIS Chính Phủ
So sánh với dữ liệu địa giới hành chính của GIS chính phủ và Việt bản đồ thấy rằng các đường biên giới địa giới của sau khi chuyển đổi từ dữ liệu bản đồ 1/50.000 đã khớp với và bao phủ toàn Việt Nam.
59
Nhưng bên cạnh đó do nguồn dữ liệu cũ từ năm 2013 nên dữ liệu về địa giới hành chính sau khi được trích xuất ra có một số vùng dữ liệu không còn được chính xác so với thời điểm hiện tại.
Bảng 4-2. Địa danh hành chính Việt Nam tính tới 01/10/2020
STT Nội dung Tổng số
Cấp tỉnh 1
Tỉnh 63 58
Thành phố trực thuộc Trung ương 5
Cấp huyện 707 2 Thành phố 77
Thị xã 49
Quận 49
Huyện 532
Cấp xã 10.614 3
Xã 8.324
Phường 1.680
Thị trấn 610
Từ bảng [4-1] và bảng [4-2] đối chiếu lại có thể thấy biến đổi từ năm 2013 đến năm 2020:
- Cấp hành chính cấp tỉnh: Dữ liệu về hành chính cấp tỉnh/thành phố
trực thuộc trung ương không có thay đổi;
- Cấp hành chính cấp Huyện:
o Thành phố: Tăng từ 64 lên 77 o Thị xã: Tăng từ 47 lên 49 o Quận: Giữ nguyên 49 o Huyện: Giảm từ 548 xuống 532
- Cấp hành chính cấp xã:
o Xã: Giảm từ 9.001 xuống 8.342 o Phường: Tăng từ 1.545 lên 1.680
60
o Thị trấn: Giảm từ 615 xuống 610
61
KẾT LUẬN
Kết quả đạt được:
Qua quá trình tìm hiểu và nghiên cứu luận văn đã giải quyết được bài toán
là:
- Xây dựng quy trình và công cụ biên tập dữ liệu biên giới, địa giới cho Nền
tảng cung cấp dịch vụ địa chỉ Việt Nam.
- Luận văn đã thực hiện các công việc từ việc bóc tách dữ liệu biên giới địa
giới trên bản đồ địa hình 1/50.000, gộp các mảnh bản đồ, chuyển đổi hệ quy
chiếu cho dữ liệu cho tới việc chuyển đổi dữ liệu sang tập tin OSM.
- Biên tập và chỉnh sửa dữ liệu danh giới hành chính Việt Nam tới cấp xã bao
gồm: 63 tỉnh thành, 708 huyện và 11.161 xã.
Hạn chế:
- Quy trình và phương pháp thực hiện yêu cầu người thực hiện phải có am
hiểu nhất định về GIS và xử lý dữ liệu trong GIS.
- CSDL địa hình đã cũ so với thời điểm hiện tại, nên địa danh hành chính
cùng biên giới địa giới chưa được cập nhật đúng với thời điểm hiện tại.
- Một số vùng dữ liệu trong tập dữ liệu gốc không đầy đủ hoặc khuyết thiếu.
- Khi cập nhật dữ liệu bản đồ địa hình 1/50.000 yêu cầu cần phải thực hiện lại
quy trình từ đầu, tuy có thể lựa chọn vùng bị sửa đổi để cập nhật nhưng chỉ
chọn vùng chỉ có thể thực hiện với bước trích xuất dữ liệu biên giới địa giới
và gộp các mảnh bản đồ. Đến bước xử lý về sau bắt buộc phải xử lý toàn bộ
Việt Nam.
62
[1] Thủ tướng Chính phủ, “Quyết định số 677/QĐ-TTg của Thủ tướng Chính
phủ : Về việc phê duyệt Đề án ‘Phát triển Hệ tri thức Việt số hóa.’”
[2] Quốc hội, “Luật Đo đạc và Bản đồ số 27/2018/QH14 ngày 14/6/2018, hiệu
lực thi hành từ ngày 01/01/2019.” .
[3] Bộ Tài nguyên và Môi trường, Thông tư số 20/2014/TT-BTNMT của Bộ Tài nguyên và Môi trường : Quy định kỹ thuật về mô hình cấu trúc, nội dung cơ sở dữ liệu nền địa lý tỷ lệ 1:50.000, vol. 85, no. 1. 2014, pp. 2071–2079.
[4] Tổng cục địa Chính, “Thông tư 973/2001/TT-TCĐC của Tổng cục Địa chính
về việc hướng dẫn áp dụng hệ quy chiếu và hệ tọa độ quốc gia VN-2000.” .
[5]
(accessed
“OpenStreetMap.” https://www.openstreetmap.org/#map=18/21.03629/105.78499 Sep. 03, 2020).
1–4,
Jun.
pp.
[6] L. He, G. Wu, D. Dai, L. Chen, and G. Chen, “Data conversion between CAD and GIS in land planning,” in 2011 19th International Conference on Geoinformatics, doi: 2011, 10.1109/GeoInformatics.2011.5981193.
[7] D. C. Docan, “Learning ArcGIS for Desktop : create, analyze, and map your spatial data with ArcGIS for Desktop,” Learn. ArcGIS Deskt., no. March, 2016.
[8] C. WRITERS and and other Rhonda Glennon, “ArcMap Tutorial,” Far, vol. 5221112212, no. 52, pp. 227–19227, 2006, doi: 10.1007/s00779-014-0815-y.
[9] QGIS Development Team, “QGIS geographic information system developers manual,” Open Source Geospatial Found. Proj., pp. 1–625, 2020, [Online]. Available: http://www.qgis.org/wiki/Developers_Manual.
[10] UNHCR, “Mapping With Qgis for,” pp. 1–14, 2017.
[11] Z. U. Ahmed, T. J. Krupnik, and M. Kamal, “Introduction to basic GIS and spatial analysis using QGIS : Applications in Bangladesh,” CIMMYT- Bangladesh, no. May, p. 146, 2018.
[12] T. R. Control, “Using the JOSM Editor.”
[13] JOSM Editor Basic Manual, “Java OpenStreetMap Editor Basic Manual.”
[14] “Combining Spatial Data in ArcMap | GeoNet, The Esri Community | GIS Community.”
Professional
and Geospatial https://community.esri.com/groups/technical- support/blog/2014/12/02/combining-spatial-data-in-arcmap (accessed Sep.
TÀI LIỆU THAM KHẢO
63
03, 2020).
[15] “Topology
in
ArcGIS—Help
ArcGIS
for
|
Desktop.” https://desktop.arcgis.com/en/arcmap/10.3/manage-data/topologies/topology- in-arcgis.htm (accessed Sep. 03, 2020).
[16] IHO, “User Handbook of Datum Transformations involving WGS 84,” vol.
2003, no. 60, p. 112, 2008.
[17] X. Ye, X. Cao, D. Qiu, J. Cao, and Y. Wang, “Study and Realization of Coordinate Conversion in Vehicle Navigation,” in 2009 International Symposium on Intelligent Ubiquitous Computing and Education, May 2009, pp. 517–520, doi: 10.1109/IUCE.2009.81.
[18] V. Janssen, “Understanding coordinate reference systems, datums and transformations,” Int. J. Geoinformatics, vol. 5, no. 4, pp. 41–53, 2009.
[19] Bộ Tài nguyên và Môi trường, “Quyết định 05/2007/QĐ-BTNMT của Bộ Tài nguyên và Môi trường về sử dụng hệ thống tham số tính chuyển giữa hệ tọa độ quốc tế WGS-84 và hệ tọa độ quốc gia VN-2000.” .
[20] “Tag:boundary=administrative
-
OpenStreetMap
Wiki.”
https://wiki.openstreetmap.org/wiki/Tag:boundary%3Dadministrative (accessed Sep. 30, 2020).
[21] “JOSM.” https://josm.openstreetmap.de/ (accessed Sep. 03, 2020).