ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

HOÀNG XUÂN PHƯƠNG

XÂY DỰNG QUY TRÌNH VÀ CÔNG CỤ BIÊN TẬP DỮ LIỆU BIÊN GIỚI, ĐỊA GIỚI CHO NỀN TẢNG CUNG CẤP DỊCH VỤ ĐỊA CHỈ VIỆT NAM

LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN

Hà Nội – 10/2020

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

Hoàng Xuân Phương

XÂY DỰNG QUY TRÌNH VÀ CÔNG CỤ BIÊN TẬP DỮ LIỆU BIÊN GIỚI, ĐỊA GIỚI CHO NỀN TẢNG CUNG CẤP DỊCH VỤ ĐỊA CHỈ VIỆT NAM

Ngành: Hệ thống thông tin

Chuyên ngành: Hệ thống thông tin

Mã Số: 8480104.01

LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC:

TS. Bùi Quang Hưng

Hà Nội – 10/2020

i

Mục lục

LỜI CẢM ƠN ............................................................................................... III

LỜI CAM ĐOAN ......................................................................................... IV

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT .................................. V

DANH MỤC BẢNG BIỂU .......................................................................... VI

DANH MỤC HÌNH VẼ .............................................................................. VII

CHƯƠNG 1:GIỚI THIỆU ............................................................................. 1

1.1 ĐẶT VẤN ĐỀ, ĐỊNH HƯỚNG NGHIÊN CỨU ................................................ 1 1.2 MỤC TIÊU CỦA LUẬN VĂN ...................................................................... 2 1.3 PHẠM VI NGHIÊN CỨU CỦA LUẬN VĂN .................................................... 2 1.4 NỘI DUNG CỦA LUẬN VĂN ...................................................................... 2

CHƯƠNG 2: .. TỔNG QUAN VỀ DỮ LIỆU BIÊN GIỚI ĐỊA GIỚI CHO NỀN TẢNG CUNG CẤP DỊCH VỤ ĐỊA CHỈ ............................................ 4

2.1 NỀN TẢNG CUNG CẤP DỊCH VỤ ĐỊA CHỈ VIỆT NAM ................................. 4 2.1.1 Giới thiệu ...................................................................................... 4 2.1.2 Bản đồ số ...................................................................................... 7 2.1.3 Loại dữ liệu trên bản đồ số ........................................................... 7 2.2 DỮ LIỆU BIÊN GIỚI, ĐỊA GIỚI ................................................................... 9 2.2.1 Bản đồ địa hình ............................................................................. 9 2.2.2 Biên giới ...................................................................................... 12 2.2.3 Địa giới ....................................................................................... 13 2.2.4 Bản đồ địa hình 1/50.000 ............................................................ 14 2.2.5 Hệ quy chiếu VN2000 ................................................................. 14 2.2.6 OSM ............................................................................................ 15

CHƯƠNG 3: .. XÂY DỰNG QUY TRÌNH VÀ CÔNG CỤ BIÊN TẬP DỮ LIỆU BIÊN GIỚI ĐỊA GIỚI ....................................................................... 16

3.1 QUY TRÌNH BIÊN TẬP DỮ LIỆU BIÊN GIỚI ĐỊA GIỚI ................................. 17 3.2 TRÍCH XUẤT DỮ LIỆU BIÊN GIỚI QUỐC GIA VÀ DỮ LIỆU ĐỊA GIỚI HÀNH CHÍNH TỪ TẬP DỮ LIỆU BẢN ĐỒ ĐỊA HÌNH ..................................................... 18 3.3 GỘP CÁC MẢNH BẢN ĐỒ THEO CẤP HÀNH CHÍNH: XÃ, HUYỆN, TỈNH ...... 23 3.3.1 Gộp các mảnh rời rạc lại thành một mảnh thống nhất: ............. 23

ii

3.3.2 Loại bỏ đường chia cắt của các mảnh sau khi gộp: ................... 25 3.4 BỔ SUNG THÔNG TIN HÀNH CHÍNH CẤP HUYỆN, TỈNH ........................... 26 3.5 SỬA LỖI SAU KHI GỘP ........................................................................... 30 3.6 CHUYỂN ĐỔI HỆ QUY CHIẾU TỪ VN2000 SANG WGS84 ...................... 39 3.6.1 Tham số chuyển đổi và lưới chiếu .............................................. 39 3.6.2 Thêm phương pháp chuyển đổi hệ quy chiếu: ............................ 41 3.6.3 Chuyển đổi hệ quy chiếu của dữ liệu: ........................................ 43

3.7 XÂY DỰNG CÔNG CỤ CHUYỂN ĐỔI DỮ LIỆU TỪ SHAPEFILE SANG ĐƯỜNG BOUNDARIES TRÊN OSM ............................................................................. 44 3.7.1 Cấu trúc của một tập tin tin OSM ............................................... 45 3.7.2 Các bước tiền xử lý dữ liệu shapefile ......................................... 47 3.7.3 Quy trình xây dựng chương trình xử lý ...................................... 51

CHƯƠNG 4:KẾT QUẢ VÀ ĐÁNH GIÁ ................................................... 53

KẾT LUẬN .................................................................................................... 61

TÀI LIỆU THAM KHẢO ............................................................................ 62

iii

LỜI CẢM ƠN

Trước tiên tôi xin dành lời cảm ơn chân thành và sâu sắc đến thầy giáo, TS. Bùi Quang Hưng – người đã hướng dẫn, khuyến khích, chỉ bảo và tạo cho tôi những điều kiện tốt nhất từ khi bắt đầu cho tới khi hoàn thành công việc của mình.

Tôi xin dành lời cảm ơn chân thành tới các thầy cô giáo khoa Công nghệ thông tin, trường Đại học Công nghệ, ĐHQGHN đã tận tình đào tạo, cung cấp cho tôi những kiến thức vô cùng quý giá và đã tạo điều kiện tốt nhất cho tôi trong suốt quá trình học tập, nghiên cứu tại trường.

Đồng thời tôi xin cảm ơn tất cả những người thân trong gia đình tôi cùng toàn thể bạn bè những người đã luôn giúp đỡ, động viên tôi những khi vấp phải những khó khăn, bế tắc.

Cuối cùng, tôi xin chân thành cảm ơn các đồng nghiệp của tôi tại Trung tâm tích hợp liên ngành và giám sát hiện trường - FIMO đã giúp đỡ, tạo điều kiện thuận lợi cho tôi học tập và nghiên cứu chương trình thạc sĩ tại Đại học Công nghệ, ĐHQGHN.

Luận văn này được hỗ trợ bởi đề tài nghiên cứu ứng dụng và phát triển công nghệ cấp quốc gia: "Nghiên cứu xây dựng Nền tảng cung cấp dịch vụ dữ liệu địa chỉ Việt Nam phục vụ phát triển các ứng dụng dân sinh”, Mã số: ĐTCT-KC-4.0-03/19/25.

iv

LỜI CAM ĐOAN

Tôi xin cam đoan rằng luận văn thạc sĩ hệ thống thông tin “Xây dựng quy trình và công cụ biên tập dữ liệu biên giới, địa giới cho nền tảng cung cấp dịch vụ địa chỉ Việt Nam” là công trình nghiên cứu của riêng tôi, không sao chép lại của người khác. Trong toàn bộ nội dung của luận văn, những điều đã được trình bày hoặc là của chính cá nhân tôi hoặc là được tổng hợp từ nhiều nguồn tài liệu. Tất cả các nguồn tài liệu tham khảo đều có xuất xứ rõ ràng và hợp pháp.

Tôi xin hoàn toàn chịu trách nhiệm và chịu mọi hình thức kỷ luật theo

quy định cho lời cam đoan này.

Hà Nội, ngày 01 tháng 10 năm 2020

Hoàng Xuân Phương

v

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT

Thuật ngữ, khái niệm Định nghĩa Ghi chú

Các từ viết tắt CSDL OSM

NĐL GIS

ArcMap

Merge

Dissolve

VNPost APIs

Cơ sở dữ liệu. Open Street Map – Nền tảng bản đồ mở. Nền địa lý. Geographic information system – Hệ thống thông tin địa lý. Là một chương trình trong bộ phần mềm ArcGIS. ArcMap cho phép người sử dụng thực hiện các chức năng: hiển thị trực quan, tạo lập bản đồ, trợ giúp quyết định, trình bày, … Gộp 2 hoặc nhiều lớp bản đồ lại thành một lớp bản đồ duy nhất. Chập các đối tượng kề nhau thành một đối tượng duy nhất thông qua một hoặc nhiều thuộc tính chung. Tổng công ty bưu điện Việt Nam Application Programing Interface – Giao diện lập trình ứng dụng.

Node

Way

Relation

admin_level

Một điểm trên OSM được xác định bằng kinh độ, vĩ độ và ID. Được sử dụng trên OSM xác định bằng các Node để xác định các đối tượng dạng đường và ranh giới khu vực. Được sử dụng trên OSM để xác định mối quan hệ giữa các đối tượng Node, Way. Được sử dụng trong OSM để xác định cấp độ của đường boundaries.

vi

DANH MỤC BẢNG BIỂU

Bảng 1. Số lượng đơn vị địa giới hành chính tính đến 01/10/2020 ................ 13

Bảng 3-1. Bảng luật topology trong ArcMap ................................................. 31

Bảng 3-2. Bảng múi chiếu .............................................................................. 40

Bảng 4-1. Dữ liệu biên giới địa giới đã được biên tập từ csdl địa hình 1/50.000 .......................................................................................................... 53

Bảng 4-2. Địa danh hành chính việt nam tính tới 01/10/2020 ....................... 59

vii

DANH MỤC HÌNH VẼ

Hình ảnh 2.1. Kiến trúc tổng thể của nền tảng cung cấp dịch vụ dữ liệu địa chỉ Việt Nam ..................................................................................................... 5

Hình ảnh.2.2. Giao diện OSM ........................................................................ 15

Hình ảnh 3.1. Kiến trúc tổng quan của nền tảng cung cấp dịch vụ địa chỉ .... 16

Hình ảnh 3.2. Các bước biên tập dữ liệu biên giới địa giới của Việt Nam .... 18

Hình ảnh 3.3. Cấu trúc dữ liệu của bản đồ địa hình 1/50.000 ........................ 19

Hình ảnh 3.4. VN2000 múi 30 cho FME ......................................................... 20

Hình ảnh 3.5. Chuyển đổi dữ liệu sang shapefile ........................................... 21

Hình ảnh 3.6. Các shapefile thu được ............................................................. 22

Hình ảnh 3.7. Các bước gộp dữ liệu ............................................................... 23

Hình ảnh 3.8. Công cụ Merge của ArcMap .................................................... 24

Hình ảnh 3.9. Kết quả sau khi Merge ............................................................. 24

Hình ảnh 3.10. Công cụ Dissolve của ArcMap .............................................. 25

Hình ảnh 3.11. Kết quả sau khi Dissolve........................................................ 26

Hình ảnh 3.12. Bảng dữ liệu của ranh giới địa giới cấp xã sau khi gộp ......... 27

Hình ảnh 3.13. Bảng dữ liệu của ranh giới địa giới cấp huyện sau khi gộp ... 27

Hình ảnh 3.14. Bảng dữ liệu của ranh giới địa giới cấp tỉnh sau khi gộp ...... 28

Hình ảnh 3.15. Join sử dụng ArcMap ............................................................. 29

Hình ảnh 3.16. Kết quả thu được sau khi join ................................................ 30

Hình ảnh 3.18. Luật must not have gaps ........................................................ 36

Hình ảnh 3.19 Các vùng bị lỗi topology ......................................................... 37

Hình ảnh 3.20. Lỗi chồng đè giữa 2 polygon ................................................. 38

Hình ảnh 3.21. Lỗi polygon không khép kín .................................................. 38

Hình ảnh 3.22. Lỗi đường phân chia ranh giới giữa các mảnh ...................... 39

Hình ảnh 3.23. Lý lịch bản đồ ........................................................................ 40

Hình ảnh 3.24. Công cụ projections and transformation ................................ 41

Hình ảnh 3.25. Thiết lập tham số cho projections and transformation........... 42

viii

Hình ảnh 3.26. Thiết lập tham số cho projections and transformation........... 43

Hình ảnh 3.27. Chuyển đổi hệ quy chiếu........................................................ 43

Hình ảnh 3.28. Kết quả sau khi chuyển đổi .................................................... 44

Hình ảnh 3.29. Bảng admin boundaries của Việt Nam trên OSM ................. 45

Hình ảnh 3.30 . Cấu trúc của một tập tin OSM .............................................. 46

Hình ảnh 3.31. Polygon sang lines của QGIS ................................................ 48

Hình ảnh 3.32. v.clean của QGIS ................................................................... 48

Hình ảnh 3.33. Trước khi sử dụng v.clean ..................................................... 49

Hình ảnh 3.34. Sau khi sử dụng v.clean ......................................................... 50

Hình ảnh 3.35. Dữ liệu gốc ............................................................................. 50

Hình ảnh 3.36. Dữ liệu sau khi chạy v.clean .................................................. 51

Hình ảnh 3.37. Tập tin OSM chứa thông tin về các đường biên giới địa giới Việt Nam. ........................................................................................................ 52

Hình ảnh 4.1. Nội dung trong tập tin OSM .................................................... 54

Hình ảnh 4.2. Bản đồ số việt bản đồ ............................................................... 55

Hình ảnh 4.3. Chồng lớp nền bản đồ Việt bản đồ .......................................... 56

Hình ảnh 4.4. Bản đồ số GIS Chính phủ ........................................................ 57

Hình ảnh 4.5. Chồng lớp nên bản đồ GIS Chính phủ ..................................... 58

1

CHƯƠNG 1: GIỚI THIỆU

1.1 Đặt vấn đề, định hướng nghiên cứu

Đề án Phát triển Hệ tri thức Việt số hóa: Phát triển Hệ tri thức Việt số hóa, là đề án của Chính phủ Việt Nam được phê duyệt theo Quyết định số 677/QĐ-TTg[1] của Thủ tướng Chính phủ ngày 18/05/2017. Đề án có mục tiêu xây dựng một hệ tri thức tổng hợp trong mọi lĩnh vực, góp phần thúc đẩy, tạo điều kiện để mọi người dân học tập suốt đời, làm chủ tri thức, tăng cường nghiên cứu sáng tạo, ứng dụng tiến bộ khoa học công nghệ, thúc đẩy phát triển đất nước. Đề án được xây dựng và cập nhật theo hình thức xã hội hóa, thu hút và khuyến khích mọi người dân và doanh nghiệp tham gia, với vai trò vừa khai thác vừa đóng góp để làm giàu các tài nguyên tri thức số hóa của Việt Nam. Góp phần khơi dậy, lan toả niềm đam mê khoa học và công nghệ, khát vọng sáng tạo, cống hiến của mọi người trong việc tạo lập và phổ biến tri thức. Đề án hướng tới phổ cập thông tin khoa học và công nghệ cho mọi tầng lớp người dân trong xã hội, nhất là các vùng nông thôn, vùng sâu, vùng xa; học sinh, sinh viên, người lao động.

Một trong những nội dung quan trọng của Đề án là Nghiên cứu xây dựng Nền tảng cung cấp dịch vụ dữ liệu địa chỉ của Việt Nam phục vụ phát triển các ứng dụng dân sinh do Đại học Quốc gia Hà Nội chủ trì. Nền tảng cung cấp dịch vụ dữ liệu địa chỉ Việt Nam sẽ là nền tảng cơ bản để trên đó các nhà phát triển xây dựng các ứng dụng dân sinh phục vụ các nhu cầu khác nhau của cộng đồng như tìm kiếm vị trí, địa điểm, địa chỉ, du lịch, văn hóa, giáo dục, y tế, …

Trong các công việc đó, việc xây dựng lớp dữ liệu biên giới địa giới là nhiệm vụ đầu tiên cần phải thực hiện và cũng là dữ liệu đóng vai trò cơ sở cho các lớp dữ liệu địa chỉ. Việc xây dựng dữ liệu dữ liệu bản đồ cho biên giới địa giới Việt Nam có thể được tổng hợp và biên tập từ nhiều mảnh bản đồ có các độ phân giải khác nhau, dẫn đến dữ liệu khi được tổng hợp thành một thể thống nhất sẽ có nhiều vùng bị khuyết dữ liệu hoặc các vùng không được liền mạch. Bài toán đặt ra cần phải chỉnh sửa hoặc cập nhật lại các vùng dữ liệu bị khuyết đó.

2

1.2 Mục tiêu của luận văn

Đứng trước các nhu cầu cấp thiết đó tôi đã quyết định chọn đề tài “Xây dựng quy trình và công cụ biên tập dữ liệu biên giới, địa giới cho Nền tảng cung cấp dịch vụ địa chỉ Việt Nam” làm đề tài nghiên cứu của mình.

Đề tài này nhằm mục đích nghiên cứu và Xây dựng quy trình và công cụ biên tập dữ liệu biên giới, địa giới cho Nền tảng cung cấp dịch vụ địa chỉ Việt Nam.

1.3 Phạm vi nghiên cứu của luận văn

Công việc thực hiện xây dựng quy trình và biên tập dữ liệu biên giới, địa giới tích hớp vào nền tảng cung cấp dịch vụ địa chỉ, là một công việc phức tạp yêu cầu nhiều kiến thức chuyên môn khác nhau và cần nhiều thời gian để thực hiện. Vì vậy trong luận văn này tôi chỉ tập chung chính vào một số công việc như sau:

- Xây dựng quy trình gộp các mảnh bản đồ 1:50.000.

- Lỗi và phương pháp xử lý lỗi khi gộp các mảnh bản đồ lại với nhau.

- Xây dựng công cụ chuyển đổi dữ liệu từ dữ liệu shapefile sang định

dạng tập tin OSM.

- Chỉnh sửa dữ liệu tập tin OSM sau khi chuyển đổi.

1.4 Nội dung của luận văn

Luận văn thực hiện xuyên suốt trong quá trình từ khi hình thành các khái niệm, ý tưởng nghiên cứu, cho đến khi xây dựng được quy trình và công cụ biên tập dữ liệu biên giới, địa giới cho Nền tảng cung cấp dịch vụ địa chỉ Việt Nam. Nội dung chính bao gồm các phần sau:

• Chương 1: Mở Đầu, đặt ra vấn đề, mục tiêu và giải pháp cho bài

toán “Xây dựng quy trình và công cụ biên tập dữ liệu biên giới,

địa giới cho Nền tảng cung cấp dịch vụ địa chỉ Việt Nam”.

• Chương 2: trình bày các khái niệm cơ bản phục vụ cho nghiên

cứu của đề tài.

• Chương 3: Quy trình và phương pháp thực hiện sẽ được trình

bày trong chương này.

3

• Chương 4: Giới thiệu về công nghệ sử dụng và kết quả thực

nghiệm.

• Cuối cùng là phần kết luận, định hướng nghiên cứu tiếp theo.

4

CHƯƠNG 2: TỔNG QUAN VỀ DỮ LIỆU BIÊN GIỚI ĐỊA GIỚI

CHO NỀN TẢNG CUNG CẤP DỊCH VỤ ĐỊA CHỈ

2.1 Nền tảng cung cấp dịch vụ địa chỉ Việt Nam

2.1.1 Giới thiệu

Luật đo đạc và bản đồ ban hành ngày 14/6/2018 và có hiệu lực từ ngày 1/1/2019[2] chỉ rõ chính sách của Nhà nước về nghiên cứu và phát triển Hạ tầng dữ liệu không gian địa lý quốc gia là tập hợp chính sách, thể chế, tiêu chuẩn, công nghệ, dữ liệu và nguồn lực nhằm chia sẻ, sử dụng hiệu quả dữ liệu không gian địa lý trong cả nước. Nội dung xây dựng hạ tầng dữ liệu không gian địa lý quốc gia bao gồm: (i) Xây dựng chiến lược phát triển, kế hoạch triển khai thực hiện hạ tầng dữ liệu không gian địa lý quốc gia; (ii) Xây dựng cơ chế, chính sách, nguồn lực để tổ chức triển khai thực hiện chiến lược phát triển, kế hoạch triển khai thực hiện hạ tầng dữ liệu không gian địa lý quốc gia; (iii) Lựa chọn và phát triển công nghệ, xây dựng tiêu chuẩn, quy chuẩn kỹ thuật về hạ tầng dữ liệu không gian địa lý quốc gia; (iv) Xây dựng, tích hợp dữ liệu không gian địa lý; (v) Xây dựng, vận hành Cổng thông tin không gian địa lý Việt Nam và các ứng dụng, dịch vụ dữ liệu không gian địa lý.

Việc nghiên cứu phát triển Nền tảng dịch vụ dữ liệu địa chỉ Việt Nam có thể coi như là một nghiên cứu thử nghiệm cho việc xây dựng, vận hành Cổng thông tin không gian địa lý Việt Nam và các ứng dụng, dịch vụ dữ liệu không gian địa lý.

5

Hình ảnh 2.1. Kiến trúc tổng thể của Nền tảng cung cấp dịch vụ dữ liệu

địa chỉ Việt Nam

Hình trên mô tả kiến trúc tổng thể của Nền tảng cung cấp dịch vụ dữ liệu

địa chỉ Việt Nam. Nền tảng này gồm các thành phần sau:

❖ Biên giới, địa giới hành chính tỉnh, huyện, xã:

o Dữ liệu biên giới và địa giới hành chính toàn quốc (tỉnh,

huyện, xã): sử dụng CSDL nền địa lý tỉ lệ 1:50.000 của Cục

Đo đạc, Bản đồ và Thông tin địa lý Việt Nam, Bộ Tài nguyên

và Môi trường. CSDL nền địa lý 1:50.000 toàn quốc đã được

Trường Đại học Công nghệ, ĐHQGHN mua năm 2014 trong

6

khuôn khổ một dự án nghiên cứu về Công nghệ tích hợp liên

ngành Giám sát hiện trường.

❖ Đường, phố:

o Dữ liệu đường toàn quốc sử dụng các nguồn dữ liệu sau: o Dữ liệu đường của cơ sở dữ liệu nền địa lý tỉ lệ 1:50.000 của

cục đo đạc, bản đồ và thông tin địa lý Việt Nam o Dữ liệu đường của Open Street Map (OSM) [3] o Dữ liệu đường cho thành phố hà nội sử dụng các nguồn dữ

liệu sau:

▪ Dữ liệu đường của csdl nền địa lý tỉ lệ 1:10.000 cho

thành phố Hà Nội.

▪ Dữ liệu đường của OSM.

o Dữ liệu đường cho thành phố hồ chí minh sử dụng các nguồn

dữ liệu sau:

▪ Dữ liệu đường của cơ sở dữ liệu nền địa lý tỉ lệ

1:10.000 cho thành phố Hồ Chí Minh.

▪ Dữ liệu đường của OSM.

❖ Dữ liệu địa chỉ:

o Cơ sở dữ liệu địa chỉ đã được thu thập được bởi tổng công ty

bưu điện Việt Nam (VNPost).

o Cơ sở dữ liệu địa chỉ các cơ sở giáo dục đã được thu thập bởi

Bộ Giáo dục và Đào tạo.

o Cơ sở dữ liệu địa chỉ các cơ sở y tế đã được thu thập bởi Bộ

Y tế.

o Cơ sở dữ liệu địa chỉ các cơ sở lưu trú đã được thu thập bởi

Bộ Văn hóa – Thể thao – Du lịch.

❖ Các thuật toán (tìm kiếm địa chỉ, tìm đường) và quản lý, biên tập dữ

liệu:

o Thuật toán tìm kiếm địa chỉ (geocoding). o Thuật toán tìm đường (route planning). o Bộ công cụ quản lý và biên tập dữ liệu địa chỉ.

❖ APIs cung cấp bộ giao diên lập trình ứng dụng (application

programing interface).

❖ Các ứng dụng:

o Ứng dụng web cho nền tảng dịch cung cấp dịch vụ bản đồ

Việt Nam.

7

o Ứng dụng di động cho nền tảng dịch cung cấp dịch vụ bản đồ

Việt Nam (Android và iOS).

o Các ứng dụng khác được phát triển dựa trên các APIs cung cấp bởi nền tảng dịch cung cấp dịch vụ bản đồ Việt Nam.

❖ Người dùng của nền tảng dịch cung cấp dịch vụ bản đồ Việt Nam

bao gồm các nhóm sau:

o Nhóm người dùng cá nhân: Các chức năng để khai thác, tìm kiếm địa chỉ, tìm đường đi cho các loại phương tiện giao thông và người đi bộ.

o Nhóm chuyên gia dữ liệu địa chỉ: Các chức năng chỉnh sửa,

cập nhật, kiểm tra, phân tích dữ liệu địa chỉ.

o Nhóm các nhà phát triển các ứng dụng dân sinh phục vụ công tác nghiệp vụ của tổng công ty bưu điện Việt Nam và đề án hệ tri thức việt số hóa: cung cấp bộ APIs để các nhà phát triển phần mềm sử dụng trong việc xây dựng ứng dụng dân sinh.

Phần trên giải thích tính cấp thiết và mô tả kiến trúc tổng quan của Nền

tảng dịch cung cấp dịch vụ bản đồ Việt Nam.

2.1.2 Bản đồ số

Bản đồ số là một tập hợp có tổ chức, lưu trữ các dữ liệu bản đồ trên thiết bị có khả năng đọc bằng máy tính và được thể hiện dưới dạng hình ảnh bản đồ.

Bản đồ số giúp biểu diễn các trực quan về thế giới. Chúng thường thể hiện các ý tưởng tốt hơn là từ ngữ. Cách này sẽ giúp chúng ta trả lời được nhiều câu hỏi. Trường học hoặc bệnh viện nào là gần nhất? Ai là người tiếp cận với những cơ sở này khó khăn nhất? Khu vực nào là khu vực nghèo nhất? Những câu hỏi đó có thể được thể hiện tốt nhất thông qua các bản đồ và bản đồ có thể trả lời cho những câu hỏi như vậy.

Bản đồ số hàm chứa nhiều thông tin. Bên cạnh đó bản đồ số có thể mô tả thông tin cho các đối tượng khác nhau ở những khu vực khác nhau, giải quyết các vấn đề của cộng đồng, hoặc đơn thuần là giúp ai đó tìm đường đi.

2.1.3 Loại dữ liệu trên bản đồ số

Bản đồ số lưu theo loại đối tượng dưới đây:

8

- Điểm (Points): Đối tượng đơn có vị trí. Ví dụ: Trường học, hiệu

thuốc, nhà hàng, …

- Đường (Arcs): Các đối tượng dạng tuyến. Ví dụ: đường sá, sông,

đường tàu, …

- Vùng (Polygons): Vùng có diện tích, định nghĩa bởi đường bao. Ví

dụ thửa loại đất

Để phản ánh toàn bộ các thông tin cần thiết của bản đồ dưới dạng đối tượng số, các đối tượng địa lý còn được phản ánh theo cấu trúc phân mảnh và phân lớp thông tin.

Cấu trúc phân mảnh: Một đối tượng địa lý về mặt không gian có thể liên tục trên một phạm vi rộng. Tuy nhiên trong cơ sở dữ liệu GIS, do hạn chế về các lý do kỹ thuật như khả năng lưu trữ, xử lý, quản lý dữ liệu mà các đối tượng địa lý lưu trữ dưới dạng cách mảnh (mapsheet, tile). Tuy nhiên khái niệm chia mảnh trong cơ sở dữ liệu GIS không hoàn toàn đồng nhất với khái niệm chia mảnh bản đồ thông thường. Một mảnh (tile) trong cơ sở dữ liệu GIS có thể có hình dạng bất kỳ miễn sau cho phù hợp với khả năng quản lý và xử lý của hệ thống. Trong một số hệ thống GIS đã có, người dùng phải tự quản lý cách chia mảnh của mình. Tuy nhiên xu hướng hiện nay, các hệ thống GIS đã cung cấp những công cụ cho phép người sử dụng tự động quản lý các mảnh trong cơ sở dữ liệu. Một số GIS tiến bộ hơn, dựa trên các kỹ thuật mới của công nghệ hướng đối tượng, về mặt vật lý, các đối tượng địa lý bị chia cắt theo từng mảnh, nhưng đối với người sử dụng, các đối tượng là liên tục không bị chia cắt.

Cấu trúc phân lớp thông tin: Một trong những bước quan trọng xây dựng cơ sở dữ liệu GIS là phân loại các lớp thông tin (layer, class). Hệ thống GIS lưu trữ các đối tượng địa lý theo các lớp thông tin. Mỗi lớp thông tin lưu trữ một loại các đối tượng có chung một tính chất, đặc điểm giống nhau. Thiết kế các lớp thông tin rất quan trọng đối với bất kỳ một hệ thống GIS nào. Cách phân lớp thông tin sẽ ảnh hưởng rất lớn đến tính hiệu quả, khả năng xử lý và sử dụng lâu dài của cơ sở dữ liệu không gian.

Một số nguyên tắc khi thiết kế các lớp thông tin:

9

❖ Có các lớp thông tin cơ bản: các ứng dụng khác nhằm cần đến

những lớp thông tin cơ bản (thông tin nền) Ví dụ như:

- Lớp thông tin cơ sở toán học bản đồ: điểm khống chế, khung,

điểm độ cao, trắc địa nhà nước, …

- Lớp thông tin về địa hình

- Lớp thông tin về hệ thống thuỷ văn

- Lớp thông tin về hệ thống đường giao thông

❖ Đủ các lớp thông tin chuyên đề: Tuỳ từng ứng dụng và yêu cầu cụ

thể trước mắt, việc chọn lựa các lớp thông tin chuyên đề được lưu

trữ trong cơ sở dữ liệu và thứ tự nhập vào là quan trọng. Nó ảnh

hưởng trực tiếp đến giá thành và thời gian xây dựng cơ sở dữ liệu

GIS

2.2 Dữ liệu biên giới, địa giới

Các dữ liệu về biên giới địa giới trong luận văn này sẽ được biên tập

dựa trên dữ liệu bản đồ địa hình 1:50.000 của Việt Nam.

2.2.1 Bản đồ địa hình

Bản đồ địa hình: Là loại bản đồ chuyên đề có tỉ lệ: 1:1.000.000 hoặc lớn hơn trên bản đồ, địa hình và địa vật một khu vực bề mặt trái đất được thể hiện một cách chính xác và chi tiết bằng hệ thống các qui ước ký hiệu thích hợp. Ví dụ: Địa hình rừng núi, sông suối, biển; Địa vật nhứ nhà máy – sân bay – bến cảng nhà ga, đình, chùa, cây to độc lập.

Ý nghĩa của bản đồ địa hình: Bản đồ địa hình trong đời sống xã hội có một ý nghĩa rất to lón trong việc giải quyết các vấn đề khoa học và thực tiễn, nhũng vấn đề có liên quan đến nghiên cứu địa hình, lợi dụng địa hình để tiến hành thiết kế, xây dựng các công trình trên thực địa. Trong quân sự: Bản đồ địa hình giúp người chỉ huy nắm chắc các yếu tố để chỉ đạo tác chiến trên đất liền, trên biển và trên không. Trong thực tế không phải lúc nào cũng ra thực địa để quan sát trực tiếp bằng mắt. Tuy có cụ thể hơn chính xác hơn nhưng rất hạn chế về tầm nhìn, do tính chất của địa hình, do tình hình địch v.v…

10

chính vì vậy bản đồ địa hình là phương tiện không thể thiếu của người chỉ huy.

Phân loại đặc điểm, công dụng của bản đồ địa hình: Trong phân loại

thông thường bản đồ được phân ra 2 loại:

- Bản đồ địa lý cơ bản. - Bản đồ chuyên dùng: quân sự, kinh tế, văn hóa, xã hội, khoáng sản,

Đặc điểm khung bản đồ và ghi chú xung quanh: Khung bản đồ: dùng để trang trí bản đồ, là những đường giới hạn diện tích của mỗi mảnh bản đồ. Khung bản đồ được gọi tên khung bắc, nam, đông, tây. Ghi chú xung quanh khung bản đồ: nhằm thuyết minh giải thích cho người sử dụng bản đồ biết cách gọi tên và sử dụng các ký hiệu trên bản đồ.

Về nguyên tắc ghi chú xung quanh của bản đồ Gauss và bản đồ UTM về cơ bản giống nhau chỉ khác cách sắp xếp vị trí, cách ghi, cách trình bày (hiện nay thống nhất cả nước ta sử dụng bản đồ theo phép chiếu Gauss).

- Khung bắc: ghi tên bản đồ, ghi địa danh hành chính cấp cao nhất được thể hiện trong bản đồ, hoặc địa danh nổi tiếng trong vùng dân cư dưới tên bản đồ ghi số hiệu của mảnh bản đồ (xác định mảnh bản đồ này nằm ở vị trí nào trên trái đất).

- Bên trái tên bản đồ ghi tên vị trí địa chỉ 1 khu vực, địa chỉ tổng quát

1 huyện, 1 tỉnh.

- Khung nam: ghi tỷ lệ số, tỷ lệ thước, tỷ lệ chữ, phía dưới tỷ lệ chữ ghi chú khoảng cao đều của đường biên độ cơ bản, tùy theo tỷ lệ bản đồ mà ghi chú này thay đổi – lược đồ bản chắp: giúp người sử dụng biết các mảnh bản đồ cần chắp với các mảnh bản đồ đang dùng.

- Tiếp theo là phần chỉ dẫn các ký hiệu giúp người sử dụng tra cứu

khi sử dụng bản đồ.

Cơ sở toán học của bản đồ địa hình:

Tỉ lệ bản đồ: là yếu tố toán học quan trọng để xác định mức độ thu nhỏ, độ dài khi chuyển từ mặt cong của trái đất lên mặt phẳng của bản đồ; là tỷ số

11

giữa độ dài trên bản đồ và độ dài ngoài thực địa; là mức độ thu nhỏ chiều dài nằm ngang của các đường trên thực địa khi biểu thị chúng trên bản đồ. Tỷ lệ bản đồ được biểu diễn dưới dạng phân số 1/M (Tử số là độ dài trên bản đồ, M là độ dài trên thực địa).

Tỉ lệ bản đồ được biểu diễn dưới 3 dạng

- Tỉ lệ số: tỉ lệ dạng phân số, ví dụ 1: 50.000; 1/50.000… - Tỉ lệ chữ: thường được ghi rõ dưới khung nam bản đồ, ví dụ: 1cm

bằng 500m ngoài thực địa (bản đồ tỉ lệ 1: 50.000)

- Tỉ lệ thước: trên mỗi tờ bản đồ đều có một thước tỉ lệ thẳng đã tính

ra cự ly thực địa.

Phép chiếu: Hiện tại ta có hai phép chiếu để thể hiện trái đất lên mặt

bản đồ.

- Phép chiếu GAUSS của nhà bác học người Đức - Phép chiếu UTM của quân đội Mỹ.

Cả hai phép chiếu là cách chiếu hình kinh tuyến và vĩ tuyến từ mặt trái đất lên mặt phẳng giấy bằng phương pháp toán học (hiện tại ta thống nhất sử dụng bản đố theo phương pháp chiếu GAUSS).

Cách chia mảnh và ghi số bản đồ: Tùy theo phương pháp chiếu đồ để

thực hiện việc chia mảnh và ghi số hiệu bản đồ.

Theo phương pháp chiếu Gauss:

- Bản đồ tỷ lệ 1:1.000.000:

▪ Chia mặt trái đất thành 60 dải chiếu đồ đánh số thứ tự từ 1 – 60. Dải số 1 từ 180 độ đến 174 độ tây và tiến dần về phía đông đến dải số 60 mỗi dải cách nhau 6 độ. Việt Nam nằm ở dải số 48 và 49.

▪ Chia dải chiếu đồ theo vĩ độ từng khoảng 4 độ kể từ xích đạo trở lên phía Bắc cực và xuống Nam cực, đánh thứ tự A, B, C, D, …tính từ xích đạo. Việt Nam thuộc 4 khoảng C, D, E, F. ▪ Mổi hình thang cong (6 độ vĩ tuyến và 4 độ kinh tuyến) là

khuôn khổ một mảnh bản đồ tỷ lệ 1:1000.000

12

▪ Dùng cặp chữ trước số sau để ghi số hiệu cho một mảnh bản

đồ. Hà Nội nằm ở mảnh F- 48.

- Bản đố tỷ lệ: 1:100.000:

▪ Chia mảnh bản đồ tỷ lệ 1.000.000 thành 144 ô nhỏ, mổi ô dọc 20’ ngang 30’ là khuôn khổ một mảnh bản đồ tỷ lệ 1:100.000.

▪ Số hiệu đánh từ 1 – 144 (từ trái qua phải, từ trên xuống dưới)

ghi vào sau số hiệu mảnh bản đồ tỷ lệ 1:1000.000.

▪ Ví dụ: F – 48 – 116.

- Bản đồ tỷ lệ: 1:50.000

▪ Chia mảnh bản đồ tỷ lệ 1: 100.000 thành 4 ô nhỏ mỗi ô dọc 10’ ngang 15’ đánh số A, B, C, D (từ trái qua phải từ trên xuống dưới), ghi sau số hiệu mảnh bản đồ tỷ lệ 1: 100.000 Ví dụ: F48 – 116 – B.

- Bản đồ tỷ lệ: 1:25.000:

▪ Chia mảnh bản đồ tỷ lệ 1: 50.000 thành 4 ô nhỏ mỗi ô dọc 5’ ngang 7’ 30’’ đánh số a, b, c, d (từ trái qua phải từ trên xuống dưới), ghi sau số hiệu mảnh bản đồ tỷ lệ 1: 50.000 Ví dụ: F48 – 116 – B - a.

Bản đồ, lưới toạ độ quốc gia và các trạm GPS là những tài liệu điều tra cơ bản được xây dựng theo chuẩn thống nhất, đảm bảo cung cấp thông tin nhanh, chính xác cho mọi hoạt động quản lý nhà nước, phát triển kinh tế, xã hội, bảo vệ đất nước, nghiên cứu khoa học...

2.2.2 Biên giới

Đường biên giới Quốc gia được xác định rất rõ, nó là hàng rào pháp lý xác định giới hạn vùng đất, vùng nước, vùng biển, vùng trời và lòng đất thuộc chủ quyền quốc gia; là nới phân chia chủ quyền lãnh thổ của một quốc gia này với một quốc gia khác và hoặc với các vùng biển thuộc quyền chủ quyền và quyền tài phán của quốc gia đó. Nước ta có đường biên giới đất liền dài 4.516 km, tiếp giáp với 3 nước láng giềng (Trung Quốc, Lào, Căm-pu- chia); có bờ biển dài khoảng 3.260 km. Nói một cách khác, đường biên giới quốc gia chính là giới hạn ngăn cách lãnh thổ quốc gia này với quốc gia khác, ngăn cách lãnh hải với vùng đặc quyền kinh tế và thềm lục địa của một quốc gia.

13

Trong điều 1, Luật Biên giới quốc gia năm 2003 của ta nêu rõ “Biên giới quốc gia của nước Cộng hoà xã hội chủ nghĩa Việt Nam là đường và mặt thẳng đứng theo đường đó để xác định giới hạn lãnh thổ đất liền, các đảo, các quần đảo trong đó có quần đảo Hoàng Sa và Trường Sa, vùng biển, lòng đất, vùng trời của nước Cộng hoà xã hội chủ nghĩa Việt Nam.

Trong nội dung luận văn này về phần xác định đường biên giới Quốc

gia chỉ giới hạn với vùng biên giới trên đất liền.

2.2.3 Địa giới

Địa giới hành chính là đường ranh giới phân chia các đơn vị hành chính, là cơ sở pháp lý phân định phạm vi trách nhiệm của bộ máy hành chính nhà nước trong việc quản lý dân cư, đất đai, kinh tế, chính trị, văn hóa, xã hội ở địa phương. Địa giới hành chính được xác định bằng các mốc giới cụ thể, thể hiện tọa độ của vị trí đó. Việt Nam có 4 cấp hành chính đó là: cấp trung ương, cấp tỉnh, cấp huyện và cấp xã. Địa giới hành chính chỉ được xác lập ở 3 cấp: tỉnh, huyện, xã.

Mỗi địa giới hành chính là một thực thể trong nền hành chính Nhà nước. Mỗi đơn vị địa giới hành chính cần phải được xác định cụ thể về: địa lý, dân cư. Trong quản lý của nhà nước cần phải xác định rõ không gian tác động của hoạt động quản lý. Hay nó cách khác với mỗi đơn vị địa giới hành chính cần phải được xác định rõ giới hạn và không gian, địa bàn cụ thể.

Bảng 1. Số lượng đơn vị địa giới hành chính tính đến 01/10/2020(1)

STT Nội dung Tổng số

Cấp tỉnh 1

Tỉnh 63 58

Thành phố trực thuộc Trung ương 5

Cấp huyện 707 2

Thành phố 77

Thị xã 49

1. https://www.moha.gov.vn/danh-muc/linh-vuc-chinh-quyen-dia-phuong-dia-gioi-hanh-chinh-26074.html

Quận 49

14

Huyện 532

Cấp xã 10.614 3

Xã 8.324

Phường 1.680

Thị trấn 610

Chính vì thế, các đơn vị hành chính cấp xã, cấp huyện, cấp tỉnh cần xác

định rõ “đường biên” hay “ranh giới” và được lưu trữ quản lý.

2.2.4 Bản đồ địa hình 1/50.000

Bản đồ địa hình 1/50.000[3] của Việt Nam: Bộ bản đồ địa hình phủ trùm toàn bộ lãnh thổ Viêt Nam gồm 740 mảnh trong đó gồm: 573 mảnh bản đồ số, 98 mảnh bản đồ địa hình biên giới Việt - Lào, Việt Nam - Trung Quốc, và 69 mảnh bản đồ địa hình đáy biển. Các mảnh bản đồ số này bao gồm 7 tập tin cho phép người sử dụng có thể tìm hiểu thông tin về cơ sở toán học, thủy hệ, địa hình, giao thông, dân cư, ranh giới, thực vật và có thể tạo mô hình không gian 3 chiều cho bề mặt địa hình.

2.2.5 Hệ quy chiếu VN2000

Theo nội dung của thông tư 973/2001/TT-TCĐC[4] của Tổng cục Địa chính: hệ quy chiếu và Hệ toạ độ quốc gia VN-2000 (gọi tắt là VN-2000) được áp dụng thống nhất để xây dựng hệ thống toạ độ các cấp hạng, hệ thống bản đồ địa hình cơ bản, hệ thống bản đồ nền, hệ thống bản đồ địa chính, hệ thống bản đồ hành chính quốc gia và các loại bản đồ chuyên đề khác. Trong hoạt động đo đạc và bản đồ chuyên dụng, khi cần thiết được áp dụng các hệ quy chiếu khác phù hợp với mục đích riêng.

Các tham số được sử dụng trong VN2000:

- Ellipsoid quy chiếu quốc gia là ê-líp-xô-ít WGS-84 toàn cầu với

kích thước:

▪ Bán trục lớn: a = 6378137,0m ▪ Độ dẹt: f = 1: 298,257223563 ▪ Tốc độ góc quay quanh trục: ▪ Hằng số trọng trường Trái đất:  = 7292115,0x10-11 rad/s GM= 3986005.108m3s-2

15

- Vị trí Ellipsoid quy chiếu quốc gia: Ellipsoid WGS-84 toàn cầu được xác định vị trí (định vị) phù hợp với lãnh thổ Việt Nam trên cơ sở sử dụng điểm GPS cạnh dài có độ cao thuỷ chuẩn phân bố đều trên toàn lãnh thổ.

- Điểm gốc toạ độ quốc gia: Điểm N00 đặt tại Viện Nghiên cứu Địa chính thuộc Tổng cục Địa chính, đường Hoàng Quốc Việt, Hà Nội.

2.2.6 OSM

OpenStreetMap[5] được viết tắt OSM là một dự án cộng đồng, với mục đích tạo ra một bản đồ thế giới miễn phí và bất cứ ai đều có thể tham gia đóng góp hoặc chỉnh sửa dữ liệu. Với việc thuận tiện và dễ dàng tham gia đóng góp xây dựng bản đồ, nên mỗi ngày có hàng ngàn tình nguyện viên tích cực tham gia đóng góp để cải thiện chất lượng bản đồ.

Các thành viên tình nguyện có thể tham gia đo vẽ dữ liệu đường phố, các điểm tiện ích quan tâm (POI) và một số thông tin địa lý liên quan. Toàn bộ dữ liệu được chia sẻ và cho phép tất cả những ai có nhu cầu tải về tại www.openstreetmap.org để phục vụ cho mục đích riêng của mình mà không phải trả bất kì khoản phí nào cả. Ngoài ra dữ liệu từ OSM còn được dùng trong một số ứng dụng thương mại và miễn phí trên các nền tảng.

Hình ảnh.2.2. Giao diện OSM

16

CHƯƠNG 3: XÂY DỰNG QUY TRÌNH VÀ CÔNG CỤ BIÊN TẬP

DỮ LIỆU BIÊN GIỚI ĐỊA GIỚI

Dữ liệu biên giới địa giới của nền tảng cung cấp dịch vụ địa chỉ được biên tập từ dữ liệu bản đồ địa hình. Dữ liệu sau khi được biên tập và chuẩn hóa sẽ được nạp vào trong CSDL, từ dữ liệu đó sẽ đóng vai trò cho việc xuất bản dịch vụ bản đồ nền về ranh giới địa giới Việt Nam. Và đóng vai trò cung cấp thông tin bổ sung cho các API truy vấn về sau.

Hình ảnh 3.1. Kiến trúc tổng quan của nền tảng cung cấp dịch vụ địa chỉ

17

3.1 Quy trình biên tập dữ liệu biên giới địa giới

Bản đồ địa hình Việt Nam 1/50.000 thuộc hệ thống bản đồ địa hình quốc gia, được thành lập cho phần đất liền, phần hải đảo và thềm lục địa của Việt Nam trong hệ quy chiếu và hệ tọa độ quốc gia VN-2000, hệ độ cao quốc gia Việt Nam. Các mảnh bản đồ địa hình gốc dạng số được lưu trữ dưới dạng MicroStation (*.dgn).

Quy trình biên tập dữ liệu biên giới địa giới được thực hiện từ việc chuyển đổi dữ liệu thô đến bước xây dựng công cụ chuyển đổi và bổ sung thông tin vào dữ liệu kết quả.

Để biên tập dữ liệu biên giới địa giới của Việt Nam sẽ được thực hiện

thông qua các bước như sau:

- Bước 1: Trích xuất dữ liệu biên giới quốc gia và dữ liệu địa giới

hành chính từ tập dữ liệu bản đồ địa hình.

- Bước 2: Gộp các mảnh mảnh bản đồ theo cấp hành chính: xã,

huyện, tỉnh

- Bước 3: Sửa lỗi sau khi gộp - Bước 3: Bổ sung thông tin hành chính cấp tỉnh, cấp huyện vào ranh

giới hành chính cấp xã.

- Bước 4: Chuyển đổi hệ quy chiếu từ VN2000 sang WGS84. - Bước 5: Chuyển đổi dữ liệu từ shapefile sang tập tin OSM thông

qua công cụ chuyển đổi.

18

Hình ảnh 3.2. Các bước biên tập dữ liệu biên giới địa giới của Việt Nam

Nội dung các bước thực hiện sẽ được trình bày chi tiết ở các mục tiếp

theo.

3.2 Trích xuất dữ liệu biên giới quốc gia và dữ liệu địa giới hành chính từ tập

dữ liệu bản đồ địa hình

Bản đồ địa hình 1/50.000 là các tập tin dữ liệu MicroStation gồm các dữ liệu về vị trí và hình học của các đối tượng đia lý và các thông tin khác có liên quan tới đối tượng địa lý đó. Mỗi một mảnh dữ liệu địa hình 1/50.000 bao gồm các lớp dữ liệu sau:

- Cơ sở đo đạc - Biên giới địa giới - Địa hình - Thủy hệ

19

- Giao thông - Dân cư cơ sở hạ tầng - Phủ bề mặt

Hình ảnh 3.3. Cấu trúc dữ liệu của bản đồ địa hình 1/50.000

Trong nội dung của luận văn này tác giả chỉ sử dụng lớp dữ liệu biên

giới địa giới.

Định dạng tập tin *.DGN là tên được sử dụng cho các định dạng tập tin CAD hỗ trợ bởi Bentley Systems, chương trình MicroStation CAD. Định dạng DGN được sử dụng trong các dự án xây dựng, bao gồm các tòa nhà, đường cao tốc, cầu cống, nhà máy xử lý, đóng tàu. DGN là một định dạng cạnh tranh để DWG của Autodesk.

Định dạng shapefile (SHP) là một định dạng dữ liệu vector không gian địa lý cho hệ thống thông tin địa lý phần mềm (GIS). Nó được phát triển và quy định của ESRI như một đặc điểm kỹ thuật chủ yếu là mở cửa cho khả năng tương tác dữ liệu giữa các ESRI và các sản phẩm phần mềm GIS khác. Định dạng shapefile không gian có thể mô tả các tính năng vector: điểm,

20

đường và đa giác, đại diện, ví dụ, giếng nước, sông, hồ. Mỗi mục thường có thuộc tính mô tả nó, chẳng hạn như tên hoặc nhiệt độ.

Để thực hiện chuyển đổi dữ liệu bản đồ địa hình sang shapefile trong luận văn này tác giả sử dụng phần mềm FME[6]. FME hỗ trợ chuyển đổi nhanh định dạng các tập tin địa lý.

Do dữ liệu gốc ở hệ quy chiếu VN2000 múi 30 nhưng trong hệ chuyển đổi của FME không có, do vậy trước khi chuyển đổi dữ liệu cần thiết lập cho FME hỗ trợ chuyển đổi đối VN2000 múi 30. Mở tập tin cấu hình MyCoordSysDefs.fme bổ sung thêm config VN2000 múi 30 như sau:

Hình ảnh 3.4. VN2000 múi 30 cho FME

Sau khi đã thêm thiết lập cho FME sẽ tiến hành chuyển đổi dữ liệu

MicroStation bằng công cụ Quick Translation của FME như sau:

21

Hình ảnh 3.5. Chuyển đổi dữ liệu sang shapefile

Dữ liệu đầu vào sẽ bao gồm:

- Format: Bentley MicroStation Design (V7) - Dataset: Đường dẫn tới tập tin dữ liệu cần chuyển đổi - Coord.System: VN2000-105-Mui_3do - Output Format: Lựa chọn Esri Shapefile

Kết quả sau khi chuyển đổi từ tập tin dữ liệu MicroStation sang shapefile sẽ thu được các tập tin shapefile bao gồm: DiaPhanTinh, DiaPhanHuyen, DiaPhanXa, MocBienGioi.

22

Hình ảnh 3.6. Các shapefile thu được

Từ các shapefile thu được sẽ được tiền xử lý qua các công cụ ArcMap[7][8], QGIS[9][10][11], JOSM[12][13] để giúp tăng chất lượng dữ liệu hoặc chuyển đổi qua các định dạng có thể xử lý về sau.

23

3.3 Gộp các mảnh bản đồ theo cấp hành chính: xã, huyện, tỉnh

Kết thúc quá trình chuyển đổi định dạng dạng dữ liệu sẽ thu được 740 mảnh dữ liệu ranh giới cấp xã, 740 mảnh dữ liệu ranh giới cấp huyện, 740 mảnh dữ liệu cấp tỉnh.

Từ các mảnh dữ liệu đó tác giả sẽ thực hiện các bước sau:

- Gộp các mảnh rời rạc lại thành một mảnh thống nhất - Loại bỏ đường chia cắt giữa các mảnh sau khi gộp - Sửa lỗi sau khi gộp - Bổ sung thông tin hành chính sau khi gộp

Hình ảnh 3.7. Các bước gộp dữ liệu

3.3.1 Gộp các mảnh rời rạc lại thành một mảnh thống nhất:

Để gộp các mảnh bản đồ ranh giới cấp xã lại thành một mảnh thống

nhất sử dụng công cụ Merge của ArcMap[14]

24

Hình ảnh 3.8. Công cụ Merge của ArcMap

Kết quả sau khi sau khi Merge các mảnh dữ liệu lại với nhau sẽ bao gồm các polygon ranh giới, thông tin của từng đơn vị xã/phường/thị trấn và đường phân chia của các mảnh:

Hình ảnh 3.9. Kết quả sau khi Merge

Bước kế cần phải thực hiện loại bỏ các đường phân chia của các mảnh.

25

3.3.2 Loại bỏ đường chia cắt của các mảnh sau khi gộp:

Để loại bỏ các đường phân chia của các mảnh sau khi gộp thông qua

công cụ Dissolve của ArcMap.

Hình ảnh 3.10. Công cụ Dissolve của ArcMap

Kết quả sau khi thực hiên Dissolve các đường viền phân chia của các

mảnh dữ liệu đã được loại bỏ.

26

Hình ảnh 3.11. Kết quả sau khi Dissolve

Đối với các mảnh dữ liệu cấp huyện và cấp tỉnh cũng thực hiện các

bước tương tự.

Kết thúc quá trình gộp dữ liệu sẽ thu được 3 shapefile về ranh giới địa

3.4 Bổ sung thông tin hành chính cấp huyện, tỉnh giới cho cấp xã, cấp huyện và cấp tỉnh.

Bảng dữ liệu của ranh giới địa giới cấp xã sau khi gộp

27

Hình ảnh 3.12. Bảng dữ liệu của ranh giới địa giới cấp xã sau khi gộp

Bảng dữ liệu của ranh giới địa giới cấp huyện sau khi gộp

Hình ảnh 3.13. Bảng dữ liệu của ranh giới địa giới cấp huyện sau khi

gộp

Bảng dữ liệu của ranh giới địa giới cấp tỉnh sau khi gộp

28

Hình ảnh 3.14. Bảng dữ liệu của ranh giới địa giới cấp tỉnh sau khi gộp

Sau khi đã có các shapefile như trên, bước tiếp theo cần thêm các trường thông tin mã đơn vị hành chính (MDVHC) cấp huyện, tên huyện, mã đơn vị hành chính cấp tỉnh và tên tỉnh vào từng bản ghi một của shapefile ranh giới địa giới cấp xã.

Để có thể thực hiện việc thêm thông tin từ shapefile ranh giới địa giới cấp huyện, cấp tỉnh vào cấp xã cần sử dụng công cụ Join trên ArcMap với thiết lập như trong hình bên dưới để thực hiện việc Join giữa 2 shapefile dựa trên không gian của các polygon:

29

Hình ảnh 3.15. Join sử dụng ArcMap

Sau khi Join xong và loại bỏ những trường không cần thiết sẽ thu được một shapefile có cấu trúc như sau:

30

Hình ảnh 3.16. Kết quả thu được sau khi Join

3.5 Sửa lỗi sau khi gộp

Sau khi hoàn thiện việc gộp các mảnh bản đồ sẽ có một số lỗi ngoại lệ xuất hiện trên bản đồ cần phải sửa lại. Các lỗi gặp phải là những lỗi liên quan đến liên kết không gian trong Polygon hay còn gọi là những lỗi liên quan đến Topology.

Quan hệ không gian Topology trong GIS là mối quan hệ logic giữa vị trí của các đối tượng. Cấu trúc dữ liệu thuộc Topology cung cấp một cách tự động hóa để xử lý việc số hóa, xử lý lỗi; giảm dung lượng lưu trữ dữ liệu cho các vùng vì các ranh giới giữa những vùng nằm kề nhau được lưu trữ chỉ một lần; và cho phép chúng ta cấu trúc dữ liệu dựa trên các nguyên lý về tính kề cận (adjacency) và kết nối (connectivity) để xác định các quan hệ không gian.

Ngoài ra Topology là mô hình được sử dụng để mô tả làm thế nào các đối tượng chia sẻ hình học với nhau. Và cũng là cơ chế để xây dựng và duy trì quan hệ Topology giữa các đối tượng. ArcGIS thực thi quan hệ Topology thông qua một tập các quy tắc định nghĩa các đối tượng chia sẻ hình học với nhau theo cách nào và một tập các công cụ chỉnh sửa các đối tượng vi phạm quy tắc đề ra.

Một số lỗi gặp phải sau khi gộp bao gồm:

- Đường phân chia ranh giới giữa các mảnh chưa mất - Polygon không kín

31

- 2 Polygon bị chồng đè - Xuất hiện vùng chống giữa polygon

Sử dụng công cụ Topology trên ArcMap để validate và sửa lỗi dữ liệu, thiết lập các luật cho Topology để ArcMap để kiểm tra các lỗi có trong dữ liệu.

Bảng 3-1. Bảng luật Topology trong ArcMap[15]

Luật topology Mô tả Sử dụng Minh hoạ

Phải lớn hơn Vùng

dung sai

cluster

Trong trường hợp luật này bị vi phạm, trái của phần bên hình ban đầu sẽ không bị thay đổi. (must be

larger tolerance) Các đỉnh vi phạm luật này được xác định là không trùng khớp và được bắt vào nhau.

Luật này là bắt buộc topology trong một và có thể áp dụng cho tất cả các lớp đối tượng địa lý vùng

Dung sai cluster: là khoảng cách nhỏ nhất giữa 2 đỉnh của đối tượng địa lý.

Phải không Vùng

chồng xếp

(Must not

overlap)

Qui định bên trong các vùng trong lớp đối tượng địa lý là không chồng xếp. thể Các vùng có chung các cạnh hoặc đỉnh.

Luật này có ích trong việc mô hình hóa ranh giới hành chính, khu vực bầu cử và phân loại khu vực riêng như khu bầu cử không được che phủ trên vùng bao khu.

32

Phải không có khoảng trống

(Must not Vùng không có khoảng trống

hanve gaps)

Các vùng đất không thể bao gồm khoảng trống. Do vậy các đa giác phải bao phủ toàn bộ khu vực.

Luật qui định rằng không có bất kì khoảng trống nào bên trong một vùng hoặc giữa các vùng liền kề. Tất cả các vùng phải trải trên một bề mặt lên tục. Sẽ luôn tồn tại lỗi trên biên ngoài của vùng.

Phải không

chồng xếp với

( Must not

overlap vith) Hai vùng trong hai lớp đối tượng địa lý khác nhau.

rời Lỗi được tạo ra tại vị trí các đa giác của hai lớp đối tượng địa lý chồng xếp.

là 2

Qui định rằng trong một lớp đối tượng địa lý không được chồng xếp với vùng trong lớp đối tượng địa lý khác. Hai vùng có thể cùng các cạnh, các đỉnh hoặc rạc hoàn toàn. Luật này có ích khi chồng xếp 2 hệ thống riêng biệt với nhau của phân loại vùng. Lớp sông hồ và lớp đất trồng lớp đối tượng địa lý khác nhau do đó 2 lớp không được chồng xếp.

Hai vùng

trong 2 Phải được che phủ bởi lớp đối tượng địa lý

lớp đối

(Must be covered by feature class of) tượng địa lý Qui định một vùng trong một lớp đối tượng địa lý phải có diện tích hoàn toàn được che phủ trong vùng của lớp đối tượng địa lý khác.

Lỗi vùng được tạo ra với đa giác trong lớp đối tượng địa lý đầu tiên tại vị trí không được che phủ. khác nhau

Quận phải được che phủ bởi các phường.

33

Phải che phủ

lẫn nhau

(Must cover

each other) Hai vùng trong hai đối lớp tượng địa lý khác nhau

Tất cả các đa giác trong lớp đối tượng địa lý đầu tiên và tất cả các đa giác trong lớp đối tượng địa lý thứ 2 phải được che phủ lẫn nhau

Thực vật và đất trồng phải được che phủ lẫn nhau. Luật cũng có thể được áp dụng với các lớp đối tượng địa lý không phân cấp như kiểu đất trồng và lớpđộ dốc.

Qui định các vùng của một lớp đối tượng địa lý phải được chi phủ hoàn toàn trùng khít với vùng của lớp đối tượng địa lý khác. Các đa giác có thể chung cạnh hoặc đỉnh. Luật này được sử dụng khi 2 hệ thống phân loại được sử dụng cho cùng khu vực địa lý. Do đó, bất kỳ điểm nào được xác định trong một hệ thống cũng phải được xác định trong hệ thống kia và hai lớp đối tượng địa lý che phủ cùng khu vực như nhau.

Phải được che phủ bởi

(Must be coverd by)

Hai vùng trong hai lớp đối tượng địa lý khác nhau

Qui định vùng của một lớp đối tượng địa lý phải được che phủ bên trong vùng của lớp đối tượng địa lý khác. Các đa giác có thể chung các cạnh hoặc đỉnh.

Lỗi vùng được tạo ra trên vùng trong lớp đối tượng địa lý đầu tiên không được che phủ bởi vùng trong lớp đối tượng địa lý thứ 2.

Luật này sử dụng trong việc mô hình hoá các vùng là tập con của một vùng bao lớn, rộng quanh

34

chẳng hạn như quản lý các cụm cây trong rừng hoặc các khối nhà trong khu nhà.

Đường biên phải được che phủ bởi đường biên

(Area boundary Hai vùng trong hai lớp đối tượng địa lý khác nhau

must be coverd

by boundary of) Qui định đường biên của các đối tượng địa lý vùng trong một lớp đối tượng địa lý phải được che phủ bởi đường biên của các đối tượng địa lý vùng trong lớp đối tượng địa lý khác.

Lỗi xảy ra trên đường biên vùng trong lớp đối tượng địa lý đầu tiên không được che phủ bởi đường biên vùng trong lớpdt còn lại.

Luật này được sử dụng khi đối tượng địa lý vùng trong một lớp bao gồm nhiều vùng trong lớp khác.

Ví dụ: áp dụng trong trường hợp các vùng và đường bao cần thành hang.

Đường bao phải được che phủ bởi.

(Boundary Lỗi được tạo ra trên các đường biên vùng

Must be

Qui định đường biên của các đối tượng địa lý vùng phải được che phủ bằng các đường trong thẳng lớp đối tượng địa lý khác. covered by) Vùng và đường thẳng trong hai lớp đối tượng địa lý khác nhau.

không được phủ bởi đường thẳng của lớp đối tượng địa lý kia. Ví dụ: đường biểu diễn phần đường biên khối điều tra dân số.

Sử dụng khi đường biên các đối tượng địa lý vùng được đánh dấu và đường thẳng có tập thuộc tính là khác nhau.

35

Vùng và

điểm trong 2

đối tượng địa lý

khác nhau. Bao gồm điểm Qui định một vùng trong một lớp đối tượng địa lý chứa ít nhất một điểm của lớp đối tượng địa lý khác. Các điểm phải nằm trong đa giác và không trên nằm đường bao.

Lỗi được tạo ra trên các vùng không chứa ít nhất một điểm.

Luật sử dụng khi mọi vùng cần có ít nhất một điểm liên kết.

Ví dụ: các thửa đất phải chứa ít nhất 1 điểm tâm thửa.

Một điểm trên đường bao vùng không được coi trong là chứa vùng đó.

Khi chồng xếp các vùng, các đa giác có thể chung 1 điểm trong vùng chồng xếp.

Ở trong trường hợp này tác giả sử dụng 2 luật:

- Must Not Overlap

36

Hình ảnh 3.17. Luật Must Not Overlap

- Must Not Have Gaps

Hình ảnh 3.18. Luật Must Not Have Gaps

Kết quả sau khi kiểm tra

37

Hình ảnh 3.19 Các vùng bị lỗi Topology

Tiếp sau đó cần phải kiểm tra và sửa lại những vùng được màu đỏ. Bên dưới sẽ là một số Hình ảnh phóng to của vùng lỗi sau khi gộp các mảnh bản đồ:

38

Hình ảnh 3.20. Lỗi chồng đè giữa 2 Polygon

Hình ảnh 3.21. Lỗi Polygon không khép kín

39

Hình ảnh 3.22. Lỗi đường phân chia ranh giới giữa các mảnh

3.6 Chuyển đổi hệ quy chiếu từ VN2000 sang WGS84

3.6.1 Tham số chuyển đổi và lưới chiếu

Sau khi thực hiện việc gộp các mảnh bản đồ lại với nhau sẽ được một bản đồ ranh giới Việt Nam được chi tiết tới cấp xã. Để có thể tích hợp vào một hệ thống và sử dụng cho các chuẩn dữ liệu toàn cầu thì việc tiếp theo cần phải chuẩn hóa hoặc chuyển đổi các độ đo quan trọng trong dữ liệu. Đối với các hệ thống GIS thì tham số đóng vai trò quan trọng đó là hệ quy chiếu. Việc chuyển đổi hệ quy chiếu sang hệ quy chiếu toàn cầu cần là một việc quan trọng trước khi thực hiện bước tiếp theo[16][17][18].

Theo quyết định 05/2007/QĐ-BTNMT[19] Về việc sử dụng hệ thống tham số tính chuyển giữa Hệ tọa độ quốc tế WGS-84 và Hệ tọa độ quốc gia VN-2000 của bộ Tài nguyên môi trường, các thông số quan trọng sử dụng trong chuyển đổi hệ tọa độ như sau:

1. Tham số dịch chuyển gốc tọa độ:

-191,90441429 m -39,30318279 m -111,45032835 m

2. Góc xoay trục tọa độ:

-0,00928836” -39,30318279 m -111,45032835 m

3. Hệ số tỷ lệ chiều dài:

k = 1,000000252906278.

40

Khi đó trong công thức (1) X,Y,Z là tọa độ vuông góc không gian trên hệ tọa độ WGS-84 và X’,Y’,Z’ là tọa độ vuông góc không gian trên hệ tọa độ VN-2000.

Bên cạnh đó cần phải xác định lưới chiếu UTM của dữ liệu đầu vào trước khi chuyển đổi. Thông tin về múi chiếu và tọa độ kinh tuyến trục được quy định tại Thông tư 973/2001/TT-TCĐC[4] của Tổng cục địa chính như sau:

Bảng 3-2. Bảng Múi chiếu

Múi 60 Múi 30

Số hiệu múi Kinh tuyến trục

1050 48

1110 49

1170 50 Số hiệu múi 481 482 491 492 501 502 Kinh tuyến trục 1020 1050 1080 1110 1140 1170

Với mỗi mảnh dữ liệu 1/50.000 có thông tin mô tả về sản phẩm như

sau:

Hình ảnh 3.23. Lý lịch bản đồ

41

Khi đó sẽ xác định được tập tin dữ liệu ở múi chiếu 3 và kinh tuyến

trục là 105 → Số múi UTM sẽ là 48.

Sau khi xác định được các tham số đầu vào bước tiếp theo là cần chuyển đổi hệ quy chiếu của dữ liệu shapefile. Ở đây tác giả lựa chọn sử dụng công cụ Geographic Transformation trên ArcMap để chuyển đổi.

Để thực hiện việc chuyển đổi hệ quy chiếu bước đầu tiên là tiến hành thêm một phương pháp chuyển đổi và bước tiếp theo là thực hiện việc chuyển đổi hệ quy chiếu của dữ liệu.

3.6.2 Thêm phương pháp chuyển đổi hệ quy chiếu:

Để thêm một phương pháp chuyển đổi hệ quy chiếu trên phần mềm ArcMap như sau: Catalog → Toolboxes → System Toolboxes → Data Management Tools → Projections and Transformation → Create Custom Geographic Transformation

Hình ảnh 3.24. Công cụ Projections and Transformation

Sau khi lựa chọn Create Custom Geographic Transformation một bảng thiết lập tham số chuyển đổi sẽ xuất hiện và lựa chọn các thông số kỹ thuật phù hợp để chuyển đổi dữ liệu.

42

Hình ảnh 3.25. Thiết lập tham số cho Projections and Transformation

Một số thông số quan trọng của bảng thiết lập tham số:

- Geographic Transformation Name: Đặt tên cho phương pháp chuyển

-

đổi Input Geographic Coordinate System: Lựa chọn hệ quy chiếu của dữ liệu đầu vào. Ở đây lựa chon VN_2000_UTM_Zone_48N theo thông số dữ liệu đầu vào đã được đề cập trên.

lựa chọn - Output Geographic Coordinate System: Ở đây

WGS_1984_UTM_Zone_48N.

chọn method là - Custom Geographic Transformation: Lựa

COORDINATE_FRAME

Sử dụng các tham số chuyển đổi ở trên để thay vào bảng tham số chuyển

đổi như sau:

43

Hình ảnh 3.26. Thiết lập tham số cho Projections and Transformation

Chuyển đổi hệ quy chiếu của dữ liệu:

3.6.3 Để chuyển đổi hệ quy chiếu của dữ liệu trên phần mềm ArcMap như sau: Catalog → Toolboxes → System Toolboxes → Data Management Tools → Projections and Transformation → Project.

Hình ảnh 3.27. Chuyển đổi hệ quy chiếu

Ở cửa sổ ứng dụng lựa chọn đường dẫn input, ouput dữ liệu và phương

pháp chuyển đổi đã được tạo ở trên.

Kết quả dữ liệu shapefile sau khi chuyển đổi đã được đưa về đúng với

hệ quy chiếu mong muốn.

44

Hình ảnh 3.28. Kết quả sau khi chuyển đổi

3.7 Xây dựng công cụ chuyển đổi dữ liệu từ shapefile sang đường Boundaries

trên OSM

Trong OSM các dữ liệu về đường biên giới địa giới được gọi chung là admin boundaries với tham số admin_level từ 1 → 11 để phân biệt các cấp độ hành chính. Ứng với với mỗi quốc gia hoặc vùng lãnh thổ sẽ có những mức level cho các cấp độ hành chính khác nhau. Trên OSM các lớp thông tin về admin boundaries của Việt Nam hiện nay đang được sử dụng 4 giá trị chính[20]:

- admin_level = 2: đường ranh giới quốc gia - admin_level = 4: đường ranh giới tỉnh hoặc thành phố trực thuộc trung

ương

- admin_level = 6: đường ranh giới thuộc quận, huyện, thị xã, thành phố

thuộc tỉnh.

- admin_level = 8: đường ranh giới cho xã, phường, thị trấn

45

/

N/A N/A N/A N/A N/A

Vietnam

province border: Tỉnh, thành phố trực thuộc TW commune / town / ward border: phường, xã, thị trấn district township border: quận, huyện, thị xã, thành phố thuộc tỉnh

3 4 5 6 7 8 9 10

Country

admin_level

Hình ảnh 3.29. Bảng Admin boundaries của Việt Nam trên OSM

3.7.1 Cấu trúc của một tập tin tin OSM

Để xây dựng được công cụ chuyển đổi dữ liệu từ shapfile sang tập tin

OSM thì bước đầu tiên cần kiểm tra xem cấu trúc của một OSM ra làm sao và

các tham số nào được sử dụng trong OSM để xác định đó là một đường biên

giới địa giới.

Cấu trúc của một tập tin OSM được lưu trữ dưới dạng một tập tin

XML, các nội dung trong một tập tin OSM quy định bởi các thẻ node, way và

relation.

- Node: là đại diện cho một điểm cụ thể được xác định bởi kinh độ và

vĩ độ. Thông tin của mỗi một Node bao gồm ít nhất là id của Node

và tọa độ của node. Mỗi một Node có một id và id của Node là duy

nhất.

- Way: là một danh sách từ 2 → 2.000 node thành lập lên một

polyline. Way dùng để biểu thị các đối tượng địa lý dạng đường

như biên giới, địa giới, sông ngòi, đường xá, … Way có 2 loại là

đóng và mở, nếu một Way có điểm đầu và điểm cuối giống nhau

được gọi là Way đóng.

- Relation: Mô tả mối liên kết giữa 2 hoặc nhiều đối tượng khác như

(Node, Way hoặc là Relation khác).

46

Dưới đây là một cấu trúc mẫu mô tả đường bao quanh của một xã trên

OSM:

Hình ảnh 3.30 . Cấu trúc của một tập tin OSM

Đối với Node và Way các thông tin sẽ giống với mô tả ở trên, còn đối với

Relation thì một số thẻ bắt buộc để mô tả đó là đường biên giới địa giới sẽ

bao gồm:

47

- admin_level: Xác định cấp hành chính, các giá trị sẽ là 4 cho hành

chính cấp tỉnh/thành phố trực thuộc trung ương; 6 cho hành chính

cấp huyện/thị xã/thành phố trực thuộc tỉnh; 8 cho hành chính cấp

xã/phường/thị trấn …

- boundary: administrative

- name: Tên đơn vị hành chính

type: boundary -

3.7.2 Các bước tiền xử lý dữ liệu shapefile

Để dễ dàng trong việc xử lý dữ liệu trước tiên sẽ cần phải thực hiện

một số bước tiền xử lý dữ liệu shapefile:

- Bước 1: Mở shapefile bằng phần mềm QGIS - Bước 2: Chuyển đổi các Polygon sang line - Bước 3: Sử dụng v.clean để phá vỡ các liên kết giữa các vùng - Bước 4: Lưu tập tin kết quả lại dưới dạng GeoJson

Dữ liệu được lưu dưới dạng GeoJson sẽ dễ dàng trong việc xử lý hơn ở định dạng shapefile, tận dụng lợi thế đó với sự hỗ trợ của phần mềm QGIS sẽ giúp việc chuyển đổi dữ liệu từ shapefile sang GeoJson một cách dễ dàng.

Với việc xây dựng đường biên giới địa giới thì dữ liệu được quan tâm sẽ là những đường viền bao quanh của một Polygon do đó trước khi được chuyển đổi sang GeoJson cần chuyển đổi Polygon sang line. Trên QGIS đã cung cấp sẵn Toolbox cho việc đó có tên là Poligon to line:

48

Hình ảnh 3.31. Polygon sang lines của QGIS

Trong cấu trúc dữ liệu trên tập tin OSM, đối với các vùng biên giới địa giới sẽ không được phép lặp lại các Node hoặc Way do đó sẽ cần phải thực hiện việc loại bỏ sự trùng lặp đó trước khi chuyển đổi. Trên phần mềm QGIS cung cấp công cụ v.clean giúp phá vỡ sự liên giữa các đường biên giới địa giới đó và đồng thời giúp xóa bỏ sự trùng lặp dữ liệu:

Hình ảnh 3.32. v.clean của QGIS

49

Dưới đây là Hình ảnh trước và sau khi sử dụng v.clean

Hình ảnh 3.33. Trước khi sử dụng v.clean

50

Hình ảnh 3.34. Sau khi sử dụng v.clean

Và bước cuối cần lưu lại dữ liệu gốc và dữ liệu sau khi đã chạy xong

v.clean lưu lại dưới dạng GeoJson.

Hình ảnh 3.35. Dữ liệu gốc

51

Hình ảnh 3.36. Dữ liệu sau khi chạy v.clean

3.7.3 Quy trình xây dựng chương trình xử lý Xây dựng chương trình xử lý bằng python thực hiên theo quy trình:

- Đầu vào gồm 2 tập tin GeoJson bao gồm: tập tin dữ liệu thô được gọi là Raw_data và tập tin dữ liệu đã được v.clean được gọi là Preprocess_data.

- Duyệt tập tin để lấy tất cả các Node từ tập tin Preprocess_data. - Lưu thông tin các Node theo cấu trúc của tập tin OSM vào tập tin kết

quả

- Xây dựng các Way từ tập tin Preprocess_data. - Lưu thông tin các Way theo cấu trúc của tập tin OSM vào tập tin kết

quả.

- Xây dựng các Relation từ các Way trước đó, xác định Way đó sẽ thuộc về xã nào, huyện nào hoặc tỉnh nào bằng cách đối chiếu với các mã đơn vị hành chính ở Raw_data.

- Lưu lại thông tin Relation theo cấu trúc của tập tin OSM vào tập tin kết

quả

Sau khi kết thúc quá trình xử lý sẽ thu được kết quả là tập tin OSM chứa

thông tin về các đường biên giới địa giới Việt Nam[21].

52

Hình ảnh 3.37. Tập tin OSM chứa thông tin về các đường biên giới địa

giới Việt Nam.

53

CHƯƠNG 4: KẾT QUẢ VÀ ĐÁNH GIÁ

Kết quả của chương trình biên tập dữ liệu biên giới, địa giới cho Nền tảng

cung cấp dịch vụ địa chỉ Việt Nam sẽ được mô tả ở dưới đây:

Kết thúc quá trình chuyển đổi dữ liệu sang tập tin dữ liệu OSM, thu được

kết quả biên giới địa giới cho 63 tỉnh thành, 708 huyện và 11.161 xã.

Bảng 4-1. Dữ liệu biên giới địa giới đã được biên tập từ CSDL địa hình

1/50.000

STT Nội dung Tổng số

Cấp tỉnh 1

Tỉnh 63 58

Thành phố trực thuộc Trung ương 5

Cấp huyện 708 2 Thành phố 64

Thị xã 47

Quận 49

Huyện 548

Cấp xã 11.161 3

Xã 9.001

Phường 1.545

Toàn bộ đường ranh giới địa giới sau khi được biên tập được mô tả trong tập

tin OSM với:

Thị trấn 615

- 1.500.206 Node: riêng biệt, mô tả các tọa độ điểm ranh giới địa giới

trên tập tin OSM.

- 39.621 Way: riêng biệt, mô tả thông tin về đường ranh giới địa giới

trên tập tin OSM.

54

- 11.385 Relation: riêng biệt, mô tả thông tin về các liên kết của các

Way trên tập tin OSM

Hình ảnh 4.1. Nội dung trong tập tin OSM

Đối chiếu với một số dịch vụ bản đồ số ở trong nước như GIS Chính Phủ (http://gis.chinhphu.vn/) và Việt Bản đồ (http://maps.vietbando.com/) thấy rằng dữ liệu được chuyển đổi ra khớp và bao phủ toàn bộ Việt Nam

55

Hình ảnh 4.2. Bản đồ số Việt bản đồ

56

Hình ảnh 4.3. Chồng lớp nên bản đồ Việt Bản đồ

57

Hình ảnh 4.4. Bản đồ số GIS Chính Phủ

58

Hình ảnh 4.5. Chồng lớp nên bản đồ GIS Chính Phủ

So sánh với dữ liệu địa giới hành chính của GIS chính phủ và Việt bản đồ thấy rằng các đường biên giới địa giới của sau khi chuyển đổi từ dữ liệu bản đồ 1/50.000 đã khớp với và bao phủ toàn Việt Nam.

59

Nhưng bên cạnh đó do nguồn dữ liệu cũ từ năm 2013 nên dữ liệu về địa giới hành chính sau khi được trích xuất ra có một số vùng dữ liệu không còn được chính xác so với thời điểm hiện tại.

Bảng 4-2. Địa danh hành chính Việt Nam tính tới 01/10/2020

STT Nội dung Tổng số

Cấp tỉnh 1

Tỉnh 63 58

Thành phố trực thuộc Trung ương 5

Cấp huyện 707 2 Thành phố 77

Thị xã 49

Quận 49

Huyện 532

Cấp xã 10.614 3

Xã 8.324

Phường 1.680

Thị trấn 610

Từ bảng [4-1] và bảng [4-2] đối chiếu lại có thể thấy biến đổi từ năm 2013 đến năm 2020:

- Cấp hành chính cấp tỉnh: Dữ liệu về hành chính cấp tỉnh/thành phố

trực thuộc trung ương không có thay đổi;

- Cấp hành chính cấp Huyện:

o Thành phố: Tăng từ 64 lên 77 o Thị xã: Tăng từ 47 lên 49 o Quận: Giữ nguyên 49 o Huyện: Giảm từ 548 xuống 532

- Cấp hành chính cấp xã:

o Xã: Giảm từ 9.001 xuống 8.342 o Phường: Tăng từ 1.545 lên 1.680

60

o Thị trấn: Giảm từ 615 xuống 610

61

KẾT LUẬN

Kết quả đạt được:

Qua quá trình tìm hiểu và nghiên cứu luận văn đã giải quyết được bài toán

là:

- Xây dựng quy trình và công cụ biên tập dữ liệu biên giới, địa giới cho Nền

tảng cung cấp dịch vụ địa chỉ Việt Nam.

- Luận văn đã thực hiện các công việc từ việc bóc tách dữ liệu biên giới địa

giới trên bản đồ địa hình 1/50.000, gộp các mảnh bản đồ, chuyển đổi hệ quy

chiếu cho dữ liệu cho tới việc chuyển đổi dữ liệu sang tập tin OSM.

- Biên tập và chỉnh sửa dữ liệu danh giới hành chính Việt Nam tới cấp xã bao

gồm: 63 tỉnh thành, 708 huyện và 11.161 xã.

Hạn chế:

- Quy trình và phương pháp thực hiện yêu cầu người thực hiện phải có am

hiểu nhất định về GIS và xử lý dữ liệu trong GIS.

- CSDL địa hình đã cũ so với thời điểm hiện tại, nên địa danh hành chính

cùng biên giới địa giới chưa được cập nhật đúng với thời điểm hiện tại.

- Một số vùng dữ liệu trong tập dữ liệu gốc không đầy đủ hoặc khuyết thiếu.

- Khi cập nhật dữ liệu bản đồ địa hình 1/50.000 yêu cầu cần phải thực hiện lại

quy trình từ đầu, tuy có thể lựa chọn vùng bị sửa đổi để cập nhật nhưng chỉ

chọn vùng chỉ có thể thực hiện với bước trích xuất dữ liệu biên giới địa giới

và gộp các mảnh bản đồ. Đến bước xử lý về sau bắt buộc phải xử lý toàn bộ

Việt Nam.

62

[1] Thủ tướng Chính phủ, “Quyết định số 677/QĐ-TTg của Thủ tướng Chính

phủ : Về việc phê duyệt Đề án ‘Phát triển Hệ tri thức Việt số hóa.’”

[2] Quốc hội, “Luật Đo đạc và Bản đồ số 27/2018/QH14 ngày 14/6/2018, hiệu

lực thi hành từ ngày 01/01/2019.” .

[3] Bộ Tài nguyên và Môi trường, Thông tư số 20/2014/TT-BTNMT của Bộ Tài nguyên và Môi trường : Quy định kỹ thuật về mô hình cấu trúc, nội dung cơ sở dữ liệu nền địa lý tỷ lệ 1:50.000, vol. 85, no. 1. 2014, pp. 2071–2079.

[4] Tổng cục địa Chính, “Thông tư 973/2001/TT-TCĐC của Tổng cục Địa chính

về việc hướng dẫn áp dụng hệ quy chiếu và hệ tọa độ quốc gia VN-2000.” .

[5]

(accessed

“OpenStreetMap.” https://www.openstreetmap.org/#map=18/21.03629/105.78499 Sep. 03, 2020).

1–4,

Jun.

pp.

[6] L. He, G. Wu, D. Dai, L. Chen, and G. Chen, “Data conversion between CAD and GIS in land planning,” in 2011 19th International Conference on Geoinformatics, doi: 2011, 10.1109/GeoInformatics.2011.5981193.

[7] D. C. Docan, “Learning ArcGIS for Desktop : create, analyze, and map your spatial data with ArcGIS for Desktop,” Learn. ArcGIS Deskt., no. March, 2016.

[8] C. WRITERS and and other Rhonda Glennon, “ArcMap Tutorial,” Far, vol. 5221112212, no. 52, pp. 227–19227, 2006, doi: 10.1007/s00779-014-0815-y.

[9] QGIS Development Team, “QGIS geographic information system developers manual,” Open Source Geospatial Found. Proj., pp. 1–625, 2020, [Online]. Available: http://www.qgis.org/wiki/Developers_Manual.

[10] UNHCR, “Mapping With Qgis for,” pp. 1–14, 2017.

[11] Z. U. Ahmed, T. J. Krupnik, and M. Kamal, “Introduction to basic GIS and spatial analysis using QGIS : Applications in Bangladesh,” CIMMYT- Bangladesh, no. May, p. 146, 2018.

[12] T. R. Control, “Using the JOSM Editor.”

[13] JOSM Editor Basic Manual, “Java OpenStreetMap Editor Basic Manual.”

[14] “Combining Spatial Data in ArcMap | GeoNet, The Esri Community | GIS Community.”

Professional

and Geospatial https://community.esri.com/groups/technical- support/blog/2014/12/02/combining-spatial-data-in-arcmap (accessed Sep.

TÀI LIỆU THAM KHẢO

63

03, 2020).

[15] “Topology

in

ArcGIS—Help

ArcGIS

for

|

Desktop.” https://desktop.arcgis.com/en/arcmap/10.3/manage-data/topologies/topology- in-arcgis.htm (accessed Sep. 03, 2020).

[16] IHO, “User Handbook of Datum Transformations involving WGS 84,” vol.

2003, no. 60, p. 112, 2008.

[17] X. Ye, X. Cao, D. Qiu, J. Cao, and Y. Wang, “Study and Realization of Coordinate Conversion in Vehicle Navigation,” in 2009 International Symposium on Intelligent Ubiquitous Computing and Education, May 2009, pp. 517–520, doi: 10.1109/IUCE.2009.81.

[18] V. Janssen, “Understanding coordinate reference systems, datums and transformations,” Int. J. Geoinformatics, vol. 5, no. 4, pp. 41–53, 2009.

[19] Bộ Tài nguyên và Môi trường, “Quyết định 05/2007/QĐ-BTNMT của Bộ Tài nguyên và Môi trường về sử dụng hệ thống tham số tính chuyển giữa hệ tọa độ quốc tế WGS-84 và hệ tọa độ quốc gia VN-2000.” .

[20] “Tag:boundary=administrative

-

OpenStreetMap

Wiki.”

https://wiki.openstreetmap.org/wiki/Tag:boundary%3Dadministrative (accessed Sep. 30, 2020).

[21] “JOSM.” https://josm.openstreetmap.de/ (accessed Sep. 03, 2020).