intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Đề án tốt nghiệp Thạc sĩ Kỹ thuật: Nghiên cứu dự báo không gian phát triển mạng Internet di động tốc độ cao tại tỉnh Tây Ninh

Chia sẻ: Cảnh Phương Thanh | Ngày: | Loại File: PDF | Số trang:73

22
lượt xem
5
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Đề án "Nghiên cứu dự báo không gian phát triển mạng Internet di động tốc độ cao tại tỉnh Tây Ninh" nhằm nghiên cứu dữ liệu không gian liên quan phát triển mạng Internet di động tại tỉnh Tây Ninh; nghiên cứu các thuật toán dự báo, máy học trong dữ liệu không gian; nghiên cứu mô hình dự báo dữ liệu không gian và GIS; đánh giá các kết quả dự báo và độ chính xác của mô hình xây dựng;... Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Đề án tốt nghiệp Thạc sĩ Kỹ thuật: Nghiên cứu dự báo không gian phát triển mạng Internet di động tốc độ cao tại tỉnh Tây Ninh

  1. HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG ----------------------------------- TRƯƠNG ĐÌNH LỢI NGHIÊN CỨU DỰ BÁO KHÔNG GIAN PHÁT TRIỂN MẠNG INTERNET DI ĐỘNG TỐC ĐỘ CAO TẠI TỈNH TÂY NINH ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) THÀNH PHỐ HỒ CHÍ MINH – NĂM 2023
  2. HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG -------------------------------------- TRƯƠNG ĐÌNH LỢI NGHIÊN CỨU DỰ BÁO KHÔNG GIAN PHÁT TRIỂN MẠNG INTERNET DI ĐỘNG TỐC ĐỘ CAO TẠI TỈNH TÂY NINH Chuyên ngành: Hệ thống thông tin Mã số: 8.48.01.04 ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. TÂN HẠNH THÀNH PHỐ HỒ CHÍ MINH – NĂM 2023
  3. i LỜI CAM ĐOAN Tôi cam đoan rằng đề án tốt nghiệp thạc sĩ: “NGHIÊN CỨU DỰ BÁO KHÔNG GIAN PHÁT TRIỂN MẠNG INTERNET DI ĐỘNG TỐC ĐỘ CAO TẠI TỈNH TÂY NINH” là công trình nghiên cứu của chính tôi. Tôi cam đoan các số liệu, kết quả nêu trong đề án là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác. Không có sản phẩm/nghiên cứu nào của người khác được sử dụng trong đề án này mà không được trích dẫn theo đúng quy định. TP. Hồ Chí Minh, ngày 21 tháng 08 năm 2023 Học viên thực hiện đề án Trương Đình Lợi
  4. ii LỜI CẢM ƠN Trong suốt quá trình học tập và nghiên cứu thực hiện đề án tốt nghiệp thạc sĩ, ngoài nỗ lực của bản thân, tôi đã nhận được sự hướng dẫn nhiệt tình quý báu của quý Thầy Cô, cùng với sự động viên và ủng hộ của gia đình, bạn bè và đồng nghiệp. Với lòng kính trọng và biết ơn sâu sắc, tôi xin gửi lời cảm ơn chân thành tới: Tôi xin chân thành cảm ơn Thầy TS. Tân Hạnh, người thầy kính yêu đã hết lòng giúp đỡ, hướng dẫn, động viên, tạo điều kiện cho tôi trong suốt quá trình thực hiện và hoàn thành đề án tốt nghiệp thạc sĩ. Ban Giám Đốc, Phòng đào tạo sau đại học và quý Thầy Cô đã tạo mọi điều kiện thuận lợi giúp tôi hoàn thành đề án. Tôi xin chân thành cảm ơn gia đình, bạn bè, đồng nghiệp trong cơ quan đã động viên, hỗ trợ tôi trong lúc khó khăn để tôi có thể học tập và hoàn thành đề án. Mặc dù đã có nhiều cố gắng, nỗ lực, nhưng do thời gian và kinh nghiệm nghiên cứu khoa học còn hạn chế nên không thể tránh khỏi những thiếu sót. Tôi rất mong nhận được sự góp ý của quý Thầy Cô cùng bạn bè đồng nghiệp để kiến thức của tôi ngày một hoàn thiện hơn. Xin chân thành cảm ơn! TP. Hồ Chí Minh, ngày 21 tháng 08 năm 2023 Học viên thực hiện đề án Trương Đình Lợi
  5. iii MỤC LỤC LỜI CAM ĐOAN.......................................................................................................i LỜI CẢM ƠN...........................................................................................................ii MỤC LỤC...............................................................................................................iii DANH SÁCH HÌNH VẼ...........................................................................................v DANH SÁCH BẢNG..............................................................................................vi DANH MỤC CÁC THẬT NGỮ, CHỮ VIẾT TẮT................................................vii PHẦN MỞ ĐẦU.......................................................................................................1 1. Tính cấp thiết của đề tài..................................................................................1 2. Tình hình nghiên cứu liên quan đến đề tài......................................................2 3. Mục tiêu, ý nghĩa khoa học và thực tiễn.........................................................3 4. Đối tượng và phạm vi nghiên cứu..................................................................3 4.1 Đối tượng nghiên cứu..............................................................................3 4.2 Phạm vi nghiên cứu.................................................................................4 5. Phương pháp nghiên cứu................................................................................4 5.1 Phương pháp nghiên cứu lý thuyết..........................................................4 5.2 Phương pháp nghiên cứu thực nghiệm....................................................4 6. Bố cục đề án...................................................................................................5 CHƯƠNG 1: TỔNG QUAN ĐỀ TÀI.......................................................................6 1.1. Tổng quan về Internet di động........................................................................6 1.2. Tổng quan về dữ liệu không gian (Spatial Data).............................................7 1.3. Tổng quan về học máy với dữ liệu không gian.............................................10 1.4. Các công trình liên quan quốc tế và trong nước............................................14 CHƯƠNG 2: MÔ HÌNH DỰ BÁO.........................................................................20 2.1. Tổng quan mô hình dự báo dựa trên học máy...............................................20 2.1.1. Giới thiệu mô hình dự báo......................................................................20 2.1.2. Mô hình dự báo dựa trên học máy..........................................................21
  6. iv 2.1.3. Các mô hình hồi quy..............................................................................22 2.2. Thiết kế mô hình...........................................................................................23 2.3. Giới thiệu về bộ dữ liệu................................................................................27 2.4. Tiêu chí đánh giá...........................................................................................33 CHƯƠNG 3: THỰC NGHIỆM VÀ ĐÁNH GIÁ....................................................35 3.1 Hiện trạng mạng internet di động.................................................................35 3.1.1 Khảo sát mạng internet di động tại Việt Nam....................................35 3.1.2 Tình hình mạng internet di động tại Tây Ninh...................................36 3.2. Phân tích dữ liệu không gian trạm BTS........................................................38 3.2.1 Dữ liệu lưu lượng 2G.........................................................................41 3.2.2 Dữ liệu lưu lượng 3G:........................................................................44 3.2.3 Dữ liệu lưu lượng 4G:........................................................................47 3.3 Huấn luyện và kiểm thử mô hình...................................................................50 3.3.1 Dự báo lưu lượng 2G theo không gian...............................................51 3.3.2 Dự báo lưu lượng 3G theo không gian...............................................53 3.3.3 Dự báo lưu lượng 4G theo không gian...............................................54 3.4 Kết quả và thảo luận......................................................................................57 PHẦN KẾT LUẬN.................................................................................................60 1. Kết quả nghiên cứu của đề tài.......................................................................60 2. Hạn chế đề tài...............................................................................................60 3. Vấn đề kiến nghị và hướng đi tiếp theo của nghiên cứu:..............................60 DANH MỤC TÀI LIỆU THAM KHẢO.................................................................62
  7. v DANH SÁCH HÌNH VẼ Hình 1.1: Điểm trong GIS......................................................................................................9 Hình 1.2: Cấu trúc dữ liệu Raster và Vector trong GIS.........................................................9 Hình 1.3: Ví dụ về phân tích dữ liệu không gian và trực quan hóa chúng...........................11 Hình 1.4: Ví dụ về ứng dụng học máy để tách lớp..............................................................12 Hình 1.5: Ví dụ về sử dụng SVM để phân lớp ảnh raster....................................................13 Hình 2. 1 Lưu đồ mô hình huấn luyện đề xuất.....................................................................26 Hình 2. 2 Biểu đồ heatmap Hệ số tương quan Pearson của các biến kiểu số......................29 Hình 2. 3 Thống kê mô tả các trường dữ liệu có kiểu số.....................................................29 Hình 2. 4 Biểu đồ phân bổ vị trí theo các cặp biến..............................................................31 Hình 2. 5 Biểu đồ phân bổ các trạm theo huyện..................................................................31 Hình 2. 6 Biểu đồ histogram các biến kiểu số.....................................................................33 Hình 3. 1 Xếp hạng 5 thành phố về tốc độ và độ trễ Internet di động trong quý I/2022.....33 Hình 3. 2 Kết quả thống kê chất lượng truy cập Internet của các mạng di động quý 1 năm 2020 (Theo VNNIC)............................................................................................................34 Hình 3. 3 Bản đồ tỉnh Tây Ninh theo hành chánh Huyện....................................................36 Hình 3. 4 Bản đồ tỉnh Tây Ninh theo hành chánh phường xã.............................................37 Hình 3. 5 Lưu Lượng 2G phân bổ ở các trạm BTS..............................................................39 Hình 3. 6 Các trạm có lưu Lượng 2G lớn nhất.....................................................................40 Hình 3. 7 Lưu Lượng 3G phân bổ ở các trạm BTS..............................................................42 Hình 3. 8 Các trạm có lưu Lượng 3G lớn nhất.....................................................................43 Hình 3. 9 Lưu Lượng 4G phân bổ ở các trạm BTS..............................................................45 Hình 3. 10 Các trạm có lưu Lượng 4G lớn nhất...................................................................47
  8. vi DANH SÁCH BẢNG Bảng 3. 1 Tổng hợp kết quả R-Squared trong 2 mô hình dự báo........................................55
  9. vii DANH MỤC CÁC THẬT NGỮ, CHỮ VIẾT TẮT VIẾT TẮT NGHĨA TIẾNG ANH NGHĨA TIẾNG VIỆT BTS Base Transciever Station Trạm trạm thu phát sóng Cell Base Transciever Station Trạm trạm thu phát sóng GIS Geographic Information Hệ thống Thông tin Địa lý System 2G 2nd Generation thế hệ thứ 2 3G 3rd Generation thế hệ thứ 3 4G 4th Generation thế hệ thứ 4 5G 5th Generation thế hệ thứ 5 LTE Long Term Evolution
  10. 1 PHẦN MỞ ĐẦU 1. Tính cấp thiết của đề tài Hiện nay, mạng thiết bị di động hay mạng di động, mạng internet di động đã trở nên khá quen thuộc với người dùng hiện đại. Với sự phát triển mạnh mẽ của công nghệ thông tin và viễn thông, những năm gần đây, mạng internet di động mỗi lúc một tốt hơn và ổn định hơn về chất lượng và số lượng. Tuy nhiên, sự phát triển của các công nghệ mới và nhu cầu sử dụng chất lượng cao của người dùng đòi hỏi nhà cung cấp dịch vụ phải luôn nâng cấp, cải tiến và mở rộng vùng phủ sóng của mình. Chính vì vậy, việc ứng dụng GIS, dữ liệu không gian vào quản lý, dự báo phát triển vùng phủ sóng mạng internet di động là bài toán bắt buộc. Đặc biệt hơn gần đây là ứng dụng hệ thống thông tin địa lý GIS tích hợp với các ứng dụng của trí tuệ nhân tạo, giúp cho quá trình ra quyết định và quản lý chất lượng mạng thông tin di động mỗi lúc một tốt hơn. Việc phát triển của trí tuệ nhân tạo, đặc biệt là máy học giúp ta dự đoán được vùng không gian phù hợp với nhu cầu phát triển mạng internet di động, điều này sẽ hỗ trợ tốt cho quy hoạch và quản lý chiến lược phát triển các trạm BTS. Với ứng dụng hệ thống thông tin địa lý GIS để số hóa Quy hoạch phát triển hạ tầng kỹ thuật viễn thông thụ động; hệ thống và số hóa toàn bộ dữ liệu trạm thu, phát sóng thông tin di động của tất cả các doanh nghiệp thông tin di động trên địa bàn quản lý. Từ đó, hỗ trợ nâng cao hiệu quả quản lý nhà nước về mạng lưới thông tin di động. Nhu cầu truy cập Internet di động cùng với sự xuất hiện của các công nghệ mới như trí tuệ nhân tạo, Internet vạn vật (IoT), và tự động hóa đang thúc đẩy sự gia tăng khổng lồ về lượng dữ liệu được tạo ra. Việc tạo ra dữ liệu đang phát triển theo cấp số nhân với khối lượng được nhận định sẽ tăng thêm vài trăm zettabyte trong thập kỷ tới. Cơ sở hạ tầng di động hiện tại không được thiết kế cho tải thông tin lớn như vậy và cần được nâng cấp. Số liệu mới được công bố của Ookla Speedtest vào quý 1 năm 2022, cho thấy Việt Nam đứng thứ 56 toàn cầu về Internet di động, giảm từ vị trí 50 trong
  11. 2 tháng 2 và 45 trong tháng 1 năm 2022. Ở hạng mục Internet băng rộng cố định, Việt Nam vẫn giữ nguyên vị trí 49. Tốc độ Internet di động trung bình trong tháng trước đo được là 33,9 Mb/giây. Trong khi đó, tốc độ Internet băng rộng cố định của Việt Nam đạt 67,96 Mbps. Tuy nhiên, hiện nay ở tỉnh Tây Ninh việc chú trọng công nghệ và phát triển mạng internet di động tốc độ cao chưa thể so sánh bằng với khu vực như TP.HCM. Vì vậy việc phát triển và xây dựng chiến lược quy hoạch vùng Internet di động với các mức độ chất lượng khác nhau đáp ứng nhu cầu sử dụng của người dân ở Tây Ninh rất cần thiết. Việc dự báo vùng phát triển phù hợp và đúng nhu cầu người dân với mạng internet di động tốc độ cao sẽ giúp ích cho việc ra quyết định, định hướng khu vực phát triển ưu tiên và ít ưu tiên, từ đó tạo hiệu quả cho xã hội đạt mức tối ưu. Đề tài như sau: NGHIÊN CỨU DỰ BÁO KHÔNG GIAN PHÁT TRIỂN MẠNG INTERNET DI ĐỘNG TỐC ĐỘ CAO Ở TỈNH TÂY NINH 2. Tình hình nghiên cứu liên quan đến đề tài Các nghiên cứu gần đây về "NGHIÊN CỨU DỰ BÁO KHÔNG GIAN PHÁT TRIỂN MẠNG INTERNET DI ĐỘNG TỐC ĐỘ CAO" đang chú trọng vào việc dự báo sự phát triển và nhu cầu về mạng internet di động. Dữ liệu không gian trong bối cảnh này chủ yếu liên quan đến vị trí địa lý, môi trường xung quanh, tốc độ truyền dẫn và thông lượng mạng ở khu vực nghiên cứu. Một số nghiên cứu đang tập trung vào việc thu thập và phân tích dữ liệu không gian để đưa ra dự đoán về tốc độ và chất lượng dịch vụ mạng tại các khu vực khác nhau của Tây Ninh. Các phương pháp phân tích không gian giúp xác định các khu vực có nhu cầu cao về dịch vụ mạng tốc độ cao, tối ưu hóa vị trí của các trạm phát sóng và cải thiện độ phủ sóng. Bằng cách sử dụng công nghệ học máy và trí tuệ nhân tạo, các mô hình dự báo được phát triển nhằm dự đoán nhu cầu và hiệu suất của mạng internet di động
  12. 3 tốc độ cao ở Tây Ninh. Những mô hình này giúp định hình quy hoạch mạng và quản lý tài nguyên mạng một cách hiệu quả. Dữ liệu không gian cung cấp thông tin quý giá về vị trí và môi trường xung quanh, giúp xác định các khu vực tiềm năng để triển khai mạng tốc độ cao. Thông qua việc phân tích dữ liệu này, các nhà khai thác mạng có thể tập trung đầu tư vào cơ sở hạ tầng ở những khu vực có nhu cầu cao và cải thiện chất lượng dịch vụ ở những khu vực có hiệu suất không đạt yêu cầu [1]. Hơn nữa, việc dự báo không gian này cũng giúp định hướng chiến lược phát triển mạng tại Tây Ninh, đáp ứng nhu cầu thực tế của người dân và doanh nghiệp tại đây [2]. 3. Mục tiêu, ý nghĩa khoa học và thực tiễn Mục tiêu tổng quát: Nghiên cứu các mô hình dự báo dữ liệu không gian nhằm phát triển mạng Internet di động tại tỉnh Tây Ninh. Mục tiêu cụ thể như sau:  Nghiên cứu dữ liệu không gian liên quan phát triển mạng Internet di động tại tỉnh Tây Ninh  Nghiên cứu các thuật toán dự báo, máy học trong dữ liệu không gian  Nghiên cứu mô hình dự báo dữ liệu không gian và GIS  Đánh giá các kết quả dự báo và độ chính xác của mô hình xây dựng 4. Đối tượng và phạm vi nghiên cứu 4.1 Đối tượng nghiên cứu Đối tượng nghiên cứu:  Đối tượng nghiên cứu chính là dữ liệu không gian liên quan phát triển Internet di động tại tỉnh Tây Ninh  Bên cạnh đó, nghiên cứu các thuật toán dự báo & máy học, học sâu ứng dụng vào dữ liệu không gian.
  13. 4  Ngoài ra, đề tài sẽ sử dụng công cụ học máy và visualize để xây dựng mô hình dự báo dữ liệu không gian. Đánh giá các kết quả dự báo và độ chính xác của mô hình. 4.2 Phạm vi nghiên cứu Phạm vi nghiên cứu:  Tập dữ liệu không gian liên quan phát triển Internet di động tại tỉnh Tây Ninh đã được thông qua ý kiến của lãnh đạo VNPT Tây Ninh cấp duyệt.  Thu thập được trong từ 2022 đến 2023.  Nghiên cứu các thuật toán machine learning phù hợp với bộ spatial data thu thập được. 5. Phương pháp nghiên cứu 5.1 Phương pháp nghiên cứu lý thuyết - Tìm các tài liệu, sách liên quan tới dữ liệu không gian, mô hình dự đoán sử dụng dữ liệu không gian, GIS, phân bố khu vực mạng Internet di động tại tỉnh Tây Ninh theo thời gian (GSM, 2G, 3G, 4G, 5G), số lượng người dùng và thuộc tính thu thập được, các thuật toán dự báo có thể áp dụng được. - Tìm tham khảo tài liệu từ những hội thảo, công trình, đề tài, luận văn thực hiện trong và ngoài nước. - Tìm tài liệu, sách liên quan tới học sâu, dữ liệu lớn như Python NoteBook, Google Colab, Rstudio, MatLab. 5.2 Phương pháp nghiên cứu thực nghiệm - Sau khi nghiên cứu lý thuyết, các bài toán, đề xuất mô hình; xây dựng và phát triển ứng dụng dựa trên mô hình đề xuất; cài đặt thử nghiệm chương trình, đánh giá các kết quả đạt được; công bố kết quả nghiên cứu.
  14. 5 6. Bố cục đề án Bên cạnh phần mở đầu, phần kết luận và phần tài liệu tham khào, phần nội dung chính của bài nghiên cứu được chia thành 3 chương chính như sau: Chương 1: Tổng quan đề tài Chương 2: Mô hình dự báo Chương 3: Thực nghiệm và đánh giá
  15. 6 CHƯƠNG 1: TỔNG QUAN ĐỀ TÀI 1.1. Tổng quan về Internet di động Đi cùng với tiến trình phát triển của điện thoại di động chính là sự thay đổi của công nghệ được sử dụng [3]. Khi GSM xuất hiện, những chiếc điện thoại dần chứng tỏ được vai trò hoàn hảo của mình hơn trong việc liên lạc đặc biệt là việc truy cập Internet. Mạng Internet di động đã phát triển và theo các thế hệ như sau: mạng 2G, mạng 3G, mạng 4G và mạng 5G. Mạng 2G: Đây chính là thế hệ mạng di động thứ 2 với tên gọi đầy đủ là hệ thống thông tin di động toàn cầu. Mạng 2G có tên tiếng anh là Global System for Mobile Communications hay còn gọi là GSM. Mạng 2G có khả năng phủ sóng rộng khắp, làm cho những chiếc điện thoại có thể được sử dụng ở nhiều nơi trên thế giới. GSM gồm nhiều các trạm thu phát sóng để những điện thoại di động có thể kết nối mạng qua việc tìm kiếm các trạm thu phát gần nhất. Mạng 2G chia làm 2 nhánh chính: nền TDMA và CDMA và nhiều dạng kết nối tùy theo yêu cầu sử dụng. Các chuẩn thương mại chính: D-AMPS, GSM/GPRS/EDGE, cdmaOne. Khi mạng 2G xuất hiện, chất lượng cuộc gọi được cải thiện đáng kể, tín hiệu và tốc độ cũng tốt hơn rất nhiều so với thế hệ trước đó. Thời gian và chi phí được tiết kiệm khi mã hóa dữ liệu theo dạng kĩ thuật số. Những thiết bị được thiết kế nhỏ gọn và nhẹ hơn, ngoài ra chúng còn có thể thực hiện tin nhắn dạng SMS. Mạng 3G: Thế hệ thứ 3 của chuẩn công nghệ điện thoại di động chính là mạng 3G Third-generation technology, cho phép truyền cả dữ liệu thoại như nghe gọi, nhắn tin và dữ liệu ngoài thoại như gửi mail, tải dữ liệu, hình ảnh. Nhờ có 3G ta có thể truy cập Internet cho cả thuê bao cố định hay di chuyển ở các tốc độ khác nhau. Đa số các smart phone hiện nay đều hỗ trợ công nghệ 3G. Hiện nay công nghệ 3G được xây dựng với 4 chuẩn chính: W-CDMA, CDMA2000, TD-CDMA, TD-SCDMA. Mạng 3G cải thiện chất lượng cuộc gọi, tín hiệu, tốc độ so với 2G. Ta có thể truy cập Internet tốc độ cao ngay khi đang di chuyển, truy cập thế giới
  16. 7 nội dung đa phương tiện: nhạc, phim, hình ảnh chất lượng cao. Người dùng có thể trò chuyện mọi nơi với chi phí rẻ hơn rất nhiều qua các ứng dụng hỗ trợ như: zalo, Viber, Line,… Mạng 4G: 4G hay Fourth-generation là công nghệ truyền thông không dây thứ 4 có thể truyền tỉa dữ liệu với tốc độ lên đến 1 -> 1.5 Gb/giây. Công nghệ 4G vượt trội hơn 3G ở nhiều điểm. Với 4G người dùng có thể tải và truyền lên hình ảnh động chất lượng cao. Với 4G, băng thông rộng hơn, tốc độ nhanh hơn, hỗ trợ các dịch vụ di động cao cấp như truyền hình trực tuyến, video HD, game online cao cấp, đáp ứng cùng lúc nhiều người sử dụng. Các chuẩn thương mại chính: LTE, LTE Advanced, Mobile Wimax và WiMax Release 2. Mạng 5G: Giống như những gì chúng ta hình dung, 5G nhanh hơn 4G. Hiện tại, mạng 5G mới được lên kế hoạch hoạt động trong dải tần số cao của băng tần không dây – nó nằm giữa 30 GHz và 300 GHz, hay còn được gọi là băng tần bước sóng milimet. Đối với các thiết bị di động, 5G sẽ giúp sửa chữa rất nhiều vấn đề của 4G và các công nghệ không dây hiện tại. Nó sẽ được thiết kế để hỗ trợ đồng thời nhiều người dùng và thiết bị hơn (theo thông số kỹ thuật ITU mỗi cell 5G sẽ hỗ trợ cho 1 triệu thiết bị trên diện tích 1 km2), với tốc độ cao hơn cả 4G. Việc tốc độ dữ liệu của bạn bị chậm đi khi đang ở một sự kiện đông người sẽ chỉ còn là quá khứ. Tuy vậy 5G vẫn còn là một khái niệm khá trừu tượng với nước ta. Để 5G có thể trở nên phổ biến phát mất nhiều thời gian nữa. 1.2. Tổng quan về dữ liệu không gian (Spatial Data) Dữ liệu không gian [7] là bất kỳ loại dữ liệu nào tham chiếu trực tiếp hoặc gián tiếp đến một khu vực hoặc vị trí địa lý cụ thể. Đôi khi được gọi là dữ liệu không gian địa lý hoặc thông tin địa lý, dữ liệu không gian cũng có thể biểu thị bằng số một đối tượng vật lý trong hệ tọa độ địa lý. Tuy nhiên, dữ liệu không gian không chỉ là một thành phần không gian của bản đồ. Người dùng có thể lưu dữ liệu không gian ở nhiều định dạng khác nhau, vì nó cũng có thể chứa nhiều hơn dữ liệu về vị trí cụ thể. Phân tích dữ liệu này giúp hiểu rõ hơn về cách mỗi biến số tác động đến các
  17. 8 cá nhân, cộng đồng, quần thể, v.v. Có một số loại dữ liệu không gian, nhưng hai loại dữ liệu không gian chính là dữ liệu hình học và dữ liệu địa lý. Dữ liệu không gian [8] có thể tồn tại ở nhiều định dạng khác nhau và không chỉ chứa thông tin cụ thể về vị trí. Dữ liệu vecter và raster [9] nằm trong một cơ sở dữ liệu của hệ thống thông tin địa lý nhằm hỗ trợ xử lý và phân tích dữ liệu ảnh viễn thám. Mỗi loại có những đặc điểm riêng và chúng khác nhau về yêu cầu lưu giữ số liệu, hiệu quả, xử lý và hiển thị. Dữ liệu không gian (hay còn gọi là Vecter): Cơ sở dữ liệu không gian chứa đựng những thông tin định vị của các đối tượng, cho biết vị trí, kích thước, hình dạng, sự phân bố… của các đối tượng. Các đối tượng không gian được định dạng về 3 loại: đối tượng dạng điểm, dạng đường và dạng vùng. Dữ liệu không gian có hai mô hình lưu trữ: mô hình dữ liệu raster và mô hình dữ liệu vector. Mô hình thông tin không gian: Dữ liệu là trung tâm của hệ thống GIS, hệ thống GIS chứa càng nhiều thì chúng càng có ý nghĩa. Dữ liệu của hệ GIS được lưu trữ trong cơ sở dữ liệu và chúng được thu thập thông qua các mô hình thế giới thực. Dữ liệu trong hệ GIS còn được gọi là thông tin không gian. Đặc trưng thông tin không gian là có khả năng mô tả “vật thể ở đâu” nhờ vị trí tham chiếu, đơn vị đo và quan hệ không gian. Chúng còn khả năng mô tả “hình dạng hiện tượng” thông qua mô tả chất lượng, số lượng của hình dạng và cấu trúc. Cuối cùng, đặc trưng thông tin không gian mô tả “quan hệ và tương tác” giữa các hiện tượng tự nhiên. Mô hình không gian đặc biệt quan trọng vì cách thức thông tin sẽ ảnh hưởng đến khả năng thực hiện phân tích dữ liệu và khả năng hiển thị đồ hoạ của hệ thống. Kiểu đối tượng điểm (Points): Điểm được xác định bởi cặp giá trị. Các đối tượng đơn, thông tin về địa lý chỉ gồm cơ sở vị trí sẽ được phản ánh là đối tượng điểm. Từ đó, tổ hợp thành kiểu đối tượng đường (Arcs), kiểu đối tượng vùng (Polygons).
  18. 9 Hình 1.1: Điểm trong GIS Hệ thống phi không gian (Raster): Những mô hình dữ liệu dạng raster phản ánh toàn bộ vùng nghiên cứu dưới dạng một lưới các ô vuông hay điểm ảnh (pixcel). Mô hình raster có các đặc điểm: Các điểm được xếp liên tiếp từ trái qua phải và từ trên xuống dưới; Mỗi một điểm ảnh (pixcel) chứa một giá trị; Một tập các ma trận điểm và các giá trị tương ứng tạo thành một lớp (layer); Trong cơ sở dữ liệu có thể có nhiều lớp. Hình 1.2: Cấu trúc dữ liệu Raster và Vector trong GIS
  19. 10 1.3. Tổng quan về học máy với dữ liệu không gian Học máy, hay gọi là Machine Learning [10] là môn khoa học nhằm phát triển những thuật toán và mô hình thống kê mà các hệ thống máy tính sử dụng để thực hiện các tác vụ dựa vào khuôn mẫu và suy luận mà không cần hướng dẫn cụ thể. Các hệ thống máy tính sử dụng thuật toán máy học để xử lý khối lượng lớn dữ liệu trong quá khứ và xác định các khuôn mẫu dữ liệu. Việc này cho phép chúng dự đoán kết quả chính xác hơn từ cùng một tập dữ liệu đầu vào cho trước. Ví dụ: các nhà khoa học dữ liệu có thể đào tạo một ứng dụng y tế chẩn đoán ung thư từ ảnh chụp X-quang bằng cách lưu trữ hàng triệu ảnh quét và chẩn đoán tương ứng. Phân tích dữ liệu không gian [11]: GIS bao gồm thu thập, quản lý, thao tác, phân tích và trực quan hóa dữ liệu không gian dưới dạng một hệ thống. Dữ liệu không gian, không giống như dữ liệu dạng bảng, có các thuộc tính không gian cho mỗi lần quan sát. Có hai loại dữ liệu không gian: vecter và raster. Dữ liệu vecter có thể có dạng điểm, đường hoặc đa giác. dữ liệu raster bao gồm các pixel dưới dạng hình ảnh. Dữ liệu không gian có thể biểu diễn dưới dạng dữ liệu dạng bảng, nhưng sự quan sát của nó có các thuộc tính không gian. Nói cách khác, mỗi quan sát đại diện cho một vị trí trong thế giới thực. Kết quả là, các quan sát trong dữ liệu không gian có vĩ độ, kinh độ, diện tích (đa giác), chu vi (đa giác), trọng tâm (đa giác) và độ dài (đường thẳng). Một nhóm các thuộc tính không gian khác có thể có là mật độ, khoảng cách và centography (điểm). Ví dụ về dữ liệu hình dạng đa giác là các thành phố, khu dân cư, khu vực sử dụng đất và các khu vực khác. Mạng lưới đường bộ, đường ống, sông và tuyến đường được thể hiện bằng các hình dạng nội tuyến. Dữ liệu điểm thường chứa thông tin về điểm độ cao, điểm độ sâu mực nước ngầm và các điểm quan tâm khác. Dữ liệu đa giác, đường và điểm có thể được chuyển đổi sang dữ liệu khác tùy thuộc vào những gì chúng ta cần.
  20. 11 Hình 1.3: Ví dụ về phân tích dữ liệu không gian và trực quan hóa chúng Trong dữ liệu dạng bảng, một quan sát không có bất kỳ mối quan hệ không gian nào với các quan sát khác. Trong dữ liệu không gian, mỗi quan sát có một khoảng cách với các quan sát khác. Do thuộc tính không gian, chúng ta có thể thực hiện phân tích không gian (hoặc thao tác hình học), chẳng hạn như clip, xóa, đệm, hợp nhất, nội suy, v.v. Học máy áp dụng vào phân tích dữ liệu không gian: Chúng ta có thể chạy các thuật toán học máy về hồi quy, phân loại và phân cụm trong xử lý dữ liệu không gian. Một trong những công cụ trong GIS được sử dụng thường xuyên là phép nội suy, ví dụ nội suy một tập hợp các điểm chứa thông tin giá nhà thành đa giác hoặc raster. Trên thực tế, phân tích hồi quy trong dữ liệu không gian là để nội suy vì chúng ta muốn dự đoán các giá trị chưa biết trong các khu vực giữa các điểm. Công cụ nội suy thường được sử dụng là Kriging. Để nội suy các điểm bằng học máy, chúng ta có thể thử công cụ Empirical Bayesian Kriging (EBK). Kriging thông thường chỉ sử dụng một mô hình bán biến số duy nhất để dự đoán các giá trị chưa biết, trong khi EBK dự đoán các giá trị chưa biết bằng cách sử dụng nhiều biểu đồ bán biến và quy tắc Bayes. EBK đã giải thích ở trên nội suy dữ liệu đơn biến.
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2