intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn Thạc sĩ Khoa học: Nghiên cứu áp dụng phương pháp Tần suất – Nhận dạng mới phục vụ dự báo khoáng sản theo tài liệu địa vật lý máy bay

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:74

22
lượt xem
4
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Luận văn đã tìm hiểu về các thuật toán phân tích và đánh giá lựa chọn thông tin; tìm hiểu về phương pháp phân tích tài liệu địa vật lý máy bay trong tìm kiếm, dự báo triển vọng khoáng sản; đánh giá, dự báo triển vọng khoáng sản cho vùng Nhị Hà trên cơ sở áp dụng bổ sung phương pháp Tần suất – Nhận dạng mới.

Chủ đề:
Lưu

Nội dung Text: Luận văn Thạc sĩ Khoa học: Nghiên cứu áp dụng phương pháp Tần suất – Nhận dạng mới phục vụ dự báo khoáng sản theo tài liệu địa vật lý máy bay

  1. ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN --------------------- Phạm Bảo Chi NGHIÊN CỨU ÁP DỤNG PHƢƠNG PHÁP TẦN SUẤT – NHẬN DẠNG MỚI PHỤC VỤ DỰ BÁO KHOÁNG SẢN THEO TÀI LIỆU ĐỊA VẬT LÝ MÁY BAY LUẬN VĂN THẠC SĨ KHOA HỌC Hà Nội – 2015
  2. ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN --------------------- Phạm Bảo Chi NGHIÊN CỨU ÁP DỤNG PHƢƠNG PHÁP TẦN SUẤT – NHẬN DẠNG MỚI PHỤC VỤ DỰ BÁO KHOÁNG SẢN THEO TÀI LIỆU ĐỊA VẬT LÝ MÁY BAY Chuyên ngành: Vật lý địa cầu. Mã số: 60440111 LUẬN VĂN THẠC SĨ KHOA HỌC Người hướng dẫn khoa học PGS.TS.VÕ THANH QUỲNH Hà Nội - 2015
  3. LỜI CẢM ƠN Để hoàn thành quyển luận văn này, trước tiên, với lòng kính trọng và biết ơn sâu sắc, tôi xin gửi lời cảm ơn tới PGS.TS. Võ Thanh Quỳnh - người thầy trực tiếp hướng dẫn khoa học và chỉ bảo tôi trong suốt quá trình thực hiện đề tài. Tôi xin gửi lời cảm ơn tới ThS. Nguyễn Viết Đạt người đã tận tình giúp đỡ tôi trong suốt quá trình làm luận văn. Tôi chân thành cảm ơn các thầy cô trong Bộ môn Vật lý Địa cầu – Trường Đại học Khoa học tự nhiên – Đại học Quốc gia Hà Nội đã trang bị kiến thức và có những đóng góp hết sức quý báu để tôi hoàn thành luận văn này. Tôi cũng xin gửi lời cảm ơn đến Hiệu trưởng, các thầy cô trong khoa Toán – Lý – Tin, Trường Đại học Tây Bắc đã tạo điều kiện tốt nhất để tôi có thể hoàn thành tốt nhiệm vụ của mình. Cuối cùng cho phép tôi bày tỏ lòng biết ơn vô hạn tới gia đình và bạn bè, những người đã luôn quan tâm, động viên và là chỗ dựa tinh thần vững chắc của tôi trong những thời khắc khó khăn nhất. Do điều kiện thời gian và trình độ nên bản luận văn của tôi không tránh khỏi những thiếu sót, rất mong nhận được sự góp ý quý báu của thầy cô và các bạn. Tôi xin chân thành cảm ơn! Hà Nội, ngày 07 tháng 12 năm 2015 Học viên Phạm Bảo Chi
  4. MỤC LỤC MỞ ĐẦU ....................................................................................................................1 CHƢƠNG 1. CƠ SỞ LÝ THUYẾT NHẬN DẠNG ...............................................3 1.1. Lý thuyết xử lí tổ hợp số liệu ............................................................................3 1.1.1. Các yêu cầu khi sử dụng tổ hợp số liệu trong xử lí ....................................3 1.1.2 Lựa chọn tổ hợp số liệu ..............................................................................4 1.2 Mẫu và các đặc trưng thống kê của số liệu địa vật lý ........................................5 1.2.1 Số liệu đo và mẫu ngẫu nhiên .....................................................................5 1.2.2 Hàm mật độ xác suất ...................................................................................6 1.2.3 Một số hàm phân phối lý thuyết ..................................................................7 1.3. Các thuật toán nhận dạng ..................................................................................8 1.3.1 Mẫu chuẩn các đặc điểm đặc trưng và sử dụng mẫu chuẩn trong nhận dạng ......................................................................................................................8 1.3.2 Các thuật toán nhận dạng có mẫu chuẩn ..................................................10 1.3.3. Các thuật toán nhận dạng không có mẫu chuẩn ......................................14 1.3.4. Quyết định sự tồn tại của đối tượng và đánh giá chất lượng xử lí ..........15 CHƢƠNG 2: MỘT SỐ PHƢƠNG PHÁP PHÂN TÍCH NHẬN DẠNG MỚI TRONG TÌM KIẾM, DỰ BÁO KHOÁNG SẢN THEO TÀI LIỆU ĐỊA VẬT LÝ MÁY BAY .........................................................................................................17 2.1. Các bước phân tích tài liệu địa vật lý máy bay trong tìm kiếm và dự báo triển vọng khoáng sản ....................................................................................................17 2.2. Phương pháp đánh giá và phân loại cụm dị thường .......................................18 2.3. Phương pháp Tần suất – Nhận dạng ...............................................................20 2.3.1. Phương pháp phân tích tần suất. .............................................................20 2.3.2. Phương pháp Tần suất – Nhận dạng........................................................22 2.3.3. Hoàn thiện và mở rộng pham vi áp dụng phương pháp Tần suất – Nhận dạng ....................................................................................................................23
  5. 2.4. Phương pháp Khoảng cách – Tần suất – Nhận dạng ......................................26 2.4.1. Xây dựng ma trận thông tin đối mẫu........................................................27 2.4.2. Đánh giá lựa chọn tổ hợp thông tin .........................................................27 2.4.3. Phân tích đối sánh xác định các đối tượng đồng dạng ............................29 2.4.4. Hoàn thiện và mở rộng phạm vi áp dụng phương pháp Khoảng cách – Tần suất – Nhận dạng ........................................................................................29 CHƢƠNG 3. KẾT QUẢ PHÂN TÍCH THỰC NGHIỆM TRÊN TÀI LIỆU THỰC TẾ VÙNG NINH THUẬN .........................................................................33 3.1. Phương pháp Tần suất – Nhận dạng và khả năng ứng dụng ..........................33 3.2. Tài liệu thu thập, tính toán về khu vực nghiên cứu ........................................34 3.2.1. Vị trí địa lí của khu vực nghiên cứu .........................................................34 3.2.2. Tài liệu Địa vật lý máy bay về khu vực nghiên cứu .................................35 3.3. Phân tích thử nghiệm ......................................................................................38 3.3.1. Phân tích thử nghiệm theo phương án 1......................................................38 3.3.2. Thực hiện phân tích thử nghiệm phương pháp Tần suất – Nhận dạng mới ............................................................................................................................43 3.4. Kết quả và nhận xét ........................................................................................50 3.4.1. Nhận xét kết quả thực hiện theo phương án 1 ..........................................50 3.4.2. Nhận xét kết quả thực hiện phân tích theo phương pháp Tần suất – Nhận dạng mới .............................................................................................................51 KẾT LUẬN ..............................................................................................................53 TÀI LIỆU THAM KHẢO ......................................................................................55
  6. DANH MỤC HÌNH Hình 2.1. Sơ đồ các bước thực hiện chương trình ....................................................26 Hình 3.1. Sơ đồ vị trí khu vực nghiên cứu ................................................................34 Hình 3.2. Bản đồ hàm lượng Uran. ...........................................................................35 Hình 3.3. Bản đồ hàm lượng Thori ...........................................................................36 Hình 3.4. Bản đồ hàm lượng Kali. ............................................................................36 Hình 3.5. Bản đồ hàm lượng kênh tổng. ...................................................................37 Hình 3.6. Kết quả phân vùng triển vọng khoáng sản theo đề án bay đo cho khu vực nghiên cứu. ................................................................................................................38 Hình 3.7. Sơ đồ diện tích triển vọng khoáng sản của khu vực theo kết quả của đề án bay đo ........................................................................................................................44 Hình 3.8. Sơ đồ vị trí các đối tượng mẫu ..................................................................45 Hình 3.9. Sơ đồ đường đồng mức hệ số đồng dạng với vùng 08 theo kết quả phân tích Tần suất- Nhận dạng. .........................................................................................48 Hình 3.10. Đường biên xác định được dựa theo sơ đồ đường đồng mức hệ số tỷ lệ ...................................................................................................................................49 Hình 3.11. Kết quả khoanh định lại biên của các vùng triển vọng khoáng sản .......50
  7. DANH MỤC BẢNG Bảng 3.1. Khoảng giá trị đặc trưng của đối tượng mẫu……………………………....37 Bảng 3.2. Ma trận thông tin của đối tượng mẫu..…………………………………......37 Bảng 3.3. Giá trị tỷ trọng thông tin sắp xếp giảm dần………………………………..38 Bảng 3.4. Giá trị tỷ trọng cho m tính chất đầu………………………………………...39 Bảng 3.5. Ma trận thông tin của 5 đối tượng đối sánh………………………….........39 Bảng 3.6. Kết quả phân tích chỉ số đồng dạng của 5 đối tượng đối sánh…...……..43 Bảng 3.7. Kết quả phân tích cho các đối tượng mẫu…………………………….……48 Bảng 3.8. Bảng tóm tắt kết quả phân tích Tần suất–Nhận dạng mới cho vùng 08..49
  8. MỞ ĐẦU Công tác đo bay địa vật lý ở nước ta bắt đầu và đẩy mạnh khoảng những thập niên gần đây. Những kết quả đạt được trong thời gian qua đã khẳng định được vai trò và hiệu quả to lớn của công tác địa vật lý máy bay trong việc tham gia giải quyết nhiệm vụ địa chất quan trọng, đặc biệt là trong việc tìm kiếm và dự báo triển vọng khoáng sản. Tuy nhiên trong thực tế công tác địa vật lý máy bay vẫn còn tồn tại một số hạn chế mà chủ yếu là ở nội dung xử lý – phân tích tài liệu cần được đầu tư nghiên cứu để không ngừng nâng cao hiệu quả. Nguồn tài liệu của các phương pháp địa vật lý máy bay là rất phong phú, khối lượng các tài liệu địa vật lý máy bay ở nước ta hiện nay rất lớn. Xử lí, phân tích tài liệu, khai thác triệt để thông tin đối với nguồn tài liệu hết sức phong phú này phục vụ công tác điều tra địa chất và tìm kiếm khoáng sản là nhiệm vụ hết sức quan trọng. Trong công tác xử lý – phân tích tài liệu địa vật lý máy bay phục vụ giải đoán địa chất, tìm kiếm và dựa báo triển vọng khoáng sản, người ta sử dụng một tổ hợp rất nhiều các phương pháp khác nhau trong đó nhóm các phương pháp thống kê - nhận dạng được áp dụng rộng rãi và có hiệu quả cao. Tuy nhiên, khi tiến hành các phương pháp phân tích nhận dạng đối với các loại tài liệu địa vật lý ở nước ta vẫn còn gặp một số hạn chế nhất định cần phải được nghiên cứu khắc phục. Do khối lượng tài liệu cũng như chủng loại các thông tin thu được trên các đối tượng địa chất rất lớn ngày càng nhiều, trong khi đó số lượng các tham số đầu vào cho các chương trình của phương pháp phân tích nhận dạng hiện có thường bị giới hạn. Việc sử dụng các tổ hợp thông tin khác nhau để tiến hành phân tích nhận dạng nhiều khi cho những kết quả rất khác nhau. Mặt khác, kể cả khi số lượng các tham số đầu vào của các chương trình phân tích nhận dạng được mở rộng thì việc sử dụng đồng thời tất cả các loại thông tin có được để phân tích nhận dạng thì kết quả mang lại có độ tin cậy không cao hơn so với kết quả của việc chỉ sử dụng một tổ hợp thông tin nhất định có chất lượng cao. Rõ ràng, việc sử dụng những thông tin thiếu độ tin cậy không những không mang lại hiệu quả mà còn làm nhòa đi thông tin quan trọng khác, gây nên những nhận biết sai lệch về đối tượng nghiên cứu 1
  9. Để nâng cao độ tin cậy của các phương pháp phân tích nhận dạng đã có những công trình nghiên cứu theo hướng ứng dụng bài toán đánh giá lựa chọn thông tin để tìm ra tổ hợp những thông tin có chất lượng tốt trước khi tiến hành phân tích nhận dạng. Bên cạnh đó các nhà địa vật lý Việt Nam cũng đã nghiên cứu xây dựng và đưa vào áp dụng có hiệu quả một số phương pháp phân tích mới trong đó có phương pháp phân tích Tần suất – Nhận dạng do nhóm tác giả PGS.TS.Võ Thanh Quỳnh và nnk đề xuất xây dựng. Đề tài luận văn “Nghiên cứu áp dụng phương pháp Tần suất – Nhận dạng mới phục vụ dự báo khoáng sản theo tài liệu địa vật lý máy bay” mà học viên lựa chọn nhằm tìm hiểu, áp dụng phương pháp phân tích tổ hợp các tài liệu địa vật lý máy bay trong tìm kiếm và dự báo triển vọng khoáng sản góp phần đẩy nhanh và nâng cao chất lượng của công tác xử lí phân tích tài liệu địa vật lý máy bay. Luận văn được thực hiện với nhiệm vụ chính sau: - Tìm hiểu về các thuật toán phân tích và đánh giá lựa chọn thông tin. - Tìm hiểu về phương pháp phân tích tài liệu địa vật lý máy bay trong tìm kiếm, dự báo triển vọng khoáng sản. - Đánh giá, dự báo triển vọng khoáng sản cho vùng Nhị Hà trên cơ sở áp dụng bổ sung phương pháp Tần suất – Nhận dạng mới. Từ những nhiệm vụ trên, luận văn được viết với cấu trúc gồm: - Mở đầu - Chương 1: Cơ sở lý thuyết nhận dạng - Chương 2: Một số phương pháp phân tích nhận dạng mới trong tìm kiếm, dự báo khoáng sản theo tài liệu địa vật lý máy bay - Chương 3: Kết quả phân tích thực nghiệm trên tài liệu thực tế vùng Ninh Thuận. - Kết luận 2
  10. CHƢƠNG 1. CƠ SỞ LÝ THUYẾT NHẬN DẠNG Nhận dạng là phương pháp thực nghiệm nhằm xác định một mô hình cụ thể trong tập hợp các mô hình thích hợp, dựa trên cơ sở quan sát các tín hiệu vào ra. Lý thuyết nhận dạng là một trong những phương pháp phục vụ cho mục tiêu của công tác thăm dò địa vật lý, chỉ cần dựa vào các số liệu khảo sát trường địa vật lý của đối tượng mà không cần tác động nghiên cứu trực tiếp đối tượng như các lĩnh vực khác mà vẫn đưa ra được các thông tin của đối tượng để phục vụ cho các mục tiêu khác nhau. Phương pháp sử dụng công cụ là toán học để giải quyết các bài toán phân loại đối tượng, và là một phương án được lựa chọn nhiều trong địa vật lý hiện nay. 1.1. Lý thuyết xử lí tổ hợp số liệu Mỗi loại số liệu thường phản ánh một số đặc trưng nào đó của đối tượng nhưng việc sử dụng số liệu đó để đưa ra kết luận cho đối tượng sẽ cho kết quả kém tin cậy do nhiều nguyên nhân khác nhau chưa kể đến sự sai số trong quá trình thu thập và chỉnh lí số liệu. Và để đáp ứng được yêu cầu thực tế cùng nâng cao chất lượng xử lí thông tin, hiện nay, người ta áp dụng phổ biến là các phương pháp xử lí số liệu tổ hợp. Xử lí số liệu về cơ bản là dựa trên nhiều loại thông tin khác nhau để giải quyết được các nhiệm vụ đặt ra phù hợp với điều kiện kinh tế và kĩ thuật cho phép. Không chỉ riêng trong địa vật lý mà nhiều lĩnh vực khác cũng sử dụng xử lí tổ hợp dữ liệu để nâng cao chất lượng xử lí. 1.1.1. Các yêu cầu khi sử dụng tổ hợp số liệu trong xử lí Xử lí tổ hợp số liệu trong lý thuyết nhận dạng là một quá trình phức tạp phụ thuộc vào đối tượng nghiên cứu và các dạng số liệu khác nhau nên khi khảo sát, thu thập thông tin về đối tượng phải đáp ứng được các yêu cầu thực tế đặt ra như sau: - Thông tin phải đảm bảo về số lượng và chất lượng để đạt được mục tiêu và xử lí với độ chính xác có thể chấp nhận được. - Thời gian thu thập thông tin phải phù hợp với tiến độ yêu cầu. - Khảo sát, thu thập thông tin phải đạt được hiệu quả kinh tế. 3
  11. Từ các yêu cầu này mà đôi khi các phương án khảo sát loại số liệu có độ tin cậy cao hơn không được lựa chọn mà thay vào đó người ta sử dụng một loại thông tin khác mà khi sử dụng tổ hợp các thông tin này cũng có khả năng đáp ứng được yêu cầu, mục tiêu đề ra. Mặt khác hiện nay các tổ hợp phương pháp địa vật lý đang ngày càng được áp dụng rộng rãi, các tổ hợp phương pháp này với các phép ghi đo tự động sẽ cung cấp một khối lượng dữ liệu rất lớn bao gồm nhiều chủng loại thông tin. Mỗi loại thông tin chỉ mang những đặc trưng nhất định của đối tượng và để hoàn thành nhiệm vụ đặt ra trong nhiều trương hợp người ta buộc phải sử dụng tổ hợp các thông tin khác nhau. Bản thân mỗi số liệu khảo sát đều mang những sai số, chúng đi kèm với số liệu và nhiều lúc gây ra những sai lầm khi xử lí. Những sai số này do nhiều nguyên nhân khác nhau gây ra như: sai số đo ghi của máy, sai số do kĩ thuật và phương pháp đo ghi, sai số do ảnh hưởng từ đối tượng khác,… Trong số liệu địa vật lý những sai số mắc phải làm giảm độ tin cậy của thông tin được loại bỏ trong các bước xử lí số liệu nhưng rất khó để tách hoàn toàn chúng ra khỏi số liệu. Đặc biệt là các nhiễu do nguồn gốc địa chất, chúng làm sai lệch mạnh các tín hiệu. Những sai số này làm giảm đáng kể độ tin cậy của thông tin, đặc biệt trong trường hợp loại thông tin đó được coi là loại tính chất quan trọng đặc trưng cho đối tượng đang được nghiên cứu. Một nguyên nhân khác dẫn đến giảm độ tin cậy của một loại thông tin là tính đa trị của kết quả xử lí, gây ra nhiều khó khăn và sai lầm trong xử lí. Để xác định đơn trị đối tượng cần sử dụng kết hợp nhiều loại thông tin khác nhau một cách phù hợp. Từ các nguyên nhân trên, các phương pháp xử lí tổ hợp số liệu đã và đang được áp dụng phổ biến trong nhiều lĩnh vực và mang lại hiệu quả cao. 1.1.2 Lựa chọn tổ hợp số liệu Trong bất kỳ bài toán nhận dạng nào thì số lượng và chất lượng các tính chất (loại thông tin) dùng để nhận dạng luôn được quan tâm hàng đầu. Mỗi tổ hợp thông tin khác nhau thường cho những kết luận khác nhau về đối tượng. Để đạt được kết 4
  12. quả đáng tin cậy nhất thì quá trình xử lý số liệu cần lựa chọn được tổ hợp thông tin có độ tin cậy cao và hợp lý. Chất lượng của thông tin tốt hay không phụ thuộc vào loại thông tin đó có đặc trưng cho đối tượng (khả năng phân biệt đối tượng với môi trường xung quanh) hay không. Tính đặc trưng cho đối tượng của một loại số liệu địa vật lý do nhiều nguyên nhân quyết định. Một tính chất là đặc trưng cho đối tượng khi độ chênh lệch giá trị của số liệu của tính chất đó giữa đội tượng nghiên cứu với môi trường xung quanh đủ lớn. Trong trường hợp đối tượng nằm quá sâu, kích thước quá nhỏ, hoặc do ảnh hưởng của các yếu tố khác (phong hóa, biến chất, chất lưu...) dẫn tới độ chênh lệch của giá trị không đủ để phân biệt đối tượng với môi trường xung quanh khi đó thông tin là không có ích cho xử lý số liệu. Các sai số không tách được sẽ gây ra sai lệch về số liệu khi đó thông tin sẽ không còn mang tính đặc trưng cho đối tượng. Một tổ hợp thông tin không đầy đủ sẽ không đáp ứng được yêu cầu, nhiệm vụ đặt ra cho quá trình xử lý. Việc chọn số lượng các loại thông tin phải đảm bảo được tính đơn trị của kết quả và đưa ra được đầy đủ các yêu cầu nghiên cứu về đối tượng. Việc sử dụng đồng thời nhiều loại thông tin trong đó có những thông tin có độ tin cậy thấp không những gây khó khăn cho quá trình xử lý, chất lượng xử lý không cao, do các thông tin thiếu tin cậy sẽ làm nhòe đi các thông tin quan trọng khác dẫn đến những nhận thức sai lệch về đối tượng. Việc lựa chọn được một tổ hợp thông tin có chất lượng cao là nội dung khó khăn và phụ thuộc nhiều vào hiểu biết, kinh nghiệm của người xử lý. 1.2 Mẫu và các đặc trƣng thống kê của số liệu địa vật lý 1.2.1 Số liệu đo và mẫu ngẫu nhiên Vì các thiết bị quan sát trường trong địa vật lý đều là các thiết bị số nên các kết quả quan sát trường địa vật lý nhiễu và sai số đo nên có thể là đại lượng này hay đại lượng khác mà người đo không dự đoán trước được. Vì vậy để mô tả các giá trị (bằng số) các trường địa vật lý do được người ta sử dụng khái niệm đại lượng ngẫu nhiên. 5
  13. Các giá trị trường địa vật lý đo được các số cụ thể nên đại lượng ngẫu nhiên là mô hình nền tảng để mô tả các số liệu địa vật lý. Đại lượng X được gọi là ngẫu nhiên nếu trong mỗi phép đo sẽ xuất hiện một trong những giá trị cụ thể x1, x2, x3,… của đại lượng này với các xác suất tương ứng p1, p2, p3,… Tất cả các giá trị có thể của X sẽ tạo thành nhóm đủ, vì bao giờ trong kết quả của một phép đo cũng sẽ xuất hiện một giá trị xi nào đó (biểu hiện nào đó của X); nghĩa là bao giờ cũng tồn tại đẳng thức: n  P 1 i 1 i (1.1) Để mô tả các đại lượng ngẫu nhiên, người ta sử dụng công cụ toán học xác suất, thông qua hàm phân bố xác suất và các đặc trưng thống kê. 1.2.2 Hàm mật độ xác suất Hàm mật độ xác suất f(x) là một hàm mô tả xác suất xuất hiện các giá trị cụ thể của đại lượng ngẫu nhiên x. Hàm mật độ xác suất có các tính chất sau: lim x f x   0 (1.2)   f x dx  1  (1.3) x2 P(x1 < X < x2) =  f ( x)dx x1 (1.4) Với P(x1 < X < x2) là xác suất rơi vào khoảng ( x1;x2) của đại lượng ngẫu nhiên x. x1 F(x) =  f ( x)dx  (1.5) Với F(x) là hàm phân bố của X; hàm mô tả xác suất để mô tả ngẫu nhiên X nhận các giá trị nhỏ hơn giá trị x1 nào đó. Đồ thị của hàm phân bố mật độ xác suất thực nghiệm được dựng lên từ số liệu khảo sát thực tế được gọi là đường cong biến phân. 6
  14. Ngoài hàm phân bố F(x) và hàm mật độ f(x) người ta còn dùng các đặc trưng thống kê để mô tả các đại lượng ngẫu nhiên bao gồm: n - Kỳ vọng toán M[x] = x = p x i 1 i i (1.6) - Mod (M0) là giá trị x mà tại đó hàm mật độ phân bố đạt max - Median (Me) là giá trị của X có xác suất P(X) = 1/2 - Phương sai D[x] = M[x – [Mx]]2 =  ( xi – M[x])2 pi (1.7) - Độ lệc trung bình bình phương   D (1.8) 1.2.3 Một số hàm phân phối lý thuyết Để mô tả các đại lượng ngẫu nhiên, trong địa vật lý người ta sử dụng các hàm phân phối lý thuyết như hàm phân phối chuẩn (phân phối Gauxơ), phân phối chuẩn loga, phân phối Puasson… Phần lớn các đại lượng ngẫu nhiên trong địa vật lý cũng như nhiều hiện tượng địa chất khác chúng tuân theo luật phân phối chuẩn. Đại lượng ngẫu nhiên X tuân theo luật phân phối chuẩn nếu hàm mật độ của nó có dạng:  x   2 1  Trong đó : f  x   2 2 e (1.9)  2    x   2 1 + Kỳ vọng :   e 2 2 (1.10)   2 + Phương sai:  2 = E(X - EX)2 (1.11) Đồ thị của hàm phân phối chuẩn đối xứng qua đường thẳng x = và giảm dần xuống xung quanh kỳ vọng. Diện tích giới hạn bởi đường cong và trục hoành bằng 1, đó chính là xác suất để đại lượng ngẫu nhiên X nhận giá trị trong khoảng (  ; ) (1.3). Xác suất để đại luượng ngẫu nhiên X nhận giá trị trong khoảng từ x1 tới x2 chính là phần diện tích 7
  15. được bao bởi đường cong, trục hoành và hai đường thẳng x = x1 ; x = x2. Xác suất đó được tính theo công thức (1.4). Nhiều giá trị trường địa vật lý như mật độ, tốc độ truyền sóng, phóng xạ… tuân theo luật phân phối chuẩn và dựa trên các thuật toán thống kê theo luật phân phối chuẩn người ta có thế xử lý số liệu để tìm ra các đặc trưng của đối tượng. Ngoài luật phân phối chuẩn còn có các luật phân phối khác đang được áp dụng phổ biến trong phân tích thống kê các số liệu địa vật lý. Ví dụ như luật phân phối chuẩn loga được dùng để mô tả các giá trị điện trở xuất, độ từ cảm của đất đá. 1.3. Các thuật toán nhận dạng Nhiệm vụ cơ bàn nhất của các công tác xử lý tổ hợp số liệu địa vật lý là phân loại các điểm quan sát thành các diện tích nhất định hay các nhóm, lớp diện tích nhất định, ở đó các đặc trưng của trường địa vật lý giống với các đặc trưng của trường liên quan với loại (lớp) đối tượng địa chất nhất định. Để giải quyết được nhiệm vụ trên tương tự nhiều lĩnh vực khoa học khác người ta sử dụng lý thuyết nhận dạng – một lĩnh vực toán học đi sâu vào giải quyết các bài toán phân loại đối tượng dựa vào mối quan hệ hữu cơ giữa các đối tượng cụ thể và các dấu hiệu đặc trưng cho đối tượng đó. Hiện nay, trong địa vật lý người ta sử dụng nhiều phương pháp nhận dạng hiện đại, được tự động hóa bằng các phần mềm mạnh. Tuy nhiên có thể chia chúng thành 2 nhóm: nhóm có phương pháp nhận dạng theo đối tượng chuẩn (có thông tin tiên nghiệm) và nhóm có phương pháp nhận dạng không có đối tượng chuẩn (không có thông tin tiên nghiệm). 1.3.1 Mẫu chuẩn các đặc điểm đặc trưng và sử dụng mẫu chuẩn trong nhận dạng Để xử lý tổ hợp các số liệu bằng phương pháp nhận dạng có mẫu chuẩn thì công việc quan trọng mang tính quyết định là lựa chọn các mẫu chuẩn và xác định các đặc trưng thống kê các trường địa vật lý của chúng. Các mẫu hay đối tượng chuẩn là phần diện tích ở đó bằng các số liệu khoan và các số liệu địa chất khác đã xác định được bản chất địa chất của từng đối tượng gây ra 8
  16. trường địa vật lý. Tùy thuộc vào các mục đích nghiên cứu khác nhau mà các đối tượng chuẩn được lựa chọn khác nhau. Ví dụ khi mục đích nghiên cứu là tìm kiếm khoáng sản thì đối tượng chuẩn có thể là một vùng quặng, một trường quặng, một mỏ quặng hay một vỉa quặng. Còn khi khảo sát địa vật lý phục vụ công tác đo vẽ bản đồ địa chất thì các đối tượng mẫu có thể là diện tích phát triển một loại đá nào đó. Tùy theo bản chất, đối tượng chuẩn có hai loại là đối tượng chuẩn mang các thông tin đại diện và đối tượng chuẩn mang thông tin phủ nhận. Đối tượng chuẩn đại diện mang các thông tin có khả năng phân loại một hay một lớp đối tượng. Trong nhiều trường hợp có những đối tượng khác nhau nhưng mang các đặc điểm trường địa vật lý tương đồng. Khi đó người ta sử dụng đối tượng chuẩn mang thông tin phủ nhận để loại bỏ những đối tượng không đúng ra khỏi tập kết quả nhận dạng. Cần lưu ý để công tác phân tích nhận dạng đạt kết quả tốt thì cần lựa chon các đối tượng chuẩn phải nằm xen kẽ với các phần diện tích khảo sát cần nhận dạng. Một đối tượng chuẩn nào đó có phạm vi ứng dụng là giới hạn và nó phụ thuộc vào các yếu tố sau: - Đối tượng chuẩn phải có giá trị thông tin tin cậy theo mục tiêu tìm kiếm. - Đối tượng chuẩn phải phù hợp với diện tích nghiên cứu. - Mật độ lưới khảo sát các loại thông tin phải tương ứng với đối tượng chuẩn lựa chọn. Đối tượng chuẩn mang các dấu hiệu nhận biết, phân biệt nó với môi trường xung quanh, các dấu hiệu có khả năng phân biệt cao trong các loại thông tin thu thập sẽ giúp quá trình xử lý số liệu cho kết quả tin cậy. Để đánh giá chất lượng của dấu hiệu người ta sử dụng khái niệm lượng tin của dấu hiệu. Lượng tin của dấu hiệu là khả năng mà dấu hiệu đó có thể phân biệt được các đối tượng khác nhau với nhau. Khả năng này phụ thuộc vào việc các đối tượng của cùng một lớp có thường xuyên cho những giá trị cố định của dáu hiệu đó hay không và các giá trị đó có phân bố ra ngoài giới hạn của các đối tượng của lớp đó hay không, 9
  17. Trong quá trình nhận dạng không phải mọi dấu hiệu trường đều quan trọng như nhau, thậm chí có những dấu hiệu trường địa vật lý hoàn toàn không chứa thông tin về đối tượng khảo sát và có thể là những dấu hiệu nhiễu làm mờ đi các thông tin hữu ích. Khi đưa các dấu hiệu này vào sử dụng để nhận dạng không làm tăng mà ngược lại lại làm giảm chất lượng nhận dạng đối tượng. Chính vì vậy, trong quá trình xử lý cần tiến hành đánh giá lượng tin của từng dấu hiệu để từ đó chọn ra các dấu hiệu có lượng tin cao đưa vào xử lý và loại bỏ những dấu hiệu có lượng tin thấp. Dựa vào các giá trị thường quan sát được trên các đối tượng chuẩn người ta tiến hành xác định các đặc trưng thống kê của trường cho từng loại đối tượng. Các đặc trưng này được sử dụng tùy thuộc vào thuật toán nhận dạng áp dụng. Thường các đặc trưng thống kê bao gồm: - Đường cong biến phân (hàm phân bố mật độ xác suất thực nghiệm). - Kỳ vọng và phương sai của trường (tính thông qua đường cong biến phân). Ngoài ra khi cần người ta tính cả hệ số tương quan giữa các dấu hiệu, phương chủ đạo của các dị thường… 1.3.2 Các thuật toán nhận dạng có mẫu chuẩn Các thuật toán nhận dạng có mẫu chuẩn là các thuật toán tiến hành xác định bản chất địa chất của các đối tượng dựa vào việc só sánh tập hợp các dấu hiệu địa vật lý của các đối tượng nghiên cứu. Việc lựa chọn các thuật toán nhận dạng tùy thuộc vào các điều kiện sau: - Số liệu xuất phát. - Tồn tại các thông tin tiên nghiêm về đối tượng. - Nhiệm vụ cụ thể của các công tác địa vật lý. Các thuật toán nhận dạng được xây dựng dựa vào các công cụ toán học khác nhau như: toán logic, các hàm hồi quy và lý thuyết định nghiệm thống kê… dưới đây là một số thuật toán điển hình. a. Phƣơng pháp nhận dạng sử dụng toán logic 10
  18. Trong các thuật toán logic, để nhận dạng đối tượng hoặc là người tính lượng tin tổng, hoặc là xác định khoảng cách tổng. Từ đối tượng chuẩn tìm đượccác dấu hiệu đặc trưng và người ta tiến hành mã hóa các dấu hiệu trường bằng mã nhị phân gồm tập số “0” và “1”. Nếu xkn là giá trị trường của dấu hiệu thứ n của mẫu thứ k thì: + xkn = 0 khi mẫu k không chứa dấu hiệu thứ n. + xkn = 1 khi mẫu k chứa mẫu hiệu thứ n. Bằng cách trên toàn bộ các mẫu được mã hóa. Tiếp theo, dựa vào các tổ hợp số “0” và “1” (từ thông tin) xác lập trên các mẫu chuẩn người ta xác định từ các thông tin chuẩn cho từng lớp đối tương. Từ thông tin chuẩn cho một lớp (đối tượng) là từ thông tin gặp p lần ở các đối tượng chuẩn của lớp đó và không gặp lần nào các đối tượng chuẩn thuộc lớp khác (giá trị p được chọn theo kinh nghiệm). Đối với một lớp người ta có thể chọn giá trị thông tin chuẩn. các thông tin này được gọi là tổ hợp dấu hiệu phức tạp đặc trưng cho các đối tượng chuẩn của cùng một lớp thì tổ hợp dấu hiệu nào đặc trưng cho mẫu chuẩn lớn hơn, tổ hợp có đấu hiệu sẽ có lượng tin lớn hơn. Cuối cùng là nhận dạng các đối tượng nghiên cứu. Ở bước này người ta tiến hành kiểm tra xem bao nhiêu tổ hợp dấu hiệu phức tạp của từng lớp gặp ở đối tượng nghiên cứu. Nếu số lần gặp các tổ hợp dấu hiệu phức tạp của một lớp nào đó nhiều hơn số lần gặp các tổ chức phức tạp của lớp khác thì đói tượng nghiên cứu được xếp vào lớp đó. Qúa trình này được tiến hành cho đến khi đối tượng cuối cùng được nhận dạng. b. Phƣơng pháp nhận dạng sử dụng phân tích hồi quy Trong xử lý số liệu địa vật lý, thuật toán hồi quy đầu tiên được sử dụng để xử lý giếng khoan và phân tích định lượng các tài liệu trọng lực. Thực chất của thuật toán này là xây dựng các hàm hồi quy xác định mối quan hệ giữa các tham số địa chất cần tìm với các số liệu địa vật lý quan sát được bằng các phương pháp khác nhau. Ví dụ mối quan hệ giữa một bên là độ rỗng của đất đá với bên kia là số liệu đo điện trở, điện trường tự nhiên, gamma… dọc thành giếng khoan. 11
  19. Thường quá trình xấp xỉ các hàm hồi quy giới hạn bởi các đa thức bậc 1, bậc 2 hoặcđặc biệt có thể xấp xỉ với đa thức bậc lớn hơn. Ví dụ: nếu chỉ có hai dấu hiệu 1 và 2 thì hàm hồi quy được xấp xỉ bằng đa thức bậc 2 có dạng: yk = akx1k + bkx2k + ckx1kx2k + dkx21k +gkx22k + hk (1.12) Các hệ số ak, bk, ck, dk, gk và hk trong biểu thức (1.12) được xác định bằng phương pháp bình phương tối thiểu theo các giá trị địa chất của tham số yk xác định được trên các đối tượng chuẩn và các số liệu đo trường địa vật lý của các dấu hiệu x1k và x2k của chính đối tượng đó. Phương trình hồi quy trên được xác định cho từng đối tượng chuẩn thứ k. Ngoài phương pháp hồi quy người ta còn tiến hành xác định giá trị ngưỡng yk cho từng lớp đối tượng chuẩn. Cuối cùng đưa các giá trị trường đo được trên đối tượng cần nghiên cứu vào các phương trình hồi quy tìm được trên đối tượng chuẩn người ta sẽ xác định được giá trị của tham số yk của đối tượng nghiên cứu . Thuật toán phân tích hồi quy có ưu điểm là dễ dàng đưa vào xử lý bổ sung các số liệu của dấu hiệu mới bằng cách đưa thêm vào các phương trình của hàm hồi quy các số hạng mới. Vì vậy thuật toán này rất phù hợp cho việc xử lý các số liệu của tổ hợp khảo sát gồm nhiều dáu hiệu khác nhau. Tuy nhiên thuật toán hồi quy cũng có nhược điểm ở chỗ với một tập hợp số liệu nhất định ứng với một giá trị sai số cho trước có thể xấp xỉ được nhiều hàm hồi quy. Nhược điểm này thể hiện rõ nhất khi các dấu hiệu quan sát thường liên quan với nhau. Lý do trên không cho phép đưa ra được các lý giải về ý nghĩa vật lý của các hệ số của hàm hồi quy tìm được. Các lý giải vật lý chỉ có thể được đưa ra khi dạng của phương trình này được xác định cho một mô hình vật lý cụ thể, còn quá trình xấp xỉ hồi quy chỉ được tiến hành đơn thuần với mục đích xác định hệ số của phương trình hồi quy ứng với mô hình vật lý đó. c. Phƣơng pháp kiểm định giả thuyết thống kê Thuật toán nhận dạng trên cơ sở mô hình thống kê đối tượng chuẩn trong phân tích số liệu địa vật lý thường sử dụng các thông số như: tỉ số sự thật L(x) và tổng lượng thông tin J(1;2;x) 12
  20. Giá trị các thông số đó được tính theo công thức: L(x) = P1(x)/ P2(x) (1.13) J(1:2,x) = log[P1(x)/ P2(x)] (1.14) Trong đó: P1(x), P2(x) là các xác suất bắt gặp giá trị dấu hiệu x cùng với các đối tượng tương ứng của lớp 1 và lớp 2 (ví dụ lớp quặng và lớp không quặng). Khi sử dụng đối tượng chuẩn cho lớp 1 (lớp quặng) thì trong các biểu thức P2(x) được thay bằng 1. x: là vectơ giá trị các dấu hiệu được sử dụng, x1,x2…xk (ví dụ các hàm lượng qU, qTh, qK…). Khi các dấu hiệu x1,x2…xk được xem là không phụ thuộc nhau thì xác suất của đại lượng n chiều của tổ hợp n dấu hiệu được tính: P(x) = P(x1). P(x2)…. P(xk) (1.15) P (x ). P(x ). P(x )   11 12 1k L ( x ) L ( x 1). L( x 2).... L ( x k) (1.16) P (x 2). 1P(x 2) 2. P(x 2) k J(1:2,x) = J(1:2,x1) + J(1:2,x2) +…+ J(1:2,xk) (1.17) Nếu sự phụ thuộc của các dấu hiệu là rõ và sự phân bố của chúng tuân theo luật chuẩn thì để nhận dạng các đối tượng quặng và không quặng người ta thường sử dụng các hàm phân giải bậc 1 (R1) hoặc bậc 2 (R2) đối với các tham số x1,x2…xn. Các hàm này được biểu diễn như sau: n R1 aixi (1.18) i1 k k k 2 R  b x ij i. x i j  1 j  cixi (1.19) 1 i 1 Trong đó các hệ số: ai, bij, ci được xác định từ các ma trận thông tin các dấu hiệu của các đối tượng quặng và không quặng. Thông qua các “diện tích đối tượng chuẩn” người ta xác định được các vectơ giá trị các dấu hiệu sử dụng x (trong trường hợp các dấu hiệu được xem là không phụ thuộc nhau) hoặc các hệ 13
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
5=>2