Nghiên c
ứu, tìm hiểu về một số kỹ thuật tấn công khai thác thông tin bậc cao thông qua hệ thố
ng tìm
kiếm Google.
1
MỤC LỤC
DANH MỤC CÁC BẢNG ............................................................................................... 3
DANH MỤC CÁC HÌNH VẼ ......................................................................................... 4
LỜI NÓI ĐẦU ................................................................................................................. 6
CHƯƠNG I. TỔNG QUAN VỀ HỆ THỐNG TÌM KIẾM GOOGLE .......................... 7
1.1.Giới thiệu về Google và hệ thống tìm kiếm Google .................................................. 7
1.1.1 Tổng quan về Google ....................................................................................... 7
1.1.2. Giao diện các trang web của Google ............................................................. 11
1.1.3. Tìm kiếm thông thường ................................................................................ 12
1.1.4. Tìm kiếm nâng cao ....................................................................................... 17
1.2. Tầm quan trọng của hệ thống tìm kiếm Google .................................................... 22
1.3. Phương pháp khai thác thông tin qua hệ thống tìm kiếm Google. ....................... 23
1.3.1. Googlebot , máy thu thập trang web của Google. .......................................... 23
1.3.2. Indexer của Google ....................................................................................... 25
1.3.3.Bộ xử lý truy vấn của Google ........................................................................ 26
CHƯƠNG II: MỘT SỐ KỸ THUẬT KHAI THÁC THÔNG TIN BẬC CAO QUA HỆ
THỐNG TÌM KIẾM GOOGLE VÀ CÁC PHƯƠNG PHÁP BẢO VỆ THÔNG TIN 27
2.1. Các cú pháp tìm kiếm nâng cao trong Google ....................................................... 27
2.1.1. Intitle and Allintitle ....................................................................................... 28
2.1.2.Inurl và Allinurl ............................................................................................. 30
2.1.3. Filetype ........................................................................................................ 31
2.1.4. Allintext ........................................................................................................ 33
2.1.5. Site ............................................................................................................... 33
2.1.6 .Link .............................................................................................................. 34
2.1.7. Cache ........................................................................................................... 35
2.1.8. Info ............................................................................................................... 35
2.1.9. Related ........................................................................................................ 36
2.1.10. Define ......................................................................................................... 37
2.1.11. Phonebook .................................................................................................. 38
2.1.12. Daterange ................................................................................................... 40
Nghiên c
ứu, tìm hiểu về một số kỹ thuật tấn công khai thác thông tin bậc cao thông qua hệ thố
ng tìm
kiếm Google.
2
2.1.13. Inanchor ..................................................................................................... 41
2.1.14. Numrange ................................................................................................... 41
2.1.15. Author ........................................................................................................ 41
2.1.16. Group ......................................................................................................... 44
2.1.17. Insubject ..................................................................................................... 44
2.1.18. Msgid ......................................................................................................... 45
2.1.19: Stocks ......................................................................................................... 47
2.2. Khai thác thông tin qua hệ thống tìm kiếm Google ............................................... 47
2.2.1. Liệt kê thư mục (Directory Listings) ............................................................. 48
2.2.2. Kỹ thuật thay thế gia tăng (Incremental Substitution) .................................... 51
2.2.3. Extension Walking ........................................................................................ 52
2.2.4. Ẩn danh khi truy cập site với bộ nhớ Caches (Anonymity with Caches) ........ 52
2.3. Các giải pháp bảo vệ thông tin ............................................................................... 55
2.3.1. Xây dựng chính sách bảo mật. ...................................................................... 55
2.3.2.Những biện pháp bảo vệ máy chủ web. .......................................................... 55
2.3.4. Trợ giúp từ Google ....................................................................................... 61
CHƯƠNG III: ÁP DỤNG MỘT SỐ KỸ THUẬT TẤN CÔNG VÀ KHAI THÁC
THÔNG TIN BẬC CAO QUA HỆ THỐNG TÌM KIẾM GOOGLE. ......................... 63
3.1. Mục đích ................................................................................................................. 63
3.2.Mô hình triển khai ................................................................................................... 63
3.3.Các bước thực hiện .................................................................................................. 64
3.3.1. Áp dụng cú pháp bậc cao để tìm những trang web bị lỗi SQL injection .. 64
3.3.2. Áp dụng cú pháp bậc cao để khai thác thông tin nhạy cảm. ..................... 66
3.4.Kết quả ..................................................................................................................... 68
3.5.Đánh giá kết quả ...................................................................................................... 68
KẾT LUẬN .................................................................................................................... 69
TÀI LIỆU THAM KHẢO ............................................................................................. 70
Nghiên c
ứu, tìm hiểu về một số kỹ thuật tấn công khai thác thông tin bậc cao thông qua hệ thố
ng tìm
kiếm Google.
3
DANH MỤC CÁC BẢNG
Bảng 1.1: Chi tiết về giao diện của Google ............................................................. 12
Nghiên c
ứu, tìm hiểu về một số kỹ thuật tấn công khai thác thông tin bậc cao thông qua hệ thố
ng tìm
kiếm Google.
4
DANH MỤC CÁC HÌNH VẼ
Hình 1.1: Trụ sở Google tại Mountain View, California, USA .................................. 8
Hình 1.2: Giao diện chính của Google (www.google.com.vn) ................................ 11
Hình 1.3: Google Search với từ khóa "Youtube" ..................................................... 13
Hình 1.4: Google Search hình ảnh với từ khóa "youtube" ....................................... 14
Hình 1.5 Google Search video với từ khóa "youtube" ............................................. 15
Hình 1.6: Trang cài đặt tìm kiếm ............................................................................ 16
Hình 1.7: Google dịch ............................................................................................ 17
Hình 1.8: Trang tìm kiếm nâng cao (1) ................................................................... 20
Hình 1.9: Trang tìm kiếm nâng cao (2) ................................................................... 21
Hình 1.10: Trang thêm URL ................................................................................... 24
Hình 2.1: Tiêu đề của trang web ............................................................................. 28
Hình 2.3: Cú pháp intitle ........................................................................................ 29
Hình 2.4: So sánh kết quả allintitle ......................................................................... 30
Hình 2.5: Tìm kiếm với inurl .................................................................................. 30
Hình 2.6: So sánh kết quả với allinurl ..................................................................... 31
Hình 2.7: Một số loại tập tin phổ biến và phần mở rộng trong hệ thống tìm kiếm
Google ................................................................................................................... 32
Hình 2.8: 25 loại tập tin phổ biến nhất .................................................................... 32
Hình 2.9: Cú pháp Site ........................................................................................... 33
Hình 2.10: Cú pháp nâng cao với Site .................................................................... 34
Hình 2.11: Cú pháp Link ........................................................................................ 35
Hình 2.12: Cú pháp info ......................................................................................... 36
Hình 2.13: Cú pháp Related ................................................................................... 37
Hình 2.14: Cú pháp define ...................................................................................... 38
Nghiên c
ứu, tìm hiểu về một số kỹ thuật tấn công khai thác thông tin bậc cao thông qua hệ thố
ng tìm
kiếm Google.
5
Hình 2.15: Cú pháp Phonebook .............................................................................. 39
Hình 2.16: Cú pháp Bphonebook............................................................................ 40
Hình 2.17: Cú pháp Author..................................................................................... 42
Hình 2.18: Cú pháp author: “Tống Đình Quỳ” ........................................................ 43
Hình 2.19: Cú pháp author:Tống Đình Quỳ ............................................................ 43
Hình 2.20: Cú pháp Group ..................................................................................... 44
Hình 2.21: Một dạng điển hình của Group Message ............................................... 46
Hình 2.22: Message ID của một cổng ..................................................................... 46
Hình 2.23: Cú pháp Stock ...................................................................................... 47
Hình 2.24: Kết quả của Directory Listings website http://forum.hocvienact.edu.vn/ 48
Hình 2.25: Kết quả tìm kiếm thư mục đặc biệt ........................................................ 49
Hình 2.26: Kết quả hiển thị danh sách thư mục cho đường
dẫn…/bpa/acadunits/admin/envr/bowman. ............................................................. 50
Hình 2.27: Tất cả đều được lưu trong Google cache ............................................... 53
Hình 2.28: Directory listing tiết lộ vị trí tập tin .htaccess ........................................ 56
Hình 2.29: Cú pháp tìm kiếm tập tin robots.txt ....................................................... 58
Hình 2.30: Nội dung của một tập tin roots.txt ......................................................... 59
Hình 2.31: Trang web của Google dành cho quản trị viên web ............................... 62
Hình 2.32: Trang web để loại bỏ URL .................................................................... 62
Hình 3.1: Mô hình mô tả quá trình tìm kiếm của Google ........................................ 64
Hình 3.2: Các trang web có thể bị lỗi SQL injection ............................................... 65
Hình 3.3: Trang web bị lỗi SQL injection ............................................................... 65
Hình 3.4: Một số thông tin của trang web bị lỗi SQL injection ............................... 66
Hình 3.5: Một số trang web có chứa thông tin nhạy cảm ........................................ 67
Hình 3.6: Nội dung của tập tin backup.sql .............................................................. 67