CHƯƠNG 3: GOOGLE<br />
HACKING<br />
Nguyễn Tấn Thành<br />
Ai trong chúng ta cũng đều biết, Google là một gã khổng lồ trong lĩnh vực tìm kiếm.<br />
Người ta có thể tìm thấy mọi thông tin từ Google. Từ những chuyện to lớn, đến những<br />
chuyện nhỏ nhặc nhất cũng có thể tìm được trên Google. Bất kể thông tin gì, miễn là nó<br />
hiển thị ra trang web thì đều được google tìm thấy.<br />
Chương trước, chúng ta đã có nhắc đến kỹ thuật theo dõi Footprinting, và sau này bạn<br />
gặp một chủ đề là Social engineering , cả hai lĩnh vực này đều có một phần ứng dụng<br />
từ Google để tìm kiếm thông tin, phục vụ cho nhu cầu tấn công hệ thống.<br />
Lợi dụng vào bộ máy tình kiếm Google để truy tìm tông tích đối tượng, thậm chỉ là<br />
dùng Google để tấn công hệ thống. Đó chính là Google Hacking.<br />
Với khả năng tìm kiếm lợi hại của Google, hacker có thề tìm thấy nhiều thông tin hữu<br />
ích, cho quá trình theo dõi mục tiêu và tấn công vào đối tượng. Chương này sẽ trình bày<br />
những thủ thuật tìm kiếm nổi trội của Google, có ý nghĩa đối với một hacker. Từ việc<br />
làm thể nào để bạn tìm được thông tin của mục tiêu, thì bạn sẽ rút cho mình kinh nghiệm<br />
làm thế nào đề không cho thông tin bị rò ra bên ngoài.<br />
<br />
1. Google Hacking Là Gì ?<br />
Nói tóm lại, Google hacking thực hiện những công việc như:<br />
Sử dụng bộ máy tìm kiếm để truy tìm thông tin của đối tượng cần theo dõi.<br />
Cũng là bộ máy tìm kiếm, với những cú pháp tìm kiếm đặc biệt có thể giúp<br />
hacker tìm thấy những thông tin đặc biệt có liên quan đến bảo mật, như username,<br />
computername, password, page logon…<br />
Sử dụng Google để thực hiện các vụ tấn công, điều này được làm như thế nào,<br />
hạ hồi phân giải.<br />
<br />
Những thông tin được chú tâm<br />
Chức năng tìm kiếm của Google rất lớn, tùy vào phạm trù lĩnh vực mà chúng ta quan<br />
tâm đến những dữ liệu nào. Trong Hacking, chúng ta cần chú ý đến những dữ liệu như<br />
sau:<br />
Sự cố mạng và những thông tin liên quan đến các server có lổ hổng bảo mật.<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
Những thông báo lỗi (erro message) có chứa nhiều thông tin quan trọng.<br />
File có chứa mật khẩu.<br />
Thư mục có nội dụng nhạy cảm như config, system…<br />
Trang đăng nhập (logon page) vào website.<br />
Trang chứa thông tin mạng hoặc dữ liệu nhạy cảm như Firewall log…<br />
<br />
Google với kết quả tìm kiếm<br />
Với Google, gõ từ khóa tìm kiếm càng ít thì kết quả càng nhiều, ngược lại từ khóa dài<br />
sẽ cho kết quả ít hơn. Kết hợp những từ khóa tìm kiếm đặc biệt, những cú pháp tìm<br />
kiếm của Google sẽ giới hạn phạm vi tìm kiếm, và có kết quả chính xác, nhanh hơn.<br />
Kết quả tìm kiếm của Google thường rất là lớn. Con số vài ngàn là chuyện bình thường.<br />
Tuy nhiên, đã có bao giờ bạn xem đến những trang kết quả cuối cùng chưa. Chắc chắn<br />
là chưa, vì bạn chưa đủ kiên nhẫn. Nhưng chính ở những nơi hẻo lánh ít người đến đó,<br />
lại ẩn chứa những bí mật mà hacker nên đến. Với từ khóa tìm kiếm là administrator,<br />
những trang đầu tiên, bạn có thể thấy những bài viết bình thường trên mạng có liên quan<br />
đến từ administrator. Nếu chịu khó đến những trang kết quả cuối cùng, bạn có thể tìm<br />
thấy thông tin của administrator đang quản lý một website nào đó. Hoặc với từ khóa<br />
username, chúng ta có thể tìm thấy một username đăng nhập hệ thống.<br />
<br />
2. Google Hacking Basic<br />
Bây giờ chúng ta sẽ bắt đầu trò chơi thật sự. Những chuyện tưởng chừng như đơn giãn<br />
là tìm kiếm trên Google, lại có thể mang lại nhiều thứ cho hacker. Ngay sau đây, bạn sẽ<br />
tìm hiểu về các kỹ thuật hacking của google. Nó đơn giãn là các chức năng quá hay của<br />
Google mà thôi.<br />
<br />
Anonymity with Caches<br />
Chức năng Cache thật sự là quá tuyệt vời của Google. Google lưu lại nhiều website mà<br />
bạn và những người khác truy cập. Bất cứ khi nào, bạn đểu có thể xem lại trang web<br />
được lưu trong bộ nhớ cache này của google, ngay cả khi nó đã bị xóa khỏi server trên<br />
mạng. Và như đã nói Google Cache lưu lại mọi thứ.<br />
<br />
Hình 3. 1: Tất cả mọi thứ đều được lưu lại trong Cache<br />
Google lưu lại mọi dữ liệu mà nó thu thập được. Có đến hàng Tegabyte dữ liệu web bị<br />
rò rõ hằng năm. Hacker có thể lợi dụng vào Google để thực hiện một cuộc tấn công ẩn<br />
danh.<br />
Bạn đăng một thông tin lên website của mình. Một thời gian không lâu sau đó, bạn xóa<br />
trang đó đi, vì không muốn tin này phát tán nữa. Thế nhưng mọi người vẫn xem được<br />
những thông tin đó do bạn đăng lên. Họ đã không xem trực tiếp từ website của bạn mà<br />
xem trong bộ nhớ cache của Google.<br />
Bạn vào trang điền thông tin cá nhân khi đăng ký tham gia một trang web bán hàng trực<br />
tuyến. Thật tai hai, khi thông tin đó của bạn được nhà cung cấp dịch vụ bán hàng hứa<br />
là giữ bí mật, mà nó vẫn bị rò rĩ ra bên ngoài. Chuyện gì đã xẩy ra? Đó chính là vì bạn<br />
đã bị Google cache thông tin đó của bạn lại, khi bạn vào xem trang thông tin của mình.<br />
Nói tóm lại, nhiều thông tin nhạy cảm của bạn và của công ty, tổ chức có thể bị Google<br />
cache lại. Và đến lúc nào đó bạn không muốn nó xuất hiện trên internet nữa, thì nó lại<br />
vẫn còn xuất hiện thông qua bộ nhớ cache của google.<br />
<br />
Nếu một hacker tinh khôn, anh ta có thể tìm thấy nhiều thông tin hữu ích lưu trong bộ<br />
nhợ cache này.<br />
<br />
Sử Dụng Google Như Một Proxy Server<br />
Sử dụng chức năng này chúng ta sẽ tìm hiểu đến công cụ Translate của google, tại địa<br />
chỉ http://translate.google.com.vn Chúng ta đều biết nó dùng để dịch đoạn văn bản.<br />
Nhưng nếu chỉ có văn bản không, thì chúng ta đã không có Proxy Server. Chức năng<br />
Translate của Google còn cho phép dịch cả một trang web.<br />
Điền địa chỉ trang web vào khung dịch văn bản, Google sẽ giúp chúng ta dịch cả trang<br />
web đó. Khi ấy, chúng ta đang truy cập vào website không đi trực tiếp từ máy của mình,<br />
mà thông qua một máy khác là Google.<br />
Trong trang ví dụ dưới đây, tôi sẽ truy cập vào trang web www.uit.edu.vn thông qua<br />
Google Translate.<br />
<br />
Hình 3. 2: Kết quả truy cập website www.uit.edu.vn thông<br />
qua Google Translate<br />
Bạn có thắc mắc là tại sao tôi lại dịch từ tiếng Anh sang tiếng Việt hay không. Đó chính<br />
là vì tôi muốn xem trang web của mình trong tiếng Việt, tiếng gốc của trang web. Bạn<br />
sẽ gặp thông báo lỗi khi cố dịch trang web tiếng Việt sang tiếng Việt.<br />
<br />
Xem xét một kết quả của trình tcpdump (trình bắt gói tin), nó thể hiện quá trình giao<br />
tiếp giữa máy tính của bạn với internet, khi bạn truy cập website ở trên.<br />
<br />
Hình 3. 3: Kết quả TcpDump<br />
Đầu tiên máy tính của bạn (192.168.2.32:53466) gửi yêu cầu đến web server<br />
(64.233.171.104:80) đây là máy chủ của Google, và toàn bộ quá trình giao tiếp chuyển<br />
dữ liệu không hề xuất hiện máy chủ uit.edu.vn.<br />
<br />
Directory Listings<br />
Directory Listings là một website đặc biệt, nó hiển thị danh sách các file và thư mục<br />
tồn tại trên server. Đặc điểm của website kiểu này là không cần lập trình, thiết kế web<br />
phức tạp. Nó được dùng trong các trường hợp chia sẽ tài nguyên. Cũng giống như FTP,<br />
chúng ta hoàn toàn phần quyền được trên các file và directory này.<br />
<br />
Hình 3. 4: Kết quả của Directory Listings<br />
<br />
một website<br />
<br />
Hầu hết các ứng dụng webserver sẽ hiển thị danh sách thư mục như thế khi trong địa<br />
chỉ truy cập không có trang mặc định (default page). Những trang mặc định như<br />
<br />