
75
CHƯƠNG 4. KỸ THUẬT PHÂN TÍCH CƠ BẢN
4.1 Phân tích gói tin
Khái niệm: Phân tích nội dung gói tin là thực hiện thanh tra, phân tích
nội dung dữ liệu bên trong một hay nhiều gói tin. Quá trình phân tích này
thường được tiến hành để xác định các gói tin quan trọng, phát triển phân
tích luồng dữ liệu và xây dựng lại nội dung.
Phân tích nội dung gói tin được đề cập đến nghệ thuật phân tích và
thanh tra các giao thức trong một tập các gói tin. Việc phân tích gói tin để xác
định các gói tin quan tâm và hiểu được cấu trúc và mối quan hệ để thu thập
chứng cứ và tạo điều kiện cho việc phân tích sâu hơn. Để xác định các gói tin
quan tâm thì cần sử dụng kỹ thuật lọc để cô lập các gói tin dựa trên các trường
giao thức hoặc danh sách của nó. Ngoài ra còn có thể tìm kiếm cho các chuỗi
hoặc mẫu nội dung gói tin để xác định mục tiêu phân tích và cả các giao thức
sử dụng vẫn chưa được biết. Việc hiểu rõ cấu trúc gói tin là rất quan trọng
trong việc tái tạo thông tin liên lạc, tập tin chuyển giao, hoặc bất kỳ dòng dữ
liệu nào. Việc chia nhỏ một gói tin, một nhóm các gói tin thường xuyên sẽ
giúp cho chúng ta xác định được các công cụ thích hợp để khai phá bằng
chứng và khôi phục lại thông tin đã mất.
4.1.1 Phân tích giao thức
Phân tích giao thức là tiến hành kiểm tra một hoặc nhiều trường trong
một giao thức, điều này rất cần thiết cho việc phân tích gói tin bởi vì việc

76
thanh tra gói tin phải được thực hiện trên đúng cấu trúc truyền thông để có thể
hiểu được nội dung gói tin hay luồng dữ liệu.
Việc phân tích thông tin an ninh mạng luôn phải được chuẩn bị để có
thể phân tích và nắm vững các giao thức chưa từng được phổ biến. Hơn nữa,
tin tặc thỉnh thoảng phát triển các giao thức mới, hoặc phát triển, mở rộng các
giao thức trước đó nhằm giao tiếp và đưa thêm một số chức năng mới để thực
hiện ý đồ của kẻ tin tặc.
Việc phân tích giao thức bao gồm một số phần cơ bản: xác định giao thức,
giải mã giao thức, xuất dữ liệu và trích rút dữ liệu.
4.1.1.1 Xác định giao thức
Hiện nay, người ta sử dụng một số phương pháp chính để xác định một giao
thức:
- Tìm kiếm các giá trị nhị phân/thập lục phân/ASCII phổ biến thường
được đi kèm trong một giao thức cụ thể.
- Thông tin nhận dạng trong đóng gói giao thức
- Sử dụng các cổng TCP/UDP, nhiều trong số đó liên quan đến dịch vụ
đạt chuẩn.
- Phân tích các chức năng của địa chỉ nguồn, đích của máy chủ.
- Kiểm tra sự có mặt của giao thức nhận biết.
a) Tìm kiếm các giá trị nhị phân/thập lục phân/ASCII phổ biển thường đi
kèm trong một giao thức cụ thể.
Hầu hết các giao thức có chứa các chuỗi bit thường xuất hiện ở trong các gói
dữ liệu được kết hợp với giao thức, ở những nơi có thể đoán được. Theo
IANA.21 thì các giao thức đóng gói trong gói tin IP này là giao thức TCP.
Một cách đơn giản để xác định giao thức là kiểm tra các giao thức TCP/UDP
và số cổng được sử dụng. Có 65.535 số cổng cho mỗi giao thức TCP và UDP.
IANA đã công bố danh sách các cổng TCP/UDP tương ứng với các dịch vụ
mạng ở lớp cao hơn.

77
Trong ví dụ này chúng ta có thể thấy chuỗi thập lục phân “0x4500” thường
đánh dấu cho sự bắt đầu của một gói tin IPv4.
b) Thông tin nhận dạng trong đóng gói giao thức
Hình . Chi tiết giao thức IP trong Wireshark. Gói tin IP chứa thông tin về giao
thức bên trên nó (trong trường hợp này là giao thức TCP, 0x06).
Giao thức thường chứa thông tin chỉ ra kiểu giao thức được đóng gói, trong
hình 4.2 chúng ta có thể xác định giao thức ở tầng 3 là giao thức IPv4. Byte
thứ 9 của IP Header chỉ ra giao thức đóng gói bên trong gói tin IP. Trong
trường hợp này, giá trị byte thứ 9 là 0x06, tương ứng với giao thức TCP. Dựa
trên những thông tin này chúng ta có thể chỉ ra giao thức TCP được sử dụng
trong gói tin IP này.

78
c) Sử dụng các cổng TCP/UDP, nhiều trong số đó liên quan đến dịch vụ đạt
chuẩn.
Một cách đơn giản và phổ biến để xác định giao thức này là bằng cách kiểm
tra các số cổng TCP hoặc UDP sử dụng. Có 65.535 số cổng có thể cho mỗi
giao thức TCP và UDP. IANA đã công bố danh sách các cổng TCP / UDP
tương ứng với các dịch vụ mạng lớp cao hơn cụ thể. Bạn có thể xem danh
sách trên trang web của IANA, và hầu hết các thông tin tương tự cũng được
lưu giữ trong thư mục / etc / dịch vụ tập tin trên hầu hết các hệ thống UNIX /
Linux.

79
d) Phân tích các chức năng của địa chỉ nguồn, đích của máy chủ
Thông thường, tên máy chủ và các dịch vụ nó cung cấp có thể xác định các
giao thức sử dụng

