Duplicate trong SEO

Hiện nay các bộ máy tìm kiếm và đặc biệt là Google xem xét

rất kỹ việc duplicate content hay còn gọi là trùng lặp nội

dung. Việc trùng lặp nội dung giữa các website thường mang

đến nhiều phiền toái cho tác giả, người trích lại hoặc ngay cả

cho người tham quan website.

Vấn đề càng trở nên cấp thiết hơn khi rất nhiều trang web đã

bị đánh rớt hạng trên các công cụ tìm kiếm, đơn giản vì lỗi

duplicate content. Để hiểu rõ hơn về duplicate content chúng

ta hãy tham khảo một số dạng duplicate sau đây:

Duplicate content: nghĩa là trùng lặp nội dung giữa các

URL khác nhau cùng truy xuất một web page. Ví dụ :

http://domain.com/index.php

http://domain.com/

Cả 2 URL trên đều cùng trỏ về trang chủ của domain.com

Có 2 loại duplicate content mà bạn nên chú ý. Đó là duplicate

trong trang và duplicate ngoài trang.

1. Duplicate trong trang:

Nội dung bị trùng lặp bởi các URL cùng thuộc tên miền của

trang. Ví dụ phía trên là một dạng duplicate trong trang.

Ngoài ra duplicate trong trang còn một số dạng duplicate như

sau:

1.1 Session ID:

Ví dụ:

http://example.com/web?ID=123

http://example.com/web

Cả 2 cùng trỏ về một nội dung trên website.

1.2 Tham số thuộc tính trên URL

Ví dụ :

http://example.com/web?color=red

http://example.com/web-red

Cả 2 cùng trỏ về nội dung web màu đỏ trên website.

1.3 Thư mục trên URL

Ví dụ :

http://example.com/web/design

http://example.com/design

Cả 2 cùng trỏ về cùng một nội dung trên website mặc dù

đường dẫn thư mục khác nhau.

1.4 Các tag trên URL

Ví dụ :

http://example.com/tag/web-design

http://example.com/web

Các 2 cùng trỏ về cùng một nội dung. Chức năng tag này

thường được rất nhiều người sử dụng, nhưng nếu không để ý

chuyển đổi sang một URL duy nhất thì lỗi duplicate sẽ xuất

hiện.

2. Duplicate ngoài trang:

Duplicate ngoài trang có 2 trường hợp đáng chú ý. Trường

hợp duplicate do trích dẫn lại hoặc duplicate do cố ý spam.

2.1 Duplicate do trích dẫn:

Dễ thấy nhất là các trang báo, tin tức hoặc các nội dung hay

thường được các trang khác trích dẫn lại. Điều này là tốt

nhưng đôi khi cũng gây ra nhiều sự phiền toái. Các search

engine không nhận được đâu là bài gốc, thường thì search

engine dựa vào độ trust của trang hoặc thời điểm index để

xác định nội dung gốc.

Nhưng cũng sẽ xảy ra trường hợp trang có độ trust cao trích

dẫn lại trang có độ trust thấp, làm cho trang chủ nội dung gặp

nhiều thiệt thòi trong lỗi duplicate.

2.2 Duplicate do cố ý spam:

Một số đối thủ sử dụng thủ thuật làm mờ mắt search engine

khi nhân bản ra hàng loạt nội dung giống nhau trên cả trang

có độ trust cao cũng như trang có độ trust thấp.

Bạn cũng biết rằng không phải lúc nào nội dung trên web của

bạn cũng được index trước, đôi khi Google vẫn lầm tưởng

nội dung mà bạn viết ra chính là duplicate content với các nội

dung mà đối thủ mang đi spam.

Tổng hợp lại, có 2 loại duplicate content : duplicate trong

trang và duplicate ngoài trang. Khi bạn nhận diện được

chúng bước tiếp theo là bạn phải suy nghĩ làm thế nào để

chuyển đổi các nội dung trùng lập về một phiên bản, giúp các

search engine dễ dàng đánh dấu được đâu là nội dung của

bạn, việc này vừa giúp bạn nâng cao độ trust của website

đồng thời cũng tránh được những sự hiểu lầm không cần thiết

của search engine đối với website của bạn.