SEO – Search Engine Optimization
TRÙNG LẶP NỘI DUNG
Thế nào là trùng lặp nội dung
Các loại trùng lặp nội dung
Cách xử lý của các SE
Làm thế nào tránh trùng lặp nội dung
www.themegallery.com
TRÙNG LẶP NỘI DUNG
Visitor & SE đều mong muốn fresh,
unique & useful content
Phát triển nội dung trùng lặp vô tình hay
cố ý
Trùng lặp nội dung (dupplicate content)
www.themegallery.com
sẽ gây ra các tác hại nhất định
THẾ NÀO LÀ TLND
Có nhiều phiên bản nội dung giống nhau
hoàn toàn hoặc tương tự
Những phiên bản này có thể trên nhiều trang của 1 website hoặc trên nhiều website
Chưa có cơ sở tin cậy cho vấn đề giống
nhau thế nào sẽ bị các SE phạt
www.themegallery.com
Việc xác định nguyên bản và bản sao của 2 nội dung hiện tại cũng chưa khả thi
CÁC LOẠI TLND
Có 2 loại TLND:
Có hại
Không có hại
www.themegallery.com
TLND KHÔNG CÓ HẠI
Cung cấp nội dung tương ứng với từng loại thiết bị (máy tính, PDA, smartphone, …)
Phần lữu trữ (archieve) của các forum
Phiên bản in của các website
TLND thông qua navigation, tiêu đề chính, các liên kết tham khảo hay nội dung của phần footer
www.themegallery.com
TLND không có hại bao gồm:
TLND CÓ HẠI
Nhân bản nội dung trên nhiều website khác nhau để thao túng bảng xếp hạng
Tạo ra nhiều landing page khác nhau (từ nhiều trang trên cùng website hoặc sub-domain) nhưng cùng một nội dung
Nội dung lặp đi lặp lại trong 1 trang
www.themegallery.com
TLND có hại bao gồm:
CÁCH XỬ LÝ CỦA CÁC SE
SE không thích trùng lặp nội dung
Nội dung fresh, unique, useful & orginal
sẽ được ưu tiên trên SERPs
Ban khi nhân bản hàng loạt
từ nhiều website hoặc giống hoàn toàn với một trang khác
www.themegallery.com
Nội dung có nhiều yếu tố giống những nội dung trên được loại bỏ dần tùy theo mức độ giống nhau
LÀM THẾ NÀO TRÁNH TLND
Không đánh cắp nội dung từ site khác
Kiểm tra TLND trên site của mình
Kiểm tra nội dung của mình có bị đánh
cắp không
Khi có nhiều URL trỏ đến một nội dung, chọn 1 URL và dùng robots.txt để chặn các URL còn lại
www.themegallery.com
Sử dụng thẻ Canonical
AI “COPY” NỘI DUNG CỦA TÔI?
Sử dụng Copy Scape
www.themegallery.com
http://www.copyscape.com
THẺ CANONICAL
kết quả trùng lặp trong SERPs
Trách nhiệm của các SE là loại bỏ các
Quá khó khăn và nặng nề …
Cần sự trợ giúp của webmaster/SEOer
nên thẻ Canonical ra đời
www.themegallery.com
Nếu có nhiều URL cùng trỏ về 1 nội dung, xác định nội dung nguyên bản bằng Canonical
THẺ CANONICAL (tt)
trang …
Chèn thẻ Canonical vào phần HEAD của
www.themegallery.com
Những điểm cần lưu ý
Tạo ra nội dung duy nhất và nguyên bản thay vì đánh cắp từ các website khác
Luôn kiểm tra website của mình có vô tình trùng lặp nội dung hoặc có ai đó đánh cắp nội dung của mình
Loại bỏ các trang trùng lặp nội dung trên website
http://giaiphaplienket.com
http://ctit-vn.com
http://hoangnguyen.edu.vn