Eric Enge phỏng vấn Matt Cutts (phần 2)
Vì bài phỏng vấn tiếng Anh khá dài, mình xin chia thành nhiều phần và
sẽ lần lượt chia sẻ ở ESNC lẫn Làm SEO, nơi mình phụ trách mục Link
Building.
Eric Enge: Hãy cùng tìm hiểu về faceted navigation. Ví dụ như, ở Zappos,
người ta có thể mua giày theo số, theo cỡ, theo màu, theo nhãn hiệu và
những mẫu giống nhau sẽ được thống kê theo 20 cách khác nhau. Điều đó
như một bài toán đánh đố. Anh có suy nghĩ gì về trường hợp này?
Matt Cutts: Nói chung “Faceted navigation” có thể khiến nhiều người hiểu
nhầm. Những người sử dụng thường không xử lý vấn đề này tốt, và trở nên
mất phương hướng không biết mình đang ở điểm nào. Có thể có rât nhiều
cách để lướt qua nội dung một trang. Nhưng nếu bạn muốn mỗi nội dung
trang tương ứng với một URL thì cũng không phải là điều khó. Có rất nhiều
cách để chia nhỏ và kiểm tra dữ liệu. Nếu bạn có thể tự quyết định cách nào
là quan trọng và hữu hiệu nhất để có thể truy cập vào được nội dung thì bạn
sẽ có cấu trúc riêng đối với các tham số URL.
Có thể lấy ví dụ như : Category có thể là tham số đầu tiên sau đó tới giá cả.
Ngay cả khi một người đang xem qua giá cả và sau đó nhấn vào mục
Catgory là điều hoàn toàn có thể làm được, chính vì thế hệ thống thứ bậc các
điều bạn nghĩ sẽ được sắp xếp trong các tham số URL dưới dạng từng vị trí.
Theo cách này, loại quan trọng nhất sẽ được đặt lên đầu tiên và loại quan
trọng tiếp theo sẽ được đặt ở vị trí thứ hai. Điều này có thể giúp các công cụ
tìm kiếm phát hiện ra nội dung dễ dàng hơn chút ít bởi vì chúng có thể nhận
ra rằng chúng có thể nhận được những nội dung hữu ích hoặc tương tự nếu
chúng bỏ đi tham số cuối cùng này. Nói chung, “faceted navigation” là một
vấn đề vô cùng hóc búa bởi vì bạn tạo ra rất nhiều cách khác nhau để ai đó
có thể tìm được trang đó. Bạn có thể có rất nhiều đường dẫn intermediate
trước khi chúng tới được sản phẩm cuối cùng.
Có lẽ sẽ dễ hiểu hơn khi sử dụng khái niệm trang intermediate, đây là một
thực tiễn. Nếu một ai đó phải click qua 7 lớp của “faceted navigation” để có
thể chọn được sản phẩm, họ có thể mất kiên nhẫn. Đó cũng là một điều bất
bình thường trong công cụ tìm kiếm nếu chúng ta phải click qua 7 hay 8 lớp
của một “faceted navigation” trước khi chúng ta có thể tìm được sản phẩm.
Ở một vài trường hợp, sẽ là rất nhiều click và rất nhiều Pagerank bị chia cho
những trang này mà không có một sản phẩm cụ thể nào người ta có thể mua
được. Mỗi lần click là một cơ hội để một lượng phần trăm nhỏ Pagerank bị
phung phí.
“Faceted navigation có thể là tốt với một số người sử dụng nếu bạn có thể
quyết định những thứ bậc riêng bạn có thể phân loại các trang và cố gắng
chắc chắn rằng “faceted navigation” là khá thấp. Những điều này có thể là
một ứng dụng tốt giúp các công cụ tìm kiếm tìm ra được sản phẩm thực sự
tốt hơn.
Eric Enge: Nếu bạn có những trang có cùng sản phẩm hoặc về bản chất là
cùng một loại sản phẩm với nhiều kiểu đặt hàng khác nhau, cách sử tốt nhất
là dùng “canonical tag”?
Matt Cutts: Cũng có thể như vậy, hoặc bạn cũng có thể tưởng tượng việc
sắp xếp lại vị trí của những tham số theo cách riêng của bạn. Nói chung, ý
tưởng về “canonical tag” được thiết kế để cho phép bạn chỉ cho các công cụ
tìm kiếm rằng 2 trang nội dung là như nhau. Bạn có thể không muốn phân
biệt một bản đen và một bản trắng của một sản phẩm nếu bạn có 11 màu
khác nhau cho sản phẩm này. Bạn có thể chỉ muốn có một trang sản phẩm
mặc định mà sau đó trang này đủ thông minh để tự chuyển đổi sang các
trang khác nhau.Thể hiện những biến đổi nhỏ trong một sản phẩm và có một
rel=canonical để đi tới tất cả là một cách tốt để sử dụng “rel=canonical tag”
Eric Enge: Hãy nói về những tác động đối với Pagerank, crawl và index
của một vài công cụ cơ bản. Hãy bắt đầu với công cụ 301 Redirect yêu thích
của chúng ta.
Matt Cutts: Nói chung 301 Redirect có thể chuyển được Pagerank. Đó có
thể là một công cụ hữu hiệu để di chuyển giữa các trang trong một site, hoặc
thậm chí là giữa các site. Rất nhiều người sử dụng chúng và dường như là nó
hoạt động khá tốt vì nó có tác dụng dẫn tới trang cần thiết rất nhanh. Tôi
dùng nó khi thử đi từ mattcutts.com tới dullest.com và quá trình chuyển đổi
đó diễn ra khá nhanh. Thử nghiệm riêng của tôi đã chứng tỏ nó hoạt động
khá thành công. Thực tế, nếu bạn truy cập vào site dullest.com ngay bây giờ,
tôi sẽ chẳng vào được trang nào. Tất cả các trang đã di chuyển từ
dullest.com tới mattcutts.com. Ít nhất đối với tôi, 301 Redirect làm việc như
tôi mong muốn. Những trang yêu thích sẽ được chuyển tới một trang mới
nếu như bạn truy cập trang theo kiểu chuyển trang và đó có thể là một công
cụ vô cùng mạnh.
Eric Enge: Có thể nói như bạn di chuyển từ một domain này tới một domain
khác và bạn tự viết một câu để hướng dẫn công cụ tìm kiếm và những người
sử dụng khác để đi từ một domain này tới một domain khác. Trong những
trường hợp như thế này, có một vài mất mát trong Pagerank có thể sảy ra
rất đơn giản bởi vì người sử dụng thực hiện một liên kết tới một site không
liên kết nó tới một tên miền mới.
Matt Cutts: Đó là một câu hỏi hay và tôi không hoàn toàn chắc chắn về câu
trả lời. Tôi có thể chắc chắn biết được sự mất Pagerank như thế nào. Tôi
không hoàn toàn chắc chắn đội crawl và index sẽ xử lý thế nào với Pagerank
chính vì thế tôi sẽ phải kiểm tra lại trường hợp này. (Chú ý rằng: trong một
email, Matt thông báo rằng đây là trường hợp xảy ra trong thực tế. Pagerank
bị mất khi thực hiện Redirect 301)
Eric Enge: Hãy nói về 302 Redirect
Matt Cutts: 302 chỉ là giải pháp tạm thời. Nếu như bạn chỉ để một thứ vào
một nơi trong một khoảng thời gian ngắn thì 302 là một lựa chọn thích hợp.
Chúng sẽ không theo Pagerank nhưng chúng cũng có thể vô cùng hữu ích.
Nếu một site chỉ làm một việc gì đó trong một khoảng thời gian ngắn, 302
có thể là một lựa chọn hoàn hảo.
Eric Enge: Thế còn Server side redirects trả về “HTTP Status Code” hoặc
là “200 Status Code”?
Matt Cutts: Nếu chúng ta chỉ thấy thông báo 200, chúng tôi thừa nhận rằng
nội dung trả về ở địa chỉ URL mà chúng ta yêu cầu. Nếu nhà cung cấp dịch
vụ đang làm một số kiểu URL rewrite kỳ lạ trên server side, chúng ta sẽ
không thể biết được.Tất cả những gì chúng ta biết là chúng ra cố yêu cầu
URL cũ, chúng tôi lấy được một vài nội dung và có thể index nội dung đó.
Chúng tôi sẽ index nó dưới vị trí URL nguyên gốc.
Eric Enge: Vì vậy bản chất của nó là giống như 302 đúng không?
Matt Cutts: Không hẳn là như vậy.Về bản chất, bạn đang lãng phí trên web
server để trả về một trang có nội dung khác so với trang mà bạn yêu cầu.
Như chúng ta quan tâm, chúng tôi nhìn thấy một liên kết, chúng tôi theo liên
kết đó và chúng tôi yêu cầu nội dung. Bạn trả lại chúng tôi nội dung và
chúng tôi index nội dung đó tại URL đó.
Mọi người có thể làm nhiều việc khác nhau ở trên server side. Bạn có thể
tưởng tượng rằng một CMS được thực hiện trong một web server sẽ không
thực hiện 301 hay 302, nhưng nó sẽ gây ra vài điều phức tạp và có thể có rất
nhiều lỗi sảy ra.
Eric Enge: Anh có thể nói một cách tổng quát về canonical tag?
Matt Cutts: Có rất nhiều điều phải nhớ ở đây. Nếu bạn có thể giảm số
lượng nội dung trùng lặp bằng cách sử dụng kiến trúc của site , đó là một
điều nên làm. Những trang mà bạn kết nối không cần thiết phải hoàn toàn là
trang trùng lặp, nhưng chúng có thể là trùng lặp về khải niệm cùng với một
sản phẩm khác hoặc một thứ nào đó có quan hệ gần gũi. Chúng ta có thể
thực hiện Cross – domain, rel=canonical đã công bố tháng 12.
Có thể lấy ví dụ như, tôi có thể đặt rel=canonical cho tài khoản của trường
cũ để tới trang mattcutts.com của tôi. Đó là một cách tốt để sử dụng
rel=canonical nếu bạn không thể vào được web server để thêm vào redirects
trong bất cứ trường hợp nào. Tuy nhiên, Hầu hết mọi người sử dụng chúng
cho những nội dung trùng lặp để chắc chắn rằng bản canonical của trang đó
được index hơn là một vài bản khác của một trang mà bạn không muốn
index.
Eric Enge: Vì vậy nếu một ai đó liên kết tới một trang có canonical tag, về
bản chất liệu nó có thể đối xử giống như 301 đối với bản canonical của
trang không?
Matt Cutts: Vâng, gọi đó là 301 của 1 người đàn ông nghèo nàn cũng
không phải là một điều quá tệ. Nếu như web server của bạn có thể thực hiện
trực tiếp 301, bạn có thể thực hiện được điều đó, nhưng nếu bạn không có
khả năng truy cập được vào web server hoặc là có quá nhiều khó khăn để
thiết lập 301 thì bạn có thể thực hiện rel=canonical.
Đó là một điều hoàn toàn tốt cho một trang tự liên kết sử dụng
rel=canonical, và với Google thì nó thật sự hữu ích để thực hiện
rel=canonical với mọi trang trong site của bạn. Mọi người nghĩ rằng nó rất
tiết kiệm nhưng thật ra không hẳn là như vậy. Chúng ra tự hỏi bản thân về
một trường hợp mà mỗi trang trong một site đều dùng rel=canonical. Miễn
là bạn quan tâm tới việc chúng sẽ dẫn tới được đúng trang và sẽ chẳng có
vấn đề gì cả.
Eric Enge: Tôi nghĩ rằng tôi đã nghe thấy anh nói trong quá khứ rằng nó
hơi mạnh để thực hiện một rel=canonical Chỉ dẫn. Về bản chất anh gọi nó
là một lời gợi ý.
Matt Cutts: Vâng, đội crawl muốn coi những thứ đó như một lời gợi ý và
phần lớn thời gian chúng tôi sử dụng chúng cho quảng cáo. Nếu bạn gọi nó
là một chỉ dẫn, thì bạn sẽ rơi vào tình trạng phải tuân theo chúng, nhưng đội
crawl và index muốn giành chúng như một quyền sau cùng để quyết định
nếu như mà người chủ site đang tự hại mình và không nghe theo
rel=canonical tag. Phần lớn thời gian, mọi người sẽ thấy tác dụng của
rel=canonical tag. Nếu chúng ta có thể nói rằng họ không có ý làm như vậy,
chúng ta sẽ có thể lờ nó đi.