Eric Enge phỏng vấn Matt Cutts (phần 2)

Vì bài phỏng vấn tiếng Anh khá dài, mình xin chia thành nhiều phần và

sẽ lần lượt chia sẻ ở ESNC lẫn Làm SEO, nơi mình phụ trách mục Link

Building.

Eric Enge: Hãy cùng tìm hiểu về faceted navigation. Ví dụ như, ở Zappos,

người ta có thể mua giày theo số, theo cỡ, theo màu, theo nhãn hiệu và

những mẫu giống nhau sẽ được thống kê theo 20 cách khác nhau. Điều đó

như một bài toán đánh đố. Anh có suy nghĩ gì về trường hợp này?

Matt Cutts: Nói chung “Faceted navigation” có thể khiến nhiều người hiểu

nhầm. Những người sử dụng thường không xử lý vấn đề này tốt, và trở nên

mất phương hướng không biết mình đang ở điểm nào. Có thể có rât nhiều

cách để lướt qua nội dung một trang. Nhưng nếu bạn muốn mỗi nội dung

trang tương ứng với một URL thì cũng không phải là điều khó. Có rất nhiều

cách để chia nhỏ và kiểm tra dữ liệu. Nếu bạn có thể tự quyết định cách nào

là quan trọng và hữu hiệu nhất để có thể truy cập vào được nội dung thì bạn

sẽ có cấu trúc riêng đối với các tham số URL.

Có thể lấy ví dụ như : Category có thể là tham số đầu tiên sau đó tới giá cả.

Ngay cả khi một người đang xem qua giá cả và sau đó nhấn vào mục

Catgory là điều hoàn toàn có thể làm được, chính vì thế hệ thống thứ bậc các

điều bạn nghĩ sẽ được sắp xếp trong các tham số URL dưới dạng từng vị trí.

Theo cách này, loại quan trọng nhất sẽ được đặt lên đầu tiên và loại quan

trọng tiếp theo sẽ được đặt ở vị trí thứ hai. Điều này có thể giúp các công cụ

tìm kiếm phát hiện ra nội dung dễ dàng hơn chút ít bởi vì chúng có thể nhận

ra rằng chúng có thể nhận được những nội dung hữu ích hoặc tương tự nếu

chúng bỏ đi tham số cuối cùng này. Nói chung, “faceted navigation” là một

vấn đề vô cùng hóc búa bởi vì bạn tạo ra rất nhiều cách khác nhau để ai đó

có thể tìm được trang đó. Bạn có thể có rất nhiều đường dẫn intermediate

trước khi chúng tới được sản phẩm cuối cùng.

Có lẽ sẽ dễ hiểu hơn khi sử dụng khái niệm trang intermediate, đây là một

thực tiễn. Nếu một ai đó phải click qua 7 lớp của “faceted navigation” để có

thể chọn được sản phẩm, họ có thể mất kiên nhẫn. Đó cũng là một điều bất

bình thường trong công cụ tìm kiếm nếu chúng ta phải click qua 7 hay 8 lớp

của một “faceted navigation” trước khi chúng ta có thể tìm được sản phẩm.

Ở một vài trường hợp, sẽ là rất nhiều click và rất nhiều Pagerank bị chia cho

những trang này mà không có một sản phẩm cụ thể nào người ta có thể mua

được. Mỗi lần click là một cơ hội để một lượng phần trăm nhỏ Pagerank bị

phung phí.

“Faceted navigation có thể là tốt với một số người sử dụng nếu bạn có thể

quyết định những thứ bậc riêng bạn có thể phân loại các trang và cố gắng

chắc chắn rằng “faceted navigation” là khá thấp. Những điều này có thể là

một ứng dụng tốt giúp các công cụ tìm kiếm tìm ra được sản phẩm thực sự

tốt hơn.

Eric Enge: Nếu bạn có những trang có cùng sản phẩm hoặc về bản chất là

cùng một loại sản phẩm với nhiều kiểu đặt hàng khác nhau, cách sử tốt nhất

là dùng “canonical tag”?

Matt Cutts: Cũng có thể như vậy, hoặc bạn cũng có thể tưởng tượng việc

sắp xếp lại vị trí của những tham số theo cách riêng của bạn. Nói chung, ý

tưởng về “canonical tag” được thiết kế để cho phép bạn chỉ cho các công cụ

tìm kiếm rằng 2 trang nội dung là như nhau. Bạn có thể không muốn phân

biệt một bản đen và một bản trắng của một sản phẩm nếu bạn có 11 màu

khác nhau cho sản phẩm này. Bạn có thể chỉ muốn có một trang sản phẩm

mặc định mà sau đó trang này đủ thông minh để tự chuyển đổi sang các

trang khác nhau.Thể hiện những biến đổi nhỏ trong một sản phẩm và có một

rel=canonical để đi tới tất cả là một cách tốt để sử dụng “rel=canonical tag”

Eric Enge: Hãy nói về những tác động đối với Pagerank, crawl và index

của một vài công cụ cơ bản. Hãy bắt đầu với công cụ 301 Redirect yêu thích

của chúng ta.

Matt Cutts: Nói chung 301 Redirect có thể chuyển được Pagerank. Đó có

thể là một công cụ hữu hiệu để di chuyển giữa các trang trong một site, hoặc

thậm chí là giữa các site. Rất nhiều người sử dụng chúng và dường như là nó

hoạt động khá tốt vì nó có tác dụng dẫn tới trang cần thiết rất nhanh. Tôi

dùng nó khi thử đi từ mattcutts.com tới dullest.com và quá trình chuyển đổi

đó diễn ra khá nhanh. Thử nghiệm riêng của tôi đã chứng tỏ nó hoạt động

khá thành công. Thực tế, nếu bạn truy cập vào site dullest.com ngay bây giờ,

tôi sẽ chẳng vào được trang nào. Tất cả các trang đã di chuyển từ

dullest.com tới mattcutts.com. Ít nhất đối với tôi, 301 Redirect làm việc như

tôi mong muốn. Những trang yêu thích sẽ được chuyển tới một trang mới

nếu như bạn truy cập trang theo kiểu chuyển trang và đó có thể là một công

cụ vô cùng mạnh.

Eric Enge: Có thể nói như bạn di chuyển từ một domain này tới một domain

khác và bạn tự viết một câu để hướng dẫn công cụ tìm kiếm và những người

sử dụng khác để đi từ một domain này tới một domain khác. Trong những

trường hợp như thế này, có một vài mất mát trong Pagerank có thể sảy ra

rất đơn giản bởi vì người sử dụng thực hiện một liên kết tới một site không

liên kết nó tới một tên miền mới.

Matt Cutts: Đó là một câu hỏi hay và tôi không hoàn toàn chắc chắn về câu

trả lời. Tôi có thể chắc chắn biết được sự mất Pagerank như thế nào. Tôi

không hoàn toàn chắc chắn đội crawl và index sẽ xử lý thế nào với Pagerank

chính vì thế tôi sẽ phải kiểm tra lại trường hợp này. (Chú ý rằng: trong một

email, Matt thông báo rằng đây là trường hợp xảy ra trong thực tế. Pagerank

bị mất khi thực hiện Redirect 301)

Eric Enge: Hãy nói về 302 Redirect

Matt Cutts: 302 chỉ là giải pháp tạm thời. Nếu như bạn chỉ để một thứ vào

một nơi trong một khoảng thời gian ngắn thì 302 là một lựa chọn thích hợp.

Chúng sẽ không theo Pagerank nhưng chúng cũng có thể vô cùng hữu ích.

Nếu một site chỉ làm một việc gì đó trong một khoảng thời gian ngắn, 302

có thể là một lựa chọn hoàn hảo.

Eric Enge: Thế còn Server side redirects trả về “HTTP Status Code” hoặc

là “200 Status Code”?

Matt Cutts: Nếu chúng ta chỉ thấy thông báo 200, chúng tôi thừa nhận rằng

nội dung trả về ở địa chỉ URL mà chúng ta yêu cầu. Nếu nhà cung cấp dịch

vụ đang làm một số kiểu URL rewrite kỳ lạ trên server side, chúng ta sẽ

không thể biết được.Tất cả những gì chúng ta biết là chúng ra cố yêu cầu

URL cũ, chúng tôi lấy được một vài nội dung và có thể index nội dung đó.

Chúng tôi sẽ index nó dưới vị trí URL nguyên gốc.

Eric Enge: Vì vậy bản chất của nó là giống như 302 đúng không?

Matt Cutts: Không hẳn là như vậy.Về bản chất, bạn đang lãng phí trên web

server để trả về một trang có nội dung khác so với trang mà bạn yêu cầu.

Như chúng ta quan tâm, chúng tôi nhìn thấy một liên kết, chúng tôi theo liên

kết đó và chúng tôi yêu cầu nội dung. Bạn trả lại chúng tôi nội dung và

chúng tôi index nội dung đó tại URL đó.

Mọi người có thể làm nhiều việc khác nhau ở trên server side. Bạn có thể

tưởng tượng rằng một CMS được thực hiện trong một web server sẽ không

thực hiện 301 hay 302, nhưng nó sẽ gây ra vài điều phức tạp và có thể có rất

nhiều lỗi sảy ra.

Eric Enge: Anh có thể nói một cách tổng quát về canonical tag?

Matt Cutts: Có rất nhiều điều phải nhớ ở đây. Nếu bạn có thể giảm số

lượng nội dung trùng lặp bằng cách sử dụng kiến trúc của site , đó là một

điều nên làm. Những trang mà bạn kết nối không cần thiết phải hoàn toàn là

trang trùng lặp, nhưng chúng có thể là trùng lặp về khải niệm cùng với một

sản phẩm khác hoặc một thứ nào đó có quan hệ gần gũi. Chúng ta có thể

thực hiện Cross – domain, rel=canonical đã công bố tháng 12.

Có thể lấy ví dụ như, tôi có thể đặt rel=canonical cho tài khoản của trường

cũ để tới trang mattcutts.com của tôi. Đó là một cách tốt để sử dụng

rel=canonical nếu bạn không thể vào được web server để thêm vào redirects

trong bất cứ trường hợp nào. Tuy nhiên, Hầu hết mọi người sử dụng chúng

cho những nội dung trùng lặp để chắc chắn rằng bản canonical của trang đó

được index hơn là một vài bản khác của một trang mà bạn không muốn

index.

Eric Enge: Vì vậy nếu một ai đó liên kết tới một trang có canonical tag, về

bản chất liệu nó có thể đối xử giống như 301 đối với bản canonical của

trang không?

Matt Cutts: Vâng, gọi đó là 301 của 1 người đàn ông nghèo nàn cũng

không phải là một điều quá tệ. Nếu như web server của bạn có thể thực hiện

trực tiếp 301, bạn có thể thực hiện được điều đó, nhưng nếu bạn không có

khả năng truy cập được vào web server hoặc là có quá nhiều khó khăn để

thiết lập 301 thì bạn có thể thực hiện rel=canonical.

Đó là một điều hoàn toàn tốt cho một trang tự liên kết sử dụng

rel=canonical, và với Google thì nó thật sự hữu ích để thực hiện

rel=canonical với mọi trang trong site của bạn. Mọi người nghĩ rằng nó rất

tiết kiệm nhưng thật ra không hẳn là như vậy. Chúng ra tự hỏi bản thân về

một trường hợp mà mỗi trang trong một site đều dùng rel=canonical. Miễn

là bạn quan tâm tới việc chúng sẽ dẫn tới được đúng trang và sẽ chẳng có

vấn đề gì cả.

Eric Enge: Tôi nghĩ rằng tôi đã nghe thấy anh nói trong quá khứ rằng nó

hơi mạnh để thực hiện một rel=canonical Chỉ dẫn. Về bản chất anh gọi nó

là một lời gợi ý.

Matt Cutts: Vâng, đội crawl muốn coi những thứ đó như một lời gợi ý và

phần lớn thời gian chúng tôi sử dụng chúng cho quảng cáo. Nếu bạn gọi nó

là một chỉ dẫn, thì bạn sẽ rơi vào tình trạng phải tuân theo chúng, nhưng đội

crawl và index muốn giành chúng như một quyền sau cùng để quyết định

nếu như mà người chủ site đang tự hại mình và không nghe theo

rel=canonical tag. Phần lớn thời gian, mọi người sẽ thấy tác dụng của

rel=canonical tag. Nếu chúng ta có thể nói rằng họ không có ý làm như vậy,

chúng ta sẽ có thể lờ nó đi.