Thứ Tư, 24 tháng 8, 2011

Google sitelinks vẫn còn là bí ẩn thú vị


Google sitelinks luôn là bí ẩn thú vị dù đôi khi mang đến phiền toái. Rất nhiều bài viết, thảo luận từ các chuyên gia SEO, nhà quản trị web từ xưa đến nay về Google sitelinks cũng chỉ dừng lại ở mức… phỏng đoán (SEO nói chung cũng luôn bí ẩn, nhưng ít ra Google đã chia sẻ tài liệu và rất nhiều bài viết chi tiết về từng khía cạnh trong đó).
Nhân sự kiện Google vừa cập nhật sitelinks tuần rồi, mình cũng muốn chia sẻ vài trải nghiệm nho nhỏ về Google sitelinks.

Thế Google sitelinks là gì?

Sitelinks, tức là “liên kết” của một site, thường là liên kết nội (internal links) hiển thị ngay bên dưới URL hay snippet (phần mô tả nội dung trang web được Google chọn) trên kết quả tìm kiếm (SERPs), giúp người dùng có thể vào các trang bên trong trang web mà không cần phải vào trang chủ. Bằng cách này, theo Google, sitelinks như là shortcuts giúp tiết kiệm thời gian của người dùng.
Theo cách “truyền thống” và đầy đủ nhất thì Google sẽ hiển thị tối đa 8 liên kết bên dưới URL dù rằng 1 site có thể có hơn 8 sitelinks (như site nhạc Mp3 Zing có tới 24 sitelinks, xem bên dưới).
Google sitelinks của LamSEO.com trên Google.com
Google sitelinks của LamSEO.com trên Google.com ngày 27/7/2010 với từ khóa "lamseo".
Nhưng từ tháng 3/2009, Google đã thử nghiệm hiển thị sitelinks theo chiều ngang, tối đa 4 liên kết và nằm ngay bên dưới snippet (thay vì URL như truyền thống). Các liên kết này thường là phần bên trái của bộ 8 links khi hiển thị đầy đủ.
Sitelinks của LamSEO.com theo chiều ngang trên Google Việt Nam với từ khóa "lam seo"
Sitelinks của LamSEO.com theo chiều ngang trên Google Việt Nam với từ khóa "lam seo"

Google xác định sitelinks như thế nào?

Đây chính là câu hỏi chưa có đáp án chính xác và toàn diện nhất. Google chỉ bật mí rất chung chung:
“We only show sitelinks for results when we think they’ll be useful to the user. If the structure of your site doesn’t allow our algorithms to find good sitelinks, or we don’t think that the sitelinks for your site are relevant for the user’s query, we won’t show them.
At the moment, sitelinks are completely automated. We’re always working to improve our sitelinks algorithms, and we may incorporate webmaster input in the future.”
tạm dịch sát nghĩa:
“Chúng tôi chỉ hiển thị sitelinks cho những kết quả mà chúng tôi NGHĨ chúng hữu ích với người dùng. Nếu cấu trúc site không cho phép giải thuật của chúng tôi tìm những sitelinks tốt, hoặc chúng tôi không nghĩ rằng sitelinks liên quan đến truy vấn của người dùng, thì chúng tôi sẽ không hiển thị chúng.
Hiện tại, sitelinks được xác định một cách tự động. Chúng tôi luôn cố gắng cải tiến giải thuật sitelinks và có thể trong tương lai chúng tôi sẽ tham khảo thêm ý kiến của webmaster”

Giả thuyết “chấp nhận được”

Google chỉ hiển thị sitelinks với những từ khóa mà bạn đạt tỉ lệ click (CTR) cực kỳ cao (đến mức nào thì chưa thể xác định), thường là các từ khóa thương hiệu, tên miền. Ví LamSEO.com sẽ hiển thị với các từ khóa như: lamseo.com, lamseo, lam seo, làm seo, tư vấn seotu van seo.
Google chỉ hiển thị những liên kết mà Googlebot có thể dò tìm từ trang chủ, thường là HTML linksđược đặt cao ở HTML source và được click nhiều nhất.

Phản biện vài giả thuyết…

Sitelinks chỉ dành cho site có trên 1 năm tuổi. Thực tế thì mình đã từng chứng kiến các site chỉ ra đời hơn 1 tháng đã có sitelinks (như Thuanthien.zing.vn) dù mình không phủ nhận tuổi đời tên miền có ảnh hưởng nhất định trong sitelinks và SEO nói chung.
Sitelinks chỉ hiển thị với các trang có nhiều liên kết ngoại với backlinks chứa anchor text là tên trang web. Mình có site cá nhân DuNguyen.com đang hiển thị những sitelinks cho trang Tag (/proxy) mà mình chưa bao giờ chú trọng phải xây dựng liên kết hay internal links.
Sitelinks của DuNguyen.com trên Google Việt Nam.
Sitelinks của DuNguyen.com trên Google Việt Nam.
Sitelinks chỉ hiển thị liên kết nội bộ. Hãy nhìn sitelinks của Zing.vn hiện tại, bạn sẽ thấy có 2 link đến mp3.zing.vn và me.zing.vn mà subdomain được Google xem như là site riêng.
Sitelinks của www.zing.vn có 2 link đến mp3.zing.vn và me.zing.vn
Sitelinks của www.zing.vn có 2 link đến mp3.zing.vn và me.zing.vn
Google chỉ hiển thị sitelinks của trang chủ. Hãy xem Zing Mp3 có sitelinks từ chuyên trang video clip.
Mp3 Zing có sitelinks ở chuyên trang Video clip.
Mp3 Zing có sitelinks ở chuyên trang Video clip.
Google chỉ hiển thị liên kết/trang web có traffic cực cao hoặc được click nhiều nhất trang. Hãy xem phần “cách khóa sitelink” bên dưới, bạn sẽ thấy nhận định này là sai.

Làm thế nào để có sitelinks như ý?

Câu hỏi đặt ra “làm thế nào để có sitelinks?” cũng được các chuyên gia thảo luận rất nhiều. Theo phỏng đoán bên trên thì mình thấy 2 điều kiện tiên quyết để có sitelinks gồm: đạt CTR cực cao (so với các site xếp dưới ở top 10 kết quả tìm kiếm) với một số từ khóa (không nhất định phải là brand) và nên tạo các HTML links đặt cao ở mã nguồn HTML, thường là các link trong Top Menu/Navigation. Trong đó CTR là do người dùng quyết định nhưng bạn có thể chủ động tối ưu thông tin hiển thị (page title, description/snippet, URL) cũng như tận dụng HTML links thay vì javascript ở Navigation/Menu (ngoài ra có thể tạo Breadcrumbs cho các trang con).
Để tối ưu sitelinks, ngoài làm tốt 2 điều căn bản trên, bạn có thể khóa (block) các liên kết không muốn hiển thị và “chờ đợi” Google sẽ tìm link khác.

Cách khóa sitelink không mong muốn

Ngay đầu bài viết mình đã nói sitelinks đôi khi mang đến phiền phức. Hmm, đúng là như vậy, bởi nó được tạo tự động, và vì vậy, không phải lúc nào cũng hiển thị link mình mong muốn. “Tai nạn nghề nghiệp” dưới đây là một ví dụ.
Một ngày cuối tuần cách đây 2 tháng (tuần cuối tháng 5/2010) (khi này mình không còn làm fulltime cho VNG nên không quản lý sâu sát Webmaster tools của các site Zing), một số cộng đồng online đưa tin Zing Mp3 đang cố tình tạo xì-căng-đan với 1 sitelink rất nhạy cảm.
Một sitelink rất nhạy cảm của Zing Mp3 ngày 29/5/2010
Một sitelink rất nhạy cảm của Zing Mp3 ngày 29/5/2010
Mình vội vàng login vào Google Webmaster Tools để khóa sitelink đó lại.
Log in vào Google Webmaster Tools, chọn tab Sitelinks
Log in vào Google Webmaster Tools, chọn tab Sitelinks
Vào Site Configuration, tab Sitelinks, chọn sitelink không mong đợi đó, tiến hành “block”.
Khóa (block) 1 site link không mong muốn.
Khóa (block) 1 site link không mong muốn.
Ngoài ra, để chắc chắn, mình cũng cập nhật robots.txt lẫn yêu cầu Google remove những trang nhạy cảm đó ra khỏi index. Và chờ đợi. May thay, khoảng 8 giờ sau Google đã cập nhật sitelinks mới, dẫu thỉnh thoảng Google vẫn hiện cache trong 1 tuần đầu tiên.
Mình chắc chắn rằng sitelink nhạy cảm trên là ngoài ý muốn, không hề có traffic trước đó và chỉ xuất hiện khi Google cập nhật giải thuật sitelinks lần đó. Xem pageviews của URL đó trong Google Analytics sẽ thấy rõ điều đó.
Không cần có nhiều lượt xem để có 1 sitelink!
Không cần có nhiều lượt xem để có 1 sitelink!

0 nhận xét:

Đăng nhận xét