Tìm hiểu về Google Panda, Google Penguin, Google penalty, Google Sandbox

Trong phần này chúng ta cùng nhau tìm hiểu về một số thuật toán của Google: Google panda, Google Penguin, Google penalty, Google Sandbox

1. Googles Panda: Đánh vào website có nội dung copy

Google  panda là tên của một hệ thống thuật toán Google, để thay đổi kết quả tìm kiếm các Website trên trang công cụ tìm kiếm.

Khi Google panda mới ban hành và cập nhật thì Google đã nhận được hàng trăm nghìn email khiếu nại từ các website về việc họ bị ảnh hưởng bởi kết quả tìm kiếm thay đổi. Họ giải thích rằng tất cả là nhằm đưa đến những kết quả có lợi cho người dùng và đã đưa ra 23 luận điểm đánh giá cho một website chất lượng.

  • Google panda Xuất hiện từ tháng 2 năm 2011 và đến nay được update qua 18 phiên bản khác nhau (mới nhất là panda 3).
  • Google panda sẽ loại bỏ những trang có nội dung rác, chất lượng thấp
  • Panda sẽ lọc các trang có tỷ lệ Bounce rate cao (tỷ lệ thoát)
  • Panda xét tỉ lệ khách hàng quay trở lại
  • Panda xét thêm thời gian online trên website

Cách để tránh google panda

  • Tăng chỉ số crawl rates (nằm trong webmastertool)
  • Đảm bảo cấp độ liên kết sâu
  • Chỉnh sửa những nội dung có giá trị thấp/ trùng lặp
  • Tránh trùng lặp title và description
  • Tăng các liên kết nội bộ trong web
  • Giảm chỉ số Bounce rate
  • Tăng tỷ lệ khách hàng quay lại
  • Tăng tỷ lệ CTR đến từ search engine
  • Lấy back link chất lượng cao

2. Google penguin: Đánh vào website có chất lượng link thấp

– Là tên gọi cho một (hệ thống) thuật toán của Google thường xuyên được cập nhật, lần đầu tiên được công bố vào ngày 24 tháng 4 năm 2012

google-penguin-seo-tips

Thuật toán này nhằm giảm thứ hạng trên công cụ tìm kiếm đối với những trang web vi phạm hướng dẫn quản trị trang web của Google bằng cách sử dụng kỹ thuật SEO mũ đen – như nhồi từ khoá, che đậy, spam liên kết, nội dung trùng lặp, và những yếu tố khác. Mục tiêu chiến lược Google penguin là để đẩy các trang web chất lượng cao hơn ở top trên, trong kết quả tìm kiếm của Google.

  • Đến nay mới update đến phiên bản 3
  • Google Penguin 1: 24/04/2012. Mức độ ảnh hưởng 3,1%.
  • Google Penguin 2: 26/05/2012 (Sau khoảng hơn 1 tháng). Ảnh hưởng 0,1%.
  • Google Penguin 3: 05/10/2012 (Sau khoảng gần 5 tháng). Ảnh hưởng 0,3%.
  • Xử phạt website có back link chất lượng thấp
  • Lọc các trang có nhiều anchortext giống nhau
  • Ưu tiên các back link cùng chủ đề

Cách để tránh Google penguin

  • Đa dạng hóa anchortext
  • Sử dụng thêm full url
  • Không spam link trên diễn đàn (nếu lấy link thì phải chọn trang có page rank cao, tự làm bằng tay không dùng phần mềm và đảo nội dung khác nhau)
  • Nên sử dụng link từ social, bookmarking, web 2.0
  • Ưu tiên link cùng ngành nghề
  • Loại bớt liên kết chất lượng thấp

Google penalty: Google penalty bao gồm 3 hình phạt:

  • Trừ 30 bậc
  • Trừ 950 bậc
  • Loại bỏ index

Những hiện tượng của Google Penalty:

  • Rớt traffic một cách tàn nhẫn, có thể ngày hôm trước bạn có traffic từ SE là 1000 visits, nhưng hôm sau chỉ còn 10 mà thôi. Và việc giảm traffic này sẽ kéo dài lê thê, nếu không biết cách khắc phục thì chắc sẽ tiêu luôn một kênh traffic ngon lành như Google.
  • Không index trên Google (Index = 0). Có thể dùng query sau để kiểm tra: site:yourdomain. Bạn sẽ thấy số lượng link site bác trên Google giảm đáng kể.
  • Rớt PR, đây cũng là một hiện tượng thấy rõ. Nhưng việc không index, rớt PR hay thậm chí là “ban” luôn cả domain chỉ được áp dụng cho những trường hợp phạm luật quá đáng.
  • Tốc độ crawl nội dung site của bạn cũng giảm đi. Thay vì hồi đó chỉ 5 phút là có, nhưng giờ thì nửa ngày, thậm chí hoặc hơn.

Những nguyên nhân dẫn đến Google Penalty:

Nguyên nhân chính yếu đó là bạn đã vi phạm những điều khoản của Google. Đầu tiên hãy đọc kĩ lại Google Webmaster Guideline, hay thậm chí là học thuộc lòng luôn. Sau đây là vài nguyên nhân thường gặp được nhiều người trên mạng chia sẻ

Google-Penalties

  • Link tới những site bị ban: Ai cũng biết càng có nhiều backlink tới site mình thì càng tốt. Và xuất hiện việc trao đổi link, link qua link lại. Nhưng tiếc là khi bạn link tới một site bị Google đưa vào blacklist thì bạn sẽ bị chụp mũ là đồng phạm (google nghĩ thế, mình phải chịu thôi). Do đó lần sau nên cẩn thận việc link tới site khác. Có thể dùng những trang trên mạng để kiểm tra xem site cần link tới có tốt hay không. (search với keyword: bad neighborhood để tìm các dịch vụ trên) hay kiểm tra bằng tay với vài thủ thuật đơn giản sau:
  • Site đó có liên quan tới nội dung xấu mà Google cấm không như khiêu dâm, bạo lực, ma túy, phần mềm lậu…
  • Trang mà bạn link tới có số lượng link là bao nhiêu? Nếu trên 100 thì đồng nghĩa với việc Google đánh giá site đó là link farm. Do đó nên cẩn thận với việc submit link vào các directory nhé.
  • Site đó có chơi trò redirect ko? Cái này vẫn còn tranh cải nhiều lắm, có người nói có, có người nói ko. Nhưng thôi, tốt nhất thì ko nên chơi kẻo vác họa vào thân
  • Gửi những query tự động lên Google: cái này thì chắc có nhiều người từng làm vì nghĩ rằng nó ko có chuyện gì nghiêm trọng. Một cách đơn giản là viết những cái link có dạng www.google.com/search?q=… hay là đối với blogger thì cũng có kiểu viết na na, youtube thì cũng có kiểu na ná (vì các dịch vụ của google đều tuân theo chuẩn viết truyền data qua URL của nó) và bạn để những link đó trên site của mình. Với ý nghĩ thật đơn giản là khi người dùng click vào thì họ sẽ được dẫn thẳng đến trang result kết quả của google. Nhưng google ko nghĩ vậy, nó nghĩ đó là hành động làm hao tổn tài nguyên máy tính của nó. Một cách khác, đây là cách của mình là dùng phần mềm để query trực tiếp lên Google để lấy kết quả về. Và thường thì có quá nhiều query trong 1 thời gian ngắn, Google sẽ ban access IP của bạn, mỗi khi search, bạn phải gõ mã chứng thực để được thấy kết quả! Và một query chết người là site:yourdomain
  • Hidden text / hidden links: Mặc dù bạn dùng hidden text và hidden links, nhưng ko có mục đích là đánh lừa SE. Mình chỉ muốn tạo ra những menu popup khi trỏ chuột vào một link như Kontera vậy. Do đó để text và link vào 1 cái DIV ẩn và chờ sự kiện trỏ chuột thì dùng javascript để show lên. Nhưng đó là vi phạm trầm trọng Google Webmaster Guideline rồi. Lần sau muốn thử vài hiệu ứng với javascript thì nên đọc kĩ code đó, xem có ẩn text hay links không.
  • Tạo backlink xấu: ai làm webmaster mà không ham backlink, nhưng nên xem xét kĩ lại cách tạo nó ra như thế nào. Đối với Google, một link tốt là khi nội dung bài của bạn tốt, người khác thấy thích, muốn chia sẻ mọi người nên link tới bài viết của bạn.
  • Vài yếu tố để đánh giá tốt 1 link là:
  • Backlink mà thôi, reciprocal link thì dễ bị chụp mũ lắm
  • Link vào trang con, ví dụ: vuacuagai.com/a.html bao giờ cũng tốt hơn là link tới trang chủ. Do đó đi spam ở mấy diễn đàn mà dùng trang chủ thì cũng chẳng có ích lợi SEO bao nhiêu.
  • Dofollow link, nếu kiếm link nofollow thì không có nhiều ý nghĩa?
  • Page mà chứa backlink đừng có nhiều quá 100 link, vì sẽ bị chụp mũ là link farm.
  • Một số link xấu nên tránh khi tạo links:
  • Reciprocal link, né cái này càng nhiều càng tốt. Và đừng trao đổi link nữa, chẳng có ích lợi gì.
  • Crossing link: lập ra hàng đống site để nó link qua link lại.
  • Link bậy link bạ: ví dụ site bạn nội dung về trẻ em mà bạn link tới những site đồ chơi người lớn PR=6, PR=7 thì tréo ngoe rồi và cũng bị xử đẹp luôn đấy. Chỉ link tới những site có nội dung gần gũi với site của bạn, đừng ham vài cái link mà bị ảnh hưởng.
  • Mua links, bán link: PR sẽ bị giảm, traffic cũng rớt theo. Google ko ưa kiểu mua bán link này. Nếu site của bạn có, thì nên remove đi, hoặc phải thông báo cho Google biết đó là paid link. Vào Google Webmaster Tool để report.
  • On-site SEO bấy nhầy: đừng spam keyword quá đáng. Chỉ nên đặt keyword ở những chỗ trọng yếu, chứ đừng viết chỗ nào cũng gặp keyword. Google sẽ nghĩ bạn đang làm mù màu mấy con bot của nó và nó có hành động thích đáng. Chỉ đặt keyword ở tiêu đề, url, đoạn paragraph đầu tiên, nếu có image thì tên image nên chứa keyword, alt trong tag img nên chứa keyword, meta description có thể chứa keyword.

Google sand box

Sandbox là một cơ chế của Google nhằm hạn chế thứ hạng của những site mới, những site không được tin tưởng. Hay nói đúng hơn nó là một bộ lọc của

google sanbox la gi

Google ra đời để ngăn chặn những website phát triển không tự nhiên, loại bớt kết quả spam và loại bớt kết quả thiếu sự tin tưởng

Tại sao Google lại sử dụng Sandbox?

Thực tế thì không ai có thể biết chắc rằng Google có sử dụng Sandbox hay không. Các SEOer thường cảm nhận hiệu ứng Sandbox trong quá trình thực hiện SEO. Nhưng nếu có thì đây là một điều tốt vì với bộ lọc này Google có thể loại bớt những kết quả không tự nhiên, những kết quả mang tính chất spam và thiếu độ tin tưởng. Có như vậy, các kết quả tìm kiếm của Google sẽ chính xác và có ích hơn cho người dùng.

Những dấu hiệu bị Google Sandbox

Như các bạn biết Google rất thích những nội dung mới (không copy của người khác) do đó việc những trang web mới ra đời mà có số bài viết cực khủng thì sẽ bị google để ý, mà chắc chắn những nội dung này do 1 công cụ gì đó tạo ra. Những trường hợp dễ bị google sandbox:

  • Autoblog (blog tự động lấy bài) hoàn toàn rập khuôn rất dễ bị để ý
  • Nội dung kém chất lượng (quảng cáo còn nhiều nội dung)
  • Duplicate content-Trùng lặp nội dung quá nhiều các bài viết có chung cấu trúc URL,title…
  • Xây dựng backlink quá nhanh trong khi site vẫn chưa có gì
  • Không tuân thủ chính sách của Google

Cách thoát khỏi Google Sandbox

Cách đơn giản nhất để thoát khỏi Google Sandbox là “trust” and “authority” (tức là độ tin cậy và độ phổ biến) chỉ việc bỏ các hành vi phát triển web không tự nhiên và tăng độ tin cậy và phổ biến đối với những URL bị phạt này thì bạn sẽ rút ngắn được thời gian trong sandbox.

>> Xem thêm: Tổng hợp tài liệu học SEO

Chúc bạn thành công!

Viết một bình luận