Kỹ thuật điều hướng spider

TRIHD.NET

Google Spider là gì? Kỹ thuật điều hướng spider

Trihd.net

09/28/2014

Đầu tiên để điều hướng được Spider thì các bạn phải hiểu được Spider là gì? Cách thức hoạt động của nó như thế nào? Khi đã phẩu thuật được con Spider này thì bạn mới điều hướng điều khiển được nó đúng không các bạn. Với những người mới bắt đầu làm SEO hay những người chưa biết đến SEO thì thuật ngữ “Google spider” hay “Robot” có thể khá lạ lẫm. Không sao sau khi xem tôi trình bày thì các bạn sẽ hiểu rõ hơn và sẽ nắm vững được các vấn đề “Google Spider là gì”, ” Cách điều hướng Google spider trong SEO”.

Google Spider là gì? Định nghĩa Google Spider.

Spider là gì hay Google Spider là gì nó chính là các “con bọ tìm kiếm “. Nó được tự động sinh ra từ các máy chủ của Google. Chúng có nhiệm vụ săn tìm, truy lùng các dữ liệu trên các website dựa trên các đường liên kết (link). Google spider hoạt động chủ yếu dựa vào liên kết ( link ) trên các pages, website và dựa vào hành vi người dùng hoặc truy vấn của trình duyệt tác động lên 1 page, website nào đó để lập chỉ mục cho page, website đó hiển thị trên công cụ tìm kiếm Google (index) và thời gian ở trong page, website của chúng là một khoảng thời gian nhất định! Các bạn cũng biết là thời gia tìm kiếm của google rất nhanh khi bạn tìm kiếm từ gì đó thì chỉ sau chưa đến 1s google đã trả về kết quả tìm kiếm cho bạn. Chứng tỏ các Spider hoạt động rất nhanh, nó lướt qua các site rất nhanh. Do đó để kéo giữ các Spider ở lại trên website của bạn càng lâu càng tốt. Video dưới đây sẽ cho bạn thấy nó hoạt động như thế nào?

1. Phân loại Spider

Google spider được phân chia đơn giản hơn thành 2 loại : spider chủ động và spider thụ động.

Spider chủ động

Google Spider chủ động hoạt động dựa trên các liên kết trong một trang hay cả website của bạn. Đối với loại Spider này yếu tố ảnh hưởng nhất là “SiteMap” do đó các SEOer thường tạo sitemap (.xml) cho website và submit lên công cụ webmaster tools cho chúng làm việc tốt hơn, website được thu thập dữ liệu tốt hơn ! Chúng tự động thu thập dữ liệu và phân tích, đi theo các đường dẫn ( link ) để tiếp tục công việc của mình.

Spider thụ động

Google Spider thụ động hoạt động dựa trên sự truy vấn của trình duyệt vào 1 website, page nào đó. Tức là nếu có 1 website mà bạn không làm gì mà chỉ truy cập thông qua các trình duyệt web như: IE, Frifox, google Chrome…thì website của bạn cũng sẽ được lập chỉ mục, nhưng thời gian sẽ vô cùng chậm tức là website sẽ lau được Index. Loại Spider này có thể tác động qua cả ứng dụng spiders

Google plus ( G+ ) khi người dùng click G+ để +1 cho page nào đó thì ngay lập tức Spider này sinh ra và đi tới page đó để tiến hành công việc. Để website được index nhanh, uy tín hơn thì các SEOER phải điều hướng được Spider để nó ghé thăm website của mình nhiều hơn. Vấn đề đặt ra là làm sao điều hướng được Spider.

2. Cách điều hướng Spider

Cũng giống như con người, thường thì khi đọc văn bản chúng ta hay đọc từ trên xuống dưới, từ trái qua phải và Google Spider cũng đọc dữ liệu trên website của chúng ta như vậy. Do đó, thường những thông tin quan trọng chúng ta cần phải bố trí hợp lý với bố cục website để điều hướng Google Spider.

Điêu hướng 1: Đầu tiên khi vào Site của bạn nó sẽ tìm đến file: Robot.txt sau đó là file: Sitemap. Do đó trên mọi website 2 file này không được thiếu.

Điều hướng thứ 2: Xấy dựng các liên kết nội bội để điều hướng Spide từ Pages này sang Pages khác trên cùng 1 website.
Điều hướng thứ 3: Google spider tuân theo thuộc tính follow – nofollow hoặc index – noindex của thẻ meta hoặc thuộc tính disallow trong file robots.txt.Vì vậy khi xây dựng web các link không quan trọng, các bạn không muốn Spider chú ý tới thì các bạn hãy đặt thuộc tính “rel=’nofollow’ ” trong thẻ “<a rel=’nofollow’ href=””></a>” hoặc thuộc tính “noindex”. Các bạn cũng có thể sử dụng thuộc tính Disallow trong file Robot.txt để chặn các đường link xấu, các đường link không quan trọng.