Cách tạo và sử dụng file robots.txt

LÀM

1. File Robots.txt là gì?

File robots.txt là một dạng file rất đơn giản có thể được tảo bởi công cụ Notepad. Bạn tạo 1 file robots.txt vào đặt vào thư mục root của trang web

File Robots.txt được sử dụng để hướng dẫn công cụ tìm kiếm tự động đến những trang nào mà bạn muốn nó tìm kiếm và sau đó thì index trang đó. Hầu hết trang web nào cũng có những thư mục và files không cần đến robot của công cụ tìm kiếm ghé thăm. Do vậy tạo ra file robots.txt có thể giúp bạn trong SEO.

2. Các User Agent của Google

Google có vài user-agent chính. Bạn có thể ngăn chúng bằng cách thêm tên của bọ tìm kiếm tương ứng và trong dòng User-agent tương ứng trong bảng ghi robots.txt. Nếu bạn chặn Googlebot thì có nghĩa là bạn chặn tất cả các bọ tìm kiếm với từ khóa “Googlebot”.

– Googlebot: Đánh chỉ số từ các chỉ mục cũ và mới của Google.

– Googlebot-Mobile: Đánh chỉ số cho các thiết bị cầm tay hoặc di động.

– Googlebot-Image: Đánh chỉ số các tệp tin ảnh.

– Mediapartners-Google: Xuất hiện trong các trang dăng quảng cáo của Google Adsense.

– Adsbot-Google: Đánh chỉ số các trang được nhà quảng cáo sử dụng giới thiệu sản phẩm hay dịch vụ thông qua Google Adwords. Nó cho phép đánh giá chất lượng của trang dùng dịch vụ Adwords.

robotstxt-file-explained

3. Cách sử dụng Google boot

Nếu bạn sử dụng WordPress một file robots.txt sẽ có dạng như sau:

User-agent: *

Disallow: /wp-

Disallow: /feed/

Disallow: /trackback/

Trong đó:

“User-agent”:* có nghĩa là tất cả những robot tìm kiếm từ Google, Yahoo và MSN nên sử dụng hướng dẫn này của bạn để tìm kiếm trang web.

“Disallow: /wp-“: dòng code này báo cho công cụ tìm kiếm biết nó không nên “lục lọi” ở những file của WordPress bắt đầu bằng wp-.

Nếu bạn không sử dụng WordPress, bạn chỉ việc thay thế dòng Disallow với files và folders mà bạn không muốn nó “dòm ngó”,

ví dụ:

User-agent: *

Disallow: /images/

Disallow: /cgi-bin/

4. Tự động tạo robots.txt

Nếu bạn có sử dụng Google Webmaster thì họ cũng cho phép bạn tạo robots.txt hoặc bạn có thể sử dụng Robots.txt Generator để tự động tạo file robots.txt cho mình

Sau khi bạn đã tạo xong file robots.txt đừng quên save, bạn chỉ việc upload lên thư mục gốc là hoàn thành.

Rồi vậy là bạn đã hiểu thêm về file robot.txt phải không nào, không quá khó khăn cũng không hề phức tạp. Chúc bạn thành công khi thực hành phần này.

>> Xem thêm: Tổng hợp tài liệu học SEO

Chúc bạn thành công!

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *