Khi đọc tiêu đề của bài viết này, chắc nhiều bạn sẽ nghĩ “Google Bots thu thập dữ liệu trên blog/ website càng nhiều thì càng có lợi cho SEO, tại sao phải hạn chế hay kiểm soát nó” phải không nào? Trên thực tế, điều này không hoàn toàn đúng. Mặc dù tần suất thu thập dữ liệu càng nhiều thì cơ hội xuất hiện trên “top” của bảng xếp hạng tìm kiếm càng cao. Tuy nhiên, việc Google hay các công cụ tìm kiếm khác thu thập dữ liệu với cường độ “quá mức” sẽ gây ra một số vấn đề đối với blog/ website của bạn, nói chính xác hơn là với hosting, đặc biệt là những hosting có cấu hình yếu so với nhu cầu sử dụng.
Tại sao bạn nên kiểm soát tần suất thu thập dữ liệu của Google Bots?
Nếu bạn sử dụng hosting với cấu hình yếu hoặc chỉ ở mức trung bình, bị giới hạn về băng thông (do không đủ điều kiện tài chính), nhưng blog/ website lại có mã nguồn nặng (chẳng hạn như các site thương mại điện tử), lượng khách truy cập hàng ngày lớn, thì việc kiểm soát tần suất thu thập dữ liệu của Google Bots là điều hoàn toàn cần thiết. Bởi vì, khi Google Bots thu thập dữ liệu, nhất là vào lúc “cao điểm” sẽ khiến:
- Tốc độ truy cập blog/ website của bạn sẽ chậm đi rất nhiều, ảnh hưởng đến trải nghiệm người dùng. Khách hàng, độc giả có thể bỏ bạn ra đi và không bao giờ quay trở lại.
- Tiêu tốn nhiều tài nguyên của hosting. Chẳng hạn như vượt quá giới hạn bandwidth khiến bạn tốn thêm chi phí, full CPU khiến host bị cho tạm dừng hoạt động (subspend).
Trong những thời điểm như vậy, kiểm soát việc thu thập dữ liệu của Google Bots là điều nên làm.
Làm thế nào để kiểm soát tần suất thu thập dữ liệu?
Thật may mắn, Google đã cung cấp sẵn một tính năng hữu ích trong Search Console (hay Webmaster Tools) để cho phép bạn làm điều này một cách đơn giản.
1. Đầu tiên, các bạn cần phải đăng nhập vào Google Search Console, chọn trang web mà bạn muốn kiểm soát tần suất thu thập dữ liệu. Click vào nút hình bánh răng và chọn mục Cài đặt trang web.
2. Trong mục Tốc độ thu thập dữ liệu sẽ có 2 tùy chọn khác nhau.
Trong đó:
- : là lựa chọn mặc định và được Google khuyên dùng.
- Giới hạn tốc độ thu thập dữ liệu tối đa của Google: cho phép bạn kiểm soát tần suất thu thập dữ liệu tối đa của Google Bots theo nhu cầu thực tế của mình. Chỉ áp dụng khi Google làm chậm máy chủ host của bạn.
Hãy kéo nấc thang màu trắng để điều chỉnh tần suất cho phù hợp. Click vào nút Lưu để áp dụng.
Lưu ý: thiết lập này chỉ được duy trì trong vòng 90 ngày. Sau thời gian đó, Google sẽ tự động khôi phục về trạng thái mặc định. Nếu muốn tiếp tục, bạn sẽ phải thao tác lại từ đầu.