Bạn đã bao giờ nhìn thấy trong Google Webmaster Tools thông báo blog/ website của bạn có một số lỗi Soft 404 hay chưa? Mặc dù bạn đã thiết lập để tự động redirect các trang bị lỗi 404 về trang chủ nhưng Webmaster Tools vẫn thông báo lỗi Soft 404. Vậy lỗi 404 là gì? Lỗi Soft 404 là gì? Lỗi 404 và Soft 404 khác nhau như thế nào? Hãy dành ít phút để cùng WP Căn bản tìm hiểu ngay sau đây.
Lỗi 404 và Soft 404 là gì?
Lỗi 404
Thông thường, khi một người nào đó yêu cầu một trang không tồn tại, máy chủ web sẽ trả về một lỗi 404 (không tìm thấy). Mã phản hồi HTTP này cho cả trình duyệt web và công cụ tìm kiếm biết rõ ràng rằng trang không tồn tại. Kết quả là các nội dung trên trang (nếu có) sẽ không được thu thập dữ liệu hoặc lập chỉ mục bởi công cụ tìm kiếm.
Ngoài việc trả lại một mã 404 để đáp ứng yêu cầu cho một trang không tồn tại, các máy chủ cũng sẽ hiển thị một trang 404. Đây có thể là một thông báo tiêu chuẩn “File Not Found” hoặc là một trang tùy chỉnh, được thiết kế để cung cấp cho người dùng các thông tin bổ sung. Nội dung của trang này là hoàn toàn không liên quan đến các phản ứng HTTP được trả về bởi máy chủ.
Lỗi Soft 404
Một trang hiển thị thông báo 404 “File Not Found” không có nghĩa nó là một trang 404. Nó giống như một con hươu cao cổ đeo thẻ có ghi là “con chó”. Nó nói nó là một con chó, không có nghĩa là nó thực sự là một con chó. Tương tự như vậy, khi một trang hiển thị thông báo 404, không có nghĩa là nó cũng trả về một mã lỗi 404. Bạn có thể sử dụng tính năng “Tìm nạp như Google” (hoặc các công cụ khác có sẵn trên web) để xác minh xem các URL có thực sự trả về đúng mã hay không?
Trả lại một mã khác (so với 404 hoặc 410) cho một trang không tồn tại (hoặc chuyển hướng người dùng đến một trang khác, chẳng hạn như trang chủ, thay vì trả về một mã 404) có thể là nguyên nhân gây ra các vấn đề kể trên (lỗi Soft 404). Thứ nhất, nó thông báo cho công cụ tìm kiếm rằng có một trang thực tại URL đó. Kết quả là URL có thể được thu thập dữ liệu và lập chỉ mục nội dung. Do Google Bots tiêu tốn thời gian dành cho trang không tồn tại, URL thực (tồn tại) của bạn có thể không được phát hiện một cách nhanh chóng hoặc không được truy cập thường xuyên và việc thu thập dữ liệu trang web của bạn có thể bị ảnh hưởng.
Lời khuyên
Tôi khuyên các bạn nên trả lại mã 404 (không tìm thấy) hoặc một mã 410 (đã đi qua) để đáp ứng yêu cầu cho một trang không tồn tại. Bạn có thể cải thiện trải nghiệm người dùng bằng cách cấu hình blog/ website của bạn để hiển thị một trang 404 tuỳ chỉnh khi trả về mã 404.
Ví dụ, bạn có thể tạo ra một trang có chứa danh sách các bài viết/ trang phổ biến nhất trên blog/ website, một liên kết đến trang chủ hoặc một liên kết cho phép gửi thông tin phản hồi. Nhưng điều quan trọng mà bạn phải nhớ là nó không đủ nếu chỉ tạo một trang hiển thị thông báo 404. Bạn cũng cần phải trả lại một mã phản ứng HTTP chính xác (404 hoặc 410).