7 Cảnh báo & Lỗi của Công cụ Thu thập thông tin SEO Bạn có thể Bỏ qua An toàn

Trong nhiều trường hợp, thứ mà trình thu thập dữ liệu SEO đánh dấu là một lỗi nghiêm trọng cần được chú ý ngay lập tức – nhưng đôi khi, nó không phải là một lỗi nào cả.

Điều này có thể xảy ra ngay cả với các công cụ thu thập dữ liệu SEO phổ biến nhất như Semrush Site Audit, Ahrefs Site Audit, Sitebulb và Screaming Frog.

Làm thế nào bạn có thể nhận ra sự khác biệt để tránh ưu tiên một bản sửa lỗi không cần thực hiện?

Dưới đây là một số ví dụ thực tế về các cảnh báo và lỗi như vậy cùng với các giải thích tại sao chúng có thể là vấn đề đối với trang web của bạn.

1. Vấn đề về khả năng lập chỉ mục (Các trang Noindex trên Trang web)

Bất kỳ trình thu thập thông tin SEO nào cũng sẽ đánh dấu và cảnh báo bạn về các trang không thể lập chỉ mục trên trang web. Tùy thuộc vào loại trình thu thập thông tin, các trang ngăn lập chỉ mục có thể được đánh dấu là cảnh báo, lỗi hoặc thông tin chi tiết.

Đây là cách vấn đề này được đánh dấu trong Kiểm tra trang web của Ahrefs:

Mẫu chi tiết vấn đề trang Noindex của Ahrefs Site Audit.Ảnh chụp màn hình từ Kiểm tra trang web của Ahrefs, tháng 9 năm 2021

Báo cáo Phạm vi của Google Search Console cũng có thể đánh dấu các trang không thể lập chỉ mục là Lỗi (nếu trang web có các trang không thể lập chỉ mục trong sơ đồ trang web được gửi) hoặc Bị loại trừ mặc dù chúng không phải là vấn đề thực sự.

Quảng cáo

Tiếp tục đọc bên dưới

Đây chỉ là thông tin mà các URL này không thể được lập chỉ mục.

Đây là những gì nó trông giống như trong GSC:

Phạm vi Google Search Console báo cáo các trang không thể lập chỉ mục là Lỗi.Ảnh chụp màn hình từ Google Search Console, tháng 9 năm 2021

Việc một URL có thẻ “noindex” trên đó không nhất thiết có nghĩa là đây là một lỗi. Nó chỉ có nghĩa là trang không thể được lập chỉ mục bởi Google và các công cụ tìm kiếm khác.

Thẻ “noindex” là một trong hai lệnh có thể sử dụng cho trình thu thập thông tin, lệnh còn lại dùng để lập chỉ mục trang.

Quảng cáo

Tiếp tục đọc bên dưới

Trên thực tế, mọi trang web đều chứa các URL mà Google không nên lập chỉ mục.

Chúng có thể bao gồm, ví dụ: các trang thẻ (và đôi khi cả các trang danh mục), trang đăng nhập, trang đặt lại mật khẩu hoặc trang cảm ơn.

Nhiệm vụ của bạn, với tư cách là một chuyên gia SEO, là xem xét các trang ngăn lập chỉ mục trên trang web và quyết định xem liệu chúng có thực sự bị chặn lập chỉ mục hay không hay liệu thẻ “ngăn lập chỉ mục” có thể được thêm vào một cách tình cờ hay không.

2. Mô tả meta quá ngắn hoặc trống

Trình thu thập dữ liệu SEO cũng sẽ kiểm tra các yếu tố meta của trang web, bao gồm cả các yếu tố mô tả meta. Nếu trang web không có mô tả meta hoặc chúng quá ngắn (thường dưới 110 ký tự), thì trình thu thập thông tin sẽ đánh dấu trang đó là một vấn đề.

Đây là những gì trông giống như trong Ahrefs:

Vấn đề phần tử mô tả meta trong Ahrefs.Ảnh chụp màn hình từ Kiểm tra trang web của Ahrefs, tháng 9 năm 2021

Đây là cách Screaming Frog hiển thị nó:

Vấn đề về yếu tố meta trong báo cáo của Screaming Frog.Ảnh chụp màn hình từ Screaming Frog, tháng 9 năm 2021

Tùy thuộc vào kích thước của trang web, không phải lúc nào cũng có thể và / hoặc có thể tạo mô tả meta duy nhất cho tất cả các trang web của nó. Bạn cũng có thể không cần chúng.

Một ví dụ điển hình về một trang web có thể không hợp lý là một trang web thương mại điện tử khổng lồ với hàng triệu URL.

Trên thực tế, trang web càng lớn thì yếu tố này càng ít quan trọng hơn.

Nội dung của phần tử mô tả meta, trái ngược với nội dung của thẻ tiêu đề, không được Google tính đến và không ảnh hưởng đến thứ hạng.

Đoạn mã tìm kiếm đôi khi sử dụng mô tả meta nhưng thường được viết lại bởi Google.

Đây là những gì Google phải nói về nó trong SEO nâng cao của họ tài liệu:

“Đoạn mã được tạo tự động từ nội dung trang. Đoạn mã được thiết kế để nhấn mạnh và xem trước nội dung trang liên quan tốt nhất đến tìm kiếm cụ thể của người dùng: điều này có nghĩa là một trang có thể hiển thị các đoạn mã khác nhau cho các tìm kiếm khác nhau. ”

Những gì bạn là một SEO cần làm là ghi nhớ rằng mỗi trang web là khác nhau. Sử dụng ý thức SEO thông thường của bạn khi quyết định xem mô tả meta có thực sự là một vấn đề đối với trang web cụ thể đó hay bạn có thể bỏ qua cảnh báo một cách an toàn.

Quảng cáo

Tiếp tục đọc bên dưới

3. Thiếu từ khóa meta

Từ khóa meta đã được sử dụng cách đây hơn 20 năm như một cách để chỉ ra cho các công cụ tìm kiếm như Altavista những cụm từ khóa mà một URL nhất định muốn xếp hạng.

Tuy nhiên, điều này đã bị lạm dụng rất nhiều. Từ khóa meta là một loại “nam châm spam”, vì vậy phần lớn các công cụ tìm kiếm đã bỏ hỗ trợ cho yếu tố này.

Screaming Frog luôn kiểm tra xem có từ khóa meta trên trang web hay không, theo mặc định.

Vì đây là một yếu tố SEO lỗi thời, 99% các trang web không sử dụng các từ khóa meta nữa.

Đây là những gì nó trông như thế nào trong Screaming Frog:

Screaming Frog nhấn mạnh rằng các từ khóa meta bị thiếu trên trang web.Ảnh chụp màn hình từ Screaming Frog, tháng 9 năm 2021

Các chuyên gia SEO hoặc khách hàng mới có thể bối rối khi nghĩ rằng nếu trình thu thập thông tin đánh dấu điều gì đó là thiếu, thì yếu tố này thực sự nên được thêm vào trang web. Nhưng đó không phải là trường hợp ở đây!

Quảng cáo

Tiếp tục đọc bên dưới

Nếu thiếu từ khóa meta trên trang web bạn đang kiểm tra, thì thật lãng phí nếu bạn nên thêm chúng.

4. Hình ảnh trên 100 KB

Điều quan trọng là phải tối ưu hóa và nén hình ảnh được sử dụng trên trang web để không cần tải biểu trưng PNG khổng lồ nặng 10 MB trên mọi trang web.

Tuy nhiên, không phải lúc nào bạn cũng có thể nén tất cả hình ảnh xuống dưới 100 KB.

Screaming Frog sẽ luôn đánh dấu và cảnh báo bạn về những hình ảnh có dung lượng trên 100 KB. Đây là những gì nó trông giống như trong công cụ:

Screaming Frog sẽ luôn làm nổi bật những hình ảnh có kích thước trên 100 KB.Ảnh chụp màn hình từ Screaming Frog, tháng 9 năm 2021

Thực tế là trang web có hình ảnh trên 100 KB không nhất thiết có nghĩa là trang web đó có vấn đề với tối ưu hóa hình ảnh hoặc rất chậm.

Quảng cáo

Tiếp tục đọc bên dưới

Khi bạn thấy lỗi này, hãy nhớ kiểm tra tốc độ và hiệu suất tổng thể của trang web trong Google PageSpeed ​​Insights và báo cáo Google Search Console Core Web Vitals.

Nếu trang web hoạt động tốt và vượt qua đánh giá Core Web Vitals, thì thường không cần nén hình ảnh thêm nữa.

Mẹo: Những gì bạn có thể làm với báo cáo Screaming Frog này là sắp xếp các hình ảnh theo kích thước từ nặng nhất đến nhẹ nhất để kiểm tra xem có một số hình ảnh thực sự lớn trên các trang web cụ thể hay không.

5. Nội dung thấp hoặc số trang ít từ

Tùy thuộc vào cài đặt của trình thu thập thông tin SEO, hầu hết các công cụ kiểm tra SEO sẽ đánh dấu các trang dưới 50-100 từ là các trang có nội dung thấp.

Đây là những gì vấn đề này trông như thế nào trong Ahrefs:

Vấn đề về số lượng từ thấp trong Ahrefs.Ảnh chụp màn hình từ Kiểm tra trang web của Ahrefs, tháng 9 năm 2021

Mặt khác, Screaming Frog coi các trang dưới 200 từ là trang có nội dung thấp theo mặc định (bạn có thể thay đổi cài đặt đó khi định cấu hình thu thập thông tin).

Quảng cáo

Tiếp tục đọc bên dưới

Đây là cách Screaming Frog báo cáo về điều đó:

Báo cáo Trang có nội dung thấp trong Screaming Frog.Ảnh chụp màn hình từ Screaming Frog, tháng 9 năm 2021

Chỉ vì một trang web có ít từ không có nghĩa là nó là một vấn đề hoặc lỗi.

Có nhiều loại trang có nghĩa là có số lượng từ thấp, bao gồm một số trang đăng nhập, trang đặt lại mật khẩu, trang thẻ hoặc trang liên hệ.

Trình thu thập thông tin sẽ đánh dấu các trang này là nội dung thấp nhưng đây không phải là vấn đề ngăn trang web xếp hạng tốt trong Google.

Quảng cáo

Tiếp tục đọc bên dưới

Điều mà công cụ đang cố gắng nói với bạn là nếu bạn muốn một trang web nhất định xếp hạng cao trong Google và mang lại nhiều lưu lượng truy cập không phải trả tiền, thì trang web này có thể cần phải khá chi tiết và chuyên sâu.

Điều này thường bao gồm, trong số những người khác, số lượng từ cao. Nhưng có nhiều loại mục đích tìm kiếm khác nhau và độ sâu nội dung không phải lúc nào cũng là thứ mà người dùng tìm kiếm để thỏa mãn nhu cầu của họ.

Khi xem xét các trang có số lượng từ thấp được trình thu thập thông tin gắn cờ, hãy luôn nghĩ xem liệu những trang này có thực sự có nhiều nội dung hay không. Trong nhiều trường hợp, chúng không phải vậy.

6. Tỷ lệ văn bản HTML thấp

Semrush Site Audit cũng sẽ cảnh báo bạn về các trang có tỷ lệ văn bản-HTML thấp.

Đây là cách Semrush báo cáo về điều đó:

Báo cáo Kiểm tra trang web của Semrush về tỷ lệ văn bản-HTML thấp.Ảnh chụp màn hình từ Kiểm tra trang web Semrush, tháng 9 năm 2021

Cảnh báo này sẽ hiển thị cho bạn:

Quảng cáo

Tiếp tục đọc bên dưới

  • Các trang có thể có số lượng từ thấp.
  • Các trang có khả năng được xây dựng theo cách phức tạp và có tệp mã HTML lớn.

Cảnh báo này thường gây nhầm lẫn cho các chuyên gia SEO mới hoặc ít kinh nghiệm và bạn có thể cần một chuyên gia SEO kỹ thuật có kinh nghiệm để xác định xem đó có phải là điều đáng lo ngại hay không.

Có nhiều biến số có thể ảnh hưởng đến tỷ lệ văn bản HTML và không phải lúc nào cũng là vấn đề nếu trang web có tỷ lệ văn bản HTML thấp / cao. Không có cái gọi là tỷ lệ văn bản HTML tối ưu.

Thay vào đó, những gì bạn là một chuyên gia SEO có thể tập trung vào là đảm bảo rằng tốc độ và hiệu suất của trang web là tối ưu.

7. Sơ đồ trang web XML không được chỉ định trong robots.txt

Robots.txt, ngoài vai trò là tệp chứa chỉ thị cho trình thu thập thông tin, còn là nơi bạn có thể chỉ định URL của sơ đồ trang XML để Google có thể thu thập dữ liệu và lập chỉ mục nội dung một cách dễ dàng.

Các trình thu thập dữ liệu SEO như Semrush Site Audit sẽ thông báo cho bạn nếu sơ đồ trang web XML không được chỉ định trong robots.txt.

Quảng cáo

Tiếp tục đọc bên dưới

Đây là cách Semrush báo cáo về điều đó:

Báo cáo Kiểm tra trang web của Semrush về sitemap.xml không được chỉ ra trong robots.txt.Ảnh chụp màn hình từ Kiểm tra trang web Semrush, tháng 9 năm 2021

Thoạt nhìn, đây có vẻ như là một vấn đề nghiêm trọng mặc dù trong hầu hết các trường hợp, đó không phải là do:

  • Google thường không gặp vấn đề khi thu thập thông tin và lập chỉ mục các trang web nhỏ hơn (dưới 10.000 trang).
  • Google sẽ không gặp vấn đề khi thu thập dữ liệu và lập chỉ mục các trang web lớn nếu chúng có cấu trúc liên kết nội bộ tốt.
  • Sơ đồ trang web XML không cần phải được chỉ định trong robots.txt nếu nó được gửi chính xác trong Google Search Console.
  • Sơ đồ trang XML không cần phải được chỉ định trong robots.txt nếu nó ở vị trí chuẩn – tức là /sitemap.xml (trong hầu hết các trường hợp).

Trước khi bạn đánh dấu đây là vấn đề ưu tiên cao trong quá trình kiểm tra SEO của mình, hãy đảm bảo rằng không có vấn đề nào ở trên đúng với trang web bạn đang kiểm tra.

Phần thưởng: Công cụ báo cáo một lỗi nghiêm trọng liên quan đến một số URL không quan trọng

Ngay cả khi công cụ đang hiển thị một vấn đề thực sự, chẳng hạn như trang 404 trên trang web, nó có thể không phải là vấn đề nghiêm trọng nếu một trong số hàng triệu trang trên trang web trả về trạng thái 404 hoặc nếu không có liên kết nào trỏ đến trang 404 đó .

Quảng cáo

Tiếp tục đọc bên dưới

Đó là lý do tại sao, khi đánh giá các vấn đề được phát hiện bởi trình thu thập thông tin, bạn phải luôn kiểm tra xem chúng có liên quan đến bao nhiêu trang và những trang nào.

Bạn cần đưa ra bối cảnh lỗi.

Ví dụ: Sitebulb sẽ hiển thị cho bạn phần trăm URL có liên quan đến một lỗi cụ thể.

Dưới đây là một ví dụ về URL nội bộ chuyển hướng đến một URL bị hỏng trả về 4XX hoặc 5XX được Sitebulb báo cáo:

Ví dụ về báo cáo về một URL nội bộ chuyển hướng đến một URL bị hỏng.Ảnh chụp màn hình từ Trình thu thập thông tin trang web Sitebulb, tháng 9 năm 2021

Có vẻ như đây là một vấn đề khá nghiêm trọng nhưng nó chỉ liên quan đến một trang web không quan trọng, vì vậy nó chắc chắn không phải là vấn đề có mức độ ưu tiên cao.

Quảng cáo

Tiếp tục đọc bên dưới

Lời kết & Mẹo

Trình thu thập dữ liệu SEO là công cụ không thể thiếu đối với các chuyên gia SEO kỹ thuật. Tuy nhiên, những gì họ tiết lộ phải luôn được giải thích trong bối cảnh của trang web và mục tiêu của bạn đối với doanh nghiệp.

Cần có thời gian và kinh nghiệm để có thể phân biệt được sự khác biệt giữa vấn đề giả và vấn đề thực. May mắn thay, hầu hết các trình thu thập thông tin đều cung cấp các giải thích sâu rộng về các lỗi và cảnh báo mà chúng hiển thị.

Đó là lý do tại sao luôn là một ý kiến ​​hay – đặc biệt là đối với các chuyên gia SEO mới bắt đầu – đọc những giải thích này và tài liệu về trình thu thập thông tin. Đảm bảo rằng bạn thực sự hiểu vấn đề nhất định có ý nghĩa như thế nào và liệu vấn đề đó có thực sự đáng để yêu cầu khắc phục hay không.

Nhiêu tai nguyên hơn:


Hình ảnh nổi bật: Biểu tượng Pro / Shutterstock

Leave a Comment