Cách giải quyết nội dung trùng lặp

Những gì là nội dung trùng lặp, và tại sao nó lại là mối quan tâm đối với trang web của bạn? Tốt hơn, bạn có thể tìm thấy nó và sửa chữa nó như thế nào?

Trong tập Whiteboard Friday của tuần này, chuyên gia của Nhóm Moz Learn, Meghan, sẽ giới thiệu một số phép loại suy hữu ích (và gây đói) để giúp bạn trả lời những câu hỏi này!

Giải phẫu của một email quảng cáo chiêu hàng hoàn hảo

Nhấp vào hình ảnh bảng trắng ở trên để mở phiên bản có độ phân giải cao trong tab mới!

Phiên âm Video

Này, những người hâm mộ Moz. Chào mừng bạn đến với một phiên bản khác của Whiteboard Friday. Tôi là Meghan và tôi là thành viên của Nhóm Tìm hiểu tại Moz. Hôm nay chúng ta sẽ nói một chút về nội dung trùng lặp.

Vậy tại sao chúng ta lại nói về nội dung trùng lặp?

Chà, đây là một vấn đề khá phổ biến và nó thường có thể hơi khó hiểu. Nó là gì? Nó được xác định như thế nào? Tại sao các trang nhất định trên trang web của tôi bị gắn cờ là trùng lặp của nhau? Và quan trọng nhất, làm cách nào để giải quyết nếu tôi thấy rằng đây là điều mà tôi muốn giải quyết trên trang web của mình?

Nội dung trùng lặp là gì?

Vậy trước hết, nội dung trùng lặp là gì?

Về cơ bản, nội dung trùng lặp là nội dung xuất hiện ở nhiều nơi trên Internet. Nhưng điều này có thể không được cắt và khô như bạn tưởng tượng. Nội dung quá giống nhau, ngay cả khi không giống nhau, có thể được coi là bản sao của nhau.

Khi nghĩ về nội dung trùng lặp, điều quan trọng cần nhớ là không chỉ về những gì khách truy cập nhìn thấy khi họ truy cập trang web của bạn và so sánh hai trang. Nó cũng nói về những gì công cụ tìm kiếm và trình thu thập thông tin thấy khi họ truy cập các trang đó. Vì họ không thể nhìn thấy trang được hiển thị, họ thường đi ra khỏi mã nguồn của trang và nếu mã đó quá giống nhau, trình thu thập thông tin có thể nghĩ rằng nó đang xem hai phiên bản của cùng một trang.

Hãy tưởng tượng rằng bạn đi đến một tiệm bánh và có hai chiếc bánh nướng nhỏ trước mặt bạn trông gần như giống hệt nhau. Họ không có bất kỳ dấu hiệu nào. Làm thế nào để bạn biết cái nào bạn muốn? Đó là những gì sẽ xảy ra khi một công cụ tìm kiếm gặp hai trang quá giống nhau.

Sự nhầm lẫn này giữa các phần nội dung có thể dẫn đến những thứ như vấn đề xếp hạng, bởi vì các công cụ tìm kiếm có thể không tìm ra trang nào họ nên xếp hạng hoặc họ có thể xếp hạng trang không chính xác. Trong vòng các công cụ Moz, chúng tôi có ngưỡng 90% cho nội dung trùng lặp, có nghĩa là bất kỳ trang nào có mã giống nhau ít nhất 90% sẽ bị gắn cờ là trùng lặp của nhau.

Các giải pháp

Vì vậy, bây giờ chúng ta đã trình bày ngắn gọn về nội dung trùng lặp là gì, chúng ta phải làm gì với nó? Có một số cách khác nhau mà bạn có thể giải quyết nội dung trùng lặp.

Chuyển hướng 301

Đầu tiên là tùy chọn triển khai chuyển hướng 301. Tùy chọn này sẽ tương tự như có một bản sao VHS của một bộ phim, có thể không còn phù hợp nữa.

Vì vậy, bạn muốn đảm bảo cung cấp cho mọi người phiên bản kỹ thuật số phát trực tuyến. Trên trang web của mình, bạn có thể chuyển hướng các phiên bản cũ hơn của trang sang các phiên bản cập nhật, mới. Điều này có liên quan đến các vấn đề với miền phụ hoặc thay đổi giao thức cũng như cập nhật nội dung mà bạn không muốn mọi người có thể truy cập nội dung cũ hơn đó nữa.

Rel = canonicals

Tiếp theo là tùy chọn để triển khai rel = canonicals trên trang của bạn. Giả sử bạn đang ở một cửa hàng bán đồ nướng và bạn mang theo hai loại bánh quy, đường và sô cô la chip. Bạn coi cookie đường của bạn là hàng đầu. Vì vậy, khi mọi người hỏi bạn rằng họ nên thử loại nào, bạn sẽ chỉ họ vào bánh quy đường mặc dù họ vẫn có quyền thử sô cô la chip.

Trên trang web của bạn, điều này sẽ tương tự như việc có hai mặt hàng được rao bán có màu sắc khác nhau. Bạn muốn khách truy cập là người có thể nhìn thấy và truy cập cả hai màu, nhưng bạn sẽ sử dụng thẻ chuẩn để cho trình thu thập thông tin biết đâu là trang phù hợp hơn để xếp hạng.

Meta noindex

Bạn cũng có tùy chọn đánh dấu các trang là meta noindex.

Ví dụ: bạn có thể có hai ấn bản của cuốn sách yêu thích của mình. Bạn sẽ đọc và tham khảo ấn bản thứ hai vì nó là ấn bản mới nhất và phù hợp nhất. Nhưng bạn vẫn muốn có thể đọc và truy cập ấn bản một nếu bạn cần. Thẻ meta ngăn lập chỉ mục cho trình thu thập thông tin biết rằng họ vẫn có thể thu thập dữ liệu trang trùng lặp đó, nhưng họ không nên đưa trang đó vào chỉ mục của mình. Điều này có thể giúp giải quyết các vấn đề về nội dung trùng lặp do những thứ như phân trang.

Thêm nội dung

Nhưng nếu bạn có hai trang thực sự không trùng lặp với nhau thì sao? Chúng nói về các chủ đề khác nhau và chúng nên được coi như các phần nội dung riêng biệt. Trong trường hợp này, bạn có thể chọn thêm nhiều nội dung hơn vào mỗi trang này để ít gây nhầm lẫn cho trình thu thập thông tin.

Điều này sẽ cho phép chúng nổi bật với nhau, và tương tự như nói thêm rắc và một quả anh đào vào một chiếc bánh cupcake và có thể một lớp phủ màu khác với chiếc kia.

Sử dụng Moz Pro để giúp xác định và giải quyết nội dung trùng lặp

Nếu bạn cần trợ giúp để xác định những trang nào trên trang web của bạn có thể được coi là bản sao của nhau, Moz Pro Thu thập thông tin trang web và Thu thập thông tin theo yêu cầu có thể hữu ích.

Trong cả hai công cụ này, chúng tôi sẽ gắn cờ các trang nào được coi là trùng lặp của nhau và bạn thậm chí có thể xuất dữ liệu đó sang CSV để bạn có thể phân tích nó bên ngoài công cụ. Chỉ một chút mẹo chuyên nghiệp ở đây. Trong quá trình xuất CSV của dữ liệu đó, nhóm nội dung trùng lặp sẽ cho bạn biết những trang nào được coi là trùng lặp của nhau.

Vì vậy, bất kỳ trang nào có cùng số nhóm nội dung trùng lặp là một phần của cùng một nhóm các trang trùng lặp. Đây hoàn toàn không phải là danh sách đầy đủ về các cách bạn có thể giải quyết nội dung trùng lặp, nhưng tôi hy vọng rằng nó sẽ giúp đưa bạn đi đúng hướng khi giải quyết vấn đề này. Nếu bạn quan tâm đến việc tìm hiểu thêm về các nguyên tắc cơ bản và chiến lược SEO, hãy nhớ xem Chứng nhận SEO Essentials được cung cấp thông qua Học viện Moz.

Cảm ơn đã xem.

Phiên âm video bởi Speechpad.com

Leave a Comment