Google thông báo nó sử dụng AI chống thư rác

Google đã công bố giới thiệu các công cụ trí tuệ nhân tạo (AI) mới để giúp chống lại hàng loạt thư rác. Ước tính nội bộ tính toán rằng AI có khả năng chặn 99% thư rác.

Tiềm năng chưa từng có để chống lại thư rác

Có nhiều hình thức spam mà Google chống lại ở các điểm khác nhau mà Google tương tác với các trang web.

Những gì Google đã làm là tạo ra một trí tuệ nhân tạo chống spam mà Google mô tả là cung cấp một “tiềm năng cách mạng chưa từng có”Chống thư rác.

Google đặc biệt tập trung vào các thuật toán chống spam vào các tìm kiếm nhạy cảm đặc biệt quan trọng đối với người dùng như những tìm kiếm liên quan đến các chủ đề quan trọng như tìm kiếm các trang web xét nghiệm y tế.

Quảng cáo

Tiếp tục đọc bên dưới

“Bằng cách kết hợp kiến ​​thức sâu rộng về spam với AI, năm ngoái, chúng tôi đã có thể xây dựng AI chống spam của riêng mình, cực kỳ hiệu quả trong việc bắt cả các xu hướng spam mới và đã biết.

Ví dụ: chúng tôi đã giảm hơn 80% các trang web có nội dung được tạo tự động và cóp nhặt so với một vài năm trước ”.

Spam trang web bị tấn công

Những kẻ gửi thư rác sẽ hack một trang web và thêm các trang mới có liên kết đến các trang khác. Một cuộc tấn công trang web phổ biến mà Google cảnh báo được gọi là Hack từ khóa tiếng Nhật bởi vì nó thêm các trang tiếng Nhật. Nó cũng có thể tiếp quản tài khoản bảng điều khiển tìm kiếm của Google của bạn.

Quảng cáo

Tiếp tục đọc bên dưới

Google tuyên bố đã bắt được “hầu hết” thư rác do hack trang web. Công nghệ AI đã có thể tăng khả năng bắt lỗi của Google lên hơn 50%.

Ba lĩnh vực mà Google chặn thư rác

Google đã xuất bản một sơ đồ phác thảo ba cấp độ mà nó gặp phải spam, chẩn đoán nó là spam và sau đó từ chối nó.

Hình minh họa: Ba lĩnh vực mà Google chặn thư rác

Nơi AI của Google chặn SpamSơ đồ minh họa nơi AI của Google chặn thư rác

Nơi Google chặn thư rác

  1. Thư rác được Thu thập thông tin
  2. Spam được lập chỉ mục
  3. Spam bị bắt bằng thao tác thủ công

Thư rác bị chặn trước khi đưa nó vào chỉ mục

Trình thu thập thông tin của Google (GoogleBot) là phần mềm thu thập thông tin trên Internet để tìm các trang web để đưa vào chỉ mục tìm kiếm của Google nhằm hiển thị các trang đó trong kết quả tìm kiếm.

Bản thân trình thu thập thông tin có thể bắt được thư rác khi nó gặp phải để thư rác không được đưa vào chỉ mục.

Quảng cáo

Tiếp tục đọc bên dưới

Thư rác được thêm vào thông qua công cụ Lập chỉ mục yêu cầu của Search Console cũng được phát hiện và loại bỏ trước khi nó được đưa vào chỉ mục tìm kiếm của Google.

Thư rác trong chỉ mục tìm kiếm bị chặn trước khi nó được xếp hạng

Các hệ thống này không bắt được tất cả các thư rác và một số thư rác được đưa vào chỉ mục tìm kiếm của Google. Bất cứ khi nào Google trả lời một truy vấn tìm kiếm, Google sẽ quét các trang web đang được xem xét để xếp hạng nhằm tìm thêm thư rác.

Các trang spam được tìm thấy ở cấp độ này được sử dụng để tạo các thuật toán chống spam tốt hơn ở cấp độ thu thập thông tin web.

Các thao tác thủ công đến từ đâu

Google tuyên bố rằng các hệ thống này chặn 99% thư rác đến tay người dùng. Những gì làm cho nó thông qua được lựa chọn thông qua các thao tác thủ công.

Quảng cáo

Tiếp tục đọc bên dưới

“Chúng tôi ước tính rằng các hệ thống tự động này giúp giữ hơn 99% lượt truy cập từ Tìm kiếm hoàn toàn không có spam.

Đối với phần trăm nhỏ còn lại, các nhóm của chúng tôi thực hiện thao tác thủ công và sử dụng các kiến ​​thức học được từ đó để cải thiện hơn nữa hệ thống tự động của chúng tôi. “

Xem lại trang web Spam

Google đã thêm các trang web mua sắm và đánh giá chất lượng thấp vào danh sách các trang web được phân tích bằng các công cụ AI của họ. Google cho biết họ muốn thưởng cho nội dung có chiều sâu và hữu ích.

“… Chúng tôi muốn đảm bảo rằng bạn nhận được thông tin hữu ích nhất cho lần mua hàng tiếp theo của mình bằng cách bổ ích cho nội dung có nhiều nghiên cứu chuyên sâu và thông tin hữu ích.”

Quảng cáo

Tiếp tục đọc bên dưới

Cuộc chiến chống thư rác của Google được tăng cường bởi AI

Các công cụ AI đã được thêm vào vào năm 2020. Không rõ điều này có thể đã ảnh hưởng đến kết quả tìm kiếm như thế nào nhưng một số trang web có thể đã nhận được thứ hạng tốt hơn do loại bỏ các trang web spam trước đây đã có thứ hạng cao.

Từ phía chúng tôi, rất khó để nói cuộc chiến chống spam của Google thành công như thế nào. Mọi người đều có một giai thoại về một trang web spam đang mất dần thứ hạng trên Google.

Trích dẫn

Cách chúng tôi tìm kiếm spam trên Google vào năm 2020

Leave a Comment