Mỗi ngày, hàng triệu trang spam vô ích được tạo. Chúng tôi chống lại
spam bằng cách kết hợp các thuật toán máy tính với việc đánh giá thủ
công.

Xác định spam
Các trang web spam xuất hiện dưới nhiều dạng khác nhau. Một số trang web là văn bản vô nghĩa được tạo tự động mà con người không thể hiểu. Tất nhiên, chúng tôi cũng gặp các trang web sử dụng kỹ thuật spam tinh vi hơn. Hãy xem các ví dụ về “spam thuần túy” là các trang web sử dụng kỹ thuật spam rõ rệt nhất. Đây là luồng ảnh chụp màn hình spam trực tuyến mà chúng tôi đã nhận dạng được theo cách thủ công và gần đây đã bị xóa khỏi các kết quả tìm kiếm.Các loại spam
Ngoài các spam đã nêu ở trên, dưới đây là một số loại spam khác mà chúng tôi phát hiện thấy và xử lý.Kỹ thuật che giấu và/hoặc chuyển hướng lén lút
Trang web dường như đang sử dụng kỹ thuật che giấu (hiển thị nội dung cho người dùng khác với cho công cụ tìm kiếm) hoặc đang chuyển hướng người dùng đến trang khác với trang mà Google thấy.Trang web bị tấn công
Một số trang trên trang web này có thể đã bị bên thứ ba tấn công nhằm hiển thị nội dung hoặc các liên kết spam. Chủ sở hữu trang web phải thực hiện hành động ngay lập tức để làm sạch trang web của họ và sửa bất kỳ lỗ hổng bảo mật nào.Văn bản ẩn và/hoặc nhồi nhét từ khóa
Một số trang có thể chứa văn bản ẩn và/hoặc bị nhồi nhét từ khóa.Tên miền trỏ hướng
Tên miền trỏ hướng là các trang web giữ chỗ với rất ít nội dung duy nhất, do vậy Google thường không đưa các trang web này vào kết quả tìm kiếm.Spam thuần túy
Có vẻ như trang web sử dụng các kỹ thuật spam có tính công kích chẳng hạn như nội dung vụn vặt, che giấu, văn bản vô nghĩa được tạo tự động từ các trang web khác và/hoặc vi phạm nghiêm trọng hoặc tái vi phạm Nguyên tắc quản trị trang web của Google.Nhà cung cấp DNS động và máy chủ lưu trữ miễn phí gây ra spam
Trang web được lưu trữ bởi dịch vụ lưu trữ miễn phí hoặc nhà cung cấp DNS động chứa một phần đáng kể nội dung spam.Nội dung nghèo nàn có ít hoặc không có giá trị gia tăng
Có vẻ như trang web bao gồm các trang có chất lượng thấp hoặc hời hợt không cung cấp cho người dùng nhiều giá trị gia tăng (chẳng hạn như các trang liên kết nghèo nàn, trang ngõ, các trang web giống nhau hàng loạt, nội dung được tạo tự động hoặc nội dung được sao chép).Liên kết bất thường từ trang web
Google đã phát hiện ra một mẫu các liên kết bất thường, nhân tạo, giả mạo hoặc nhằm mục đích thao túng xuất phát từ trang web này. Đây có thể là kết quả của việc bán liên kết mà PageRank chấp nhận hoặc tham gia vào các mưu đồ liên kết.Spam do người dùng tạo
Có vẻ trang web chứa nội dung spam do người dùng tạo. Nội dung có vấn đề có thể xuất hiện trên các trang diễn đàn, các trang lưu bút hoặc tiểu sử người dùng
Nguồn: google.com
0 nhận xét:
Đăng nhận xét