Tặng Khóa Học Marketing Online Miễn Phí Trị Giá 2,4tr ==> Đăng ký ngay

Thứ Bảy, 25 tháng 5, 2013

Google phát triển cơ chế chống SPAM

Mỗi ngày, hàng triệu trang spam vô ích được tạo. Chúng tôi chống lại spam bằng cách kết hợp các thuật toán máy tính với việc đánh giá thủ công.


Cơ chế chống SPAM của google
Các trang web spam làm mọi cách để giành vị trí đứng đầu trong số các kết quả tìm kiếm thông qua các kỹ thuật như lặp đi lặp lại từ khóa, mua liên kết mà PageRank chấp nhận hoặc đặt văn bản ẩn trên màn hình. Điều này ảnh hưởng không tốt tới tìm kiếm vì các trang web có liên quan bị vùi lấp và sẽ không có lợi cho những chủ sở hữu trang web chân chính do trang web của họ sẽ trở nên khó tìm hơn. Tin tốt là các thuật toán của Google có thể phát hiện phần lớn spam và tự động giảm hạng. Đối với những spam còn lại, chúng tôi có nhóm đánh giá trang web theo cách thủ công.
Chống SPAM của google

Xác định spam 

Các trang web spam xuất hiện dưới nhiều dạng khác nhau. Một số trang web là văn bản vô nghĩa được tạo tự động mà con người không thể hiểu. Tất nhiên, chúng tôi cũng gặp các trang web sử dụng kỹ thuật spam tinh vi hơn. Hãy xem các ví dụ về “spam thuần túy” là các trang web sử dụng kỹ thuật spam rõ rệt nhất. Đây là luồng ảnh chụp màn hình spam trực tuyến mà chúng tôi đã nhận dạng được theo cách thủ công và gần đây đã bị xóa khỏi các kết quả tìm kiếm.

Các loại spam 

Ngoài các spam đã nêu ở trên, dưới đây là một số loại spam khác mà chúng tôi phát hiện thấy và xử lý.

Kỹ thuật che giấu và/hoặc chuyển hướng lén lút 

Trang web dường như đang sử dụng kỹ thuật che giấu (hiển thị nội dung cho người dùng khác với cho công cụ tìm kiếm) hoặc đang chuyển hướng người dùng đến trang khác với trang mà Google thấy.

Trang web bị tấn công 

Một số trang trên trang web này có thể đã bị bên thứ ba tấn công nhằm hiển thị nội dung hoặc các liên kết spam. Chủ sở hữu trang web phải thực hiện hành động ngay lập tức để làm sạch trang web của họ và sửa bất kỳ lỗ hổng bảo mật nào.

Văn bản ẩn và/hoặc nhồi nhét từ khóa 

Một số trang có thể chứa văn bản ẩn và/hoặc bị nhồi nhét từ khóa.

Tên miền trỏ hướng 

Tên miền trỏ hướng là các trang web giữ chỗ với rất ít nội dung duy nhất, do vậy Google thường không đưa các trang web này vào kết quả tìm kiếm.

Spam thuần túy 

Có vẻ như trang web sử dụng các kỹ thuật spam có tính công kích chẳng hạn như nội dung vụn vặt, che giấu, văn bản vô nghĩa được tạo tự động từ các trang web khác và/hoặc vi phạm nghiêm trọng hoặc tái vi phạm Nguyên tắc quản trị trang web của Google.

Nhà cung cấp DNS động và máy chủ lưu trữ miễn phí gây ra spam 

Trang web được lưu trữ bởi dịch vụ lưu trữ miễn phí hoặc nhà cung cấp DNS động chứa một phần đáng kể nội dung spam.

Nội dung nghèo nàn có ít hoặc không có giá trị gia tăng 

Có vẻ như trang web bao gồm các trang có chất lượng thấp hoặc hời hợt không cung cấp cho người dùng nhiều giá trị gia tăng (chẳng hạn như các trang liên kết nghèo nàn, trang ngõ, các trang web giống nhau hàng loạt, nội dung được tạo tự động hoặc nội dung được sao chép).

 Liên kết bất thường từ trang web 

Google đã phát hiện ra một mẫu các liên kết bất thường, nhân tạo, giả mạo hoặc nhằm mục đích thao túng xuất phát từ trang web này. Đây có thể là kết quả của việc bán liên kết mà PageRank chấp nhận hoặc tham gia vào các mưu đồ liên kết.

 Spam do người dùng tạo 

Có vẻ trang web chứa nội dung spam do người dùng tạo. Nội dung có vấn đề có thể xuất hiện trên các trang diễn đàn, các trang lưu bút hoặc tiểu sử người dùng

Nguồn: google.com

0 nhận xét:

Đăng nhận xét