seo攻略兵在搜索垃圾邮件检测技术及过滤

  微软的伊戈尔·罗德尔,BinG索引质量团队的首席开发经理发表了BinG搜索一个博客张贴博客命名为网络垃圾邮件过滤。在帖子中,伊戈尔股份兵如何去有关检测,处理,并从他们的索引过滤掉垃圾邮件搜索。

  秉轮廓他们用发现的方法的一些方法算法然后过滤内垃圾等。它们包括:

  访问的内容的质量:兵解释说:

  这本身是一个庞大而重要的概念,我们将深入探讨了在未来的博客。在高级别,提供垃圾邮件发送者的首要目标是要推动广告和会员点击,页面的内容是很重要的只是,它有助于促进对该目标的程度。换一种方式,垃圾邮件发送者产生针对搜索引擎和他们的算法的内容,而合法的上市公司增发为他们的客户的内容。其结果是,在大多数情况下,垃圾邮件的页面有内容不足,有限的对用户有价值。我们利用这一点来帮助检测。有数以百计,如果不是数千,用来做这种评估的信号,从喜欢的页面字数简单的事情,内容的独特性和实用性的更复杂的概念。

  在广告的网页上存在秉外观:兵解释说:

  只是在网络上的每一页含有广告。广告的存在不会使页面不好,更不用说垃圾邮件。我们所关注的是像一个事情)有多少广告的网页,B)什么类型的广告(五上会出现。g。横幅,灰色接管,弹出窗口),以及c)如何入侵/破坏他们。

  还秉着眼于信息的页面上的位置和布局。冰解释说:

  其中的主要内容是位于? 位于何处广告? 广告是否能肩负起主要的房地产或者是他们从整齐的主要内容分离开(E。g。在页眉/页脚或侧窗格)? 它是便于用户从广告精神上单独的内容?

  兵解释说垃圾邮件发送者通过使用内容生成技术迅速“最大化网络的存在”通过大规模的内容生产(一)复制使用外部API来其他内容(无论全部或小的调整),b)使用程序自动生成页面内容,C)填充他们与非唯一内容页。通过使用“创造性的聚类算法”来检测这些尝试秉抵消这些努力。

  冰补充说,垃圾邮件发送者使用其他的方法,如)馅页面正文/ URL /关键字通过链接工厂,链接网络,论坛帖子的滥用和c)包括在页面上隐藏的内容并不意味着人类食用执行链路操作锚,B)。为了抵消这些,兵使用算法来寻找的网络内容离群如果事情看起来不自然,可以检测。对于链接操作,兵可以使用他们的网络图形(页/网站的反向链接和出站链接)来识别可能存在的联系操纵。

  必应采取不同程度的行动上的垃圾,他们发现包括:(a)降级的页面,(B)中和特定邮件技术的影响或(c)去除页/网站进行索引的所有在一起。行动的水平取决于)所涉及的邮件技术和b)的潜在价值的页面呈现给用户的程度/ egregiousness。

  有关这方面的更多详情,请参阅兵站长博客。

要发表评论,您必须先登录