近期360搜索算法更新较为频繁,从悟空算法到后羿算法,简直就一神话套装呀。那么下面来纷纷看看他们是起到什么作用的吧。
悟空算法
首先是悟空算法,互联网上针对网站的各种黑客攻击日趋严重。网站被黑后,在搜索结果中将无法展现正常的标题和摘要,取而代之的是博彩、色情等不良内容,对网站在搜索引擎中的排序、网站流量、声誉和用户体验都会造成极其恶劣的影响,背后隐藏的各种欺诈、钓鱼行为会严重损害网民利益。
针对网站被黑现象,基于360公司业界领先的安全技术和安全数据,360搜索研发并上线了“悟空”算法,可以快速准确地识别针对网站的各种黑客攻击行为,及时发现被黑网站,有效减少网站被黑的不良影响,保护网站安全。
360搜索致力于为网民提供安全可信的搜索结果,新上线的“悟空算法”,将与360安全卫士、360浏览器等安全产品一起,全方位保护上网用户安全,避免遭受被黑网站伤害。
360搜索反作弊团队方面表示,已正式上线“悟空算法”,这一算法主要是针对网站被黑后无法正常在搜索结果页中展示标题和摘要的情况。据官方表示,悟空算法能自动识别被黑网站,防止博彩、色情信息给网站造成不良的影响。
后羿算法
后羿算法它主要的功能就是保护原创,“原创+转载+信息分类聚合”已经成为互联网新闻网站的最常见内容产出模式,比如新浪、搜狐、网易这些传统门户,和今日头条等移动APP。原创内容保证了网站的独特性,而转载内容保证网站信息的足够全面,大量的分类聚合工作,让互联网信息条理清楚类目分明。
12月26日,360搜索发布站长公告,宣布上线抑制采集保护原创的高级算法“悟空算法”,该算法将对低劣的采集站点加以控制,对原创和稀缺性网页进行保护和提权。360搜索表示,愿与无数专心做好站的站长共同建设良好的互联网生态环境
“后羿算法”上线后,对于内容丰富的优质网页(如原创、稀缺资源、精心编辑的内容页等),会增加其在用户面前展现的机会;对于滥用采集手段的行为(如整站大规模采集,页面内容拼凑、含有大量广告干扰用户阅读、恶劣弹窗跳转、大量堆砌无关热词、站内搜索结果页等),会显著降低其展现机会和网页收录量;对于新闻网站正常的转载行为,采取了合理引导和规范控制,而不是一棒子打死。
据悉,后羿算法采取了业界领先的大规模并行机器学习算法,通过亿万维度特征的刻画,结合对搜索领域问题的不断探索和实践,对海量文本数据进行主题和内容倾向性分析,对用户喜好程度进行全面建模和应用,能够对原创信息进行快速而精准的鉴别,能够对采集行为和垃圾网页进行定向的约束和管控。
360搜索一直以来都掌握着采集类站点的完整索引量和历史行为模式,并对之进行长期的密切的关注和监控,一旦发现有恶劣作弊倾向就会进行严肃处理,用“后羿“命名该算法,就是为了秉承了英雄后羿的“去除冗余,除暴安良”精神。
其算法就不应该叫后羿算法,觉得如来算法更恰当,还记得六耳猕猴(假悟空)如来被收,那能更好而又恰当的形容原创与抄袭逻辑。
除此之外,下一个算法上线会是筋斗云吗?加速算法,对于服务器特别慢影响用户体验的站点一定的惩罚,或者是其他神话名词。只能360的算法名称是要上天了呀!(以上内容纯属吐槽)
原创内容来自胡多钱,转载请注明
作者简介:胡多钱果批网创始人,自媒体人,科技媒体