做了近五、六年的优化技术。我又是专攻底层搜索技术为主的。所以很大多人问我,底层技术是什么?
这是个很好的问题。所谓的底层技术,就是各家搜索共性的和普遍的基础排序算法的技术。
各家搜索引擎都是由上百甚至数百个算法在支持倒排表的结果。 其中的算法分为几类:
(1)第一类就是底层算法:
作为搜索的倒排计算的最底层的算法,给出了每个页面的基础权重值。
底层计算的根本是三块,第一块是文档,第二块是链接,第三块是反作弊。
文档指的是该页的所有纯字符串的集合,文档底层的权重赋值
(1)比特值的高低
(2)访问人数的多少
(3)节点结构的丰富度
(4)该文档主题的分类多样性
(5)该页面的访问停留时间
链接的计算,首先分出外部和站内的链接,在计算出该页迭代结构和关系,由这些样本进行深入的权重赋值计算。
反作弊计算
例如:文档的权重值 链接的权重值 以及节点的权重值。
(2)第二类就是个各家搜索的差异算法:
例如:google的PR值计算赋值多层迭代计算的赋值。
(3)第三类就是过滤计算:
这个百度比较严格(由于国情因素):
例如:百度对文档严格的计算 色情信息的过滤计算……
(4)第四类时效性赋值计算:
例如:最新发布的数据权重递增值。这个简单的信息论道理,新数据比特质是最高的。
作者:江西SEO曾庆平
版权所有。转载时必须以链接形式注明作者和原始出处。请大家尊重原创,珍惜别人的汗水!