
页面的收录是每一个SEO人员在网站优化中必备的工作,以目前国内最大的搜索引擎:百度,来讨论页面收录及权重学习。
对于很多小白或者不熟悉互联网的人,都会觉得互联网这么大,百度为什么能这么快呈现出搜索结果呢?
这就涉及到一个知识点:爬行蜘蛛,网页被搜索引擎蜘蛛爬行并保存索引,能被我们检索到时就算网页被收录了!
简单的说就是:没有收录,就不可能有排名
收录的页面才能有排名,有了排名就有可能有流量,比如:想参加美国总统选举,首先得有美国公民的身份一样
那一个页面是否被收录,在百度里搜索这个页面就可以;
如果整个网站,有多少页面被收录,如何查询?命令格式:site:+站点域名(site命令适合于百度、搜狗、搜搜等)
那收录就会有一个:百度快照
百度在不同的时间访问网站页面,并抓取收录,在访客无法打开某个搜索结果,为访客提供的之前在服务器上保存的网页内容的纯文本;
一般快照被保存多个日期版本。
那如何让百度收录,记住三点:
1、原创内容
百度更青睐内容为原创的网页,有专门计算原创源头页面的算法(绿萝算法)

2、规律性的添加内容
形成有规律性时间间隔添加新内容,例如:隔一天添加一次,每天九点添加一次,每天隔两个小时添加一篇文章,周一至周五每天添加,周六周日不添加,反例:三天打渔两天晒网懒散式的添加,第一天添加3篇隔一周后添加1篇再下周就没添加!
3、内链和外链(这点内容对于SEO是很重要的,后续给大家细分析)
当然有人会有一个问题:为什么别人的网站排名第一?
这涉及到一个术语:权重
搜索引擎认为这个页面重要性很高,一般权重比较高的网页排名靠前!
权重如今分为百度权重和谷歌权重,这两个是比较看重的权重,一个国内,一个国外。当然百度权重和谷歌权重是有一定的差距!
谷歌PR(权重简写):
PR是Page Rank的缩写,是谷歌官方提供的数值,做英文网站的站长特别重视PR值;
PR值是从0-10逐级递增,是对网页的评级;
PR值越高,谷歌搜索结果排名靠前的可能越大。
百度权重:
预估百度搜索带来的网站流量,从0-10逐级递增的;
百度官方没有此定义,由第三方统计工具(爱站和站长工具)推出,两个工具算法不一致,所以数值也可能不一致;
百度权重代表网站整体一定的流量和获得流量的能力。

影响权重的因素,从搜索引擎角度思考
页面质量:
文章是否原创/伪原创
原创文章将增加本页面和网站权重
复制文章可能受到搜索引擎的降权处罚
链接的数量和质量
导出链接和导入链接
用户体验:越来越重要的影响因素,这点也是百度如今特别注重的一点
网站是否规律更新
服务器质量,网站打开速度(响应速度)
网站页面一般分为三类:
首页、频道页、内容页,这三类权重也是前者大于后者,首页权重是最高的