为什么你的原创文章不被百度收录而别人的伪原创却圈粉无数

不少自媒体作者有这样的感受:我的文章是原创的怎么没被百度收录?我的个人网站首发的文章没收录,为什么别人转载去却收录了?别人的网站转载了我的原创文章排名为什么比我的还高……很多辛苦坚持原创的朋友们一直被困扰着!

之所以出现这种情况,主要还是大家伙对于“原创”二字的定义和搜索引擎对“原创”的定义有差别。这篇文章将通过”狭义”和”广义”两个方面来诠释一下搜索引擎眼中的“原创”二字。

狭义的原创

对很多用户来说,原创即自己写的内容。对搜索引擎来说这是狭义的原创,也正是这个狭义的原创让他们对搜索引擎公平性产生怀疑,总觉得搜索引擎对自己另眼相看,而对大站无比眷顾。

但事实并非如此,在狭义的“原创“概念里有2点需要澄清:

1、原创内容并非优质内容

从字面意思上来看,原创就是自己亲自撰写编辑的内容,自己在官网或各大平台首发的内容。但是,原创并非优质!

搜索引擎之所以喜欢原创,主要是想把优质的不重复的内容展现给用户。如果仅仅是原创,而并不优质的内容,同样不是搜索引擎想要的内容。因此,一定要清楚,搜索引擎要的是优质内容,而不仅仅是简单粗略的原创。

搜索引擎是机器,能鉴别内容是否优质吗?百度等搜索引擎也在从技术上提高鉴别优质内容的能力,专门从内容角度去考虑是否对用户有帮助。因此,一定要在原创的基础上创作优质的内容,搜索引擎才更喜欢。

2、原创内容并非单指文字

搜索引擎的蜘蛛抓取一篇文章,是从整个页面的HTML进行的。而并不是跳开程序,去简单的抓取几段文字这么简单。所以说你的原创文章没有收录,也并不一定是你的文章不优质,而是你的整个网页对搜索引擎来说还不够优质,所以这篇优质的文章嵌套进这个网页后塑造出来的这个页面,对搜索引擎有可能并不友好。

而别人转载去却收录了,是因为你的这篇文章嵌套进其他网站的页面后,文章和别人家页面的头部、页脚、右侧栏、图片、相关推荐、简洁规范的代码等优质模块相结合,塑造出了一个全新的优质页面。而这个优质页面是搜索引擎需要的。 (虽然文章内容差不多,但在搜索引擎看起来确实另外一个更美的人;大爷还是曾经的大爷,大妈已经不是当年的大妈了)。

所以,很多人会把自己的文章发布到一些权重比较高的平台,增加百度收录的概率,也正是这个道理!目前来看,对百度搜素比较友好的平台有:新浪博客、百家号、搜狐自媒体、豆瓣、天涯论坛等等!

广义的原创

广义的“原创”,是一个价值体现的问题。广义的原创可以是借鉴别人的思想做了二次加工,但是从内容角度上来说有实际的价值!所以广义原创是一种价值的塑造!

比如:一篇文章原创首发到一个日访问量几十IP的博客上,跳出率很高,用户浏览完之后不留任何痕迹,也没有任何思考和评论。平心而论,这也许是一片有潜质的爆文,但是却没有爆发,从价值角度来说,这篇文章的价值不高!

但如果他被一个日均IP几万甚至几十万的大号转载之后,网民纷纷回复,展开各种讨论。从内容本质上来讲,回复内容给这篇文章增加了新的知识点,新的内容拓展。因此,对搜索引擎来说,这篇文章转载过后,进行了二次加工,相当于塑造出了一篇新的原创内容。

一篇文章,无论多优质,发布到一个每天只有几十个IP的个人博客上,意味着什么?意味着这篇文章只能给几十个人带来潜在价值。而同样这篇文章被一个几万甚至几十万流量的大网站转载之后,将有上万人阅读到这篇文章,也就是说,如果这篇文章真的很有用,那么将有上万人会收益。而这恰恰是搜索引擎存在的意义:搜索引擎是一个服务于广大用户的平台,它希望挖掘更多优质内容给更多的用户带来潜在价值。

所以,如果你站在搜索引擎的角度去思考,就能理解为什么你辛苦写的原创文章排名不高,而一些大站通过各种转发却能带来大量的流量!不是你不够优秀,而是在搜索引擎看来你在互联网上不够强大!

如何让自己的原创文章尽快收录、排名更靠前?

1、如果是自建网站

首先,对原创文章要做到条理清晰、图文并茂、段落分明,真正做到原创并优质;

其次,对该页面进行整个页面的优化,从代码,到页面结构等多方面进行规范,减少页面打开时间等;

再次,页面的附带模块不能过多,太多会导致原创内容在整个页面的量被稀释,如果原创内容字数较少,很容易被搜索引擎判断为该页面没有更新。

最后,在做网站模板时,要考虑到相关文章的内部链接的相互推荐,可以通过已经收录的页面引导蜘蛛去爬行新的原创页面。

2、多平台分发

如果自己没有网站,尤其是现在的自媒体时代,一定要找对百度友好的平台去同步分发,比如上面提到的:搜狐号、新浪博客、豆瓣、天涯论坛以及百度系的产品:百家号、百度贴吧、百度经验等。

分发平台越多,百度收录概率越大,排名靠前概率越大!

3、文章优质

当然,最最重要的点依然不要忽略,那就是原创文章+优质内容!

更多关于互联网和自媒体的干货资讯,欢迎和“张老师很来斯”沟通!

我是如何做到新网站新域名3天之内被百度收录的

  一个网站上线之前和上线之后应该做什么,不应该做什么,尤其在网站优化角度,今天长沙网站建设公司征帆网络就给大家分享分享如何做到新网站新域名5天之内被百度收录的。

  1、每天更新2-5篇文章,至少要保持2篇原创,字数不少于500字,图文并茂最好。我们之前有写过一篇《如何坚持每天写出好的原创文章》。

  2、每天更新网站地图,网上有好多网站地图生成工具,我在这里不在累述,大家可以百度搜索一下即可。

  3、去百度站长工具提交自己的网站,看了下有个自动提交,我也测试了下自动提交,我的是liux系统,所以用了下命令,不知道自动提交对收录是否有帮助,但也只是测试了10条而已,以后嫌麻烦没有再做。

  4、最好安装百度统计代码,理论上应该能吸引蜘蛛过来爬网站。

  5、我没有发任何外链,发过一次也只是抱着测试会否被删的心理,没想到被秒删。

  6、上线后最好不要修改网站主题,标题,关键词。

  7、做好robots.txt文件

  8、服务器要稳定。

  9、做网页zip压缩,我的web服务器是nginx,所以直接用nginx配置的压缩。

  10、网站尽量不要js跳转,尽量保持a连接跳转,我网站上线第三天把所有js异步请求全部改成同步的a连接了。

  11、网站做好301,404,500等错误提示,301跳转很重要

  12、我每天会观察百度蜘蛛爬取网站情况,根据蜘蛛爬取分析网站哪里做的不好,修改成蜘蛛喜欢的界面。

文章来源:征帆网络 本文地址:2018/20180910A/T2619033

SEO之批量查询百度收录脚本Python源码

SEO批量查询百度收录脚本说明:

1、批量查询百度收录。统计收录率、收录数据共多少条,未收录数据共多少条;2、脚本需先列出待查URL,把URL文件跟脚本文件放到同一个文件夹即可;3、查询过程是遇到验证码会停止N分钟,不用管,会自动继续运行。

懒得换图了

代码中test.txt :待查询URL的列表文本,一行一个URL;

另外:Python的缩进要求是强制的,因为缩进不对直接影响了代码逻辑,所以如果要使用代码请自行根据代码逻辑缩进!还有需要安装的python库自行百度安装!

下面为大家把代码贴上,可自行复制到txt或者使用notepad粘贴进去另存为***.py(注意:脚本后缀为.py)

运行时直接写命令:python ***.py 即可!

新手注意:复制代码最好使用PC端,我在发布内容时发现移动端预览无缩进,懂代码的略过即可!

#encoding=utf-8

#批量查询百度收录。统计收录率、收录数据共多少条,未收录数据共多少条

import urllib,time

import StringIO

import pycurl

def get_baidu_html(url):

html = StringIO.StringIO()

c = pycurl.Curl()

myurl=”http://www.baidu.com/s?wd=%s”%url

c.setopt(pycurl.URL, myurl)

#写的回调

c.setopt(pycurl.WRITEFUNCTION, html.write)

c.setopt(pycurl.FOLLOWLOCATION, 1)

#最大重定向次数,可以预防重定向陷阱

c.setopt(pycurl.MAXREDIRS, 5)

#连接超时设置

c.setopt(pycurl.CONNECTTIMEOUT, 60)

c.setopt(pycurl.TIMEOUT, 300)

#模拟浏览器

c.setopt(pycurl.USERAGENT, “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)”)

#访问,阻塞到访问结束

ret = c.perform()

#输出网页的内容

ret = html.getvalue()

if “百度为您找到相关结果” in ret:

print url,’成功被收录’

return 1

elif “检查输入是否正确” in ret:

print url,’未收录’

return

elif “http://verify.baidu.com” in ret:

print “查询过程出现验证码”

time.sleep(300)

return

if __name__==”__main__”:

urls=open(‘test.txt’,’r’).readlines()

oknum=0

lostnum=0

for url in urls:

#print url.strip() #ctrl+/

if get_baidu_html(url.strip()):

oknum+=1

else:

lostnum+=1

print ‘收录率:’,float(oknum)/(oknum+lostnum)*100,’%’

print “收录数据共 %s 条”%oknum

print “未收录数据共 %s 条”% lostnum

seo

我是尔东,一个不太合格的SEO从业者!

这两类域名很少被百度收录买错的朋友赶紧改

很多朋友会有这样的问题:自己的网站已经上线三个月了,还是没有被收录,检查了一下,网站的文章图文并茂的,关键词布局也挺合理的,到底是什么原因呢?

域名收录

问题可能就在于你选的域名了!

我们常见的域名有.com/.cn/.edu/.gov等等,除了教育类和政府网站之外,我们见到最多的就是.com/.cn了,但是我们注册域名的时候,会看到很多后缀的域名,价格也是差别很大,像我,图便宜,就随便注册了一个.top的域名玩玩。

1、top域名

但是我的老师告诉我,劝我不要用这个域名,因为这个域名不好收录!

.top的域名在百度看来,是很多站长做站群用的,因为便宜,成本低,也是很多不法网站的温床,所以如果你也是.top的域名就要小心了,建议及时更换!

2、中文域名

现在市面上还出现了很多的中文域名,大家也不要使用,很多搜索引擎并不能正确识别中文域名,尤其是国外的一些网站,当然,中文域名作为一个新事物,未来在国内会有所放开,但是主流域名还是国内搜索引擎的最爱!

当然,想要网站早日被收录,重要的还是要做好基础工作,把SEO优化做到位,但是这些小的方面大家也是要注意的

如何快速让百度收录阿里1688诚信通店铺

在生意经看到一位商友说他的阿里巴巴店铺终于被百度收录,他感到非常高兴。他还在内容说到他店铺有时候会掉到第二页去。我后面自己也去查一下,当时确实是掉到了第二页。我也在评论区看到有的商友说他的店铺都没有被百度收录,问有没有方法可以教教他。在这里,我就跟大家讲讲如何快速让百度收录咱们阿里巴巴旺铺。

做SEO优化的站长都知道搜索引擎的原理主要是四个步骤:抓取-过滤-存储索引库-展示排序。我们简单理解一下就好,意思就是百度蜘蛛首先抓取我们的网站,然后对我们网站的内容进行过滤,高质量的内容将会被放到索引库,然后根据各种算法把满足用户需求的网站优先展现出来。如果大家想深入了解的,可以自己百度优化指南的。

所以如果是新开的店铺,不被展示出来也是正常。但是我们可以通过向百度站长提交我们店铺的链接,吸引百度蜘蛛过来抓取我们的店铺。我们也可以将我们的产品链接提交给百度。这时你也许会问到要提交多少条比较好。这个是比较随意的,就自己喜欢。还有一点就是百度喜欢原创的高质量的内容,也就是说百度喜欢新鲜的血液,这也说明了阿里巴巴为什么不支持重复铺货。所以我们可以每天坚持上新产品,然后提交URL。

还有我们可以把自己店铺绑定顶级域名。我们很多阿里店铺的域名都是属于二级域名。绑定顶级的域名好处就是便于百度收录,而且顶级域名的权重会比二级域名的权重要高。关于什么是顶级域名,什么是二级域名,大家可以自行百度了解一下。绑定顶级域名的方法就是首先购买好域名,然后点击阿里后台-我的旺铺资料-进入官网-旺铺绑定顶级域名。

最后就是我们可以通过其他平台发我们阿里店铺的链接。例如其他B2B平台,我们可以一天注册十个B2B平台,一个月下来就差不多注册了三百个平台了。我们在B2B平台发布产品信息的时候,可以在详情页上加上我们阿里店铺的链接。还有就是假如你在搜狐,今日头条等平台发布软文的时候,在文章尾部也可以加上我们店铺的链接。这些就是做外链的一个方法。我们一定要记得高质量的外链,现在百度算法非常完整,低质量的外链会对咱们店铺有惩罚的。所以我们不能因为懒惰而去用机器或软件发外链。

很多时候,别人做得非常成功,自己做得却没有什么起色。因为别人都十分注重细节问题,而且非常认真去做。所以我们不能给自己太多借口懒惰,用心去做,最后一定会成功的!

为什么被百度收录的文章缩略图不显示

  郑州seo阿伟的网站在经过了,网站的空间的更换程序的搬家,网站的主题的升级等一系列的改动后,发现前期被百度收录的文章相比之前的收录的图片慢慢的减少,直至后面都没有一条的收录文章展示出来缩略图。

  而在移动端额的收录文章中居然是有一篇文章是展示有左侧的缩略图的,这一点的出现严重的误导了我之前的判断,就没有和网站的robots.txt文件的书写上有错误的地方,思路就转向了在文章中的图片上的问题的检查上(图片质量 、图片的数量、图片主题内容)等因素上,发现在这些的问题上已经做过改进后,在后期收录的文化中依然是不显示左侧的缩略图。

  近日在重点研究解决这个问题的时候,在百度搜索资源的的后台检测网站的robots文件的时候,就发现在下面的有单独的网址检测框,便把其中一篇的文章中的地址附在上面检测,所反馈出的结果居然是禁止的状态仔细检查网站的robots文件之后发现存在文章图片的目录是设置为Disallow的状态,这一下就找到先关的原因了,对于这个小问题已经做出修改,暂时看不到更改后的效果,等待下一次网站快照的更新!

  

  百度收录文章左侧的缩略图作用:

  搜索引擎在收录网页文章中,对已经建立索引的文章当触发网民的搜索关键的时候便会被展现在页面的所有结果的列表中。在搜索的展现结果的左侧中(除去商业推广的结果除外,此处的结果缩略图片可在竞价的后台中认为的设置显示指定的图片)程序会在文章中的 图片的首次出现的图片图片(高质量、符合百度图片收录要求的)展示在结果列表中,百度左侧的搜索结果展示 顶部是网址的标题 ,左侧为网页中的图片缩略,右侧则为网址的描述文字。

  这三者在理论上会同时出现在搜索结果的列表中,所展现的图片以及和文字的描述部分就是这个网页的最为简练的主题内容,往往在这三个方面上做的都很优秀的网页更加的吸引网民点击。

  也有比较特别的网站,如:“seo每日一体贴”的网站您会发现在搜索关键词所给出的结果列表中是没有左侧的缩略图的,点击文章中看到整篇文章的还没有一张图片的,看到这样的问题你也不用担心,博主Zac博客是为大家分享自己的经验,再加上本身的知名度,就可以不难理解出文章没有必要出现图片去说明问题,文章的内容均是原创,为网民展示自己在seo方面的见解和经验只求做到文章内容的条例清晰、段落主题突出、文字内容真实有用(博主已经拜读过,内容基本没有假大空)等等这些就足够了,所以并没有必要在文章中出现图片。当然因人而异你自己的文章中有没有必要去插入图片还要看自身网站的需要来定。

  为什么被百度收录的文章不显示缩略图?

  1. 百度图片优化

  图片质量清晰主题突出,图片比例尺寸接近121.75, 图片是否为原创 图片是否存在违规内容 ,图片在文中出现的位置符合文章的主题内容。

  百度在人工智能的领域上凸起,在搜索引擎上肯定会引入人工智能的技术,相应的图片识别的技术肯定会运用在图片的收录上。

  2.图片的alt标签优化

  在网站seo的优化的中的对网站的代码优化是尤为重要的一点,其中对于图片的优化则会在标签的ALT标签中的“alt=”***”是对于图片的加以说明描述,alt标签的作用 “如果无法显示图像,浏览器将显示替代文本;鼠标移上去显示为说明文字”,图片“title标签”。(优化常用的html标签有哪些?)

  3.文章中的图片在网站服务器中的空间是否被封禁

  在文章中的穿插显示图片可以显示有一个好的排版 ,文章的写作在加上主题突出的图片可使文章不显得那么的枯燥,一方面也一定程度上吸引网民在网页上的停留时间延长。

欢迎关注郑州SEO阿伟的百家号,经会为你不定期带来有关于seo优化,百度竞价 网站建设等等方面的技巧的分享

百搜测试站被百度收录的处理方法实际案例

测试站被百度收录的处理方法

某个平台的测试站xxxxx(代指测试网站)被百度收录了,这个站如果不控制,一直参与收录和排名的话会给平台带来很大的负面影响。以后我们平台的测试站,只要不是给客户看的,一律选择以下方法之一处理:

方法一

测试域名下设置robots.txt文件,放在测试站根目录,禁止百度抓取网站的任何页面

User-agent: *

Disallow: /

方法

将”nofollow”写在网页上的meta标签上,用来告诉搜索引擎不许抓取本页,也不许顺着本页抓取索引别的链接:

<meta name=”robots” content=”noindex,nofollow”>

百度收录的相关疑问事项

SEO在一些收录方面有一些网友会发现很多的怪事,就像之前的收录旧的url地址、错误网址被收录了结果导致了自己的正常网址不被收录、换了ip结果不被收录、换了ip导致百度收录不更新了等等。这里大家都会吧问题的原因归结给了百度。

这里先和大家说明一点小知识:域名和IP相当于站点的名字和身份证,IP相当于现如今的身份证,但是身份证IP地址很难记,所以就产生了域名。大多数情况下都采用域名来访问所以导致大家忽略了一个事实:最终寻址的是身份证号码也就是IP,不是域名!所以域名只是方便我们记忆,而真正的寻址的应该是IP!大家都知道域名DNS服务器在全球有N个节点,我们新域名刚解析的时候常会碰到某些区域因为DNS数据同步慢而导致访问不了的情况,而老域名换IP的时候也会碰到用户访问的还是老IP的想象。现在我们来分析一下这几个现象的具体原因在哪里:

一、地址更改还继续收录旧的URL地址

1.是否已经去除所有旧地址入口?

改版要换URL必须彻头彻尾的把所有链接替换为新的URL。为了加速生效新的链接除了站点自身链接外尽可能修改一下外部的链接,例如友情链接。

2.老的url地址是否重新在新的301转向url上?

3.百度方面

即使百度收录了旧的链接,也不必担心,因为百度对跳转属性的站点和链接识别和确认需要一定的时间,而且只要是稳定的跳转,最终都会转换成新链接的流量,当然记得通过网站改版工具及时提交改版规则。

二、测试网址被收录导致正式网址不被收录

建议大家以后测试的时候尽量环境保证本地或者在特定测试环境下才能访问

1.没有关闭测试服务器

换IP或者换URL地址的时候因为老的服务器没有关闭,而搜索引擎缓存了IP,导致搜索引擎还是可以访问到这些页面

2.没有删除IIS绑定

一般情况下搜索引擎缓存的时候较长,或者因cdn等因素导致IP同步失败的都会导致上述情况发生,更换ip以后,可以通过抓取诊断工具测试一下百度是否能够正确抓取,如果解析到的ip有误,可点击抓取诊断详情中的“报错”,通知百度更新您站点的ip。

三、IP地址更换百度不收录

百度在换IP的时候也说过尽量保证老服务器一段时间内可以访问,为什么要这样?因为服务器真的需要时间去同步内容同步IP,而且直接断了老的服务器很容易导致短时间突发404,因此会给站点造成不可预估的问题;换IP后不收录原因也是这样,因为换了新服务器数据迁移后导致老服务器的内容并没有更新,所以这个时候其实是百度根本抓取不到你的更新。因此需要通过上面的方式尽快告诉百度,您站点ip的变动,减少站点流量损失。

在大家实施操作的过程中还是有很多的不理解的问题,一般情况下这类问题都是在站长现在的未解决的误区导致的,也希望可以更好的帮助到大家。

本文由杭州华育整理,喜欢就记得点点订阅哦`(*∩_∩*)′

为什么你的页面内容总是不被百度收录

在这互联网营销的时代,百度收录对于企业来说是至关重要,百度不收录也就意味网站无法获得更多的流量,,那么是什么原因导致百度不收录内容页面呢?下面和快商通一起来看下吧!

1、内容相识度过多

作为一名合格的SEOer而言除去其他琐碎的优化外,每天更新内容是必不可少的一件功课,那么我们是否有考虑到自己所更新的内容百度会收录呢?大家都知道百度喜欢原创的内容,因此我们也不断的追随的百度的步伐,每天较劲脑汁的在写原创来维护网站,然而我们会忽略的百度对内容的抓取判断能力,有时候即使我们是一字一句的码上去,但是对于百度而言我们辛苦码出来的文章依旧还是属于伪原创,这也是导致如今很多网站内容页面不收录的问题之一。

2、网站结构相识度过多

大家都开始在百度里寻找自己中意的模板来套用殊不知相同的一种模板框架在互联网上已经被使用了千万遍,百度对于这类网站的判断能力现在也开始“关注“起来了试问下一种模板框架风格分了成千上万的网站出来,让百度如何判断那个不叫好呢?应该收录那个比较好?对于这类情况笔者也曾经测试过,因此大胆的猜测出来,不相信的你也可以自己去测试下的!

3、抄袭采集过多

前期的优化工作做好之后,每天更新的内容量并不大,往往只需要1-3篇的文章就可以满足了。快商通——在线客服也建议每天都以原创的内容去更新维护,如果做不到这点的话,可以采集部分内容,自己手动原创一部分去更新维护。

4、网站外链质量因素

外链对于优化来说至今还是至关重要的一个环节,一个网站没有外链的支撑根本的无法获得排名和权重的,更得不到推广的效果,而外链的质量却是决定网站能否得到权重的传递因素,一个好的外链可以得到大量的权重传递以及百度友好的爬行相反,一个垃圾的灌水外链,不仅得不到权重的传递更。

以上这些信息希望对广大的SEO人员有所帮助!

如何让你的小站迅速被百度收录

1、确保自己网站的内容是独一无二的,原创的。这样百度才会喜欢。你要是一上来就全是采集内容或很大一部分是采集内容,那就很可能永不会被收录,或者收录后被百度吐出来。

2、每天都要添加内容,最好数量固定,如果条件允许的话添加时间也固定,那样更好。切忌今天加10篇,明天一篇也不加。这样百度蜘蛛搞不清你到底什么时间更新,也搞不清你要更新多少,也不会喜欢你。

3、在有一定权重的网站发展外链,因为百度对那些站点比较信任,所以顺带也会对和他相连的网站也比较信任。

4、增加的外链越多,你的站被收录的越快,因为蜘蛛来你家的道路畅通了,从哪个地方都能到达你家。

5、外链数量虽然重要,但你要确保它的增长速度处于自然水平才行。不要一下子加很多。不然百度该看出来了:这小子一看我喜欢外链,肯定自己在死命地增加外链,忽悠我!百度也不傻,谁都知道正常增长是一步一步来的。

6、切忌要有耐心,如果你做到以上几点了,那收录是肯定的事。只要你坚持下去,那肯定没问题,就怕在人家考察你的时候你没耐心了,自己放弃了。那就玩了。

7、就是你添加的内容要跟你的关键字和描述一致,不能没有相关性。比如你选的关键字是减肥方面的,但内容却是建筑或者农业方面的,或许能蒙得了人家一时,却蒙不了很久。