知名搜索引擎 Ask-com 服务器日志意外公开 泄漏 237-9GB 搜索记录

近日知名英文搜索引擎 Ask 因未知原因导致其 Apache 服务器状态面向公众公开,几乎所有人都能看到 Ask.com 上的实时搜索记录 。

这一问题由研究员 Paul Shapiro 在本月 7 号发现,目前尚不清楚这些数据对外公开了多久,而分析显示 Ask 服务器曾在三天前重新启动,或许就是在重启之后服务器页面才被意外地暴露。

据统计,被公开的页面显示了服务器重置以来人们搜索的所有细节 —— 440 万条大约 237.9GB 的搜索记录等等。

所幸,这并非安全威胁。虽然通过日志能够清楚看到人们在搜索着什么,但这一页面并未暴露用户 IP 等进一步隐私信息 。事实上,日志中记录的均是内部 IP 地址,亦有可能是内部防火墙地址。

目前,被暴露的搜索记录页面已无法访问。

世界十大搜索引擎巨头 他们分别做什么业务

世界十大搜索引擎巨头,他们分别做什么业务?

1 Google 62%

谷歌公司(Google Inc.)成立于1998年9月4日,由拉里·佩奇和谢尔盖·布林共同创建,被公认为全球最大的搜索引擎。谷歌是一家位于美国的跨国科技企业,业务包括互联网搜索、云计算、广告技术等,同时开发并提供大量基于互联网的产品与服务,其主要利润来自于AdWords等广告服务。1999年下半年,谷歌网站“Google”正式启用。2010年3月23日,宣布关闭在中国大陆市场搜索服务。2015年8月10日,宣布对企业架构进行调整,并创办了一家名为Alphabet的“伞形公司”,成为Alphabet旗下子公司。2015年,在2015年度“世界品牌500强”排行中重返榜首,苹果和亚马逊分别位居第二和第三名。2016年6月8日,《2016年BrandZ全球最具价值品牌百强榜》公布,以2291.98亿美元的品牌价值重新超越苹果成为百强第一。2017年2月,Brand Finance发布2017年度全球500强品牌榜单,排名第一。2017年6月,《2017年BrandZ最具价值全球品牌100强》公布,谷歌公司名列第一位。

2 雅虎 12.8%

雅虎(Yahoo!,NASDAQ:YHOO)是美国著名的互联网门户网站,也是20世纪末互联网奇迹的创造者之一。其服务包括搜索引擎、电邮、新闻等,业务遍及24个国家和地区,为全球超过5亿的独立用户提供多元化的网络服务。同时也是一家全球性的因特网通讯、商贸及媒体公司。雅虎是全球第一家提供因特网导航服务的网站,总部设在美国加州圣克拉克市,在欧洲、亚太区、拉丁美洲、加拿大及美国均设有办事处。雅虎是最老的“分类目录”搜索数据库,也是最重要的搜索服务网站之一,在全部互联网搜索应用中所占份额达36%左右。所收录的网站全部被人工编辑按照类目分类。其数据库中的注册网站无论是在形式上还是内容上质量都非常高。2003年3月,雅虎完成对Inktomi的收购,成为Google的主要竞争对手之一。雅虎有英、中 、日、韩、法、德、意、西班牙、丹麦等 12种语言版本,各版本的内容互不相同。提供目录、网站及全文检索功能。目录分类比较合理,层次深,类目设置好,网站提要严格清楚,网站收录丰富,检索结果精确度较高。2015年雅虎已成为“全球第三大移动广告公司”。2016年7月25日,美国电信巨头Verizon(威瑞森)以48亿美元收购雅虎核心资产。2016年9月22日,美国雅虎公司承认,这家企业与至少5亿用户相关的信息遭人窃取,涉及用户姓名、电子邮箱、电话号码、出生日期和部分登录密码。雅虎发布公告,确认失窃事件发生在2014年下半年,失窃信息取自雅虎网络系统。

3 百度 5.2%

百度(纳斯达克:BIDU),全球最大的中文搜索引擎、最大的中文网站。1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,他毅然辞掉硅谷的高薪工作,携搜索引擎专利技术,于 2000年1月1日在中关村创建了百度公司。“百度”二字,来自于八百年前南宋词人辛弃疾的一句词:众里寻他千百度。这句话描述了词人对理想的执着追求。百度拥有数万名研发工程师,这是中国乃至全球最为优秀的技术团队。这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

4 微软 2.9%

微软,是一家美国跨国科技公司,也是世界PC(Personal Computer,个人计算机)软件开发的先导,由比尔·盖茨与保罗·艾伦创办于1975年,公司总部设立在华盛顿州的雷德蒙德(Redmond,邻近西雅图)。以研发、制造、授权和提供广泛的电脑软件服务业务为主。最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office系列软件,目前是全球最大的电脑软件提供商。

5 NHN 2.4%

NHN曾是韩国第一大门户集团,也是目前韩国国内股价最高的游戏集团。在2001年由Naver和Hangame两家公司合并而成,其麾下的Naver是韩国使用率最高的搜索引擎,在韩国的地位就相当于国内的百度,屡屡使Google在韩国受挫。而Hangame本身则是门户网站和游戏运营平台的综合体,类似于今天国内的腾讯。2013年Naver和Hangame分离, Hangame成立了独立的在线游戏公司,名称沿用了之前的nhn, 后面加了娱乐,NHN娱乐,同年8月独立上市。

6 eBay 2.2%

eBay(EBAY,中文电子湾、亿贝、易贝)是一个管理可让全球民众上网买卖物品的线上拍卖及购物网站。ebay于1995年9月4日由Pierre Omidyar以Auctionweb的名称创立于加利福尼亚州圣荷西。人们可以在ebay上通过网络出售商品。2014年2月20日,eBay宣布收购3D虚拟试衣公司PhiSix。2017年6月6日,《2017年BrandZ最具价值全球品牌100强》公布,eBay名列第86位。

7 时代华纳 1.6%

时代华纳(英语:Time Warner Inc.)是美国一家跨国媒体企业,成立于1990年,总部位于纽约。其事业版图横跨出版、电影与电视产业,包括时代杂志、体育画报、财富杂志、生活杂志、特纳电视网、CNN、HBO、DC漫画公司、华纳兄弟、等具有全球影响力的媒体皆为旗下事业。2012年财富世界500强排行榜排名第381名。2000年美国在线(AOL)与时代华纳合并为美国在线时代华纳,2009年美国在线和时代华纳分拆。时代华纳是互联网时代媒体与娱乐公司,2014年康卡斯特以450亿美元并购时代华纳有线。2017年《财富》美国500强排行榜发布,其中时代华纳排名第95位。

8 Ask.com 1.1%

Ask Jeeves,是一种人工操作目录索引的美国著名搜索引擎,规模不大但很有特点。Ask Jeeves公司创立于1996年6月.总部设在加州桑尼维尔(Emeryville,California),麾下的 www.ask.corn是ASK公司的旗舰站。这个搜索站点以其热心的网上帮手杰福斯而闻名。Jeeves是西方20世纪30年代电影中的人物。作为一名典型的英国仆人.杰福斯先生总是能遇事不乱,有条不紊地为主人提供满意周到的服务。因此,杰福斯成了优秀仆人的代名词,并为英美大众所熟悉。ASK公司正是利用了这个家喻户晓的名字和形象,作为其搜索引擎的标志和名称。

9 Yandex 0.9%

Yandex是俄罗斯重要网络服务门户之一。据Gallup传媒,ФОМ 和 Комкон调查公司资料,Yandex是俄罗斯网络拥有用户最多的网站。2006年初每天访问Yandex的人数(包括外国访问者)达到四百万。Yandex目前所提供的服务包括搜索、最新新闻、地图和百科、电子信箱、电子商务、互联网广告及其他服务。Yandex在俄罗斯本地搜索引擎的市场份额已远超俄罗斯Google。

10 阿里巴巴 0.8%

阿里巴巴网络技术有限公司是以曾担任英语教师的马云为首的18人于1999年在杭州创立,他们相信互联网能够创造公平的竞争环境,让小企业通过创新与科技扩展业务,并在参与国内或全球市场竞争时处于更有利的位置。阿里巴巴集团经营多项业务,另外也从关联公司的业务和服务中取得经营商业生态系统上的支援。业务和关联公司的业务包括:淘宝网、天猫、聚划算、全球速卖通、阿里巴巴国际交易市场、1688、阿里妈妈、阿里云、蚂蚁金服、菜鸟网络等。2014年9月19日,阿里巴巴集团在纽约证券交易所正式挂牌上市,股票代码“BABA”,创始人和董事局主席为马云。2015年全年,阿里巴巴总营收943.84亿元人民币,净利润688.44亿元人民币。

2016年4月6日,阿里巴巴正式宣布已经成为全球最大的零售交易平台。2016年7月5日,第三方应用商店“豌豆荚”宣布,其应用分发业务并入阿里巴巴移动事业群,双方已正式签订并购协议。

(数据采自2015年)

谷歌SEO搜索引擎优化入门教程

当你第一次进入谷歌SEO的世界时,面对很多要学习的知识可能会让你感到迷茫。

你可能也会考虑到很多专业优化人员已经在外贸网站优化中工作了十多年,随着Google推出新的更新,他们不断学习新的东西。很明显,开始有一条学习曲线,充满了对未知的探索,

当你超越了这个曲线时,你可能感觉到一个瓶颈,但在你感到不知所措之前,你应该明白,虽然SEO涉及很多知识,但每个组件本身并不是特别复杂; 如果你把SEO的知识归类,那实际上是非常可学的。

谷歌SEO涉及的九个方面

  • 全局观察

在开始进行外贸网站优化排名SEO之前,先退后一步,了解SEO的“全局”。SEO的目标是优化网站,使其在与行业相关的搜索中排名更高; 有很多方法可以做到这一点,但几乎所有事情都归结为提高网站的相关性和权威性。网站相关性衡量网站内容对于搜索结果的恰当程度(可以通过关键字选择和内容创建进行调整),网站的权威性则衡量Google如何看待网站(可以通过入站链接,品牌提及,高质量内容以及可靠的网站指标)。

  • 域权限和页面权限

接下来,应该了解域权限和页面权限,以及它们如何预测网站的搜索排名。这是基本的操作办法;网站的域名授权是由Moz提供的分数,即域名的“可信”程度。它是根据网站入站链接的数量和质量来计算的。网站权重值越高,网站中的所有网页权重越高,可能会在自然搜索结果中排名更高。页面权重跟网站权重非常相似,但是页面是可以修改的特定网页,可以使用它来设计一个链接架构,从战略上有利于某些网页。权重取决于入站链接的权重和数量。

  • 网站内部优化

网站内部优化是一个循序渐进的工作,其中大部分都很容易的,比如优化标题和元描述和包含一些目标关键字,确保网站的代码干净简洁,并在每个页面上提供充足的相关内容。

尽管内容营销可以被看作是一种独特的方法,但我认为它是SEO最重要的方法。只有随着时间的推移开发高质量的内容,才能够针对目标关键字进行优化,累计网站的权重值,并进行客户活动的策划。

  • 链接建设

友链建设是一种不错的外链建设方法,而且对提高网站的相关性有很大的帮助。我们一般是在外部网站上创建内容,同时建立个人品牌和公司品牌,并创造机会链接到自己网站。外链建设要注意打造高质量的外链,有时候这样要比建设几千条垃圾外链有作用。

  • 进行网站数据的测量和分析

网站优化的任何时期数据分析都是非常重要的,他能帮助我们了解网站的现在的情况,并且有助于指导我们下一步的操作思路和方法,一般对于新手来说谷歌分析是一个不错的选择。请记住任何时期,数据分析都是必须要存在的。

  • 关键词研究

特定的目标关键字有时候对谷歌SEO的成功并不重要,因为Google的搜索是通过语义和上下文理解来加强的,但是我们仍然有注意关键词的选择,包括长尾的精确关键词,广泛词的选择,只有正确的选择对了才能引导客户到我们的网站。

  • 技术SEO

技术SEO是SEO知识库中最令人恐惧的部分之一,但它是必不可少的一部分。不要让这个名字吓倒你; 即使你没有任何编程或网站开发经验,也可以学习SEO的最技术元素。例如你可以轻松了解如何更新和替换网站的robots.txt文件,并且借助SEO插件,应该可以高效地将网站地图做出来。

  • 故障排除和调整

在做谷歌SEO的头几年里,你几乎肯定会遇到与其他人相同的问题和挑战; 你的排名也许会稳定,你会在你的网站上发现重复的内容,你可能会看到显着的排名波动。这个时候就需要了解对网站故障进行排除的方法。

其实不一定要按顺序学习这九个SEO知识,但是他们应该包括在谷歌SEO的知识中,只要记住; SEO理论是比较容易掌握的,但如果你想磨练你的技能和学习更多关于SEO的知识,你需要把这些理论运用起来来获得更多的经验。

更多外贸seo知识请关注微信公共号:waimaoseo

或者留言给我们。

(2018年第一季度)国内搜索引擎市场份额

2018年,国内搜索引擎市场份额报告,如果你想了解各个搜索引擎服务商市场占比,可以带来一些帮助。

百度国内市场份额为82.99%,排名第一(即最大);

360搜索第二,市场份额为7.35%;

搜狗搜索第四,市场份额为3.60%;

神马第三,市场份额为3.19%;

Google第五,市场份额为1.41%;

必应第六,市场份额为1.02%;

其他搜索引擎的市场份额为0.44%。

国内搜索引擎的PC端市场份额(Platform:Desktop):

百度 60.88%;

360搜索 27.52%;

Google 3.74%;

搜狗搜索 3.43%

必应 3.24%……

Desktop Search Engine Market Share China

国内搜索引擎的移动端市场份额(Platform:Mobile+Tablet):

百度 90.43%;

神马 4.25%;

搜狗搜索 3.66%;

Google 0.62%;

360搜索 0.55%……

Mobile Search Engine Market Share China

最后总结一下,百度依然是老大,360搜索占据优势,移动端,神马搜索居首。

现如今,很多的网站推广的站长都在不断的抱怨说网站推广效果不好,其实,在整个推广的过程中,影响到推广效果的因素有很多的,并且随着互联网的发展,之前很多推广方式也都已经失效,效果确实没有之前好。SEO顾问通过2018年网络大形势分析,网站推广助力企业网站排名,引流订单其实并不难。网站推广助力企业引流订单 网站

那么到底是什么原因导致现在很多推广站长会觉得网站推广越来越难做?分析以下几点原因,仅供参考。互联网还没有现在这么有知名度的时候,大部分企业都没有网站,即便有网站,也并未意识到SEO优化,竞价,外推等这些的重要性,自然竞争力较小。但是,现在就不同了,现如今就连个人都开始建设自己的网站,而且建站公司为了提升自己的核心竞争力,也会主打SEO网站、营销型网站,再加上网上公司的不但增加,而且质量越来越好,推广人员的推广能力也在提升,这些都加大了各个行业网络推广的竞争程度。

在互联网的今天,或许很多的人对于网站建设都不陌生,并且觉得随着互联网中网站数量的不断增加,建设一个网站应该很容易,但是应该去推广呐?很多的客户对宣传推广知识一点了解都没有,觉得最有效的推广就是花钱做百度竞价,见效快还不用费心费力,就是多烧点钱而以,如果是这个想法是对的,那么为什么SEO优化还那么受企业的爱戴呐?在百度竞价烧钱为什么不用这笔钱招一个网站推广人员呢?

现在流量ip推广不仅分散,并且花费还比之前更多,而效果还不如之前,若如今网站推广只是针对百度来推,想看到理想的效果不容易,即便如此,也不能否认百度推广是目前网站推广最主要的地方,也是推广效果最好的地方。可是,随着百度手机端弱势,很多移动端流量被其它的平台给占据了,如:微信、UC流器、360搜索,网站推广只选择一个平台不行,推广到更多平台有造成流量分散用户不精准,效果大不如从前。

移动互联网的时代,使得发布信息变得触手可及,推广最核心要素:推广内容、推广平台、推广受众。移动互联网时代,发布信息变的不再有门槛限制,一部有网络的智能手机即可推广,而这也是微商火爆的原因,因为推广门槛降低了,这也意味着参与网络推广人群数量正在爆炸式增长,网络推广难度加大在意料之中。

其次,移动互联网流量和PC互联网相比,已经达到了4:7,甚至更可怕的2:8,但移动互联网推广这块采用的还是传统的推广方式,如:QQ、微信发信息,再加上移动互联网流量增加,这也就意味着PC互联网流量将变少,而我们还在PC互联网的红海中争夺流量,这也是网络推广难度变大的另一个原因。

现实证明,现在很多企业老板,都不喜欢自己动手做,然而网站推广却是实践性极强的手艺,这手艺是要靠动手做才能学会与提升,只听不动手怎么可能学到手艺,自己一点手艺都没有,又怎么能够去监督和就检查团队的工作,说出来的话都是模棱两可的,但又无法落地执行,本质在于听的实在太多,而真正动手实践去做的实在太少。

综上所述,今天在互联网中,推广的方式和方向有很多,对于不懂推广的企业和站长而言,自然会觉得网站推广很难做,难不在渠道,而是在网站推广花费很大,都是靠砸钱来做网站推广的,小公司哪有那么多预算呀!在此,SEO顾问建议各位企业主们,不妨采用SEO优化,事实证明,SEO优化做得好,对提升企业知名度很大的帮助,能帮助企业吸引到更多新用户。

新手需知道的搜索引擎优化的五点思路

第一,精准网站的Meta信息,包含Title,关键词,网站描述。这些可谓优化的杠杆,影响非常之大,在选取网站目标关键词以及网站描述的时候一定要周全,一经确定就不要随便更改,除非有必要,更改Meta信息会引起搜索引擎对网站的信任浮动,从而影响权重和排名。

第二,合理的网站框架结构。网站的设计和布局需合理,并且以良好的用户体验为最高法则,网站形式不必追求华而不实。优化网站优化结构需要引起技术人员的重视,层次分明,符合用户的使用习惯,简单明了,指向明确,整个网站的网页形成一个符合逻辑的网络图。具体表现为:

主页链接向所有频道主页;主页一般不直接链接向内容页,除非是非常具有特色或者网站主推的特殊页面;所有频道主页都指向其他频道主页;频道主页都连回网站主页;频道主页一般不连向其他频道的内容页;所有内容也都连向网站主页;所有内容也都连向自己的上一级频道主页;内容页可以连向同一频道其他内容页;内容页可以以匹配的关键词适当指向其他频道内容页;频道形成分主题。

另外,网站设计要有互动性,文章页面有留意评**能;网站要有站内搜索功能。关于网站结构这一点,请在建站之前就周密考量,尽量不要再建成被搜索引擎收录以后再调整更改,对优化影响很大;还有,Flash页面多的网站不好优化,这一点需要注意。

第三,丰富新鲜的资讯量。这里提到两个问题,一是资讯的量,一是资讯的质。网站的内容量要足够,原创度要高,才能被赋予较高的权重,毕竟,一个内容贫乏毫无原创的网站是没有人喜欢的。

这就需要编辑不断地为网站采集新的资讯,并尽量保证原创的比重。资讯的长度和内容也很重要,一般文字至少在300字以上,内容无冗余不堆砌。首段结尾均出现关键词,标题里也要出现关键词,适度做锚文本,请记住,锚文本对站内优化的帮助是很大的,绝对不可小觑。

第四,服务器的稳定度,这个就不用说了吧,想必大家都了解,因为之前服务器曾出现两次比较大的问题,两天内网站都无法正常访问,造成的结果就是快照停止更新,收录停止,排名和权重均明显下降。服务器不稳定,一切优化工作只能是无用功。

第五,高质量外链。外链对于网站的作用众人皆知,外链的质和量均影响网站的排名和权重,也能侧面反映一个网站的成熟度,所以要坚持不断的增加外链,而且在做外链的时候,多与搜索引擎的相关产品挂钩,会被赋予更多的权重。但是,外链的增加也是有度的,是一个循序渐进的过程,不可能今日还是100,明日就成一万了,绝对会被搜索引擎盯上。外链分布范围要广,量要大,质要优,这才是我们的追求。

本文由龙猫吧网站分类目录http://dir.longmaoba.com/整理发布!

搜索引擎无内容可收录 SEO还有必要吗

搜索引擎作为搜索工具,可以让网民在海量信息中寻找自己需求的信息,然而近年来,好推建站发现不少平台不向搜索引擎贡献内容,网站站长有所减少。搜索引擎貌似无内容可收录,SEO还有必要吗?

在pc互联网时代,有大量的个人站长,有大量的专栏作家、博主在互联网上创作。对于搜索引擎来说,有大量的网站内容可收录。然而到了移动互联网时代,貌似一切都改变了。

移动互联网APP内容属于平台,搜索引擎无法获取。

越来越多的APP形成了闭环,不让搜索引擎抓取信息,特别以微信公众号为例(目前只支持搜狗搜索)。现在的很多自媒体平台也或多或少不允许搜索引擎收录。

流量和用户是平台争抢的根源,都不想自己的平台用户帮其他平台导流,都希望互联网用户在自己的平台多待一会。以自媒体为例的平台形成了自己的内容和流量闭环,搜索引擎无法很好的抓取内容。

事实真是这样吗?守护袁昆前几天发布过一条消息:根据中国互联网络信息中心2018年1月31的公告指出,目前搜索引擎还有近6亿用户在使用(网民规模7.72亿)。所以说搜索引擎还有近8成的网民在使用。

截止2017年12月底,域名总数达到3848万个,而网站数有533万个。根据不完全统计数据显示全球APP才14万个。只占网站零头的APP数真的不足以道。

虽然移动互联网时代APP有非常重要的作用,不少APP内容禁止搜索引擎收录,然而越来越多的APP也有网页版,而网页版的内容却可以被搜索引擎收录。

搜索引擎也在改变,百度做了哪些?

移动互联网时代,搜索引擎也在改变,比如目前国内排名第一的搜索引擎百度,在移动端发力非常强大,手机百度满足了移动端网民的需求。

自媒体是这个时代影响巨大的群体,所以百度推出了百家号。当然现在整合到了熊掌号:一手搜索,以网站为主;一手信息流,以百家号自媒体为主。

不少朋友都觉得搜索引擎好像无内容可收录了,好像APP都形成了内容和流量闭环。其实不然,搜索引擎的用户还是有互联网网民的8成以上,大家还是习惯于搜索。所以不管是网站、还是APP、或是各种内容表现形态,离不开搜索引擎倒是真的。

有人就有搜索,有搜索就有SEO优化。

为什么会搜索呢?因为信息过量,信息泛滥成灾。大家都说互联网解决了信息不对称的问题,守护袁昆觉得互联网加重了信息不对称,互联网用户不得不去各方面搜索,各方面求证。

有搜索就有排名问题,自然就离不开SEO。不仅是我们熟悉的百度SEO和淘宝SEO,还有后面出现的微博SEO,微信SEO,当然少不了现在各平台自己的内部搜索。

如何利用SEO搜索引擎提高工作效率

之前说过在互联网上95%的信息都可以通过搜索找到,即很多的信息都可以自己找到解决问题的答案。

本文应该属于科普篇,做外贸的,做跨境电商的,我相信绝大多数人都懂得搜索引擎的指令,有效的利用搜索引擎的查询指令可以极大的提高工作的效率。比如;

竞争对手分析

可以针对竞争对手的关键词布局,外链建设,页面优化的情况,网站收录,网站权重等等都可以通过搜索引擎的指令来分析查看更多关于如何利用SEO搜索引擎提高工作效率请浏览www.guxiaobei.com的B2C博客

精确的资料查询

可以过滤不需要的信息,精确的查想要的资料,如特定的文件格式,只查找标题,链接中资料等等。

我认为下面的这些指令是所有人都应该要学会的,你将从中挖掘到巨大的宝藏。

1、双引号

把搜索词放在双引号中,代表完全匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。百度和Google 都支持这个指令。如假发的关键词搜索: “hair extension”

从搜索上来看,Hair Extension 必须是完全匹配的,不会泛搜索。使用双引号搜索可以更准确的找到特地的关键词的竞争对手。查看更多关于如何利用SEO搜索引擎提高工作效率请浏览www.guxiaobei.com的B2C博客

2、减号

有时候不想看搜索结果出来的一些关键词,那么就可以利用减号的指令来排除。比如你想查看的是苹果的手机,不想看关于苹果的电影,那么这个时候减号的作用就很有效。

减号(-)代表搜索不包含减号后面的词的页面。使用这个指令时减号前面必须是空格,减号后面没有空格,紧跟着需要排除的词。Google 和百度都支持这个指令。例如:苹果 -电影 返回的则是包含“苹果”这个词,却不包含“电影”这个词的结果

3、星号

星号是常用的通配符,也可以用在搜索中。百度不支持号搜索指令。比如在Google 中搜索:搜索*擎其中的号代表任何文字。返回的结果就不仅包含“搜索引擎”,还包含了“搜索收擎”,“搜索巨擎”等内容。

我经常有些成语忘记了,只是大概的记得2个字,那么我也会用星号来代表,如下图,我会这样查询 成语 作舍** ,如下图

这样作舍道边这个成语就被我找到了。这种方法对于经常似懂非懂的问题都可以解决的。

4、inurl

linurl:指令用于搜索查询词出现在url 中的页面。百度和Google 都支持inurl 指令。inurl 指令支持中文和英文。

比如搜索:inurl:hair extension返回的结果都是网址url 中包含“hair extension”的页面。由于关键词出现在url 中对排名有一定影响,使用inurl:搜索可以更准确地找到竞争对手。

5、inanchor

inanchor:指令返回的结果是导入链接锚文字中包含搜索词的页面。百度不支持inanchor。

比如在Google 搜索 :inanchor:点击这里返回的结果页面本身并不一定包含“点击这里”这四个字,而是指向这些页面的链接锚文字中出现了“点击这里”这四个字。查看更多关于如何利用SEO搜索引擎提高工作效率请浏览www.guxiaobei.com的B2C博客

可以用来找到某个关键词的竞争对手,而且这些竞争对手往往是做过SEO 的。研究竞争对手页面有哪些外部链接,就可以找到很多链接资源。

6、intitle

intitle: 指令返回的是页面title 中包含关键词的页面。Google 和百度都支持intitle 指令。

使用intitle 指令找到的文件是更准确的竞争页面。如果关键词只出现在页面可见文字中,而没有出现在title 中,大部分情况是并没有针对关键词进行优化,所以也不是有力的竞争对手。

7、allintitle

allintitle:搜索返回的是页面标题中包含多组关键词的文件。例如 :allintitle:hair extension就相当于:intitle:hair intitle:extension返回的是标题中中既包含“hair”,也包含“extension”的页面

8、allinurl

与allintitle: 类似。

allinurl:hair extension 就相当于:inurl:hair inurl:extension

当然也可以用下面的查询语句 inurl:hair/extension/love

9、filetype

用于搜索特定文件格式。

Google 和百度都支持filetype 指令。比如搜索filetype:pdf hair extension返回的就是包含hair extension 这个关键词的所有pdf 文件。

百度只支持下面几种文件格式:pdf,doc,xls,ppt,rtf,all。其中的“all”表示搜索百度所有支持的文件类型。Google则支持所有能索引的文件格式,包括HTML、PHP等。

10、site

site:是SEO 最熟悉的高级搜索指令,用来搜索某个域名下的所有文件。

site的指令现在不是很准确,这个只能作为参考来用.比如查询 site:anker.com 返回的是anker.com这个域名的所有页面。查看更多关于如何利用SEO搜索引擎提高工作效率请浏览www.guxiaobei.com的B2C博客

11、related

related:指令只适用于Google,返回的结果是与某个网站有关联的页面。比如搜索related:http://cnseotool.com我们就可以得到Google所认为的与点石网站有关联的其他页面。

这种关联到底指的是什么,Google 并没有明确说明,一般认为指的是有共同外部链接的网站。上面介绍的这几个高级搜索指令,单独使用可以找到不少资源,或者可以更精确地定位竞争对手。把这些指令混合起来使用则更强大。

inurl:gov 减肥

返回的就是url 中包含gov,页面中有“减肥”这个词的页面。

很多SEO 人员认为Gov和学校网站有比较高的权重,找到相关的Gov和学校网站,就找到了最好的链接资源。

或者使用一个更精确的搜索:

inurl:hair extension intitle:guest post

返回的则是包含hair extension这个关键词,标题中包含“guest post”这四个字的页面,返回的结果大部分是标题中包含guest post 并在连接中包含 hair extension

一个合格的SEO必须熟练掌握这几个常用指令的意义及组合方法,才能更有效率地找到更多竞争对手和链接资源。找外链的时候你可以用这几种命令组合,

比如:

下面这个指令:inurl:edu.cn/forum/*register返回的结果是在.edu.cn域名上,url 中包含“forum”以及“register”这两个单词的页面,也就是学校论坛的注册页面。找到这些论坛,也就找到了能在高权重域名上留下签名的很多机会

inurl:guxiaobei.com/客座博客

查询的是特定网站下的关键词搜索

再比如:

查看更多关于如何利用SEO搜索引擎提高工作效率请浏览www.guxiaobei.com的B2C博客

如果你想要org的链接,就换成site:.org,inurl:blog是指博客。“post a comment” -”comments closed” -”you must be logged in” 是指,“能够写评论的”减去“ 关闭评论的”再减去“必须要登录才能写评论的”

上面这些查询语句,如果大家熟练运用的话会对大家的工作效率有着极大提高,建议大家多经常熟悉。

作者:顾小北B2C(www.guxiaobei.com,微信公众号:guxiaobei365)是跨境电商领域权威的B2C营销专家,擅长SNS(Facebook,Instagram,pinterest,Twitter,YouTube等一系列社交营销),SEO,Amazon,分享跨境电商经验以及心得。

本文由 @顾小北原创发布于搜狐自媒体,未经许可,禁止转载。

Google和必应都无法替代的10大深网搜索引擎

当我们想要搜索某些内容时,我们第一个想到的就是打开Google、百度或必应这类的搜索引擎。但针对有些内容,却是这些常规搜索引擎无法获取到的,那就是隐藏在深网的内容。据不完全统计,深网的信息量为表层网络的500倍。那么,深网主要都包含了些什么内容呢?其实,深网主要包括的都是些,例如需要某些条件如注册、付费,才能访问的内容,如数据库和某些服务等。而常规搜索引擎通常只会对静态网页进行抓取,而对于这些存储在数据库中的内容,对其而言几乎是不可见的。其次,当我们使用Google时,Google还可能对我们的活动轨迹进行跟踪。这对于要求匿名的用户而言,也是不可接受的。

为什么Google搜索不到深网的内容?

这是因为所有的Deb网站(.onion)都是没有索引的,而正常的搜索引擎通常都是通过目标网页索引来获取内容的。因此对于没有索引的搜索结果则不会被Google所收录。此外,在搜索过程中还会和服务器建立连接,这样对我们的隐私和安全也带来了一定的隐患。

“据研究人员介绍,只有4%的互联网对公众可见,剩下的96%的网站和数据则隐藏在Deep web。”

此外,深网中还包含了许多非法内容,例如毒品,武器交易,高度成熟的黑客工具,色情,军事机密等。

robots文件

robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。robots.txt文件会告诉蜘蛛程序,在服务器上什么文件是可以被查看/禁止查看的。如果某些页面被设为不可查看,那么搜索引擎也是无法正常获取到的。

说了这么多,那么有没有既可以保证高度匿名性,又可以获取到深网内容的搜索引擎呢?下面,我将为大家推荐十款比Google,必应更加“强大”搜索引擎

1. pipl

Pipl是一款为搜索网络上的人物信息而生的搜索引擎。不同于传统意义上的搜索引擎,Pipl是专为检索“深网”上的信息而设计的。Pipl的爬虫能够与可搜索的数据库打交道,从中提取个人信息、联系方式、成员名录、科学出版物、法院记录以及其它很多“深网”内容。

Pipl目前提供五种方式搜索方式搜索特定人物:名字、Email地址、用户名、电话号码以及还处于BETA版的商业搜索。

Pipl所关注的不仅仅是找到更多的结果,它还通过高级语言分析和排名算法将与你搜索关键词最相关最匹配的结果以简单的单页形式展示给你。

2. My Life

MyLife是一个全面的成年人资料数据库,可以根据姓名、年龄、邮编等信息来查询你想要找的人。

MyLife的服务可以通过整合Twitter、Facebook、LinkedIn、Friendster和Flickr等社交网站的数据,帮助用户在互联网上找人。MyLife用户是免费注册,但如果要使用单身搜索、查看谁在搜索自己等高级功能,用户就需要付费。

MYLIFE网站还推出了一个全新的个人关系管理系统(PRM),是一个基于浏览器的服务,让用户在同一个内容流里就能看到Facebook、Twitter和LinkedIn的订阅源并进行答复、“赞”、转推等操作。

3. Yippy

Yippy是一个将多个搜索引擎信息结合在一起,然后得出统计结果的集成化搜索引擎。如果你想检索暗网的信息,Yippy便是一个不错的工具。暗网因其存储在专用网络而被屏蔽难以发现,而Yippy提供的搜索结果将帮助你发现不被传统搜索引擎检索到的隐藏网站。

4. Surfwax

SurfWax是一个元搜索引擎,能限定最多返回结果条数和排序方法,检索速度一般。该搜索引擎有一个显著特点,即点击每条结果左边的“网址按钮”图标,可浏览该结果包括的任何页面,并显示搜索语句在文件中的位置。可以把搜索结果和文件存储起来以备后用。此外,焦点字(FocusWords)功能提供搜索词在各种不同含义下的同义词/近义词、上位词、下位词的列表,辅助选择词语检索。

5. Way Back Machine

通过Wayback Machine可以搜索某一特定网站过去(从1996年到现在)的样子。实现对Web过去的存档要求一百太字节的存储空间,并包含一百亿个网页!网页存档起初是由Alexa项目的负责人收集的。你可以在你的电脑上安装一个提供网站信息和排名的工具栏。

在Wayback Machine网站上,你可以搜索和链接你喜欢的网站,看它们过去的样子,你会发现它们像时间“快照”一样保存着。例如,你可以看到whatis.com网站在1996年的样子,也可以看见它在1997年及以后的样子。

6. Google Scholar

GoogleScholar学术搜索专门在期刊论文、理论摘要及其他学术著作文献中进行搜索,内容从医学、物理学到经济学、计算机科学等等,横跨多个学术领域以及大量书籍和整个网络中的学术性的文章。它虽然不支持中文,但可以用拼音搜索国内学者在国际刊物上发表的文章。这个搜索引擎搜索国外的资料非常方便,输入一个学者的名字,就可以搜索出其全部在网上的文章,并且可以知道在哪个数据库,以及该篇文章被多少篇其它文章所引用,以及所引用文章的目录等等。同时该学者所著的书也都有显示,并告知该书被哪些图书馆所收藏,或其它可能获得的商业途径。

GoogleScholar的搜索结果可以过滤掉普通搜索结果中的大量垃圾信息,排列出文章的不同版本以及被其他文章所引用的次数,还可以通过引用链接方便的找到与搜索结果关联的其它相关学术资料,对于学生、学者以及其他需要经常查阅学术文章的人来说是非常实用的。

7. DuckDuckgo

害怕信息被泄露,想要匿名访问互联网?DuckDuckGo将是你的首选!DuckDuckGo不会保存你的任何浏览信息、社交文件、邮件等,这也是跟Google最大的区别。DuckDuckGo的用户非常喜欢像「zero-click」这样的功能,快速无线下拉设计真的是懒人福利。更棒的是,DuckDuckGo并沒有像Google那么多广告,以及经常弹出广告等问题。DuckDuckGo甚至还配备了自己的Tor出口中继,帮助Tor用户提高搜索性能。

8. Fazzle

Fazzle是一个支持英文发文和荷兰文的元搜索引擎。它即可进行一般的网址搜索,又有一个主题目录可提供专题的资源搜索。其前身为SearchOnline著名元搜索引擎

9. not Evil

不像其他的Tor搜索引擎,not Evil是一个不以营利为目的的搜索引擎。它是专门设计用于搜索暗网内容的搜索引擎,堪称暗网中的谷歌。此外,它的安全性体验度也做的非常的到位。既没有多余的广告推送,也不会对用户的搜索行为进行跟踪。再加上其不断更新的搜索算法,用户很容易就能通过它找到想要的内容或信息。值得一提的是,在此之前该项目被人们广泛的称为TorSearch。

10. Start Page

StartPage是由Ixquick推出的一个托管在美国和荷兰的搜索引擎服务,通过免费匿名代理提供谷歌搜索和图片搜索结果,号称是世界上最安全的保密型搜索引擎。该搜索引擎非常注重把对用户隐私的保护,它不会收集和分享任何用户的资料。

在Startpage,Ixquick的隐私与谷歌的搜索结果紧密相连。你可以放心使用这些来自世界上最受欢迎的搜索引擎搜索的结果,并受到Ixquick的隐私保护,这是世界上最大的私有搜索引擎。并且还受到了第三方权威机构——欧洲的联盟隐私倡议机构EuroPriSe的认证。 2008年7月14日,Ixquick被授予第一个欧洲隐私认证。

*参考来源:gbhackers,FB小编 secist 编译,转载请注明来自FreeBuf(FreeBuf.COM)

谷歌搜索引擎工作原理

Google官方对其搜索技术的叙述

我们搜索技术的后端软件会在服务器侧触发一系列执行时间不到1秒的并行计算,Google问世前的传统搜索引擎的搜索结果严重依赖于关键词在页面上出现的频度,我们使用了200多个指标信号(其中包括我们拥有专利的PageRank页面等级加权算法)用来检查万维网的链接结构(佩奇和布林最初的想法是把万维网的链接结构用图论的有向无环图来建模)并决定网页的重要程度,我们假定一个网页的重要程度取决于别的页面对它的引用,就像学术论文中的引用指数一样,重要的论文总是会被很多其他论文引用。然后我们再根据搜索条件进行超文本匹配分析(对bot抓取的页面内容进行关键词倒排索引检索)确定跟搜索请求最相关的网页。综合最重要的网页和跟搜索请求最相关的网页两个方面,我们就能按重要程度和用户搜索请求相关程度把查询结果排序后呈现给我们的用户。

数据中心:Google用来索引世界的塔

Google的数据中心高度机密,我们能了解到的不多:

1. 在美国本土有19个以上的数据中心,其余17个数据中心分布在美国以外的世界各地。

2. 每个数据中心有50万平方英尺那么大,建造一个数据中心要花费约6亿美元。

3. Google数据中心是世界上最高效的设施之一,而且也非常环保,几乎没有碳排放。

4. 数据中心使用50到100兆瓦的电力,由于需要冷却,通常建在便于用水的地方。

5. Google服务器安置在一个一组容得下1160台服务器的有房子那么大的标准集装箱容器中。

处理流程

1.你写博客、或在Twitter上推微博、更新站点等诸如此类往Web上添加内容的操作

2.Google bots程序(一种作为搜索引擎构件的智能代理程序)抓取你网页的title和deion、keyword等内容

(1)Google爬虫沿着链接路径周游万维网,如果没有超文本路径到你的站点,你的站点将不会被索引

(2)如果你在robots.txt中设置不许索引,Google爬虫程序将不会抓取你的网页

(3)如果链接到你站点的超文本链接上有nofollow标签,Google爬虫将不会从这些链接路径周游到你的站点。

(4)Google也能通过blog软件或xml站点地图找到你的网站

(5)从PageRank越高的网站链接到你的网站的链接越多,你的网站的PageRank就越高。

(6)Google爬虫将周游所有未标注为nofollow的链接

3.一旦被Google爬虫访问到,网页几秒内就被索引了

(1)网页内容被存储在一个倒排索引中

① 网页标题和链接数据被保存在一个索引中,用于广度优先搜索

② 网页内容保存在另一个索引中,以用于检索频率不高的长尾、个性化、深度优先搜索

(2)当你用Google搜索时,你并没有在检索时时更新的万维网,而是在检索Google的缓存,Google定期更新其索引库,在Twitter实时搜索等的竞争下,Google的索引库更新周期趋短。

4.Google基于链接评估域名和网页的总体PageRank值。

5.检查网页以防止作弊行为

(1) Google的搜索质量和反垃圾信息审查和优化算法

(2) 1万多远程测试用户评价搜索结果的质量

(3) Google征请用户对有PageRank讹诈嫌疑的垃圾信息进行举报

(4) Google接到 (美国)数字千年版权法案的通知,要求Google从搜索结果中剔除涉嫌盗版的内容

6.在对页面做了损害分析后,现在每个页面都有很多用于辅助用户搜索的数据片(比如检索关键词)反向引用着它

7.用户发出搜索请求

(1)Google搜索质量工程师Patrick Riley:在大多数Google搜索中,你的搜索处于许多并行的控制过程或Google实验室的创新项目组过程中,可以说每一个查询请求都会参与一些Google的创意实验。

8.Google会用同义词匹配与你的搜索关键词语义相近的查询结果

9.生成初步的查询结果

(1)Google当然能返回成千上万数量无限的查询结果,但一般只显示不到1000条的查询结果,出于“少则得,多则惑”的考虑。

(2)对查询结果做本地化处理,本土站点在查询结果中优先出现

10.对查询结果集按权威性和PageRank进行排序,重复的查询结果被剔除。

(1) Google根据关键词、广告类型、用户所处位置找出相关的被竞价拍卖的关键词广告

(2) 关键词广告必须遵守当地法律条文

① 广告业主的非法广告将被取缔

② 如果关键词的搜索流量过低或关键词广告点击量偏低,则会被自动禁用

③ 出于商业策略,像亚马逊这样的客户会给予优惠折扣。

(3) 关键词相关广告按收益潜力(对关键词进行竞价拍卖后的广告质量不断进行评估)排序

(4) 对广告业主来说广告内容一般都是固定的,但有时使用动态关键词使关键词广告与搜索关键词相关度更高

① 一些广告本身允许增加易变的附属信息,比如网站链接、电话号码、产品链接、地址等

(5) 当广告拥有了相当高的点击率,则会显示在搜索结果列表的上方,以使其更显眼。

(6) 其余的广告依序显示在相应的位置

11.对查询结果进行过滤处理

(1) 对通常的查询(比如在Google首页上发出的搜索请求),Google会把相关的专题性垂直搜索结果(比如新闻、购物、视频、书籍、地图等)也加到返回的查询结果中

(2) 个性化方面:用户访问过的网站在查询结果列表中会更靠上

(3) 大量使用锚点的网站有可能被从查询结果中删除

(4) 搜索结果集的聚簇性:如果网页被其他高PageRank的网站引用,则网页的重要性会大大提高。

(5) 趋势分析:对搜索流量爆增或有大量新闻的搜索关键词,Google会在新的查询结果中增加额外的PageRank权值。(Google有反映关键词搜索流量的Google趋势专题页面)

(6) 同一个域名下的多个网页如果具有相同的PageRank会被归为一组。

12. 最终返回给浏览器端的用户一个人性化的、布局良好的、查询结果和广告泾渭分明的结果页面。

所有这些步骤在总共不到1秒的响应时间内完成,每天3亿次的点击量给Google带来了超过200亿美元的年收入。

搜索引擎之研究关键词的必要性(二)

搜索引擎之研究关键词的必要性(二)

刚做网站的人最容易犯的错误就是,脑袋一拍就贸然进入某个领域,没规划好目标关键词就开始做网站,这样做常常导致两个结果,一是自己想做的关键词排名怎么也上不去,二是自己认为关键词的排名到了第一也没什么流量。今天就给大家讲解一下我们为什么要研究关键词以及研究关键词的必要性

一、为什么研究关键词

1、确保目标关键词有人搜索:要确定适当的关键词,首先要做的是,确认用户搜索次数达到一定数量级。在这方面做出错误的方向选择,对网站的影响将会是灾难性的。

2、降低优化难度:做关键词研究就是要找到被搜索次数比较多,同时难度不太大的关键词,网站优化才有可能在一定的预算、周期下取得较好结果。

3、寻找有效流量:排名和流量都不是目的,有效流量带来的转化才是目的。

4、搜索多样性:搜索词并不局限于我们容易想到的热门关键词。用户使用的搜索词五花八门,很多是站长自己所想象不到的。

5、发现新机会:每个人的思维都会有局限。研发和销售某些特定产品的人,思路很容易被局限在自己和同事最常用的词汇上。而用户需求千变万化,上网经验也不同,他们会搜索各种各样我们想不到的词。seo人员查询搜索引擎提供关键词的扩展工具,或者分析网站流量是一件非常有意思,而且常常有意外发现的工作。

二、关键词的选择

选择恰当的关键词是SEO最具技巧性的环节之一。只有选择正确的关键词,才能使网站SEO走在正确的大方向上。确定什么样的关键词决定了网站内容规划、链接结构、外部链接建设等重要后续步骤。

1、内容相关:目标关键词必须与网站内容有相关性。SEO早期曾经流行在页面上设置设置堆积搜索次数多但与本网站没有实际性的关键词,也曾起到很好的作用,能带来不少流量,但现在这样的做法已经过时了。网站需要的不仅仅是流量,更是有效的流量。

2、搜索次数多,竞争小:很显然,最好关键词是搜索次数最多、竞争程度最小的那些词,这样既保证seo代价最低,又保证流量最大。可惜现实不是这么理想的。大部分搜索次数多的关键词,也是竞争大的关键词。

3、主关键词不可太宽泛:一般行业通称都是过于宽泛的词,如“新闻”、“旅行”之类的。把目标定在这样宽泛的词上,要么做不上去,要么费了九牛二虎之力做上去却发现转化率很低,得不偿失。

4、主关键词也不可太特殊:选择主关键词也不能走向另外一个极端。太特殊太长的词,搜索次数将大大降低,甚至没有人搜索,不能作为网站主关键词。

5、商业价值:不同的关键词有不同的商业价值,就算长度相同,也会导致不同的转化率。

三、关键词竞争程度判断

关键词选择最核心的要求是搜索次数多,竞争程度小。搜索次数可以通过搜索引擎本身提供的关键词工具查看,简单明了,数字比较确定。而竞争程度判断起来就要复杂得多,下面列出几个可以用于判断关键词竞争程度的因素。每个因素单独看都不能完整、准确地说明关键词的竞争情况,而必须整体考虑。更为困难的是,有的因素在数值上并不确定,比如竞争对手网站优化水平,无法给出一个确定数值。

1、搜索结果数:搜索结果页面右上角都会显示这个关键词返回的相关页面总数。这个结果数是搜索引擎计算认为与搜索相关的所有页面,也就是参与这个关键词竞争的所有页面。

2、intitle结果数:使用intitle:标题中出现关键词的页面才是真正的竞争对手。

3、竞价结果数:搜索结果页面右侧以及最上和最下面有多少个广告结果,也是衡量竞争程度的指标之一。

4、竞价价格:几大搜索引擎都提供工具,让广告商投放前就能看到某个关键词的大致价格,能排到第几位,以及能带来多少点击流量。

选择关键词的第一步是确定网站核心关键词,核心关键词通常就是网站首页的目标关键词。一般来说,整个网站会有很多目标关键词,这些关键词不可能都集中在首页上进行优化,而是合理地分布在整个网站,形成金字塔形结构。难度最高、搜索次数最多的两三个是核心关键词,放在首页;难度次一级、数量更多的关键词,放在栏目收或者分类首页;难度耕地的关键词,数量更为庞大,放在具体产品和文章页面。

好了,关于研究关键词的必要性的内容暂且分享到这里,希望能帮助大家解决问题,同时也希望大家能继续关注我们新川教育。