磨一剑手把手教你开发国外客户之搜索引擎Google篇一

看过磨一剑《外贸十年之路》的同学，肯定还记得，早期磨一剑做的客户，大部分来是自己找来的。

那么从今天开始，磨一剑就分享给大家，如何一步一步的找到自己想要的客户。

这个客户开发是个系统工程，磨一剑可能需要花很多篇文章写了，请大家给磨一剑一点时间。

先看第一篇，肯定会有（二），也许会有（三）（四）（五）等等。

说到找客户，自然而然就会想到谷歌Google。

可能国内不做外贸的人，不一定听说过谷歌，但是会知道手机安卓系统Android，基本上除了iphone，就是安卓系统的手机了。如同不知道alibaba但是会知道淘宝一样。

虽然谷歌因为某种原因，离开了中国大陆。但是并不妨碍我们对它的喜欢，都说不喜欢谷歌的外贸不是好外贸。好吧，那大家努力。

谷歌2016年拿下了全球搜索市场75.8%的份额，当之无愧的第一名，要做就做第一名。

我们可以看看下面的全球市场占有率：四月份谷歌的市场占有率是88%，真恐怖。

图片：1.jpg

让磨一剑再来给大家看看Google在某些国家的市场占有率。

图片：2.jpg

是不是比我们想象的还恐怖？

一句话，老外基本都知道Google，大都用谷歌。就如我们基本知道百度，基本用度娘（谷歌被强，也挡不住访问）。

所以如果我们要想利用谷歌开发客户，那么我们是否需要了解一下Google.

就好比，我们喜欢上人家姑娘，那怎么也要了解了解她吧，要不然怎么下手，对吧？

胡乱下手会死的很惨的，人家明明喜欢看蜡笔小新，你非要让人家看鬼片，好吧，终于自己去见鬼了。

要了解谷歌，那就一定要说说创始人Lawrence Page,大家都叫他Larry page，没有他，就没有谷歌。不知为何原因磨一剑特别喜欢他，可能源于他是个技术狂，梦想狂？就如同磨一剑喜欢乔布斯和马斯克一样。

图片：3.jpg

1996年，Larry page做为stanford的研究生，用自己发明的Pagerank技术(专利），建立起来的全新搜索引擎BackRub.1997年Backrub改名为Google，1997年9月15日正式注册Google.com域名。

图片：4.jpg

事实上谷歌不是第一家搜索引擎公司，在谷歌之前，已经有好几家巨头在做了：Yahoo，Excite，Infoseek，Lycos，AltaVista.

就好比阿里巴巴不是第一家B2B一样。

估计除了yahoo听过，很多人没听过后面几家公司。百度大老板李彦宏之前就是在Infoseek工作的。

想想那个时候吧，难怪谷歌差点以75万美金卖给Excite.

为什么现在他们都能做老大，就是他们一个共同的特征：牛逼的技术和运营。

接下来磨一剑讲一下，谷歌的工作原理，我们要充分利用好谷歌，我们必须知道它如何工作的。

谷歌的工作有四个部分，我先用极其简单的语言表述，目的是让一个完全不懂谷歌的人能够看懂。

第一：搜集一切有用的信息。

首先就是把所有的信息搜集起来，yahoo最早的人工目录，就是人工一个一个的把网页搜集起来。想想看，那是需要多大的人力。

这个有点像，马云95年做中国黄页。就是把所有的公司网页搜集起来，然后放到网上去。

（不过马云最早做的黄页应该是这样的，比想象的好还是？）

图片：5.jpg

中国黄页上留的是以jackma为前缀的邮箱。（马云总是谦虚的说他只会收发邮件，那么在95,96年，能用邮箱也是。你懂的）。当时网站上引用的搜索引擎是yahoo,Lycos,Excite. 那时候并没有Google.

人工搜集实在太慢，所以就需要计算机程序自动搜集信息。我们把这个程序叫爬行器crawler或爬行机器robot。

在谷歌叫做Googlebot，像百度就叫做baiduspider（百度蜘蛛）。

很多人直接叫蜘蛛或爬虫，或者爬虫器都是一个意思。

这个crawler很厉害，它一直在快速漫游，迅速发现和搜集信息。

这样的crawler是一群能打战的集团军，而不是只有一个好士兵。

它专门做两个内容：

1.根据链接，发现新的一切信息。

2.根据一定的规则，去搜集有用的信息。

为什么说有用，这里并不是所有的网页它都会去的。

比如，

1）发现你的页面和别的都是一模一样的，他就不去了。

尤其是网页结构和网页内容都一样。（就是双胞胎穿着同样的衣服，它只认一个）

2）还有就是如果网站管理员，明确告诉它，我不需要你。

这样直接可以在robots.txt文档里写上：Disallow: /

比如天猫tmall.com，就明确告诉搜索引擎，我不需要你爬。谷歌搜索的结果就是这样的：

Tmall.com

https://tmall.com/

由于此网站的robots.txt，所以无法提供该结果的相关说明。

了解详情

不过其实谷歌还是收录了tmall蛮多页面，也就是从另外一个层面说，当你足够牛逼，虽然你明确说别来找我，但是比你牛逼的人还是会来找你的。

第二：存储信息。

找到这些网页信息，那么就是要把它存储起来，以便用户好找。

根据爬行机器搜到的网页，图片，视频等信息，把这些信息存入数据库中。这些数据库分别位于不同计算机服务器中。

谷歌很牛逼，服务器上百万个。这些服务器分布于不同的谷歌数据中心。你可以看看谷歌的数据中心图片：

图片：6.jpg

第三：将存储的信息进行分类索引。

存取的信息，肯定需要分门别类。就好像，我们去图书馆一样，都是分类的。要不然找很难找到我们要看的书。

索引是什么意思呢，是一个专业数据库的术语。我们只要知道索引就是类似图书的目录，我们看目录中的页码就能马上找到内容。

这些就是素引器（Indexer）干的活。

这个过程也就是：

简单的理解就是一个网页文档索引到全部的文字

网页文档1-------》》》(文字1,文字2,文字3...).

网页文档2-------》》》(文字1,文字2,文字3...).

而这个过程专业上就叫Forward Index正向索引的过程。

只是实际工作会做很多技术上的处理，因为网页实在太多了，比如：

每个网页文档都会有URL分解器分配专门的文档ID。而存储的文字有文字的位置，文字的字号，大小写等等信息。

第四：根据用户的要求，把需要的信息提供给用户。

这个就是我们经常所做的，在搜索框中输入一个关键词，然后谷歌根据这些关键词，迅速搜索自己的数据库，然后根据一定的排名规则，一一排序反馈给用户。

这个就是检索器干的活。

对于我们要找客户而言，那么重点就是要了解第四部分。让磨一剑再来详细讲解第四部分。

1.我们首先打开google.谷歌的web服务器首先根据用户所在地点，自动匹配合适的分站以及最近的服务器。

比如在我们中国，就会自动跳到Google.com.hk

比如你在韩国，就会自动跳到Google.com.kr

2.当我们在搜索框输入关键词时，谷歌就已经开始为你工作了。

比如磨一剑刚输入了一个a，谷歌就根据搜索热度自动跳出

amason

amanda bynes

american airlines

airbnb

这个大家只要用过谷歌或者百度，都会有印象。

这个叫做Google Instant predictions （Google 即搜即得的功能）

这个方便了我们搜索，但是有的人也会觉得很烦，会一不小点了下面的，而不是自己想要的。不过其实可以关掉的。

在谷歌的Search Settings搜索设置里，

点击Never show Istant result一律不显示即搜即得结果。

3.当我们按下Search搜索时，谷歌服务器会首先自动检测你的关键词是否正确。

例如，磨一剑打入alibabs ，谷歌经过分析发现，alibabs和alibaba相似度极高，并且alibabs几乎很少有人搜，而alibaba有NN多人搜，那么会把alibabs和alibaba同时传给索引服务器。并在查询结果中会给用户建议：

————————————————————————————————

显示的是以下查询字词的结果： alibaba

仍然搜索： alibabs

同时谷歌会把用户输入的词和自己的词典服务器，进行语义相近（同义词）分析匹配。那么谷歌会同时把用户输入的词和语义相近的词同时发送到索引服务器中，

例如你输入进去的的关键词，比如你输入chinese led light，那么谷歌服务器进行语义相近匹配，发现和china led light,china led lighting相近，那么会同时把chinese led light ,china led light ,china led lighting发给索引服务器。

这时候，没有像上面所说的提示，而是直接显示结果。因为谷歌基本判定你需要china led light ，china led lighting几乎一样能满足你的需求。

图片：7.jpg

我们再举个例子：

我们用alibaba国际站搜索打个比方，实际上国际站的搜索框也是个搜索引擎，只是他是搜索国际站会员的信息。

那么我们如何利用这条来为我们的阿里平台运营服务呢？

阿里巴巴的搜索引擎相对于谷歌其实要简单很多。但是目标也是一样的。就是当国外客户输入产品的关键词时候，阿里的查询结果能够满足国外客户的需求，找到需要找的产品和供应商。从这个层面理解是一样的。但是在其他的方面，阿里的搜索引擎就没有谷歌这么智能了。那么从另外一个层面，也就提供了我们阿里会员的机会了。

具体是什么，磨一剑还是留着给新的VIP或者视频讲解了。

阿里的运营和管理等，如果有机会，还是另外开篇专门写了。

事实上，讲归讲，关键还是自己动手做一遍。讲了不做，等于没讲。

所以磨一剑一直强调，如果你是新进的VIP或者视频会员，不是付了钱就进步了，进来只是加速你的学习，思考和改进，所以如果你真的想理解进去我所说的，那么请务必根据我的思路做个复习，以及最重要的是实践，实践再实践。

如果只是看了一遍，我相信你可以记住好几天的，甚至好几十天，但是你不是AlphaGo，今天输入进去了，再也不会忘记了，过了十万天都可以就可以轻松应对李世石的挑战。

作为一个普通的人，只能等自己学了，复习了，做过了，有疑问了，然后找磨一剑指导。磨一剑才能够根据你目前的存在的问题，有针对的去帮助你取改进，那样才能真正的学到，真正的提升自己的实力。还记得小时候读书嘛？你不做作业，哪怕老师黑板上讲了一个一模一样的题目，你照样也不会做，即使今天会做，时间一长就忘记了。这个叫做：要学会游泳必须下水，要不然你看一万次游泳葵花宝典也只能是个旱鸭子。

很多人没有明白知道到做到的距离，其实知道到做到的距离就是你看见对面的一位美女或帅哥，你就想要跟他或她生个Baby的距离。要生baby，你至少要先鼓起勇气先去认识他或她吧。

要想勾搭磨一剑深入系统学习外贸的，可以看文章后面的加入VIP和视频的。当然勾搭磨一剑不会生baby的，所以你也别太紧张。

磨一剑还是继续来讲解谷歌方面。

4.索引服务器根据发送来的关键词进行分析匹配。

当关键词发送到索引服务器，索引服务器通过关键词找到匹配的网页。

也就是这样的过程：

简单理解就是一个word文字对应到全部的文档网页。

word1-----》》》（网页文档1，网页文档2，网页文档3,..）

word2-----》》》（网页文档1，网页文档2，网页文档3,..）

然后这样就可以找到所有有关用户输入的keyword的网页了。

而这个过程就是反向索引的过程。反向索引在正向索引做完之后，就已经完成了。

就是为了谷歌能更快更好的找到需要的文档信息。

当然反向索引也像正向索引一样，实际会做很多技术处理。上面讲过了，就不重复了。

同时谷歌会根据用户输入的关键词和已经有的关键、广告类型、用户所处位置找出相关的被竞价拍卖的关键词广告。这个过程和上面的过程一样。谷歌有专门独立于网页关键词的广告服务器。这很重要，谷歌就是靠它收钱的。这也是谷歌最主要的收入来源，这个以后会专门来讲。

5.得到所有有关用户搜索的关键词网页数量，然后初步反馈查询的结果。

谷歌实际搜索到的网页很多很多。

比如我们输入China，谷歌查询结果显示的第一行就是: 找到约 3,460,000,000 条结果（用时 0.88 秒）------34亿6千万个网页。（你可以想像一下，这么多页面，谷歌0.88秒就完成了，实际上谷歌的搜索都不会超过1秒就能完成）

我们再一页一页翻去，到第42页的时候，就已经没了，看见了如下：

“为了向您显示相关程度最高的结果，我们省略了一些与已显示的 442 条结果极为相似的条目。

如有需要，您可以重新搜索以显示省略的结果。”

事实上，谷歌最终展现给用户看的一般不会超过1000条。

因为按照谷歌的理解，一般1000条以内你就能找到你想要的信息了。而事实上，几乎很少很少人有很好的耐性把1000条都翻完。

早在2013年，权威调查机构统计过，谷歌搜索结果第一页的点击率占据了91.5%，第二页为4.8%，第三页为1.1%。前十页基本占据了98.6%。

具体前十页的统计结果，看下面的图就清晰了。

图片：8.jpg

而磨一剑自己本人也很少翻到10页以外。你经常翻到10页以外么？

从另外一个层面说，如果你在做阿里，那么你的绝大多数关键词都排到第一页，那么流量询盘量肯定都不会差。是吧？

所以这里很重要的一个概念就是，我们在找客户的时候，如果一个关键翻完，而事实很多的网页都没展现出来，这就需要我们用不同的类似关键词，或者加减一些限定的条件重新去搜索。所以千万别说，我都把谷歌搜遍了，也没找到潜在客户。

哦，忘了！你是做核捣蛋的。

6.按照目前Pagerank算法技术（估计现在超过200多个因素）进行排序。

事实上，Pagerank算法从Larry page发明到现在，已经不知道进行了多少次改进了。

谷歌每年都要将近快上千次的实质性改进。但是不管怎么改，谷歌的目标就是“能够理解用户的需求，并为用户提供所需要的一切”。

怎么理解这个目标呢？

打个比方，也许是你的孙子，对的，就是你的孙子一个人（虽然我知道现在你儿子今年才3岁）在家里不小心摔倒了，基于谷歌软件的传感器，就会通知基于谷歌软件的无人驾驶汽车，迅速将你的孙子送往最近的医院。或者通知谷歌机器人医生迅速来到家里帮你的孙子治疗。

事实上，谷歌眼镜，谷歌无人驾驶汽车，谷歌机器人，等等都在做了。你没听说过AlphaGo三比零完胜目前世界排名第一的中国棋手柯洁九段？所以华人首富李嘉诚，都亲自请阿尔法狗之父“上课”。

图片：9.jpg

李先生听课很激动,数度站起来,害得两创办人也连忙礼貌地陪站。

华人首富都一直坚持学习，作为普通的我们没有理由不去学习。

所以一句话，谷歌梦想还是有的，万一实现了呢。

接下来我们还是举个谷歌搜索的例子：

我们打入：杭州的旅游景点。然后出来是这样的，见如下图。

谷歌把所有的杭州景点都一一列出来了，是不是相当的方便?

图片：10.jpg

你可以和百度比较一下。可能没这方便了，还要你进一步的去找哪个网页合适。

再来说Pagerank,其实Pagerank算法技术够说一个礼拜了。这也是谷歌的核心技术。

那我们这里只是简单的说，简单的去理解一些基本概念：

Pagerank技术就是用Web的链接结构计算每个网页的排名值：

1）其它网页链接到你的网页越多，你的重要性越大。

理解就是：其实好比，我们被需要的人越多，你就越牛逼。我们都需要谷歌，所以谷歌就越牛逼。

2）越重要的网页链接你的网页，说明你的网页重要性越大。

理解就是：越牛逼的人需要你，那么你就越牛逼，不是嘛 ? 假如马云都需要你帮助，你能不牛逼？

3）越多垃圾的网页链接到你的网页，说明你的网页越垃圾。

理解的是：

越垃圾的人都找你玩，你也自然也是垃圾的。

你的身边都是赌徒，估计你也是个赌徒。

你的身边都是吸毒的，估计你也要吸毒了。

高富帅很少和矮穷挫在一起玩的。

当然矮穷挫可以在童话里娶到白富美的，不是嘛？

从这里可以看出来，谷歌极其的聪明而且懂人性。

这里说的人性是什么呢？留点空间自己思考吧。

6.接着进行过滤处理。

1）过滤重复信息。如果两个页面相似度很高，而且里面的内容都一模一样会被过滤。

发稿网（QQ：599515669）是全国领先的在线新闻稿发布平台，团队由资深互联网专家组成，服务内容类涵盖软文发布、软文发布、微信营销、微博营销、视频置顶、百度问答等多种互联网广告行业。发稿网平台有上千媒介编辑、专业写手、段子手、营销专家，为企业、公共机构和个人提供定制化的解决方案，将创意、智慧、技能转化为商业价值和社会价值。发稿网平台凭借多年的网络资源和客户资源积累，发展遥遥领先同行业其他软文平台。