谷歌搜索 如何 排名第一的问题竟是

Google释出全球10大以“如何(How to……)”开头的求救问题,代表民众一旦遇到这些不知道如何处理的状况时,就会上网搜寻解答。其中的第1名,就是“如何打领带(How to tie a tie)。”

综合外媒报导,Google新闻研究室编辑罗杰斯(Simon Rogers)表示,这些问题可能会因为时间和地区不同而有变化。罗杰斯透露,自从2004年以来“如何(How to……)开头的问题搜索量增加了140%以上。

罗杰斯说,当中有部分都是针对如何修复物品,例如灯泡、窗户、洗衣机,甚至是厕所。罗杰斯指出,“如何修复……”一直都是世界各地最常见的问题列表。

全球民众在Google搜寻的10大问题如下:

1.如何打领带(How to tie a tie)。

2.如何亲吻(How to kiss)。

3.如何怀孕(How to get pregnant)。

4.如何减肥(How to lose weight)。

5.如何画画(How to draw)。

6.如何赚钱(How to make money)。

7.如何做煎饼(How to make pancakes)。

8.如何写1封求职信(How to write a cover letter)。

9.如何做法国吐司(How to make french toast)。

10.如何减掉腹部脂肪(How to lose belly fat)。

多策网络新营销-搜狗搜索调整商业推广信息展现

今天早上多策网络从“艾奇SEM”看到,搜狗紧跟百度搜索推广位置调整,也做出了位置变动。截图如下,多策君在没有确认情况下,谨慎的找到搜狗行业人员,了解到相关调整,确实已经变动。

一开始,多策君还没有确认,认为是广告的随机展现,刷新几次后,仍然看到如上图的广告展现位置。右侧位置也没有相关的广告展现。多策君仍不死心 ,在搜狗搜“英语培训”——仍清楚的看到同样的广告展现位置。

就此,多策网络了解到,百度、搜狗已经悄然按照国家新规,做出了行业调整。并且已经开始实施。SEMer从业人员,也深感压力很大。广告位置一下子减少,而公司以往80%流量都要靠SEM推广,如今只好转移投放移动端、网盟、DSP、广点通等信息流广告了。

多策网络给SEMer和企业的建议投放渠道:

  1. 移动DSP

  2. 网盟

  3. DSP类

  4. 信息流广告

  5. 广点通

等。

如果您有相关的问题需要咨询,请关注微信:dcvip1618.(转载请注明:www.duocechina.com)

23个统计数字揭示搜索用户行为

统计数据来源于Jumpshot的点击流数据,记录的是美国用户浏览器访问和点击情况,不是来自搜索引擎。翻译一下供国内外贸企业做SEO优化参考。

1)每个月在Google.com有多少次真正搜索?

就jumpshot设备能记录分析的数据,每人每天做了3.4次搜索。换算下来,相当于美国用户在Google.com每个月进行了400-600亿次搜索。

2)每次Google搜索进程平均多长时间?

从开始搜索,到搜索结果页面打开,到点击结果页面,到点击返回按钮回到结果页面,到重新点击另一个结果,平均不到1分钟时间。

3)多少用户一天里进行至少一次搜索?

只有15%的美国用户在一天里做过至少一次搜索。这个数字不高啊。好的一面是,还有很大增长空间。

45%的用户在一个星期里至少做了至少一次搜索,68%的用户在一个月里做了至少一次搜索。

4)多大比例的搜索导致了一次点击?

66%的搜索导致了一次或多次点击。34%的搜索啥也没点。

和百度一样,Google也愿意把用户留在自己网站上。不同的是,百度是把用户送到自己的内容页面去,如百度百科、知道,Google是在搜索结果页面上直接回答问题。

5)多少比例的点击是点击了搜索广告?

只有3.4%点击的是AdWords搜索广告。在百度上是否更高?Google搜索广告占的面积现在也是越来越大了。

6)多少比例的点击是去往地图/本地结果?

0.1%的点击是点击到地图/本地结果。

这里指的不是在maps.google.com上的地图搜索,而是在www.google.com搜索,结果点击去了地图或本地结果。

7)多少比例的点击去了知识图谱(knowledge graph)?

有大致38%的搜索会显示知识图谱,也就是搜索结果页面右侧经常出现的背景知识。但只有0.5%的点击去了知识图谱里的链接。知识图谱就是那些在搜索结果页面就能看到答案,所以用户不必再点击的那类结果之一。

百度也有类似结果,好像也叫百度知识图谱。

8)多少比例的点击去了图片区域?

11%的Google搜索结果会出现图片结果,3%的点击去了这部分图片。

这个应该不是百度特有的图文展现那种,而是展示一排图片的那种。图片还是很能吸引眼球的。

9)多少点击去了新闻结果?

没统计出来。原因是统计数据期间,Google新闻结果的格式有变化,从News Results改成了Top Stories。

10)多少点击去了twitter区块?

7%的搜索结果显示一个Twitter结果区块,有0.23%的点击去了twitter。

11)多少点击去了Youtube?

6.3%的搜索结果有Youtube内容,1.8%的点击去了Youtube。

Youtube比twitter的吸引力高多了。或者应该说是视频的吸引力。

12)多少点击去了gmail?

0.16的点击去了gmail里的邮件。

这个是Google特有的,只有在用户处于登录状态时才显示gmail邮件内容。其实挺方便的,比如搜索一下某个航班或酒店,搜索结果里会出现自己已经预定的航班、酒店邮件。

13)多少点击去了Google Shopping结果?

9%的搜索会出现Google Shopping内容,0.55%的点击去了Google Shopping。

Google Shopping出现时,在页面顶部占很大一块,而且图片显示很吸引眼球,看来点击结果也不错。

14)多少点击去了Google自己的内容?

包括地图、gmail、图书、Google+之类的,去了这些Google自己内容的点击是11.8%。

相比之下,百度搜索去了自己内容的点击肯定更多,搜索结果中出现的百度百科、知道、经验等等,有时候比例高得惊人。请参考百度霸屏这篇帖子。

15)美国主要搜索服务各自所占比例?

Google.com 59.30%

Google Images 26.79%

YouTube.com 3.71%

Yahoo! 2.47%

Bing 2.25%

Google Maps 2.09%

Amazon.com 1.85%

Facebook.com 0.69%

DuckDuckGo 0.56%

Google News 0.28%

Google图片搜索比例很大,远超过被认为是第二大搜索服务的youtube。

雅虎和必应的使用比例貌似惨不忍睹。当初雅虎放弃自己的搜索技术并没有给雅虎和微软带来市场份额。

16)关键词搜索需求分布情况?

前1百万查询词占所有搜索的25%,前1千万查询词占所有搜索的45%,前10亿占了90%。如下图:

所以,长尾还是挺长。

17)PC和移动查询词平均包含几个单词?

典型用户使用的查询词平均包含3个单词。PC用户查询使用的单词数比移动用户稍长。但也只是稍长,并不是移动用户因为输入困难而使用短得多得查询词。

18)多少比例的查询是以问题的形式?

8%的查询是以问句的形式出现,比如“明天会下雨吗”这种。

问句式查询近年来占比越来越大,是个可以挖掘的新机会。常见的问句形式包括

xxx是什么?(如SEO是什么?)

xxx怎么做

xxx哪个/哪家最好

xxx是什么时候

哪里有xxx

为什么xxx

和新闻写作的5个W、1个H(Who, What, When, Where, Why, How)是很相近的。

19)移动和PC搜索中付费及自然结果的点击率区别?

在移动搜索中,40.9%的搜索产生自然排名点击,2%的搜索产生付费点击,57.1%的搜索什么点击也没有产生。

在PC搜索中,62.2%的搜索产生自然自然排名点击,2.8%的搜索产生付费结果点击,剩下的35%没点击。

所以,SEO流量远远超过PPC,但企业花在PPC的钱通常远远超过SEO。我见过每个月花几十万做PPC的公司说,他们愿意在SEO每个月花100块钱。

20)多大比例的查询,用户没有点击任何结果,就查询其他词?

用户查询某个词,没看到什么合适的答案,转而搜索其它词,或者点击搜索引擎列出的相关搜索,这种比例占多大?统计数据是18%的查询会这样。

21)多少查询导致不止一次点击?

用户在新窗口打开结果页面(百度就不用了,页面缺省就是在新窗口打开),或者点击返回按钮再点击另一个结果,有21%的搜索会产生这种不止一次点击的情况。

22)弹回并点击其它结果的有多少?

用户点击一个结果页面,跳出返回搜索结果页面,点击了另一个结果,也就是上面21条中的第二种情况,8%的搜索会发生这种情况。

这也就是跳出率可能影响页面排名的情况。

23)有多少点击是去了非Top 100网站?

除了Google自己的内容,有多少点击是去了top 100网站?也就是那些巨大的站。有多少点击去了非top 100网站?也就是普通点的网站。12.6%的点击去了搜索流量前100名的网站,剩下87.4%给了芸芸众生。

还好,长尾还在,如果一半流量给了top 100网站,普通做SEO的就没法活了。

作者: Zac@SEO每天一贴版权属于: 中新虚拟主机版权所有。转载时必须以链接形式注明作者和原始出处及本声明。

作者:Zac@SEO每天一贴版权属于:中新虚拟主机

微信搜索开通热词排名功能 也能做优化排名了

  9月8日消息,HiShop网获悉,微信搜索推出了“热词”功能,会像微博搜索框一样显示近期的热词。

  据悉,进入微信搜索框后,点击“资讯”,即可看到最近热门的关键词及其对应的微信指数。目前,该功能可以显示5个热词,根据微信指数顺次排列。进入热词后,便会出现与热词相关的最新新闻、资讯,支持按条件筛选(如按发布时间排序等)。

  微信热词页面

  今年3月,微信推出了提供的基于微信大数据分析的移动端指数“微信指数”,而热词排行正是该功能的延伸,同时也是看一看、搜一搜功能的升级。

  HiShop网了解到,微信和WeChat的合并月活用户数已达9.63亿,处于成熟发展阶段的微信,正试图通过各种新功能,挖掘更多增长空间,如赋能商家的小程序、调整朋友圈显示算法、优化朋友管理功能等。

无需搜索下载,微用小说唯一全网搜罗

随着智能手机的普及,手机阅读成了越来越多年轻一族的选择。在休息间隙或者上班路上,用手机阅读的人比比皆是。但是到哪里能快速找到符合自己口味的精品内容,这让很多喜欢用手机阅读的用户十分头疼。现在,轻巧微用帮你收纳无涯书海,并且按用户的喜好精细化分类,一网打尽小说、诗词歌赋、国学、笑话、散文等所有类型的阅读内容,无需搜索下载皆可随手取用,精彩作品全网搜罗,让你从此告别书荒!

微用下载体验:

图片1 微用小说

微用出手解决难题 新鲜小说全网搜罗

对于喜欢阅读小说的朋友们来说,最痛苦的莫过于两件事,书荒和追连载。虽然网络上有茫茫的作品,但始终找不到符合自己口味的一本。遇上一本没有完结的小说,总是想第一时间看到更新。现在,尚娱网络全新打造的移动内容聚合提供商——微用为你出手解决难题,所有小说无需搜索下载皆可随手取用。不管你是帅哥还是萌妹,不管你是爱言情还是爱玄幻,爱经典还是爱现代,都可以第一时间享受到最新的小说内容!

图片2 微用主页

无需下载轻松取用 便捷搜索避免烦恼

微用不但为用户囊括了海量的阅读应用,还进一步开发了便捷的应用搜索功能,让微用用户可以通过搜索的方式以最快的速度获取所需,并轻松实现横向对比选择,免去繁琐的寻找下载流程。即使是在快餐式阅读盛行的今天,用户也可以通过搜索功能在浩如烟海的小说作品中,找到自己的最爱。

图片3 微用推荐

丰富功能服务生活 流畅顺滑使用体验

除了提供小说阅读功能之外,在微用令人难以置信的小巧体积中还包含着令人难以置信的丰富功能。在微用2M的轻量空间中,海量囊括了购物、资讯、社交、娱乐等多个种类应用,并实现全部应用实现免下载、免安装、免更新,面面俱到满足生活需要。轻体量的微用可以为用户带来更加流畅顺滑的使用体验,免去用户在有限的手机内存和不断发展的兴趣爱好之间难以取舍的痛苦挣扎。

图片4 微用分类

手机空间神器——微用集三千应用于一身,2M轻体积神奇包容数据世界。无需搜索下载,为你全网搜罗热门小说。让阅读变得更加轻松!

关于尚娱

上海尚娱网络科技有限公司成立于2008年,以移动端应用产品及大数据营销为主营业务。包括内容聚合平台“微用”系列产品、更加适合移动搜索的“弹指搜索”产品,以及快推大数据精准营销平台。尚娱网络以精细服务为理念,结合互联网发展趋势,将为互联网行业带来更多惊喜。

人工智能实战场景爆发 百度AI竟能审核搜索广告

自陆奇空降百度一事宣布之后,外界对陆奇评论最多的一个词无疑是「科技界最有权势的华人」。确实,卡耐基梅隆大学助理研究员、IBM艾曼登研究中心研究员、雅虎搜索与广告技术集团高级副总裁,甚至微软集团全球执行副总裁都不足以说明他的重要性,引用微软集团总裁史蒂夫·鲍尔默的评价:「陆奇能够加盟微软的原因是,他是全世界运营搜索业务的最佳人选。」

2016年对于百度来说,是风波不断的一年,2017年伴随陆奇的到任,一方面,百度目前最核心的搜索与广告业务能否被二次激活,成为科技圈瞩目的焦点;另一方面一直被质疑无法短期变现的人工智能业务能否开辟另一片战场成为圈内外更为关注的重点话题。

另一边,同样作为站在潮头的推动者、改变者,阿里巴巴启动了大数据打假,致力于依托大数据和互联网技术,让电商打假更有力、更高效、更透明。而BAT中素来最具备技术基因的百度,对于其搜索广告平台的治理又将拿出什么样的秘密武器呢?

虚假广告屡禁不止,治理难点是违规词库

谈到百度,当然无法绕开搜索推广业务。过去一年百度经历的风波无一不与后者所牵涉的虚假广告有关。事实上,百度搜索推广从诞生伊始,与非法信息和虚假广告的斗争就从未停止过。百度统计数据显示,2016年,百度全年查处非法信息达16.9亿条,平均每分钟320条信息以上,每天处理违规广告量约1000万,禁止的违法词汇量超过30万。仅在Q3季度,百度就处理了风险账户3163个,包含处罚账户672例,一线自查账户2491例。

虚假广告屡禁不止有着多方面的原因,这些非法信息一部分来源于资质企业提交的非法推广信息,另一方面则是由不法分子通过灰色产业链生成,主要表现为假冒官网、形声字、变声词等。而导致治理困难的核心因素在于资质企业发布非法信息和违规词库建设的滞后性,尤其是后者,因为中文的复杂性,导致一个违规搜索词往往有数十种变体词,给人工审核造成了很大难度。

非法广告的发布,不仅侵害了网民的权益,更对作为平台方的百度造成了极大不良影响和利益损害。因此,如何从规则上和技术上规范、严控百度推广,不仅是网民、优质企业的需求,更是持续陷入舆论漩涡的百度推广急需要解决的问题。

百度出台准入规则,三重拳叫停虚假广告

事实上,百度面临的问题,也是世界范围内搜索引擎平台发展所遇到的重要阻碍因素。在这一背景下,百度公司于2016年8月公布《百度推广准入准则》,成为目前搜索行业内信息上线最严格的企业,同时推出四大风控体系,三重拳叫停虚假广告。

从公开的《百度推广平台治理报告》可以看到,出现在百度搜索结果中的每一条广告,均需经过四大风控系统层层过滤:

首先,在准入门槛方面,审核要求再次提高,除了十大禁区外,再度加强对限制性行业的资质审查,针对国内商业环境复杂,诚信系统不够完善等因素,设置了多维度身份验证,严防套牌、盗号等资质造价行为;同时利用人工智能秘密武器——百度文字识别技术(OCR)、仿冒证件检测技术(图像识别),对广告主身份进行二度排查;在此基础上,千人审核团队24小时在线对资质审查进行最后把关。

第二,对资质企业发布的广告内容进行风控审查。事实上,资质企业每日投放的海量广告,存在着严峻的违法违规及擦边球问题。新规范再次利用人工智能技术,对广告图像和文字同步进行审核。

最后,应对突发风险,打造全方位应急渠道。基于TM、spark等每天进行百亿级全网全库巡检,日处理400万+推广内容、站点,针对不法分子伺机作案的特点,小时级全网排查,5-10分钟迅速处理个案问题,助力遭遇诈骗、钓鱼的网民解决问题。

人工智能加持打假,进阶更好的搜索引擎

在这三记重拳中,最值得称道的是人工智能的引入。不仅在准入口得以实现信息的高效排查,更重要的是针对违规词及不断变化的辩体词,基于人工智能的全自动操作,实现了对推广广告各个环节的全自动核查和处理流程,一旦系统发现商户账户涉及违法违禁内容就会直接下线。同时百度还将深度学习和大数据深挖技术应用到推广客户违规信息的排查中来,以实时监控推广企业网站是否涉及到黑产操作,并不断检测百度搜索中的网站是否存在收集用户信息、泄漏用户隐私以及威胁到用户财产安全的其它恶意行为。

在具体操作方面,OCR识别和图像识别技术双管齐下,对广告主身份和广告内容进行实施甄别。2016年Q3期间,百度文字识别(OCR)基于最新的深度学习技术,以姓名识别精度99.67%,号码识别精度100%的优异表现,在国际文档分类与识别大会(ICDAR)最具挑战性的自然场景类文字识别任务中斩获五项冠军。而百度DeepImage图像识别技术在全球人脸识别最权威的国际评测FDDB与LFW中,均获得第一名成绩,领先于腾讯、FACE++、linkface等同行,几乎接近人脑水平,达到了99.77%的准确率。

目前百度已利用百度大脑AI通过提取页面中文字和图片信息构建机器识别模型,通过对变体词模拟、商标知识库、风险词挖掘三大违规行为的处理,对无行业许的医疗推广等违规进行严厉打击。同时借助百度独有的搜索引擎反作弊算法——绿萝算法:全面打击超链中介、出卖链接、购买链接等超链作弊行为。

同时还利用人工智能和大数据打造百度信誉体系,对存在信用问题的广告主绝不姑息。评级方法引入多维度信息,并联手权威第三方公司,以更真实的数据连通线上线下,杜绝非法信息的输出,保护信网民与广告主的利益。

根据百度新公布的打假成果信息,在人工智能和大数据加持下,2016年百度共下线2518家医疗机构、删除1.26亿条医疗广告、把360103个词汇关进搜索关键词黑名单、升级各行业广告审核策略45次、完成超过80万家企业的搜索信息认证、通过审核拒绝16.9亿条违法违规广告、对44451个品牌词进行搜索结果保护、完成3万于起网民保障申请受理。百度用这8个数字对过去一年打击虚假信息、守护互联网良性发展的战斗做出了最好的总结,同时也让网民和企业看到了百度治理非法信息、保护合规推广的决心和行动。

更可喜的是,百度在人工智能的军备竞赛中,充分挖掘了技术的可能性,将百度大脑这一未来前沿能力,有效应用在自身搜索引擎平台的治理和规范上,这无疑属于技术应用的一个场景。在广告审核中应用技术只是一个创新,但未来是无尽想象的空间,这也就能理解,为何百度将下一个十年得技术方向,瞄准了人工智能。

从前,百度在极大程度上改变中国网民的信息获取模式;未来,执人工智能之牛耳的百度,又将会带来哪些改变呢?对此,我们不妨拭目以待。

———————————————————————————————————-

李安嶙,互联网观察者,著名专栏作者,超级自媒体。他是阅读量超过10亿的专栏作者,文章见百度百家、新浪科技、网易科技、搜狐客户端、今日头条、一点资讯、虎嗅、钛媒体、界面新闻、蓝鲸TMT、艾瑞等国内数十家顶级专栏,文章转载与商务合作加个人微信号:lianlin8866

除了搜索和Chrome:我还喜欢Google这5款App

在过去的十几年里,Google 一直占据着搜索引擎的霸主之位,旗下的 Chrome 浏览器也在上架后的短短几年内超过了 IE 成为 PC 市场占有率最高的浏览器。

我们用得最多或许就是 Google 的搜索功能和 Chrome 浏览器了。

其实 Google 还出了很多适用范围广、大众比较熟知的好应用,今天 AppSo就为大家整理一下吧。

Inbox by Gmail:Gmail 邮件客户端 #iOS #Android

Inbox by Gmail 是一款 Gmail 邮件客户端。

Inbox 与 Gmail 客户端最大的区别在于,Inbox 不仅是一款邮件收发应用,还是一款 To-Do 待办事项应用

当收到邮件时,你可以 左划以设置闹钟稍后处理,届时 Inbox 会再以通知的形式提醒,确保你按时完成工作。

Inbox 会将你的邮件划分为促销、社交,旅行等几大类别,保证你的生活和工作互不干扰。

Inbox by Gmail 适用于 iOS 7.0 的 iPhone 和 iPad 及 Android 4.1 以上设备,iOS 版大小 184 MB,Android 版大小因设备而异,完全免费。

Google Keep:轻量级笔记应用 #iOS #Android

Google Keep 是一款轻量级在线笔记应用。

虽然只有 7 MB,但 Google Keep 仍能 满足你对笔记的绝大多数需求:文字、待办事项、图片和语音笔记都不在话下。

除此之外,你可以在笔记中 输入「#标签」将笔记加入到特定标签,并通过标记不同的颜色将笔记区分开来,便于查找。

值得注意的是,Google Keep 不支持中文文内搜索,但英文和数字都得到了很好的支持。

Google Keep 适用于 iOS 8.0 的 iPhone 和 iPad 及 Android 设备,iOS 版大小 140 MB,Android 版大小、版本因设备而异,完全免费。

Snapseed:简单高效的修图神器 #iOS #Android

Snapseed 是一款简单高效的修图应用,想必它已经躺在了很多人的手机里。

它不仅可以修改曝光,白平衡和光源,还可以指定比例裁剪,一键调整色调。除了基础的参数调整,Snapseed 提供多种滤镜,在一定情况下能组合使用。

这里 AppSo 就告诉大家两个 Snapseed 贴心好用的小功能,更多新玩法需要大家一起去挖掘。

通过变形板块,你可以改变拍摄视角, Snapseed 会自动填充边角,使图片尽可能地还原。

通过污点修复,你可以去掉闯入镜头的路人甲,祛除脸上的小痘斑,使照片更加清爽。

Snapseed 适用于 iOS 8.0 的 iPhone 和 iPad 及 Android 4.1 以上设备,iOS 版大小 125 MB,Android 版大小因设备而异,完全免费。

Google 拼音输入法:支持中文的滑动输入法 #Android

即使鲜有更新,Google 拼音输入法仍是最好用的中文输入法之一。

在输入方式上,Google 拼音输入法支持全键、九宫格、笔画和手写,并 支持绝大多数的双拼方案除了传统的输入方式以外,Google 拼音输入法还可以滑动输入。

在细节方面,双击空格键可以插入句号,支持智能更正和建议联系人姓名。

Google 拼音输入法适用于 Android 设备,大小、版本因设备而异,完全免费。

Google Translate:得力翻译助手 #iOS #Android

Google Translate 是一个翻译应用,可以离线翻译多种语言,还能实时语音翻译。在遇到不知如何输入的文字时,Google Translate 还支持手写录入。

启用「点按翻译」后,复制想要翻译的内容,右上角就会弹出一个小圆球,点开圆球则出现相应的翻译弹窗。

如果不点击,小圆球就会在几秒内消失,绝不会对你的工作造成干扰。

更为强大的是,当你将镜头对准想要翻译的词句时,Google 会自动将翻译好的内容叠加在原文之上,契合堪称完美,甚至连原文的字体都没有任何改变。

Google Translate 适用于 iOS 8.0 的 iPhone 和 iPad 及 Android 设备,iOS 版大小 49 MB,Android 版大小、版本因设备而异,完全免费。

由于网络环境的限制,大部分 Google 产品在国内的体验并不尽如人意,需要搭配梯子使用。

除了以上 AppSo(微信号 appsolution)整理的这 5 款应用,Google 还出了很多应用,比如聊天应用 Allo、相册工具 Google 相册。

你在用什么 Google 家出品的好应用呢?在评论区留言和大家分享吧。

龙芯平台快速搭建Elasticsearch 开源的搜索和大数据分析引擎

Elasticsearch背景

▲ Elasticsearch形象标识

互联网产品中的检索功能随处可见。当你的项目规模是百度搜索这种体量的时候,自己开发一个搜索引擎,加入各种定制的需求和优化,是非常自然的事情。但如果只是普通的中小型项目,直接用一个搜索引擎的基础服务即可。Elasticsearch就是这样一个搜索引擎的基础服务。更重要的是,除去常规的全文检索功能之外,它还具有基础的统计分析功能(最常见的就是聚合),这也让他变得更加强大和实用。还在用数据库的like来实现产品的全文检索吗?抛弃它,用Elasticsearch吧。

Elasticsearch是一个分布式可扩展的实时搜索和分析引擎,建立在全文搜索引擎 Apache Lucene(TM) 基础上,Elasticsearch并不仅仅是 Lucene 那么简单,它不仅包括了全文搜索功能,还可以进行以下工作:

(1)分布式实时文件存储,并将每一个字段都编入索引,使其可以被搜索。

(2)实时分析的分布式搜索引擎

(3)可以扩展到上百台服务器,处理PB级别的结构化或非结构化数据。

▲ Elasticsearch分布式架构

我们建立一个网站或应用程序,并要添加搜索功能,但是想要完成搜索工作的创建是非常困难的。因此,集合了运行速度快、零配置和免费、简单地使用JSON通过HTTP来索引数据、搜索服务器始终可用、可扩展、实时,多用户等特点的Elasticsearch对于我们来说是一个非常好的解决方案。

龙芯平台环境

本文以elasticsearch-5.2.0版本为例进行介绍,旨在为基于龙芯平台开发的同仁提供Elasticsearch基础服务以及前段管理插件head的搭建经验。

本文搭建所用环境:龙芯3B3000双路服务器+中标麒麟服务器操作系统V7.0

下载并安装Elasticsearch

Elasticsearch是基于Java开发的开源工具,具有跨平台等特点,只需在Elastic官网下载即可。

(1)浏览器打开以下链接:

https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.2.0.zip

(2)将下好的elasticsearch-5.2.0.zip包,放到合适的位置,本文以/root/桌面为例。

(3)解压elasticsearch-5.2.0.zip

(4)解压完成后,启动elasticsearch服务

(5)在浏览器输入http://localhost:9200,可看到elasticsearch-5.2.0服务已启动。

▲ Elasticsearch服务启动成功

下载Elasticsearch-head插件

Ealsticsearch只在后端提供各种api,那么我们如何管理elasticsearch呢,下一步我们就要安装elasticsearch-head。该插件作为一个入门级的elasticsearch前端插件,是一款专门针对于elasticsearch的客户端工具。

(1)首先在github下载elasticsearch-head,浏览器打开以下连接:

https://github.com/mobz/elasticsearch-head/archive/master.zip

(2)将下好的elasticsearch-head-master.zip包,放到/root/桌面。

(3)解压elasticsearch-head-master.zip

安装nodejs

head插件是nodejs实现的,所以必须安装nodejs。

(1)直接在线安装:

(2)在安装nodejs的过程中,如遇到上图问题,证明中标的yum源不可用,我们需要修改yum源的配置文件

(3)打开ns7-mips.repo配置文件,将下图的ftp改为http,保存后退出。

(4)修改好中标的yum源后,重新安装nodejs

由于npm是随同nodejs一起安装的包管理工具,能解决nodejs代码部署上的很多问题,所以在安装nodejs过程中,npm也一并安装了。

(5)验证nodejs和npm是否安装成功

安装grunt

由于head 插件的执行文件是有grunt 命令来执行的,所以这个命令必须安装。

(1)安装grunt-CLI,“CLI”被翻译为“命令行”。要想使用grunt,首先必须将grunt-cli安装到全局环境中。

(2)然后开始安装grunt

这里需要解释的是,“–save-dev”的意思是,在当前目录安装grunt的同时,顺便把grunt保存为这个目录的开发依赖项。

(3)进入elasticsearch-head-master文件夹,利用grunt命令执行head插件的执行文件。

(4)在执行过程中会出现缺少插件的报错,接下来我们会有一系列grunt插件的安装,他们的安装过程和grunt一样。但是他们的执行都是基于grunt的,因此才能把grunt叫做一个“构建工具”。grunt没有具体的作用,但是它能把有具体作用的一个一个插件组合起来,形成一个整体效应。

开始一个一个插件安装:

以上插件安装过程中出现的warning可忽略。

修改Elasticsearch-head插件的配置文件

(1)修改配置文件,vim打开elasticsearch-head-master 文件夹下的Gruntfile.js文件:增加hostname属性,设置为*。

(2)修改_site/app.js文件,可根据需要修改head的连接地址。

本文使用默认的head的连接地址,不做修改。

运行Elasticsearch-head插件

(1)运行head插件

(2)在网页上访问Elasticsearch服务的前端插件head:http://localhost:9100(注意该端口号已经不是之前的9200,而是head 插件中的 9100 )

(3)上图所示的页面“集群健康值:未连接”,说明连接还存在问题。解决方案是修改elasticsearch-5.2.0/config/ elasticsearch.yml文件,在文件最下方添加:

http.cors.enabled: true

http.cors.allow-origin: “*”

(4)elasticsearch.yml文件修改完成保存后,重新启动elasticsearch服务即可。

(5)再次访问http://localhost:9100

▲ Elasticsearch前端插件head启动成功

这样本文的Elasticsearch服务以及Elasticsearch前端插件head就搭建完成了。

总结

Elasticsearch在搭建的过程中比较顺利,没有遇到无法解决的问题,基本上实现了无障碍迁移。说明龙芯软件生态环境已经非常完善,有能力作为搜索引擎、分布式实时文件存储、大数量分析这样的基础平台。

在打造龙芯平台软件丰富性的过程中,龙芯公司已经走出了一条坚实的道路,希望产业链能够一起把龙芯的软件生态完善起来!

参考

[1] http://www.tuicool.com/articles/7fueUbb

[2] 2019/20190426A/F018798.html

[3]《Elasticsearch服务器开发》

[4]《实战Elasticsearch、Logstash、Kibana》

[5]《Elasticsearch In Action》

[6]《某ES大牛PPT》

中国版Google搜索 黄了

来源:量子位(ID:QbitAI)

作者:夏乙、乾明

尘归尘,土归土,一切尝试都回到了原点。

说的正是Google想要在2019年推出的中国版搜索。

据The Intercept消息,Google决定关闭该项目的整体数据来源,内部投注的资源也转移到其他发展中国家,如印度、印尼和巴西。

Google CEO桑德尔·皮猜也在国会听证中明确指出:目前没有在中国推出搜索服务的计划。

所以事情眉目已清晰:黄了,凉了,散了吧。

关数据,撤资源

这个项目为何突然停止?

据The Intercept报道,核心原因还是Google内部抗议,然后Google关闭了这个搜索引擎所需要的数据分析项目。

而这个数据分析项目,你可能并不陌生。

为了了解久违的中国用户,Google用了265.com来训练搜索引擎

年轻人,你没听说过265?它是一个导航网站,国外媒体说它自称“中国最常用的首页”,Google 2008年从蔡文胜处收购。

它也有个搜索框,但背后连接的是百度。输入关键词点击搜索,就会跳转到百度搜索结果页面。

不过,Google在这中间加了一个小步骤:把用户搜索的关键词记下来。

通过这样的市场调查,Google积累了规模不小的数据集,来了解中国用户在搜什么。

一名Google工程师说,他有关联着265.com的API,能收集这个网站的搜索数据。

通常来说,分析人们的搜索关键词这种事情,在Google有严格的限制,需要内部隐私团队的审查。

但是,在一批媒体对这个特殊项目进行报道之前,内部隐私团队对这个“市场调查”是毫不知情的。

于是一场内部撕逼不可避免,Google内部就“裂上加裂”。

结果隐私团队赢了。Google最后告诉项目工程师们,不能再用265.com的数据了。

这个项目的工程师们,也被陆陆续续调到其他项目,比如针对印度、印尼、俄罗斯等国的搜索。

于是,整个“蜻蜓”项目就此停滞不前。

生于2017,死于2018

现在,“蜻蜓”项目胎死腹中,从曝光到结束,热闹而孤独。

“蜻蜓”项目最早曝光是今年8月1日。

当时The Intercept挖到消息:Google正在为中国用户打造一个定制版搜索,而且早在2017年年初,这个项目就开始了。

项目代号Dragonfly,“蜻蜓”之意。

然而一经曝光,这只蜻蜓就激起千层浪。

马上就有1400名谷歌员工签署了联名信,要求公司提高透明度,称“蜻蜓”项目的进行引发了紧迫的道德和伦理问题。

虽然桑德尔·皮猜等公司高管都给出了相应的回应,但员工没有买账,甚至有不少员工愤而离职。

Google原本希望把事情控制在内部讨论层面,甚至谢尔盖·布林和皮猜都愿意在内部全员大会中说明,但事情越藏越受关注。

其后9月26日,一场参议院的听证会中,Google官方不得不公开承认“蜻蜓”项目存在。

然后员工的抗议更强烈了。

11月28日,Google员工又搞出联名信,指向非常明确,呼吁公司取消“蜻蜓项目”。

因为一部分员工不接受以“服务中国用户”为由,去专门打造一个定制化版本,这不符合Google价值观。

现在,如联名信所愿,“蜻蜓”项目落入尘土。

桑德尔·皮猜在美国国会听证会时给出了最新表态:没有在中国推出搜索引擎的计划,但拒绝排除将来推出的可能性。

而更严重的是数据集关闭。

The Intercept爆料,Google已经暂停了对相关数据集的访问,原来负责“蜻蜓”项目的工程师,已经转移到其他的项目上。

总之,原计划2019年1月到4月推出的“蜻蜓”项目,已凉凉。

也不知听闻此消息的你怎么想?

但Google在发给美国媒体CNBC的邮件中这样说:

依然想服务中国用户。

360搜索助力考生填志愿 专业报考信息全汇集

高考正式结束,随之而来的估分报考成为考生们的头等大事。专业内容,高校资源等方面都是众考生与家长们衡量报考的重要标准。今年高考填报志愿期间,360搜索特别推出创新应用,将全面提供考生及家长想要报考专业的就业远景、职业方向、薪酬和高校排名等信息,为广大考生准确填报志愿提供参考。

360搜索页面

相关学科介绍 让报志愿变得有的放矢

据了解,360搜索创新应用可以分为两方面,首先,360搜索提供的相关学科介绍,从学科的就业前景,各地招聘需求,开设院校三方面集中展示,考生家庭仅用一个页面就能了解所有信息,实现有效的信息获取。

打开360搜索搜相关学科,专业学习内容,专业平均薪资,甚至是专业在各大城市招聘职位数量,都将一一为考生家庭呈现。

不仅如此,页面下拉还有来自知乎、360问答等处的学科知识问答,让“前人们”为考生家庭提供真人解答。

360搜索相关学科显示页面

量体裁衣 报一个“门当户对”的好学校

其次,360搜索还将为考生及家长提供最全最新的全国大学排名表,排名列表分别来源于校友会、高考派、武书连、网大四处,考生及家长通过对不同版本的排名进行对比,可以准确了解各高校实力。

360搜索高校排名显示页面

专家特别提示,好的专业不代表好就业,热门专业冷就业,冷门专业热就业,在填报志愿时,考生家庭需要综合考量各方指标。而360搜索提供的创新应用,就能让考生家庭对各方面都有直观的了解,帮助考生家庭做出正确判断。

更值得一提的是,360搜索旗下百科还开辟了“高考通道”,将邀请名家进行直播报考注意事项,通过面对面讲解的形式,让高考家庭掌握报考技巧。

此外,新设置的独特的小功能,“智能选大学/专业”,考生只需将自己的分数填入,系统将自动筛选适合考生填报的院校,更借用了老师常说的报考法则:“冲一冲”、“稳一稳”、“保一保”生成三个板块,方便考生家庭填报志愿。

高考相关资讯精准又全面 和同类产品相比360搜索略胜一筹

作为互联网时代资讯的最重要入口,搜索引擎自然是大家获取信息的首选途径。笔者对国内几个主要的搜索引擎与高考相关的功能进行了对比,发现从信息的精准和实用性角度综合比照,360搜索还是略胜一筹。

首先是栏目信息的设置,对比之下,360搜索栏目设置更为详细,分类更为精准,比如对于艺术类考生、港校招生都提供了专门的入口。这一细节尽可能满足了更多人的特殊需求。

对比两家搜索引擎的高考资讯入口,360搜索的入口设置更详细更精准

其次是高考新闻的重点推荐,可以让考生第一时间掌握高考最新的动态,不错过与高考相关的任何一条重要信息。

360搜索对高考的最新动态进行了重点推荐

最后,360搜索整合的高考导航不仅提供了今年高校专业新增及撤销名单、调整学位授予门类等重要资讯,而且还提供了诸如:高校收费标准、高校联系方式、助学贷款政策、高考加分政策等重要讯息,尽量满足每一位考生的需求。

360搜索整合的高考导航满足更多考生特殊需求

作为中国第二大搜索引擎旗下产品,360搜索考虑运用大数据技术,准确、全面的对各学科的信息进行了一个集中整合,为不同需求的考生提供尽可能精准的信息。从用户体验角度横向对比,360搜索提供了优于其他搜索引擎的产品体验,力争为考生提供了下一步人生规划的信息参考,为考生的择校择业安全保驾护航。