美国的VC都用哪些数据库做搜索 帮你总结好了

对于创投圈而言,创投数据库就像考纲之于考生一样举足轻重,青芽草堂经过细心筛选、精心翻译整理,对比了以下五个数据库,在此分享给大家:

来源/ medium

作者/ 渡边千贺

作者简介/渡边千贺小姐是一名资深的美日科技业务发展专家,斯坦福MBA,现在是总部位于美国加利福尼亚的管理咨询公司Blueshift的全球合伙人,多年从事早期投资、战略发展、跨国企业管理、国际业务扩张等方面的工作,对数据和信息的搜集、分析、整理有深入的研究

译者/ 青芽草堂:贺一鸣 宫德婧

转载请注明出处

因为我对CBInsights一年的订购期马上就要结束了,所以最近我对几家私企数据库进行了比较。我随意申请试用了一些相似的服务并进行了全面的比较,不过我一开始并没打算这样做。但既然我已经做了一个26栏的表格对PitchBook,PrivCo,DataFox,Mattermark,CBInsights进行了仔细的分析,我和愿意和大家分享我的发现。

简单来说:

▲ 如果你需要详细的交易条款和创投核心资料,可以用PitchBook;

▲ PrivCo有很多初创公司的收入情况及其他财务数据,甚至很小的公司也能找到;

▲ CBInsights的提交成果最有条理,且界面美观友好;

▲ Mattermark的免费公司信息很棒,可以找到免费的员工数量统计;

▲ DataFox便于找到某一特定商业/科技领域的公司;

就我自己而言,我最终选择了DataFox和Tracxn(关于Tracxn会在之后详述)

当我启动某项简单的研究时,最开始我并不清楚我要寻找什么。但是当我对五家标的公司进行更深入的调查之后,我渐渐明白,我所需要的是能够从不熟知的领域找到目标公司,此时我需要数据库能够提供一份详尽的清单,列示出我可能无法准确描述的某一行业中的所有佼佼者。相比之下,深入的单个公司信息也很有用,但相比之下却是次要的。

价格高低不同,价格高的一年要10000到20000美元左右,低的一年大概6000美元。因为大家都知道CrunchBase,我也仍时不时地使用,所以也把它列近来作为参照。

Tracxn从哪里来?即使算不上是一个真正的数据库提供商,Tracxn在印度已经有超过100位研究员,能够在3天内按需产出客户定制报告。按月支付2000美元,你就能够要求无限量的报告。

但在进行每个数据库的详细介绍之前,你可能会问:

“任何一个数据库都囊括了足够的公司吗?它们的数据准确吗?“

个人认为,以上五家公司的答案都是肯定的。

Mattermark号称拥有最多的公司数——140万,而CBInsights最少——18万。我从未觉得CBInsights覆盖面太窄,相反,在我一年的订购期内,我也查阅了十家初创企业,从只有几个工作人员的微型公司到资金1亿以上的大公司都有。在每个数据库中都能找到这十家公司。

“五家公司的准确性也差不多,不过有几家会有更多的独家信息或分析信息,也就是说,深度可能不同,但都是准确的。”

总之,以下是我对每一家的看法。

PitchBook:

可能是金融圈人士首选

PitchBook总部位于西雅图,建立于2007年,拥有400多名员工,目前是这五家中最大的。他们自己的数据库显示,2015年他们有3100万的收入。

他们的优势在于估值和细致的投资条款。如下例,它不仅给出了投前/投后估值,还包括了清算优先倍数,反稀释条款(棘轮条款),参股情况,表决权等等。

财务身份惨遭PitchBook解剖的不仅仅是公司。就创投资本而言,除了日常的资金规模和投资组合公司等,内部收益率和投资留存资金等可能也会被曝光。如果你需要频繁地查看交易条款或创投资本的业绩表现,那么PitchBook就是一个不可或缺的数据库。

PitchBook还掌握各公司特别精确的员工数量数据,比如它不会粗略记为140而是会精确到138或142。他们还声称拥有收入数据,但不太多。如果你搜索收入在10万美元以上的公司,结果有12383条。这仅占PitchBook公司总量695000的1.8%。当然,许多初创公司并没有收入,但也很可能是收入在10万美元以上的不仅仅只有1.8%。

在我看来,PitchBook最大的缺点在于关键词检索不灵敏。它支持关键词检索功能,但是必须与它为每个公司预设的关键词精准匹配才能找到这家公司。比如,我想同时检索出著名的智能投顾Wealthfront和Betterment,但是却找不出这样的关键词。通常情况下,你只要找到其中一家公司,然后再查找它的竞争对手就能解决问题。但PitchBook还有一个问题:它列出的可比公司太多了,反而让人眼花缭乱。Wealthfront就有245家可比公司,Betterment也有133家。很显然这并不能让你分辨出谁是竞争对手。也许在某种情况下,需要了解和一家公司有些许关联的上百家公司,但我的工作中应该不会遇到。

PrivCo:

收入,收入,还是收入

PrivCo坐标纽约,拥有约30名员工和十二三个外包研究员。在五家数据库公司中,它是唯一一家不提供免费试用期的。我只好给销售人员打电话并且尴尬地要求他通过网络会议做了多次搜索。

PrivCo对财务数据的覆盖能力确实是出类拔萃。数据库包含的86.4万家公司中,大约75万家都有收入信息,占到近九成。无论是多年的财产负债表和利润表,还是三年前的一个收入数字都很有用,因为私企的收入数据一般都很难拿到。

PrivCo的销售人员说他们会深入挖掘离婚申请这样的机密信息来源。向他们的努力致敬。

但PrivCo的缺点也在于关键词搜索。它甚至还不如PitchBook:你需要遵循他们的分类标准。他们有2万多个分类,听起来很多,但当我真正开始查找的时候,每一个类目又显得太宽泛。例如,若要查找计算机或手机游戏,可能适用的只有3个分类:

科技>软件>在线电子游戏开发

互联网>互联网服务>网络游戏

媒体>教育>益智类游戏

呵呵哒……

不过好在每家公司的竞争对手都是由PrivCo的分析师人工挑选的,通常比较准确和到位。

CBInsights:

有趣而美观

CBInsights由精通社会营销知识的创始人AnandSanwal领导。公司有70多人,于去年11月筹集了1000万美元。

他们的网站在视觉上令人极其愉悦;信息以一种直观而有趣的方式呈现。如果把PitchBook和PrivCo比作是Windows应用程序,那么CBInsights便隶属于OSX。下面我们来看看优步的资金历史是如何被呈现的:

如果你将鼠标悬停在每个圆圈上,则该部分将被放大,就像Dock在OSX上被放大一样。

CBInsights还通过汇编职务招聘信息为你提供深入了解的机会。你可以按周看到求职人数变化的趋势,并了解创业公司的发展势头。他们还按类型(能力)和级别分析工作列表,甚至包括单个列表的一小个片段。使你可以很好地了解到初创公司的发展轨迹和战略。CBInsights不包括员工数量统计,但你可以利用mattermark获知这一信息。

CBInsights还有一个另辟蹊径的数据点:技术包。公司使用的是Hadoop,Docker还是Python?CBInsights掌握着这些信息。随着软件工程师被“热”科技所吸引,世界被软件(TM)所吞没,这些打包信息可能将是衡量公司五星的有效途径。或者,如果你身处企业软件销售行业,这些信息一定颇有价值。

还有一个小问题,也在于关键字搜索。它存在两个缺点:较小的一个在于,多个关键字将通过OR运算符进行联结,尽管你可以使用+(必须包含单词),-(不包含单词)和“”(短语)。更大的问题是关键字必须几乎逐字地出现在公司的介绍中。这两个问题合在一起,将变得令人恼火:当你搜索“IoT平台”时,你的描述中必须按照该顺序包含这两个单词;你不能单独使用“IoT”和“platform”,因为他们将被OR算法联结,从而使你获得许多干扰信息。

每个公司的竞争对手名单通常都是很好的,就像PrivCo的一样。因此,一旦你确定了一个特定领域的至少一家公司,你就能以菊花链方式找到其他家。我不是在此讽刺。现在这是一种合法方式,以供使用任何公司的数据库。

即使你无意注册任何数据库,CBInsights的免费电子邮件通讯也是值得订阅的。事实上,因为充满了具有洞察力的和/或有趣的数字搜索结果,时事通讯甚至比付费内容更有趣。这些时事通讯使提醒了我OKCupid的大数据分析博客OKTrend在2014年变得不活跃的事实,这件事使我十分懊恼。 CBInsights还提供免费的在线研讨会,这些也是极好的。

CBInsights的爬虫也很迅速。公司新闻在它们发出的当天就已经被列出。

在我为期一年的订阅期间,我对他们在功能和UI改进方面取得的进展印象深刻。今后应该会有更多进步的可能。

你也许已经猜到了,我不会再用CBInsights了。是的,不过只是因为它的附加功能太贵了。

mattermark:

免费的员工统计

mattermark在旧金山有40多名员工,迄今已筹集了1000万美元。他们最近宣布,他们大部分的私企信息是免费提供的。但如果你想要通过条件进行搜索,或者得到诸如历史员工人数,网络流量和手机下载量一类的与增长相关的数据,你仍然需要每年支付6000美元。

我的确尝试了他们的付费功能,同样,他们的关键词检索性也不尽如人意,尽管已经比PrivCo或PitchBook要好一些了。例如,当我搜索“投资管理”(+募集超过5000万美元,+最后一次资助活动是在2014年8月1日之后),我只得到了Wealthfront,而没有Betterment。不是我苛刻,这已经是在尝试了许多关键字或关键字组合之后了。(mattermark也为每个公司分配了关键字,但这两家的关键字是B2B,B2C,Analytics,Banking,Finance和Mobile。显然,这些都不是智能投顾所特有的)。mattermark为每个公司列举了“类似公司”,“强的”或是“中等的”。Wealthfront在“强势”对手里列出了11家公司,包括Betterment。这很好。

在mattermark上,你可以查看按孵化器批次分组的公司。虽然利用其他数据库,你可以通过搜索投资者名称和资金来源来做同样的事情,但这是一个很好的体验。

mattermark还有一个非常精良的搜索界面,在这里你可以根据需要结合AND和OR。但是纯粹的关键字搜索并不如我想要的那样强大。例如,如果我搜索“3D”(+融资超过5000万美元,+最后一轮融资日期在8月1日14日之后),它为我显示了14家公司,包括MagicLeap,但如果我使用“虚拟现实”而不是“3D”,我只得到有Jaunt和CCPGames两个结果。

mattermark的员工统计信息与PitchBook一样尤为具体。这两个数据库的数字不完全相同,但非常接近。mattermark的销售人员表示,他们从“社会化数据”中获得了这些数字。也许ADP现在被称为社会化数据,我并不清楚。对于少数几家初创公司,实际上我知道他们的员工数量,而mattermark(和PitchBook的)数字并不完全正确,但在已经在“足够好”的范围内了。(例如显示为30而实际为45.)

至于风险投资方面,mattermark只有像行业重点,投资阶段和位置这样的基本信息

mattermark的界面是简洁的,而且特别是针对员工人数而言,这是一个很好的免费资源.

DataFox:

人工智能与人类智慧集成

DataFox是位于旧金山的,由20多人组成的公司,由斯坦福大学的校友开创。

让我们先说说它的缺点:他们的UI让我回想起Balmer还是微软首席执行官的日子;。委婉地说,它的功能有些粗糙,或者换句话说,故障重重;每个公司的信息似乎都不如其他数据库中可用的那么深入;他们的爬虫也很缓慢(他们的销售人员告诉我,我可以要求加快特定公司的爬虫);它没有太多关于投资者的信息(基本上只是公司名称的文件集合);而且也没有办法搜索收购交易信息。

但是我决定放弃CBInsights而使用DataFox,因为它有几种方法来加强基于关键字的搜索。

例如,如果我输入“人工智能”,它将自动提出“人工智能计算机视觉”和“人工智能机器学习”,每个关键字下都包含了一些相关的公司里都包含了许多公司。我可以选择OR或AND作为手段来联结搜索条件。

DataFox还有一个有趣的功能,叫做公共列表,每一列个都是一组特定领域的公司。由DataFox的分析师或用户创建了超过10,000个公共列表。有些是通用的,如“社交游戏”或“网络安全500强”。还有更多细分的列表,如“物联网(垂直)”,“块链技术”或“斯坦福GSB2010”。你可以关注这些列表并获得关于其中公司的新闻快讯。

另一个特色则是“会议”:,在那里为一个特定会议他们创建参展商和演讲者的名单,以供参加一个特定的会议。如果你感兴趣的会议不在以上名单之列,可以要求DataFox创建一个。

DataFox可以让用户更容易地在数据库中添加更多的信息,同时输入嵌入在各种地方的表单。你也可以制作属于自己的数据库自己的数据区,把它作为进行投资时买卖的参考,当然这仅仅只能作为一个最基本的工具。以便你可以像使用salesforce一样使用它来进行投资,尽管这是一个基本的方式。

DataFox,mattermark和CBInsights都声称他们囊括了机器学习,但他们的人工智能(或可能是任何的人工智能)都尚未能完全取代人类。我想我们仍然处于在针对公司的信息发掘方面我们(的人工智能能力)仍然处在的监督学习阶段,而DataFox里的数据众包的方式可能会成为,建立更好的预测模型的一种方法。庞大数据功能可能会帮助建造更好的预测模型。

附录

1-Tracxn:聪明的印度人

比起数据库,Tracxn更像是创业公司界的Gartner,尽管他们提供了超过10万家公司的信息,如位置,创始年份,业务领域,资金,投资者和投资历史。但它的发现能力超出了基础范围:如果你搜索“人工智能”,它将会反馈6,815条结果;而加上“融资超过2000万美元”也只是将其缩小至724条。

相反,Tracxn可以根据需求提供超快速的搜索。你可以问一个具体的问题,他们会在3天内组织一个报告。他们在印度拥有超过100名研究人员,这些人一直在全球技术或咨询公司工作。不过要注意,他们的研究仅基于从互联网筛选的信息,所以不是特别让人大开眼界。但是,如果你想要一个快速的数据收集作为研究的起点,它们是快速而便宜的。如上所述,你可以以2000美元/月/席位的价格订购无限数量的定制报告。

此外,他们每月就某个特定模块部分发表16篇报告,这些报告都包含在订阅中。难怪传统咨询公司正在向着专业化和差异化的方向努力发展。

2-Quid:人工智能的可视化

Quid是一个基于AI的可视化引擎,可以让用户绘制出复杂的概念。他们吸收了超过30万个新闻和博客资源,来自世界各地的专利申请,以及44,000家由VC资助的创业公司的信息。这听起来远超我所需,但是我想尝试一下。

从我开始订阅DataFox以来已经有几个星期了,但是我有一半的时间出门在外。但我有一半的时间都处于未使用状态。现在我正式开始使用它了,虽然我有点担心他们古怪的界面让我怕怕的;。看起来他们试图一下子做太多的事情,以至于延伸得太肤浅而无法顾及到他们的用户界面或者用户体验,。也可能他们没有足够多的开发者。不管怎样,我相信DataFox的不同之处在于投资回报率很高。自从我订阅了一年之后,我自私地希望更多的人注册使用DataFox并创建有用的公共列表,同时为从而为公司提供更多的资源帮助他们把,使网站建设好变得更好。

版权声明:CareerIn除发布原创干货以外,致力于优秀投行/PE/VC文章精选、精读。部分文章推送时未能与原作者取得联系。若涉及版权问题,敬请原作者联系我们。联系方式:微信instructor22或instructor11

CareerIn19周投行/PE/VC学徒计划6期班正在进行中

2017 美国人民搜索最多的关键词是

Google今天发布了

2017年搜索关键词报告

通过大数据发现

在这一年里

人们搜索最多的关键词是

··· ···

这个结果,连Google自己都感到意外。

这个How,记录着人们的困惑、无助、恐惧和悲痛,但同时这个How也承载着一种无声却让人敬畏的力量。

朝鲜的导弹射程有多远?

如何制作抗议标语?

尊重女性

如何观看日食?

森林大火是怎么烧起来的?

飓风是如何形成的?

世界上有多少难民?

怎么用模板钉住窗户?

但还有更多的How是

人们时刻准备伸出的援手

如何帮助受灾群众?

如何帮助难民?

如何帮助波多黎各?

如何帮助墨西哥?

如何帮助拉斯维加斯?

在暴风雨中,如何安抚狗狗?

这个世界可爱又残忍

但我们都在用力而认真地活着

我们不想碌碌无为

我们也在期待遇见更好的自己

如何有所作为?

希望在这一年

你我在各自的“How”里

成为自己的超级英雄

如何成为超级英雄?

如何成为坚强的女人?

如何成为一个好父母?

成为一个勇敢而无畏的人?

– END –

搜狐分类搜索正式推出收费增值服务

随着互联网的飞速发展,对企业的重要作用日益显现出来,因此越来越多的企业也开始建立了自己的企业网站。但是在浩如烟海的互联网站点中,如何让自己企业的网站脱颖而出呢?

2001年9月21日,中国领先的新媒体、通讯及电子商务公司搜狐公司(NASDAQ:SOHU)正式推出面向企业网站的分类搜索收费增值服务(http://db.sohu.com/regurl/regselect.asp),在符合收录标准的前提下,使接受该服务的网站得以享受搜索优先权地位,以较低的成本更有效地进行网站宣传。

搜狐搜索引擎在互联网业界具有绝对领先和第一品牌的地位。2001年9月15日,在《电脑报》最受读者欢迎的搜索网站评比中,搜狐分类搜索获得42.2%的票数,获”搜索网站”市场占有率第一名,以近30个百分点的绝对优势力拔头筹,再次印证搜狐搜索在业界具有的不可动摇的权威地位。自1998年2月起,搜狐在国内率先推出分类搜索服务,在当时以鲜明的市场口号”出门靠地图,上网找搜狐”轰动互联网业界,并深受广大网民的热烈欢迎。经过三年多是实践经验的发展以及技术更新,至今累计收录了150万个网站,以符合中国语言文化习惯的科学分类方法科学系统的将搜狐分类搜索分为18部类,以层层相连的树叉型结构组织网页,是当之无愧的互联网搜索第一品牌。

搜索引擎作为互联网上仅次于电子邮件的第二大常用服务,是企业从事互联网推广和网络营销的最重要途径之一,在此基础上推出的增值服务更加具有收费的基础。目前在国外,Yahoo、MSN、AOL、Altavista、Lycos、iwon等知名网站,尤其是GoTo.com和LookSmart的搜索引擎都采用收费服务的形式。搜狐公司经过市场调查和为期2个月的试运行,日前正式推出搜索收费增值服务,是国内首次对搜索引擎收费这一经营模式的大胆尝试。

此次搜狐针对不同的客户群体将网站登录方式分为两种:普通网站登录和商业网站登录。”普通网站登录”主要为非商业性网站如个人、学校、政府机构等提供免费登录服务;”商业网站登录”针对赢利性、商业性网站,如商场、公司、电子商务等开辟的收费服务。搜狐将对”商业网站”进行优先确认,企业网站的名称和简介将显示在关键词搜索结果、类目页面的第一页,企业可以在商业网站”用户管理中心”查询类目页面、关键词搜索结果页面的访问量,以及经该页面点击进入用户网站的点击数。

搜狐公司执行副总裁兼总经理周云帆说:”搜狐搜索收费增值服务不仅以极低的成本使企业网站脱颖而出,并将在一定层度上改变网络营销方式。特别是对于广大中小企业,将在网上与大型企业站在同一起跑线,公平的开展竞争。同时,搜索收费增值服务将不影响检索结果,反而有利于分类搜索本身质量的提高。相对而言,具有赢利性和商业性的企业网站内容丰富、更新及时,制作和维护更加专业,该收费服务实行以后用户将可以更加方便的检索到这样的企业网站。”

从近两个月的是运行来看,获得了较好的营销效果,受到广大企业的普遍欢迎,尤其是在中小企业上网踊跃的江浙地区。搜狐商业网站登录服务的收费标准为:人民币1500元/年,或人民币3000元/2年。用户可以通过邮局汇款、银行转账或网上支付的方式支付服务费用。

百度发布2017搜索榜单

  2017年即将结束,又到了年终回顾的时候。12月18日,百度发布了2017年度国人搜索榜单,成为解读2017年中国网民“社会集体记忆”和“线上生活”的最佳窗口。

今年的百度沸点国人搜索榜单开设年度热搜榜、年度文娱榜、年度现象榜三大榜单,细分国内、国际、科技、娱乐、人物等18个领域的子榜单,共180个热门话题。目前分列18个领域子榜单首位的分别是:“一带一路”论坛开幕、马克龙当选法国总统、freestyle、AlphaGo对战柯洁、鹿晗、周有光、战狼2、人民的名义、王俊凯、鹿晗关晓彤公布恋情、冯提莫、王者荣耀、红黄蓝、iPhone X发布、西汉高速重大交通事故、国产客机C919、脱发“90后”、滑稽表情。

即日起,用户使用手机百度或PC端百度搜索“2017百度沸点”即可查看榜单全部内容。

百度沸点国人搜索榜单从衣食住行到国内国际时政,从娱乐、文化到经济、科技,关注范围几乎涵盖了中国社会的方方面面,以全体网民当年在百度的搜索数据为依托,不设专家评委,不进行线上投票,完全根据当年百度搜索关键词检索数据统计而来。目前,百度搜索覆盖超过95%的中国网民,日均响应数十亿次搜索请求,通过对海量搜索数据的记录和分析,百度以最真实、客观的数据,绘制出中国社会的注意力图谱,展现了中国网民“线上生活”的全貌。北京商报记者 魏蔚/整理

2018百度搜索榜首流行语 年度关键词发布 都是些啥

百度今天公布了2018年百度APP沸点国人年度榜单,他发布的榜单和奖项,是以网民搜索数据为热度影响力的主要依据,向我们呈现了2018年所发生的实时热点。

根据榜单显示,2018年度关键词为:世界杯、中美贸易争端、台风山竹、苹果发布会、延禧攻略、创造101、skr、李咏去世、锦鲤、电竞。

2018百度搜索榜首

而2018年度流行语有:skr、佛系、大猪蹄子、小奶狗、小姐姐、钢铁直男、C位出道、渣渣辉、真香、官宣体。

而在年度国民骄傲一栏,“IG夺冠”这一年度游戏圈热门事件,在榜单中位列第二。

2018百度搜索榜首

除了以上三个榜单外,2018百度APP沸点搜索子榜单还包括:年度国内事件、年度国际事件、年度全民热议、年度泪点事件、年度人工智能关键词。

2018百度搜索榜单

大数据揭秘 iOS11 iOS12 两大系统关键词搜索结果到底变了哪儿

自苹果圣诞节放假开始,过审难、产品批量下架、关键词频繁发生波动……等事件纷至沓来。对于开发者和推广人来讲可谓是怨声载道。而近期,iOS11&iOS12 不同系统中关键词搜索结果数及其排名也有着不同的变化,那么搜索结果数及其排名到底有什么具体变化呢?

1 月 2 日关键词波动事件回顾

在 1 月 2 日之前,iOS11&iOS12 部分关键词搜索结果数与搜索排名均不同

从 1 月 2 日开始,iOS11&iOS12 部分关键词搜索排名基本一致,而搜索结果数虽有部分关键词趋同但大部分关键词仍旧不同

根据此次波动前后七麦数据提取样本,针对此次事件进行分析,发现以下现象:

样本维度:(波动前后关键词样本一致)

iOS12 搜索指数>5000 的关键词

关键词个数:4515

搜索结果均为 App 相关数据(排除开发者、内购及专题等因素)

对比搜索排名 Top100 产品数据

取数时间:波动前–1 月 1 日、波动后–1 月 3 日

①波动前后,69% 的关键词在 iOS12 搜索结果数均少于 iOS11

如图所示,排除正常关键词搜索结果数波动情况(变化率绝对值10以内)后,无论是波动前还是波动后,iOS12 的关键词搜索结果数比 iOS11 的关键词搜索结果数均有所减少,且受影响的关键词数量差别不大。

②波动前 99.7% 的关键词搜索排名(Top100 产品)不同

③波动后 79% 的关键词搜索排名(Top100 产品)相同

④波动后,iOS11&iOS12 中关键词搜索排名趋于一致,而两系统关键词搜索结果数依旧变动较大

对比波动前后关键词搜索产品 Top 100 排名变动情况,可以明显看出波动后排名正趋于稳定。

总结

  • 此次波动使 iOS11&iOS12 关键词搜索排名趋于一致,但 iOS12 的关键词搜索数仍和 iOS11 有所差距,部分 App 在某些关键词下落榜现象仍旧存在。
  • 针对 iOS12 这一落榜现象数据显示,建议开发者重点分析落榜关键词性质,切忌恐慌。
  • 根据目前研究发现,大多数落榜关键词与 App 的相关性较低,建议仔细分析后再采取措施,相关性较低的关键词进一步评估是否需要优化。对于高相关性关键词落榜,此时建议重点优化,并进一步提高产品权重。

12 月 30 日关键词波动事件回顾

12 月 30 日,元旦放假期间,七麦数据发布相关快讯提醒:大量产品关键词覆盖总量减少,波动严重——部分关键词落榜,也有部分排名提升。对比关键词搜索结果后发现以下现象:

1、疑似中国区本地化权重有所增加(iOS12&iOS11 系统上部分产品关键词排名有所提升)

2、澳大利亚区关键词本地化大部分失效

3、产品在 iOS12&iOS11 系统均覆盖的关键词排名基本一致,目前观测有可能是苹果调整所致

目前此现象已于 12 月 31 日恢复。

猜测&建议

1.虽然目前 iOS11&iOS12 大部分关键词搜索排名趋于相同,但搜索结果数仍旧不同。苹果近期关键词搜索结果波动严重,调整不断,建议开发者们持续关注。

2.就目前关键词变动趋势来看,关键词波动正趋于稳定,关键词搜索排名逐渐趋于一致,猜测苹果正在不断调整,缩小 iOS11&iOS12 差异,尽可能保证多系统展现结果一致。

3.根据苹果 2019 年 1 月 1 日更新的 iOS 系统用户使用情况来看,已经有 75% 的设备在使用 iOS12 系统,开发者可将更侧重于优化 iOS12。

– end –

本文由七麦研究院专栏作者【石叶】原创,转载需联系七麦研究院获取授权,七麦研究院有权向非授权转载追究责任。

劈开迷雾 蘑菇街搜索架构及搜索排序实践

前言

蘑菇街的愿景是让一半人类更幸福,而让每位女性用户能便捷的找到心仪的商品则是搜索系统的愿景。作为重要的流量入口,搜索系统一直承担着关键的职责:优化商家流量分配和提升用户体验,让最优质和最符合用户个性化需求的商品排在前面。随着集团品质升级战略的深化,算法排序的不断升级,对搜索系统也提出了更高的要求。

本文首先介绍蘑菇街目前的整体搜索架构,之后会以一个在线请求来细化描述搜索排序的实现。

现有搜索架构

目前的搜索架构图,请看如下图所示:

整体架构从大的层面可以分为两部分:在线和离线。在线部分主要是涉及线上请求的系统(运维平台和排序平台是的系统,但主要服务线上系统,所以也划分在在线部分),包括业务层、投放层、精排层、引擎层。离线部分主要是算法训练和数据流相关系统(ACM打点、dump等)。

下面介绍下核心系统的功能。

Topn

topn是搜索系统的统一入口。向上通过统一的接口和检索协议对接不同的搜索业务,业务层只需要关注数据透出结构和来源,不用关注引擎细节和算法逻辑;向下则对接不同的搜索引擎和排序系统,这些系统只需关注自身的搜索及排序逻辑,不需要关心不同的业务接入。同时,topn集成了abtest分流系统及提供算法配置后台,使得多个算法的并行测试和日常上下线非常便捷;另外,通过分组隔离和标准化部署,在可用性和扩展性上提供了最大保障。

Abtest

abtest分流系统实现了uuid/hash/人群标签等多种分流规则,同时也支持自定义分流条件;分层策略能够让多层实验互不干扰。通过统一的实验控制台,结合ACM打点数据,能够实时统计ab数据效果,方便算法同学进行线上评估。统一的SDK使得有ab需求的业务方集成很方便,目前已覆盖集团90%以上的流量入口。

QR

QR系统的主要功能是实现query的改写(Query Rewrite)来扩展query。通常用户输入的搜索词是比较简单的,会根据算法的逻辑进行扩展,然后带到引擎中进行召回和计算。典型的改写功能如切词、同义义词扩展、类目相关性预测、品牌词加权等。QR系统实现上也比较灵活,支持算法的插件化开发,插件之间可以根据业务需求灵活组合。

精排系统

精排系统主要支持算法的个性化排序,以及灵活的算法业务开发。搜索引擎主要负责召回粗排结果,而精排则需要加载更多的特征和更复杂的模型进行排序计算或实时预测。算法排序业务复杂多变,需要较频繁地做ab对比实验,精排通过提供灵活的排序逻辑配置和动态加载机制来支持。实现上精排的底层存储复用了搜索引擎的技术,支持高密度的数据存储和高并发读取。

搜索引擎

基于自研的统一底层框架zindex实现的高性能C++搜索引擎;支持检索、过滤、统计、排序等标准功能;支持海选和多轮排序,提供插件化的排序框架,方便算法同学开发排序算法;支持灵活的索引结构和召回逻辑等。

UPS

User Profile System,用户个性化数据存储系统,包括离线的用户特征数据,以及实时的数据特征(实时点击的商品、实时搜索词、实时加购物车等)。主要服务两大核心业务——搜索和推荐,提供高性能的用户特征数据获取,用于个性化排序和推荐。新版底层基于搜索引擎的统一框架实现,目前线上峰值QPS接近10w,单次请求平均rt在3ms内。

引擎运维平台

提供引擎实例配置、创建、发布部署、索引构建、服务上下线、监控报警等全流程的运维服务。依托docker虚拟化技术和公司的发布系统,支持高效的容器化部署和发布;提供灵活的索引配置和管理;同时提供友好的web控制台进行操作。

算法排序平台

通过统一的可视化后台,为算法同学提供一站式服务,包括快速创建算法场景、模型、排序策略略、脚本,以及上线前的评测等。

为算法同学屏蔽了复杂的线上系统,加快了算法上线的效率和稳定性。平台目前已对接推荐和搜索的多个系统和场景。

dump系统

dump系统的职责是规范和管理搜索数据流,以统一的方式将上游的数据源同步到下游的存储,比如从DB到搜索引擎。从数据特性和系统需求上,提供三种形式:增量、全量、小全量。增量主要解决实时数据的变更和推送;全量主要提供离线高吞吐的数据构建;而小全量主要解决算法数据的更新。另外,在数据的可靠性上也提供了有效的保障。

特征管理平台

特征平台对算法特征进行统一的管理,包括规范特征的定义,算法训练特征生成的统一调度,特征生成后的统一存储,特征的推送上线,特征校验和监控等。算法同学只需专注模型训练和算法调优,特征的上线和复用则交给特征平台。

ACM数据采集系统

ACM采集系统主要解决用户行为数据的埋点、采集、清洗和追踪,为算法的模型训练和实时报表统计提供可靠的数据源。

实现上通过统一的打点日志规范(即自定义的ACM规范),在服务端进行拼装,然后在客户端进行埋点,之后统一收集到数据仓库,通过清洗后提供给算法训练或者做实时统计。

上面主要介绍了搜索系统整体架构和核心系统,看起来可能比较抽象。下面以一个真实的在线请求来详细阐述排序实现。

在线搜索流程

在实际场景,用户在蘑菇街app搜索框上输入 “nike”,搜索请求会经过以下链路(如下图示):

1.topn

topn接收到用户query,会根据用户信息和请求来源等进行判断,获取对应的 abtest配置以及后续请求链路的配置,比如该请求是否要请求UPS、请求哪个引擎、是否需要精排等 。

线上topn配置示例如下图所示:

一条典型的配置信息包括以下内容:

  • 排序code,用于指定搜索引擎的排序插件;

  • Abtest配置,这里我们用了UUID分流方式,指定某一位对应的值即可;

  • SearchEngine配置,会对应不同的业务实例 (比如商品引擎、店铺引擎);

  • QR配置,是否要请求QR;

  • UPS配置,是否请求UPS以及要获取的字段;

  • ReranConf精排配置,用于指定精排的排序插件和排序模型;

对照上图的配置,可以清楚知道哪些流量走哪个排序,对应请求后端的哪些系统。

2.QR

QR的目的是扩展query以召回更丰富的商品集,不同的query会触发不同的改写插件。可以看下“nike”这个query经过QR做了哪些改写:

  • nike品牌词触发旗舰店加权(商家扶持)。上图的brankInfo。

  • query类目相关性。上图的categoryInfo,数字表示对应的类目ID和权重。

  • 同义词扩展。“nike”有同义词“耐克”。

  • 切词这里没有,因为nike本身就是一个完整的词。

3.UPS

UPS主要存储用户的历史和实时行为,包括收藏、点击、加购、下单等,这些个性化信息提供给精排系统做个性化的排序。比如可以获取用户最近点击的商品列表,精排系统根据这些点击商品进行相似商品加权。接口提供单个UID+行为的获取和批量获取。 比如获取UID=783207的点击数据,大概结构如下:

4.搜索引擎

topn在请求QR获取改写后的query和UPS获取用户个性化信息后,结合自身的排序配置信息,拼成最终的query串传递给搜索引擎,做商品召回和粗排。

搜索引擎的排序是通过排序插件的方式开放给算法同学开发的,支持海选和多轮粗排序。topn配置里的sort=ltr_test_antispam 在引擎中的排序配置如下:

一个算法(algo)排序对应一轮海选(audition)加多轮粗排(rank):

  • 海选配置的是LTRRanker,是我们基于机器学习的线性排序器(ranker)。一个ranker可以包含多个打分器(scorer)。ranker和scorer的关系图如下所示,比如我们的线性ranker包含:商品质量分打分器、通用线性模型打分器、文本相关性打分器。多个打分器通过不同的权重进行线性加权生成最终的排序分数。海选的排序和打分逻辑相对通用和简单,召回性能也高,通常召回的商品数量较大(2w~10w),这些商品再进入到后续的多轮粗排。

  • 粗排配置的是三轮排序:QueryCTRRanker、BrandWeightRanker、AntiSpam,分别是基于query点击率预估的排序、品牌加权排序、反作弊过滤。粗排以链式执行,上一轮粗排的结果是下一轮粗排的输入。粗排的计算逻辑要复杂很多,参与排序的商品量也相应少,排序结果透出给精排系统(不需要做个性化重排序的场景下,结果直接返回给前端),粗排召回量通常在千级别(1000~5000)。

5.精排系统

精排系统主要做个性化重排序以及业务重排序,对应的排序模型和算法随业务变化较快,对数据和模型的实时性要求也更高。排序逻辑跟引擎类似,也支持多轮排序,典型的排序如同店打散、类目打散等。

精排系统最终返回topK排序结果给前端,整个在线请求完成。

总结

本文主要介绍了目前蘑菇街搜索系统的整体架构,以及在线请求链路的细化分析。

随着业务的发展,期间经历过很多次的迭代,才慢慢进化成现在的体系,不过可预计的将来现有架构也将进一步演变,我们的最终目标高效支持业务和算法。

本文只是囫囵吐枣,让大家对搜索系统有个整体印象,架构中的每个系统都有很多有价值的细节可挖,期待在后续的文章中跟大伙继续分享。另外,也会讲讲搜索架构是如何一步步演变过来的,敬请期待。

作者&来源:美丽说联合数据技术

医疗搜索行业踏上脱困之路 百度改360弃搜狗推新

法治周末采访史立臣

医疗搜索行业已站在了分水岭之上。

魏则西事件后,国家网信办等多个政府部门介入调查,尽管目前其提出的整改要求只针对,但是所引发的震动,已经影响到了整个搜索引擎行业。

业内人士指出,魏则西事件对整个民营医院的声誉造成重创,这势必会影响民营医院在搜索引擎上投放推广的效果;而随着监管部门针对搜索引擎提出更为严格的要求,医疗搜索的转型也势在必行。

百度360搜狗均有新动作

根据5月9日国家网信办公布的对百度的调查结果,百度须全面清理整顿医疗类的商业推广服务,对未获得主管部门批准资质的医疗机构不得进行商业推广;改变竞价排名机制等。

调查结果公布后,百度方面称将坚决整改。据了解,目前百度已停止包括各类解放军和武警部队医院在内的所有以解放军和武警部队名义进行的商业推广,并对全部医疗类(含医疗机构、医药器械、药品等)机构的资质进行了重新审核。

尽管受魏则西事件直接影响的是百度,但我国另外两家主要的搜索引擎服务商——360、搜狗也不可避免地受到波及,他们也在以不同的方式回应社会的关注。

5月3日,360搜索在致用户的公开信中表示,从即日起,放弃一切消费者医疗商业推广业务。公开资料显示,2013年4月,360搜索推出了子垂直搜索引擎——良医搜索,截至目前,已运行3年时间。

360搜索在公开信中表示,一年以前,360搜索曾经尝试通过严格的审核机制,来帮助用户规避虚假医疗信息所带来的风险和隐患,取得了一定的效果;但他们发现,只要互联网医疗商业推广这种商业模式存在,就无法从根本上杜绝虚假医疗信息给用户带来的伤害。

为此,在这份致用户的公开信中,360呼吁所有搜索企业:在相关的法律和制度完善之前,为了生命和健康,暂时放弃商业利益。

而另外一家搜索引擎公司搜狗,则没有响应同行此种呼吁,而是“反其道而行”,于5月8日正式上线了垂直医疗搜索产品——搜狗明医。

记者注意到,搜狗明医目前主要呈现维基百科、搜狗百科、知乎社区、专业学术期刊论文、丁香园等相关网站的权威内容,收录自正规大型医院、疾控中心、世卫组织及科研机构等“白名单机构”的专业内容。

搜狗明医相关负责人在接受法治周末记者采访时表示,搜狗明医希望让用户获得真实、权威的医疗信息。对于搜狗明医是否将参照国家网信办对百度的要求,去规范以后推广业务这个问题,该负责人则未直接回应,只是表示搜狗明医产品刚刚上线,正在不断优化中。 对于360搜索是否还会重启医疗推广、若重启后是否会参照国家网信办对百度的要求,360搜索方面也未对记者进行回应。

医疗推广已成刚需 慎用“一刀切”

搜索引擎诞生以来,经过多年的市场培养,通过搜索引擎查询病症及好的医院,已成为很多病人及家属的常规动作。

于是,医疗商业推广也成为了搜索引擎服务商获取收入的重要来源。2013年3月,互联网实验室曾发布了《关于搜索推广中的违法医疗广告情况调查》,指出“医疗广告凭其高利润的特点,在搜索引擎中出现频率一向居高不下,并成为搜索行业相关企业的主要收入来源之一”。

搜狗CEO道出了自己的一段亲身经历:家人患癌后,他也曾接触过“细毛免疫疗法”这一概念,当时病友强烈推荐成都市一家正规的医院在开展该疗法,后来他也通过上网搜索相关信息,绝大多数的中文资讯,都是在积极描述此项疗法。

王小川坦言,当时自己也以为看到了希望,直到他联系了在哈佛医院的朋友,才知晓该项疗法因为几无效果,已经被淘汰。

据卫计委统计,截至2015年5月底,全国医院数量达到2.6万个,其中公立医院13326个,民营医院13153个。尽管两者在数量上旗鼓相当,不过民营医院的门诊量和住院量占比仅为10%至15%,公立医院则占到了85%至90%。

据《每日经济新闻》援引一位莆田系医院负责人的话称,莆田系医院的广告投入中,60%投给了搜索引擎,甚至有医院在搜索引擎上的推广费用占到营业额的70%、80%。莆田系医院一年在网络搜索引擎的广告投放规模或达200亿元。

以百度为例,去年百度就“清理”医疗广告与莆田系发生纷争时,摩根大通发布研究报告称,“医疗相关广告主在百度2014年的总营收中约占15%至25%”。

香港艾力彼医院管理研究中心主任庄一强博士在接受法治周末记者采访时表示,与公立医院相比,民营医院缺乏政府信用背书、也缺乏人才优势,需要借助互联网的宣传力量,将其医院品牌及医疗服务推向市场。

庄一强不建议对医疗推广采取“一刀切”的态度,他认为,这将阻断优质民营医院的市场传播,不利于民营医院的整体发展,也不利于医疗体制改革。

王小川也认为,即使没有商业推广服务,正常的搜索结果也是良莠不齐,让急切想获得权威知识和帮助的用户,得到同样无助的结果,甚至带来误导和更大的伤害。

北京鼎臣医药管理咨询中心总经理史立臣也对法治周末记者表示,不能因噎废食,只要搜索引擎服务商按照《医疗广告管理办法》对进行推广的医疗机构加强审核,那么就能在很大程度上避免虚假医疗广告泛滥的现象,也能让民营医疗机构有一个高效的推广途径。

多因素将倒逼搜索引擎转型

魏则西事件后,国家网信办表示,将于近期在全国开展搜索服务专项治理,加快出台《互联网信息搜索服务管理规定》,促进搜索服务管理的法治化、规范化。

同时,国家网信办还将会同相关部门严厉打击网上传播医疗、药品、保健品等事关人民群众生命健康安全的虚假信息、虚假广告等违法违规行为。

易观智库新媒体总监庞亿明在接受法治周末记者采访时表示,国家网信办的整改要求,势必会影响百度的广告位库存,会对其收入造成影响,但相对的,广告位的稀缺会造成单价广告的上升;而对于广告的醒目标识提示会影响用户的点击率。

“愈加严格的推广规范,会对虚假医疗信息进行更加有效的屏蔽,而有价值的医疗机构、医药信息,也会得到有效的呈现。”庞亿明表示,受政策的影响,医疗行业对自己的推广预算花费也会产生影响。

魏则西事件的影响已经显现。由于为魏则西提供医疗服务的为莆田系承包科室,事发后,有网友整理出了莆田系在各地经营的民营医院或承包的公立医院科室的名录,该名录一度在微信朋友圈疯狂传播。

史立臣在工作中会接触一些莆田系民营医院的负责人。据他了解,魏则西事件后,前去莆田系医院就诊的病人数量明显下降,个别莆田系医院负责人坦言,“再持续一段时间,医院可能就无法经营下去了”。

“用户不可能一一记得每个莆田系医院的名称,出于安全考虑,可能会放弃所有的民营医院。”史立臣认为,受魏则西事件的影响,不仅莆田系医院声誉受损,而且对整个民营医院的品牌损失都非常大,未来3年内,社会资本将会对进入民营医院领域持更加谨慎的态度。

史立臣据此预测,中国民营医院将会进入加速整合期,民营医院数量的减少也会使得其在推广营销上的预算大为降低,而目前这几家搜索引擎服务商也是上市公司,出于业绩考虑,也会倒逼一些搜索引擎服务商对医疗付费推广业务进行调整。

北京市医药卫生法律专业委员会委员、盈科全国医药卫生及健康产业法律专业委员会秘书长朱丽华对法治周末记者表示,国家网信办的整顿,以及可能出台的调整政策,短期内很可能对诸多民营医院的“客源”产生不小的影响,民营医院也可能会考虑其他的广告推广模式,比如纸媒、电台等。

“但是,从长远看,不管是通过互联网,还是其他媒介,医疗机构广告必须是规范、合法的,才能够使民营医院走上稳定的、良性、有序的发展道路。”朱丽华说。

即将出台的互联网广告新规承载期望

魏则西事件过后,一些学者建议,应将竞价排名、付费搜索推广服务纳入广告法规制范畴。针对这一提议,有业内人士指出,如果让搜索引擎服务商承担广告发布者的审核责任,势必会增加搜素引擎服务商的运营成本,如此一来,竞价排名、付费商业推广模式恐将走向终结。

对此,朱丽华持不同看法。她对法治周末记者表示,根据现有相关法律法规,广告发布者对医疗广告的法定审查责任是形式审查责任,而非实质审查责任,即其不需要其到医院调查核实或亲自体验相关内容的真实性,而仅需要依照广告法、《医疗广告管理办法》等的规定,对相关资质或证件进行形式上的查验即可。

另外,朱丽华认为,目前,除了搜索引擎服务商,其他类别的广告发布者的法定审核职责也早已有之,但他们并没有因为依法实施了发布者的法定审核职责,就导致相关广告产业链或商业模式的终结。

“法律上讲究的是权利义务的平衡、对等,广告发布者如果收受了相关费用、基于公众的搜索,享受了相关基于广告的权利,而不履行对公众和社会的相关广告义务,不符合现代法律精神,也不会是一种长久的商业模式。”朱丽华说。

当然,互联网广告发布者具体履行什么样的审查义务,现有的广告法律法规体系,是否对其苛以过重的义务,朱丽华认为,这还有待于将来的互联网广告发布实践来检验,也有待于即将出台的《互联网广告监督管理暂行办法》能够紧贴实践,对这一行业进行具体约束。

史立臣,北京鼎臣医药管理咨询中心创始人

MBA,医药战略管理专家,医药营销专家,美国格理集团医药专家团成员,

现为多家大型药企发展顾问、营销顾问。

著有《新医改下的医药营销与团队管理》、《医药企业转型升级战略》,接受过包括凤凰卫视在内1000多次报刊和电视媒体采访,为药企和投资机构提供过100多次专业医药管理和投资培训。

联系:slcfw@sina.com,微信slcfwsr

搜索之时

激活搜索框、输入搜索关键词、点击搜索按钮这一系列非常自然的动作看似很简单,背后的故事不少。

之前笔者发表的介绍了用户使用搜索的原因,不同的用户群是怎么在页面中找到他们需要的信息,不同的搜索入口的设计可以在什么样不同的情况下使用。当然了,没看过也不要紧,因为这篇《搜索之时》和上一篇《搜索之前》没有关系… 并没有前因后果的联系,其实写的是用户在使用搜索功能的不同时段的用户行为和根据他们的行为对应的设计。

这里搜索之时指的是点击搜索框之后到点击“搜索“按钮或者按”回车“之间发生的事。是不是觉得间隔时间很短?短到平时都忽略了这个过程,但是这里面的故事不少,各个平台都花了不少心思在这中间过程的设计上。

点击搜索框

当用户点击页面上的搜索框之后,如果在PC端通常会给出历史搜索词和推荐的关键词;如果是在手机端除了两种搜索词外还会同时弹出键盘。历史搜索针对的是近期多次浏览对比同一个搜索结果的用户。可能是用户在电商平台挑选商品,可能是用户在视频类网站追电视剧。于是设计者们就把内容前置,可以让用户在不输入关键词的情况下直接得到想要的搜索结果。

推荐的关键词有几种可能,有其他用户近期的热搜词(最近流行的电视剧,流行的网络词),有平台推荐的搜索结果(给某些类目拉流量用的),有广告(金主给钱的),有针对用户的推荐词(根据用户最近的操作习惯精准化推荐的)。这其中近期的网络热搜词效果最好,针对用户的推荐词次之,之后分别是平台推荐词和广告。另外,也有对用户的输入行为预判并且分类的。这时内容前置给出的就是这些分类的名称,而不是某几个关键字。

输入关键词

用户在输入搜索关键词的时候,不管已完全输入了要搜索的关键词还是只输入了部分,各个搜索页面这时通常会给出关键词的联想搜索结果。有些平台在用户输入了一半的时候就根据用户的历史搜索记录和自己的数据库猜想出了用户想要输入的完整关键词。

有些平台甚至可以定位到某一部指定的影片

或是指定的地址,并且可以直接开始导航。

这也是一种信息前置的很好的方式:在用户输完所有关键词之前就给出搜索答案,给出下一步的操作。

关键词

现在大部分用户在搜索框输入要找的内容时已经不会再输入“黑色27寸戴尔高清4K显示器”这么长的关键词,而是中间会用空格把每个修饰语隔开。因为当用户用几个词语代替一长串字的偏正短语会得到更多的搜索结果。其实这样的长关键词更符合日常生活中的自然语言,把一个长短语拆解为几个词,加上空格再输入实际上是我们帮程序做了一步翻译的工作。

现在由于技术的进步,我们又可以搜索“黑色27寸戴尔高清4K显示器”了,程序会自动解析这一长串的字,先给出匹配所有关键词(黑色,27寸,戴尔,高清,4K,显示器)关联度最高的搜索结果,之后再给出去掉一个或者两个关键词的搜索结果。这样最大化的满足用户的需求,而不是尴尬的来一句“没找到相关内容”。

更高级的搜索方式

在可以搜索长关键词的基础上,现在有些平台已经可以语音输入搜索内容了。因为“黑色27寸戴尔高清4K显示器”也不是我们自然的沟通方式,“我想买黑色27寸戴尔高清4K显示器”才是。

只是语音输入并不适用于很多生活场景中,例如大家不会在办公室对着电商APP说我要买什么;而车载导航的场景就比较合适,封闭的空间,几个人相同的目的地,但是很多地址因为名字取的很尴尬,也不是那么容易搜到。

大家在做的搜索优化都是在简化搜索的过程,更精准的提前给出搜索结果。从点击搜索框给出历史搜词和推荐词,到输入部分文字给出部分匹配的搜索结果,到点击搜索按钮之后给出精确的搜索结果,是一个从模糊猜测到精确定位的过程。由于技术越来越完善,在模糊猜测的阶段我们现在就能抓到一些用户的需求,把搜索结果前置,缩短了搜索的流程。相信今后语音搜索可以更贴近自然语言,让搜索的过程更加高效。

谷歌推出 医疗病症搜索

据外媒报道,最近,谷歌开发了一个新的搜索功能“医疗病症搜索”,用户进行疾病搜索可通过使用iPhone或Android版谷歌搜索应用展示出相关疾病,并通过自己的实际情况进行初步判断。

例如,查询“肚子疼”、“皮疹”、“偏头痛”等病症时,就会在搜索框的右下方看到6张数字卡片,每一张卡片都大致描述了与这项搜索结果相关的常见健康问题。

据悉,搜索结果是由哈佛医学院和梅奥诊所的专家们审查后给出的。谷歌会在搜索页面描述症状的概况,并与其他信息放在一起,如:是否可以通过各种方法进行自我治疗,是否严重到必须寻求专业医生的帮助。此外,谷歌APP还提供语音搜索功能,为用户随时搜索提供方便,例如:可以一边做饭一边询问谷歌。

谷歌搜索团推产品经理维罗妮卡·品金(Veronica Pinchin)表示:谷歌在全球范围内的搜索请求约有1%与病症有关,所以公司针对数百万不同的搜索关键词创建了数百万张卡片。但这并不意味着每次都能显示正确的卡片。由于这只是一个算法,所以并不完美,但我们会逐渐扩大它的覆盖范围,改进信息的精确度。“

同时,品金说道:我们不能取代医生为病人作出诊断并提供治疗建议,但我们希望能够帮助他们改善沟通效率,因为我们的一大重点是降低这些信息的获取难度,希望让其成为一个所有人都能理解的语言,而不仅限于医生。”

美国家庭医生学会主席万达·菲乐(Wanda Filer)认为,谷歌早就应该改进与健康相关的搜索功能,这种做法令人鼓舞。“很多时候,人们会被网上的信息吓得魂飞魄散。”菲乐说,“所以,如果这些谷歌卡片能增加一些背景信息,那就可以为医生和病人带来莫大的帮助。”

目前,谷歌只提供英语版本,且只适用于美国地区,不过谷歌公司计划推出更多语种,让更多人受益。

据悉,未来这项功能还会融合进Google Home,谷歌的数字助手会变身临时医生,它不但可以通过你的症状诊断疾病,还能在紧急时刻提供急救引导。