谷歌又来黑科技 推出 病症搜索

据外媒报道,最近,谷歌开发了一个新的搜索功能“医疗病症搜索”,用户进行疾病搜索可通过使用iPhone或Android版谷歌搜索应用展示出相关疾病,并通过自己的实际情况进行初步判断。

例如,查询“肚子疼”、“皮疹”、“偏头痛”等病症时,就会在搜索框的右下方看到6张数字卡片,每一张卡片都大致描述了与这项搜索结果相关的常见健康问题。

据悉,搜索结果是由哈佛医学院和梅奥诊所的专家们审查后给出的。谷歌会在搜索页面描述症状的概况,并与其他信息放在一起,如:是否可以通过各种方法进行自我治疗,是否严重到必须寻求专业医生的帮助。此外,谷歌APP还提供语音搜索功能,为用户随时搜索提供方便,例如:可以一边做饭一边询问谷歌。

谷歌搜索团推产品经理维罗妮卡·品金(Veronica Pinchin)表示:谷歌在全球范围内的搜索请求约有1%与病症有关,所以公司针对数百万不同的搜索关键词创建了数百万张卡片。但这并不意味着每次都能显示正确的卡片。由于这只是一个算法,所以并不完美,但我们会逐渐扩大它的覆盖范围,改进信息的精确度。“

同时,品金说道:我们不能取代医生为病人作出诊断并提供治疗建议,但我们希望能够帮助他们改善沟通效率,因为我们的一大重点是降低这些信息的获取难度,希望让其成为一个所有人都能理解的语言,而不仅限于医生。”

美国家庭医生学会主席万达·菲乐(Wanda Filer)认为,谷歌早就应该改进与健康相关的搜索功能,这种做法令人鼓舞。“很多时候,人们会被网上的信息吓得魂飞魄散。”菲乐说,“所以,如果这些谷歌卡片能增加一些背景信息,那就可以为医生和病人带来莫大的帮助。”

目前,谷歌只提供英语版本,且只适用于美国地区,不过谷歌公司计划推出更多语种,让更多人受益。

据悉,未来这项功能还会融合进Google Home,谷歌的数字助手会变身临时医生,它不但可以通过你的症状诊断疾病,还能在紧急时刻提供急救引导。

————————

阿蔬医生的个人QQ号公开啦~

3502312478

出国看病的问题都请砸过来吧

微信公众号:出国看病那点事

(长按复制)

更多精彩等着你!

————————

5月25日明星搜索指数排行

女演员

排名

姓名

搜索指数

1

杨紫

499571

2

蒋欣

125473

3

古力娜扎

116776

4

王妍之

90720

5

乔欣

50241

6

7

8

9

10

张天爱

秦海璐

迪丽热巴

韩雪

张嘉倪

48006

45024

44663

44663

22086

男演员

排名

姓名

搜索指数

1

黄子韬

245828

2

侯明昊

238327

3

秦俊杰

216487

4

陈学冬

127917

5

霍建华

121930

6

7

8

9

10

茅子俊

尹正

成毅

马天宇

韩庚

118325

101981

85725

76680

57908

第一经纪人致力于发现有潜力的新生代演员,为影视公司、剧组输送优秀人才;

商务合作 、投稿联系电话:17701336570

深度解析京东搜索排序算法规则(四)

京东好店、虚假作弊、千人千面个性化排序在搜索排序中也占有很大的比例

6.京东好店

京东好店,是指基于京东平台风向标对店铺综合服务能力进行评分,甄选各二级类目中评分排名前10%的商家,并结合开店时长等基准要求给予商家的平台认证。获得京东好店认证的店铺会在PC/APP/微信手Q/M端有好店认证标识。

商家是否通过通用型京东好店的认证,其综合经营及服务能力的强弱,将影响该商家店铺中的商品在京东搜索的排序结果。主要考核因素有店铺销售、店铺的销售转化、综合服务能力、同行业商家对比等。

7.虚假作弊

作弊指通过非正常手段快速提升商品在搜索结果的排序。作弊行为会严重影响消费者的搜索体验,对通过提升自身服务质量的商品或者商家是不公平的。为减少作弊行为对搜索的不良影响,被判定为作弊的商品将根据其作弊程度进行处理。

8.个性化排序(千人千面)

不论是淘宝还是京东,个性化排序早已经是为满足各类消费者在同一搜索词的不同需求而上线排序的个性化服务,实现搜索千人千面。个性化排序,也就是同一搜索词,不同的消费者可看到不同的搜索结果。

目前 的逻辑是按照前一天的综合计算消费者的浏览、加购、购买、搜索、咨询某些商品的行为权重进行排序;没有访问过的店铺目前主要是商品本身的销量、评价、浏览量来进行综合排序.

消费者行为个性化是指把消费者的浏览数据、购买数据使用到搜索排序中,当消费者用搜索时,可以快捷方便的找到这些商品。随后消费者性别模型、消费者购买力模型等数据也会被应用到搜索排序中,使排序多样化,满足不同消费者的不同搜索需求。

另外,为减少0库存商品对搜索体验的影响,搜索结果中该消费者所在地区无货的商品在排序中将被做降权处理。

个性化搜索排序一直在不断进行优化,不但能增加用户粘度,而且还增加买卖匹配的精准性,提升消费者搜索体验的同时,为商家带来更精准流量。

装修设计的风格搜索热度前5排名

新房要装修,对于“看啥啥漂亮“的业主来讲,确定一个自己喜欢的装修设计风格,实在太难。俏业家小编根据百度指数数据,做关于2017年上半年新房装修设计的装修风格的搜索前5排名,帮助各位业主迅速找到网红装修风格!让选择不再纠结!

排名第一,北欧装修风格

北欧风格重视装修的实用性,简单自然的设计观打造“极简主义”的理性取向。这种装修风格把舒适体验度放在首位,特别受到85后的追捧。

排名第二,欧式装修风格

欧式风格以奢华品质见称,有强烈的独特性的文化潮流。注重对称的空间美感。历久不衰,因此,多被用于别墅等大户型的装修,所以热度不减,任然是装修设计风格中的热搜风格。

排名第三,美式装修风格

美式风格,小资比较偏爱这种风格,既能体现他们对生活方式的需求,又能在小奢的氛围中,包含自在与情调。

排名第四,田园装修风格

田园风格的设计里,粗糙和老旧是被允许的,因此,这种朴实,亲切的装修效果很自然的被凸显出来。在喧哗的城市中,低调的享受生活,靠近自然,得一份宁静。

排名第五,现代装修风格

现代风格往往造型简洁、无过多的装饰,重视功能和空间结构,注重发挥新房户型本身的形式美。不过,随着北欧装修风格的兴起,现代风格的概念会被外行人模糊,因而,被搜索量有下降。

Win10系统优化搜索索引的方法

不少用户在电脑使用过程中,发现正式版系统自带的索引服务功能很占资源,而且还不能随意将其关闭,因为会使很多功能不能使用,这该怎么办呢?其实,我们可以优化一下搜索索引,减少其对资源的使用。

方法一:关闭在线搜索

1、微软将Web搜索加入索引功能中,其实就是让必应进行搜索,内容还是需要开启浏览器查看,很鸡肋;

2、我们可以进入任务栏搜索框的设置,将Web搜索关闭。

二:搜索服务延迟启动

1、按Win+R键,输入“services.msc”,打开服务;

2、找到并双击打开“Windows Search”服务,将启动类型选择为“自动(延迟启动)”。

三:禁止索引C盘

1、C盘大多是一些系统文件,所以对C盘搜索一般没有必要,可以关闭;

2、打开资源管理器,右击C盘,选择“属性”,取消勾选下方的“除了文件属性外,还允许索引此驱动器上文件的内容”。

四:自定义索引区域

1、按Win+X键,选择“控制面板”,打开“控制面板”,选择“索引选项”;

2、在索引选项窗口中,点击“修改”按钮,选择一些必要的索引位置即可。

(图文为原创,如需转载请注明出处)

原文链接:

付费搜索明确属于广告了 由此带来3大涉税风险

国家工商行政管理总局于7月4日出台了《互联网广告管理暂行办法》(国家工商行政管理总局令第87号,以下简称“《办法》”),将于9月1日起生效。

该《办法》第3条对互联网广告的范围作了正列举:“互联网广告包括:(一)推销商品或者服务的含有链接的文字、图片或者视频等形式的广告;(二)推销商品或者服务的电子邮件广告;(三)推销商品或者服务的付费搜索广告;(四)推销商品或者服务的商业性展示中的广告,法律、法规和规章规定经营者应当向消费者提供的信息的展示依照其规定;(五)其他通过互联网媒介推销商品或者服务的商业广告”。

在《办法》出台前,由于互联网广告业态是借助虚拟数字环境提供的,与传统的广告类型不同,以上五类服务的性质具有模糊性,特别是付费搜索通常不被认为属于广告性质。《办法》第一次明确了以上五类服务的广告性质,因此带来的涉税风险主要包括以下3点:

一、发票开具的风险。《办法》公布前,因为互联网企业提供五类服务的性质判断不清,既有开具“广告服务”品名的,也有开具其他品名的,诸如“咨询服务”、“技术服务”等。按照《发票管理办法》关于如实开票的规定,《办法》公布后,互联网企业需要注意,如果发生五类广告服务,应当开具体现“广告服务”内容的发票,否则属于开具品名与实际交易内容不符,需要承担法律责任。

二、企业所得税的风险。《企业所得税法实施条例》第44条规定:“企业发生的符合条件的广告费和业务宣传费支出,……不超过当年销售(营业)收入15%的部分,准予扣除;超过部分,准予在以后纳税年度结转扣除”。因此购买互联网广告服务的企业所得税纳税人需要注意按照限额扣除。互联网企业也需注意发票开具品名是否正确,如果发生的服务属于《办法》规定的五类情形而开具品名不能体现为“广告服务”,则受票方有可能采取故意逃避广告费用限额扣除的规定,将相关支出在企业所得税前全额列支的偷税手段。这种情况下开票企业相当于为受票方偷税提供便利和创造条件,可能要承担行政责任甚至刑事责任。

三、文化事业建设费的风险。根据《财政部国家税务总局关于营业税改征增值税试点有关文化事业建设费政策及征收管理问题的通知》(财税〔2016〕25号)有关规定,提供广告服务的广告媒介单位应按照提供广告服务取得的计费销售额和3%的费率计算缴纳文化事业建设费。对《办法》中列明的五类互联网广告,提供广告的互联网企业应当按照收取的全部价款和价外费用减除支付给其他广告公司或广告发布者的含税广告发布费后的余额为计税依据,在缴纳增值税的同时缴纳文化事业建设费。

总之,《互联网广告管理暂行办法》的目的虽然不包含规范互联网广告的税收秩序,但其中对互联网广告范围的界定仍然会带来一定的涉税风险。鉴于互联网已经渗透到商事交易的各个领域,其风险的影响范围广泛,广大纳税人切不可等闲视之。

按:《互联网广告管理暂行办法》是工商部门制定的行政规章,出台旨在规范互联网广告活动,保护消费者的合法权益,促进互联网广告业的健康发展,维护公平竞争的市场经济秩序。然而这一规章相关的规定暗含着对特定交易类型定性的规定,进而涉及税收和发票的风险。学习税法不能只局限于税收相关法律法规和财税部门制定的规范性文件,而是要放宽眼界,从其他类型的法律法规和规范性文件中解析与税收有关的风险和注意事项。

从搜索时代到大数据时代 你的营销有效吗

互联网,正逐步从“搜索引擎时代”进入“大数据时代”,平台没有变,但工具变了、传播变了、模式变了,营销的价值挖掘方式,自然而然也发生着变化。所有的企业、品牌,包括传播平台,如果不能顺应这样的变化,或许你连消费者在哪里都不知道。

如果没有数据支撑,你可能想象不到女性搜索最多的关键词,不是“爱情”、“美食”和“美容”,而是“减肥”。你也可能想象不到,越来越多的女明星在借助大数据,寻找自己合适的代言产品和项目。

互联网,正在从“搜索引擎时代”进入“大数据时代”,平台没有变,但工具变了、传播变了、模式变了,营销的价值挖掘方式,自然而然也发生着变化。所有的企业、品牌,包括传播平台,如果不能顺应这样的变化,或许你连消费者在哪里都不知道。

传播变了:从“记录”到“预测”

有两个故事深刻记录了“搜索营销”与“大数据营销”——故事一:某门户网站老总怒气冲冲地训斥广告总监道:你怎么能让这些情趣用品的广告放到我们的网站页面上?之后,老总有上情趣网站习惯的消息在全公司不胫而走。故事二:Target超市用25种典型商品消费数据构建“怀孕预测指数”,并向一个17岁女孩寄送了婴儿尿片和童车的优惠劵,在父亲兴师问罪超市的一个月后,才发现自己的女儿确实怀孕了。

如今,这两个故事描绘的营销图景“方兴未艾”,前者越来越多的出现在我们浏览的每一个网站,后者也正在逐渐成为现实。不过,仔细分析你会发现“搜索营销”与“大数据营销”还是相距了一个时代。

搜索营销是借助用户搜索、浏览过的网站记录下用户的行为习惯,并在下一次主动推荐给用户,它是一种先“记录”后“营销”的逻辑,它比过去的广告模式先进,但有可能用户在第一次搜索后消费就已经发生过了,再次营销时,已经不存在需求了。

而大数据营销则完全是“预测式”,它根据你之前的行为,预测将要发生的事件,然后给你推荐你当下需要的“东西”,由此产生的营销显然将价值挖掘到了极致。Target超市预测少女怀孕的故事,由此被媒体称为“世界大数据的第一课”。

5年前,一家广告公司的任务就是根据客户的要求给出一个广告创意,而如今除了广告创意人才,广告公司需要更多懂技术的人。依靠技术创新,品牌会变得“性感”,离消费者更近,用户能感知他。百度副总裁曾良对百度的描述,准确说明了这一变化:百度从单一搜索引擎已经转变为更懂人性和生活的科技营销平台。

沟通变了:品牌直面消费者

搜索技术对于用户需求的捕捉是割裂的,没有连续性。而大数据则可以有效“洞察”消费者的下一个需求。比如,某君今天团购了一个4人套餐,那么紧接着,他可能需要打车去餐厅,餐后可能会在附近KTV唱歌,或者去Shoping。

当用户的连续需求都可以被大数据分析到,由此产生的“贴心”营销推广,就不会让用户不适应,反而会“求之不得”。这意味着在“人”与“服务”间建立起全新的链接,而不需要广告作为中间方了,品牌的营销沟通方式变了。

用户是通过信息找到服务、产品和品牌,通过广告找品牌的过程会越来越少。纵然,有大数据技术,市场营销也不会是简单的数理模型,不会是消费者、广告主要什么就能直接一一对应。但是,互联网的自发性和透明性,加上大数据的丰富性,能够高能耗的帮助品牌让质化的消费者洞察到量化的依托,从而更快找到打开消费者心门的钥匙,确注定成为必然。

广告金主宝洁公司,从2012年大幅减少了电视广告的投放,并在2013年与百度达成“联合商业计划”——百度将持续帮助宝洁以更高效的方式与消费者沟通。与宝洁的合作,不仅给百度带来了史上最大“订单”,也启迪了灵感,百度据此创建其一整套涵盖大数据挖掘、新媒体投放模式与评估标准、数字消费者沟通的营销方法论,为更多的传统广告主树立标杆。

模式变了:从“展现”到“服务”

传统的营销更多是依靠“租用”媒体的版面进行,有版面就有“展现”,有展现就有用户。搜索引擎的应用无非是将更多流量导入特定的“展现”页面。而在大数据时代,这种模式正在受到挑战。标志性事件几乎同时发生在平台和企业主两端:从2013年起百度广告的年度收入已经超过央视;而海尔成为首家公开宣布放弃杂志硬广,转向新媒体广告的企业。

百事可乐为了顺应其目标消费群体的行为变化,期望找到一位更具有现代特征,更受90后以及年轻人喜爱的品牌代言人诠释其品牌内涵。百度在分析了百事可乐的目标人群,了解了他们的地域、年龄、喜好等等内容之后,进一步分析这群人的明星偏好,来看这群人心目中,与百事最为适合的明星是谁。

搜索引擎+大数据的应用,使信息传播的方式重构,过去金字塔似的信息组织与传播,被瓦解为网状传播,信息可以在人群中形成闭环,大数据也由此形成。这也让营销“脱媒”成为可能,可见新媒体和自媒体的兴起是这个过程的结果,而非原因。

营销脱媒让信息不再仅仅作为展现方式和对象存在,而更是一种“服务”方式。在此情形下,宝洁、平安都已成为百度亿元级广告主,而在过去,这种量级的投放只会出现在电视上,可以肯定的是,未来央视要立足于第二、第三大广告平台都很难,这些位置最终都将归属于拥有大数据的互联网公司。

前 360 搜索负责人加盟字节跳动 加速搜索业务布局

据 ,今日头条母公司正在加速进入搜索领域,据相关人士透露,前 360 搜索产品负责人吴凯已于2018年底加入字节跳动,担任搜索业务的负责人。对此,新浪科技向今日头条求证,尚无回复。

据了解,1月16日,“头条号”官方微信订阅号发文称,今日头条App上线“帐号内搜索”功能,“发过的内容一搜就有”。目前,新浪科技在今日头条App搜索发现,除了站内内容,一些站外内容,包括视频和文字都可以搜到。

而早在5.9.8版本的时候,今日头条App就已经上线了搜索推荐,在这之前的版本里面只是提供了一个搜索框,而那次更新后会提供一些搜索推荐。另外,App store显示,其6.7.8版本也优化了搜索体验。

目前来看,今日头条已经不仅仅是一个内容分发平台了,而是想做成一个全面的内容聚集平台,包括内容的呈现及搜索,这也将与百度的信息流业务越来越重合。

一图解千言 从兴趣意念直达搜索目标

前言

搜索是人们在海量信息中获取有效信息的一种常见方式。

与日常“文字搜索”不同,图像搜索是通过“以图搜图”的方式来获取人们想要的图片信息。

当前,图像搜索正在以更广泛的应用、更形象的体验迅速崛起,获得越来越多的市场关注,被公认为当前最具有市场潜力的应用之一,并且在电子商务、知识产权保护、服装纺织、旅游等领域逐步得到广泛应用。

演讲嘉宾简介

安永,阿里巴巴数据智能产品运营专家,来自阿里云智能事业群。

以下内容根据演讲嘉宾视频分享以及PPT整理而成。

本次主要内容分为三部分:

一、市场分析:图像搜索被公认为最具市场潜力的应用之一。

二、产品介绍:一图胜千言,从兴趣意念直达搜索目标。

三、用户分析:图像搜索已经在各种行业领域有了广泛的应用。

一、市场分析

如果从市场角度去看,国内的电商,无论是巨头,譬如天猫、淘宝;还是垂直电商以及跨境电商类的平台越来越多,无论平台大小,这些都是我们今天图像搜索这款产品潜在的目标用户。

用户购买产品时对内容检索的需求是非常的强烈,要求也非常高,而且需要强调的一点是:他们的使用场景不会是在某个安静的环境去购买,在上下班路上、在逛超市的时候,有你喜欢的一款衣服,结果没有合适的码数,这个时候你打开淘宝,搜索框有个拍照按钮,拍张照片一搜,直接下单,第二天心仪的宝贝就到手了,你们说方便吗~~

这就是我们拍立淘这款工具,我们可以直接在天猫、淘宝里面检索相应图片,事实证明的话,拍立淘的购买转化率也会高15%左右。

另外就是国内的图库IP公司。我们拿到了04年到16年的一个数据,可以直接看到图片素材的交易量有了快速增长的趋势,国内也有很多这样的客户,包括视觉中国、东方IC…

在互联网上也有各种图片,譬如论坛,或者说旅游网站中那些图片也是属于我们图像搜索的范围内的,这些也都是我们的潜在客户!

二.图像搜索产品介绍

图像搜索服务 (Image Search)是以深度学习和机器视觉技术为核心,结合不同行业应用和业务场景。

概览:

帮助用户在自建图库中实现相同或相似图片搜索的以图搜图服务。

我们产品是基于阿里巴巴电商拍立淘孵化出的搜索服务,提供低成本、高准确度、轻松交付的图像搜索服务!我们是基于阿里云IaaS底层,而且算法维护成本低,使用学习成本低,采用按月收费,同时不限调用次数,不限调用次数,不限调用次数!

图像搜索是基于百亿级别的图片训练,我们算法毋庸置疑,尤其是在电商、零售领域是所向披靡。我们服务仅考虑客户图片总量大小和QPS数量,不做调用次数的收费,简单明了!

产品优势:

? 搜索精度高:业内领先水平的搜索服务。

? 搜索效率高:结合超大规模聚类和量化索引技术,达到毫秒级响应。

? 支持海量数据:大规模检索引擎可支持百亿级别数据。

? 实时化接口:支持实时增删数据。

? 支持定制化:可根据用户需求定制化开发。

三.用户分析

我们的目标客户前提必须要有大量的图片,这些图片不仅可以是摄影作品,也可以是各种商品。

我们能为客户解决的核心需求就是:商品搜索、图片查找、近似图片推荐等。

如上图所示,我们所能覆盖的各种类目,电商类目是我们最擅长的,其他类目的话我们也有很多成熟的案例,也是完全可以商业化的。

在这要极其强调一点:如果有以上这些类目外的需求,比如说汽车,我们也可以去做一些探索和定制。

图搜场景例举:

电商图库类场景:

简化搜索流程,提升购买体验

用户只需拍摄或者上传商品照片,就可以根据图片进行商品搜索。 省去了繁琐的文字描述,简化了商品搜索流程,大大提升用户的购物体验。

通用图库类场景:

高性价比,支持大并发服务

图片分享和社交类网站通常有大量通用图片供用户搜索使用,利用图像搜索服务,可在云端快速构建百亿级图像搜索引擎,提供以图搜图功能,提升用户体验。

最后说一下:

我们使用图搜要有两个很重要的流程:

1.要建索引库。客户要把所有图片离线上传,把图片库传到阿里云上面做一个特征的提取,提取之后我们会建立一个检索引擎。

2.在线流程。当新的图片过来后,我们要做类目识别、主体检测、特征提取,然后和大库里面原来建好的索引做匹配。

以上就是我们今天想要告诉大家的主要内容,如果还是没有理解图像搜索真正的需求在哪里,可以先思考以下三个问题试试:

1. 客户能否使用准确文字来描述想要找的产品?

2. 客户如何区分想要的产品上细节层面的不同?

3. 海外客户使用不同语言怎么去描述需求?

PDF下载:敬请期待

其他数据智能产品资料即将上线~~

搜索体系的建立与优化

来源:知与灼见(授权发布)

看完本文你会学到

1.搜索体系的组成

2.搜索功能常见的模块

3.优化的意义及思考

写在前面的话

一般来说,搜索功能按顺序分三个阶段

点击搜索——跳转搜索页——搜索结果页

接下来,我们按照流程顺序一个个来说吧

一、搜索前

我们在使用搜索功能前,首先要找到他的入口在哪,所以设计一个明确,高效的入口是“登月第一步”。常见的移动端搜索入口会放在顶部或底部,有些资讯、博客、工具类app也会出现悬浮按钮式的搜索入口

二、搜索中

点击跳转到搜索页后,就可以进行输入了。搜索系统现分为“文本”“图片(扫码)”“音频(识曲)”三种载体分别应对不用场景下的搜索需求。页面中会出现哪些模块呢?

2.1 热词搜索

简称热搜,玩过微博的小伙伴们应该对非常了解,许许多多的流量“爆款”就产生在这里,这小小的方寸之间几乎是大天朝舆论的风向标。

2.2 关键词联想

当我们输入某个词或词组时,搜索系统往往会联想出词串组,帮助用户节省输入成本。当然,有时候出现的可能是相关内容的热搜或是广告投放。

2.3 搜索历史

这个非常好理解,就是用户曾经搜索过的内容,通常来说10条的展示量基本可以满足用户的使用需求,京东最多可以展示20条的搜索历史。不过也有少的,微博只有区区两条的展示量,估计是不想与下面热搜入口的主要视觉区域对冲,稀释流量吧。

2.4 运营区

这个模块的名称比较难定义,暂时叫运营区吧,此类模块经常出现在社交,泛娱乐类型的app中,搜索入口流量大,用户操作密集,建立运营模块/个性化定制模块既能生产流量,又能导流。

2.5 个性化内容定制

简单来说就是“猜你喜欢”,根据用户平时的产生的行为进行个性化的推荐。「千人千面」就是说这样的功能啦。

2.6 分类

通常会出现内容载体/功能形式划分比较清晰,统一的app中,类似于资讯类,阅读类。有些app的分类是独立的模块或是一级导航,有些则会并入搜索中,这边不多讨论啦。

三、搜索结果

看到这里,我们来到了搜索过程的最后一步,在这个页面上,我们通常可以看到大量的内容按照特定的逻辑顺序排列,有的顺序用户可以在筛选器中设置,比如电商app中的,按价格高低排序,销量多少排序等等,有的则是根据业务原因排序,用户不能改变,总体来说每个app都有自己特定的逻辑顺序。在这个阶段的搜索栏,通常的交互方式为上滑隐藏。当搜索关键词与搜索结果高度吻合的时候,会出现命定词高显模块,来看图例吧。

当搜索结果出现异常的时候?会怎么样呢?(不考虑404)

1.搜索结果零匹配,会出现一些相关词组选项,这些词组通常是你给出的搜索内容的分词。

2.当你打错字的时候,结果页优先显示正确词组的匹配内容。但有个前提是,其他字或词要与相关内容匹配度非常高,这样才能被计算出来。

四、优化思路

4.1 用户使用目的不明

随着互联网的高速发展,手机变得越来越“好玩”,功能很多时候就不再是简单的功能本身了。长期刷微博的小伙伴们会发现,“热搜”模块内容的变更简直代表了时代的变化。从鹿晗关晓彤公开恋情,到pg one李小璐夜宿绯闻,到space x发射成功,热搜就像是时代的风向标,每个人都害怕错过热点,仿佛会被这个世界淘汰。在这种现象的背后,究竟是用户“精神消费”过剩?还是搜索机制的升级?我们习惯于把某个功能固定于在某个意义层面上而难以跳脱,设计搜索时,我们假定用户为「进行带有强烈目的性搜索行为」。但很多情况下,懵懵哒,不晓得干嘛的用户数量也非常庞大。热搜是一种非常棒的分流手段,我们也可以递进式拓展相关的模块,比如,搜索栏下可以放置「经常访问博主/up/头条号/专栏…入口,往大胆了想,在电商app中,针对于经常购买,浏览固定商家的用户,则可以在搜索过程中变更某个固定模块为「推送固定商家」「类似在售商品」的信息,根据用户的行为特点,让「内容定制化」上升为「模块定制化」,打破app模块分配固定、难调配的局面。

4.2 搜索智能化

首先介绍一下搜索的物理逻辑:用户输入信息,系统根据输入的信息匹配相对应的内容,再按照特有的rank逻辑进行排序展示。这个表述只是简单的介绍,如果想要知道具体的原理,还需要深入到搜索词库的建立。每个搜索系统都有一个词库和一个索引库,他们之间是可以进行快速的关联匹配的,词库就好比一本书,索引库就好比目录,当你心里有具体想翻阅的某个内容时,就可以根据目录找到页码,匹配到相关内容。实际上“查书”这样的动作就已经构成一个简单的搜索过程了。那么,机器检索复杂在哪里?这边要介绍一个新的概念:分词。

给大家看个幽默图片轻松一下,这位老母亲也是为自己的崽崽操碎了心。在图片用户输入检索内容时,你会发现,这个文本结构非常的口语化,“女儿高高胖胖穿什么好看”这更像是一个问句,很明显用户对于内容没有明确的预期。如果用这样口语化的描述性文本在淘宝中进行搜索,会出现什么样的结果呢?结果将会是没有匹配。

既然这样搜不到,那我们换个思路来吧,“女儿高高胖胖穿什么好看”,是不是可以换成“高个的女孩穿显瘦服装”这样的文本进行检索呢?我们来试试看。

咦,还是没有,那我们干脆再简化字段扩大搜索范围吧,换成“高个女显瘦”来搜索呢?

结果匹配到了很多漂亮时尚的衣服,搜索完成。

回头再梳理一遍过程,我们从“女儿高高胖胖穿什么好看”这样的非结构化文本到“高个的女孩穿显瘦服装”再到“高个女显瘦”的简化过程,就是一次人工分词操作。如果在足够智能的搜索引擎上,这些都可以自动完成。分词,简单表述为:拆分滤用字符串。例如,三国的军事家司马懿。可以拆分为“三国”“的”“军事家”“司马懿”这些词组。那在分词系统中,“的”“是”“在”是常见的停用词,通常会被直接pass掉,词组进一步拆分为“三国”“军事家”“司马懿”。经过这样的处理,非结构化的内容就会转化成结构化的,可匹配度高的词库,可以轻易的匹配到想了解的内容。这个说了 这么多搜索原理,那优化思路在哪呢?这里说两点自己的看法。

五、词条归一

这是针对词库的优化,说到这个,得介绍一下搜索系统匹配关键词的规则「TF-IDF算法」,假如用户在百度上搜索「苹果」,那苹果有很多相关的信息文档,怎么才能准确匹配呢?系统需要提取这些信息文档的关键词,感兴趣的小伙伴可以百度公式。系统计算出文档里每个词的TF-IDF值后,然后按降序排列,取排在最前面的几个词与搜索词匹配就可以得到准确的匹配结果,不会出现我搜的是苹果,出来的是青苹果乐园。进一步的还有Lucene的打分系统,让好的,召回率高的内容优先展示。说了这么多,词条归一到底是什么?其实就是将同一词义的词组归为同一个词,比如苹果的别称有“蔷薇科苹果属果实”“柰”“滔婆”“apple”“りんごちゃん”等等,这些词组说的都是同一个意思,所以词条归一就是将这些词组归为同一类别,扩大匹配范围,提高关键词召回率。

六、更符合业务目标的rank逻辑

我们在搜索完成后,会看到搜索结果会按照特定的顺序排序,再进行展示。有些产品中,展示的顺序是否能够切合业务目标,会直接影响到产品的收益。所以,制定展示逻辑的算法要高度理解业务内容,实时回归业务进行规则的更新。