搜索 – 第 65 页

搜索权重无法入池导致排名卡住需要怎么破

Posted on 2019年5月22日 by fagaome

Nov.

今天更大家分享搜索京东从搜索模型变化后，从流量和转化指标发生很多变化了从去年搜索书生部门刚上线人气模型，可能相对而言不是狠稳定，不知道判断标准是什么维度是好的产品，那么今天开始搜索已经越来越稳定，那么人气模型和搜索反馈两大模型变成一个权衡的指标，也让京东整体操作要UV价值和转化率同时拥有递增增长势的操作维度。今天重点来分享如何入池：另外（搜索书生会员金卡明天首发招商贴，欢迎优质品牌来咨询金卡会员服务。）

◆◆◆

今天是搜索书生陪伴您的第991天

京东双11要狠狠抓一批！

选词的标准流程

从选词标准就是搜索爆款的第一步，那么选择一个好的关键词对于您打造其他关键词有一定的相对的相互帮助，那么从交易指数上进行一个判断，优先选择一个成交指数的关键词，可以快速给商家的权重带来入池，因为京东目前在判断一个产品的优秀，主要还是转化率和点击率，那么从一开始来判断的适合，要选择一个优秀的关键词要通过行业分析的关键词分析交易指数来进行判断，然后进行放入表格选择一个可以一开始从新品操作第一个关键词，比如：我们做一个皮衣的项目，可能你一开始先入池一个高转化的是“皮衣男真皮”这个高转化的池，最后就这个高转化率的，可以带动皮衣男的增长。这个是一个一开始选择标准。

入池的标准流程

从入池标准看到一个爆款在10天打爆一个关键词带动三个中小词作用，那么入池的标准是第一个门槛也是可以把握好操作维度，搜索书生从私家班线下的培训一直强调关于通过我们给予的爆款滚雪球计算数据表进行操作，那么我们今年又提出一个递增式增长模型来稳定搜索本质的商业规律。

京东搜索目前入池标准，大家可以粗暴，也可以温柔，因为两则都可以得到一个优秀的排名，可能粗暴的方式得到的反馈结果可能到了第一页就可能看到效果不太好，那么递增的增长模型就是一个入池的考核维度，进行漫步式增长的操作流程。首先第一个指标：转化率，第二个指标：搜索人气，第三个指标，UV价值，三个指标，从一开始操作就要随着排名额增长去控制本身单量在页数维持的单量和转化率，那么因为随着单量越大，转化率要想控制UV就要做人气的导入。那么点击率和转化率和UV价值，可以通过行业值标来进行一个两倍的增长，目前测试，如果超过三倍以上就会被搜索给监控到，具体更精准指标搜索书生最近在开发一个工具，给大家使用，方便大家控制自己的指标维度，这样就不会导致你搜索产品的入池被停滞不前甚至会发现上下浮动的想象。

防止停滞的技巧

搜索规则从之前的销售额量作为考核，只要围绕搜索关键词来计入权重，那么就能让排名在一定的3天 7天 15天计算反馈权重，得到一个优秀的排名，那么从今天加入人气指，如果你的UV和点击率没有做为任何的控制的话，你的排名会发生七天内的停滞，一旦进入到卡顿一两天就会进入排名系统监控，那么停滞不前的行为会卡顿周期七天，七天后从新释放权重，然后就可以从新排名会有一定的起伏明显的增长，如果在七天后从新操作递增维度数据没有控制号，从新进入到卡顿排名，那么可能会被开始监控删除评价和忽略评价，那么从进入到删除和忽略评价的池子里面你发现商品在整体的判断都会受到影响，可能产品被监控了，那就是15天来释放，所以新品的前十五天的搜索搜索反馈是非常重要的一个SKU的重要生命周期，各位读者在操作订单的适合，爆发式增长已经过去，除非你一下子操作三天或者七天，七天以上的稳定增长周期，一旦进入你就要进入监控维度，你就要遵循操作递增的增长。

分享本文章到朋友圈，免费领取19套高质量KA运营计划表，发分享截图到订阅号哦！

搜索书生（sousuoshusheng）是一个专注京东搜索规则分享（share）与交流的平台，平台文章励志做最好的文章汇总和原创者。

高性能高可用机票实时搜索系统

Posted on 2019年5月22日 by fagaome

简

要

大

纲

看看系统诉求。

我们面临着什么问题。

我们的设计思路是怎样的。

粗略分享我们的大的搜索框架。

深入探讨一下其中的一个核心系统，报价引擎的设计与优化历程。

系统诉求

去哪儿网的定位是做全球最大的中文在线旅行网站。

对于机票业务来说，就是要从这些方面都做到最好。

1）我们希望用户在我们网站搜索出来的价格是全网最低的。

2）希望世界有的任何航线，都能在我们网站上搜出报价来。

3）希望报价的更新是最实时的，用户根本感知不到价格变化。

4）希望产品最大限度满足用户出行需求。

5）希望用户预订流畅，心情最愉快。

归根结底我们要取悦用户，用户第一是我们的口号，也是我们的压力所在。

面临问题

但是，这些方面要实现起来，做到最好，都不容易。机票行业与普通电商不同，有他的特点，最大的特点是价格和库存变化非常频繁，实时性要求很高。

1）库存变化体现在航班舱位的状态在时刻变动，特别是热门航线的航班，在出行高峰期尤其频繁。

2）价格变化则是因为机票的销售体系的特点，除了航空公司本身外，有大量的供应商，不同供应商的机票售价可能不一样，会根据各种情况动态调整，热门航线，出行高峰是价格变化的高峰。

3）除了供应商，作为机票的主要载体，航空公司也有很多运价方面的政策，这些政策也会根据各种情况进行调整，导致大量航班价格发生变化。

4）机票行业信息化比较早，所有的航班数据、运价数据、订座出票，都掌握在叫 GDS 的角色手中。国内主要的 GDS 是中航信。供应商和我们的数据都要从GDS 手中付费获取，付费一般是按指令执行次数来定的，价格不菲。因此我们不可能无限的获取航班数据，这就需要在新鲜度和费用上面做权衡。这也是导致报价变化不实时的一个因素。

5）此外，不同供应商在 GDS 的权限不一样，同样的航班拿到的报价可能不一样，这就对系统提出了更高的要求。

变化不是问题，问题在于变化的是海量的数据。

1）供应商在平台上录入大量的规则，来进行定价，这种规则相当复杂，数量级达到2亿；航司的运价规则也有上亿的量级，复杂度也很高。

2）全世界大概有28万条航线，我们粗略估算一下，全部的报价量大概会是千亿的量级。

3）搜索系统要面对每秒3千多次的搜索量，单看这个搜索量可能不算大，但是背后有大量的并发计算，每秒要计算1500万量级的报价产品。

设计思路

面对这些背景和问题，我们怎么做，能实现系统诉求呢？

1）有一次有朋友问我，你们怎么这么忙，机票搜索为啥搞这么复杂？放个静态页面上去不就好了，多少用户搜索预订都没问题。我有那么一瞬间，竟无言以对。

2）不过后来我想了想，要说这样搞也不是不可以，如果资源足够的话，我们大可以做一个很大很大的哈希表，把未来几个月的每条航线每天的航班报价计算好，用户来搜索直接就拿哈希表的数据展示就可以了。一旦监测到哪个渠道有价格变化，即时计算替换老的数据。这样一来我们的搜索将飞快，并且变价的情况会很少发生，这是最理想的。

然而现实是骨感的。有限的资源不允许我们这样做。所以我们只能从用户的角度入手。我们参考 CAP 和 BASE 理论，设计了分布式的系统。按需计算，用户需要搜索的数据，实时计算，计算完了将结果缓存起来，下一个用户再搜索同样的条件就不用再实时计算了。系统之间采用消息驱动的方式，使用异步机制来降低耦合，使系统扩展起来很简单。整个系统水平分了多层，各层有各层的缓存。各系统的计算流程都设计为无状态的，可以很容易横向扩展。

搜索框架

这个图就是我们搜索系统大的一个框架。

1）我们将系统分为4层，从上到下为应用层，聚合层，报价源层，基础数据层。纵向则根据各层的特点，划分为多个渠道或者多个源。这样划分的好处是不同的层可以独立发展，可以有各自的流量控制和服务降级策略，保证系统整体的高可用；不同的渠道和源可以有不同的处理方式，耦合度低，扩展方便。

2）应用层接受用户搜索条件，向聚合层要匹配条件的全量报价，经过筛选、包装和排序，输出给前端。按照不同渠道的特点，报价的包装和排序处理会有区别。

3）聚合层管理着所有航线的报价缓存，以供应商作为独立的存储单元。它接到一个搜索条件，会先问一下 Cachemanager ，有多少个供应商的缓存报价失效了，得到一个需要重新搜索的供应商列表，然后带着搜索条件：出发到达日期和供应商列表，向下层的报价源发消息，然后异步等报价源回消息。报价源接到消息之后，会对相应的供应商进行搜索，搜出报价之后放到redis里，然后发消息通知 PriceMerger 。PriceMerger 从 Redis 里将报价取出来，和没有失效的供应商的报价进行聚合，筛选出最优的价格进行包装。

4）CacheManager 是缓存失效管理系统。我们设计了主动和被动两套缓存更新机制。主动更新就是由各环节发现价格有变化，主动通知 CacheManager 。比如航班数据、运价数据发生变化、供应商规则数据发生变化、预订发生变价等等，都主动通知 CacheManager 。被动更新则是根据热度排行，对不同热度的航线，配置不同的过期时间，越热门航线的过期时间越短。

5）整个系统以供应商作为独立报价单元，报价源遵循这个规则。所以不同的报价源可以很容易接入搜索框架。

6）各层间的数据交换大多是异步的，用 Protobuf 序列化并 Gzip 压缩，通过 Redis 中转，能很好降低我们的 IO 和带宽使用，也使系统的耦合大大降低，扩展起来非常方便。

纵观整个系统的发展，我们遇到了不少问题，这里总结了一些有代表性的。

1）一个是报价数量很多，聚合层的系统，内存遇到了不少问题。有一次新上一种产品，直接导致了系统的崩溃。原因是新产品引进大量的字符串 Map ，这些 Map 还支持随意扩展，一下子涌进来很多对象， GC 都回收不过来了。这之后我们严格控制了数据的准入，只留必要的数据，尽量采用原生的数据类型，将很多小对象，编码成原生的数据类型，大大缩减内存占用。

2）另一个问题是报价源比较多，不稳定，有些供应商接口性能不好，回数很慢，而我们对响应时间要求很苛刻。对此我们采用分批回数的方式，先回来的报价，先返回给前端，多次轮询，直到报价回完，同时我们也设计了一个回数比例模型，如果达到这个比例或者超时，这次搜索就结束了，后台异步等报价源的回数，等下次的用户搜索，就可能看到新的报价了。

3）对于搜索条件，有个明显的冷热门问题，热门的航线和日期，搜索的人很多，数据量也很大。我们以航线+日期作为 Key 做了一致性哈希，将搜索条件均衡打到不同的服务器上，并且让相同的条件只会分配到同一台机器上，这样能最大限度地利用本地缓存。

以上是搜索框架的介绍。

报价引擎

下面我们来深入探讨一下报价引擎的设计和优化历程。

报价引擎作为一个报价源，是去哪儿网的供应商平台、我们内部叫 TTS 的搜索系统，是最核心的一个报价源。一开始的时候，是没有这个平台的，机票的报价都是从大量供应商的网站抓取的，预订交易都要跳转到外网进行。流量大了之后为了保障服务质量，有了这个 SaaS 平台，供应商通过这个平台录入他们的定价和服务规则，我们负责把价格计算好报出去，后续的预订交易流程，都在平台上完成。由分散到集中，这是机票服务发展到一定阶段的必然之路。到后来几乎80%的报价都是这个系统产生的。我们花了大量的精力对这个系统进行设计和优化。

一个机票报价是怎么产生的呢？决定因素有供应商规则，航司运价以及航班舱位状态，这些要素组合起来，即可计算出每个供应商每航班每个舱位的价格；我们会在这些价格当中，选取一些最优的价格，包装成套餐，比如低价特惠、商旅优选等产品，展示给用户预订。

报价引擎解决的核心问题就是，根据用户的搜索条件，对每一个供应商的定价规则库进行搜索，获取符合条件的规则，与航班舱位状态、航司运价进行匹配，计算出每个供应商每个舱位的最优价格。

供应商规则相当复杂，有日期限制、航司限制、航班限制、舱位限制、年龄限制等等，每条规则都有很多使用条件，几十个字段。这些规则量达2亿。

可以说供应商定价规则是决定机票价格的最重要因素之一。

成千上万的供应商在 TTS 平台上投放规则，少则几万，多则几千万。

这些规则的存储按供应商进行分库，每个供应商一个库，多个库作为一组，分布在一个 Mysql 的实例上，有多个 Mysql 实例。

在这个背景之下，系统面临这些问题

1）供应商更新规则数据很频繁，每时每刻都在更新，特别是热门航线。

2）最坏的情况下，每次用户的搜索都可能会触发所有供应商的规则搜索。 DB承受的压力是用户搜索量乘以供应商数量。这种情况下，业务增长一点， DB 的压力就大幅增加。

3）在老的系统里， DB 是压力最大的一环，读写都很频繁。曾经单独为搜索做了7、8组从库，但是还是扛不住业务的快速增长，故障频发，一家供应商出问题，比如更新太频繁，就可能拖累整个系统交易。

4）除此之外，频繁变化的航班舱位，热点航线的供应商规则量大、搜索量大，让系统的内存压力、计算压力很大，应用服务器也经常出问题。

新的报价引擎就是为了克服这些问题来设计的。我们回到搜索引擎的核心技术来看问题。搜索引擎主要是对收集到的信息进行整理、分类、索引以产生索引库。我们是不是应该组织一个合适的索引库，让搜索的效率大幅提升呢？

对用户搜索条件进行了分析，我们发现用户搜索的是航线日期，并不关心哪个供应商。但是我们因为系统结构的原因，要对所有的供应商库进行查询。聪明的做法是做一个适合航线搜索的索引库。我们将所有的航线拿过来，进行了热度排序，均衡打散为 N 个表， N 个表平均分布到 M 个库。然后开发了一个数据同步系统，将供应商维度的规则，实时同步到航线维度分表的索引库。

这个数据同步系统以 Binlog 同步方式工作。我们引入了阿里巴巴开源的项目 Canal ，这个项目通过实现 Mysql 的主从同步协议，能把自己伪装成从库，实时增量获取 Mysql 的 Binlog 数据。

我们通过 Canal 拿到增量的 Binlog 数据之后，做解析、拆分，将供应商规则按航线分布插入索引库，或者从索引库删除。

这时我们面临的问题是：

1）源数据写入量很大，集群峰值达20K TPS

2）为了保证报价的新鲜度，我们要求同步延迟很低，不超过60s

3）必须保持顺序一致性，如果先删后插变成先插后删，数据就不一致了

4）必须保持数据最终一致

5）系统必须是高可用的

针对前面4个问题我们的解决方案是这样的：

首先保证读 Binlog 的吞吐量：

源数据写入量、顺序性与同步延迟是矛盾的，为了保持顺序，一个 Mysql 实例只能由单线程来读 Binlog 。但是如果 Mysql 实例上的供应商数量很多，短时间数据更新量就可能很大，单线程处理不过来，同步延迟势必很大。因此我们将规则库分散到更多的 Mysql 实例上面，从物理层面保障了更多通道并行同步，提高读 Binlog 的吞吐量；

其次保证写索引库的吞吐量：

Binlog 数据解析、分拆处理到写入索引库阶段，为了保持顺序写，似乎也只能每个mysql实例单线程来做，可是这样写的吞吐量上不去，同步延迟也会很大。仔细分析一下，其实并不需要全局顺序一致，只需要每条航线的数据顺序保持一致就可以了。我们按航线划分了很多的队列，不同航线的 sql 在各自队列里保持顺序入库，这样并行度就高了，写入的吞吐量也就上去了。

再有就是保证数据的一致性：

增量同步可能会因为一些网络问题或者入库失败，导致数据不一致。这个时候，为了让数据最终一致，我们又设计了一个全量数据 Diff 的功能，定期（比如5分钟一次）对两个库的数据进行比对，如果有不一致的，通过增删来保持索引库的数据跟规则库保持一致。这就保证数据在异常情况下能短时间达到最终一致。

最后一个问题是系统的高可用。我们希望任何一个环节出现问题都不影响数据同步。

分两部分， Canal 这边本身已经提供了方案，应用服务器和 DB 都配备主备自动切换来保证高可用。这个不多说。

我们的同步程序呢，也设计了一套方案。系统是分布式的，一共有 K 个 Mysql 的实例，分配到 P 台服务器上。这其实是一个任务分配问题。要达到几个效果：

1）任务分配要均衡。

2）分配完之后保持稳定。

3）某台服务器挂掉了它上面的任务需要自动切换到健康的服务器上，不影响其他的任务。

4）加入了新的服务器，任务重新分配，保持各服务器的负载均衡。

我们利用 ZK 作为协调者，从集群服务器中选出一台 Leader 来执行任务分配，依靠 ZK 的节点发现和通知机制，实现了这四个功能。

这样我们的整个同步系统是高可用的，在吞吐量很大的情况下，峰值延迟不超过60秒，平均延迟10秒左右。

索引库构建好了之后，我们的系统结构可以是这样的。入口接收PriceMerger的搜索消息，这个消息会带着《出发》、《到达》、《日期》还有《供应商列表》这些参数，随机打到分布式集群的某一台搜索服务器上。服务器把符合这些条件的供应商规则从索引库查询出来，同时并行把航班数据、运价数据取回来，进行匹配、计算、筛选，计算出每个供应商的舱位最优价，将结果写入 Redis ，最后发消息通知 PriceMerger 。这个流程很清晰，只需要查一次库，理论上 DB 是没有什么问题的，应用系统也很容易扩展。但是系统做出来之后，还是遇到了大问题。

1）索引库压力很大。

2）是部分服务器的负载很高，GC频繁，吞吐量上不去。

为什么会这样呢？这个时候我们是比较沮丧的。但是问题还是要解决。我们考察了搜索条件的特点。

1）首先，搜索的请求条件冷热门很明显，热门航线比如北京到上海的请求很多，投放这些航线的供应商也很多，规则数量很大，热门航线的航班数量和运价数量也很多。这些因素结合起来，一次热门航线搜索， DB 和应用服务器的 IO 占用都很高， CPU 方面光反序列化就占用不少，报价计算的量很大，这就导致了 DB 和应用服务器的负载都很高，但是吞吐量上不去的情况。

2）另外我们的供应商规则，以及航班数据和运价数据，有大量的String、Map和 List 等对象，尤其热门航线的搜索，请求量稍微大一点，堆内存占用很多，释放不掉， GC 根本回收不过来。

4）分析了这些情况之后，我们有两个措施，一是想办法大幅减少 DB 的请求量，二是想办法减少内存的占用。

如何能减少 DB 的请求呢？

有效的办法是在应用服务器增加本地的 Cache 。查询出来的规则数据，不扔掉，放在 Cache 里下次同样条件的请求直接使用。然后每次搜索进来的时候，去索引库检查一下这个条件下的规则数量和最后更新时间，有变化的话就将缓存清掉，从 DB 取一遍，保证缓存数据的新鲜度。这样一来， DB 压力陡降，服务器 IO 也降了很多。

有了本地缓存，我们需要让缓存命中率尽量高，并且保持稳定。根本的办法是让同样的请求条件，每次都打到同样的服务器上。直接将请求按航线进行一致性哈希，可以达到效果，但是这样会有冷热门航线的问题，会导致部分服务器的负载不均衡。

我们对负载均衡策略进行了扩展，将航线+单个供应商作为哈希条件，一致性哈希分到某台服务器，之前的供应商列表就会分多批，一个请求分裂成多个请求，进行分发。

由于是一致性哈希，命中率会很高，并且我们增减服务器，不会引起缓存命中率的大面积变化。

单台服务器上的规则缓存，只是某些航线的部分供应商的规则，并不是全量规则，在集群服务器数量足够的情况下，不会占用单台服务器太多的内存。

DB 的压力在做了 Cache 之后大幅降低。但搜索量上涨后还是会出现负载高的情况。原因是每次搜索都会要检查规则是否更新。这个 sql 执行量很大。有没有办法减少它呢？回顾整个系统，其实我们已经在数据同步的时候就知道了供应商是否更新了规则，可以在这个时候，去通知引擎，将该条件的本地缓存失效掉。这样就不需要每次搜索都去 DB 里检查了，作为兜底可以1分钟检查一次。这样 DB 就毫无压力了。

另一个措施，是缩减内存的占用。

每条供应商的规则都有几十个字段，这些字段有很多 String ，整形，日期等对象类型。航班数据、运价数据，包含大量的 Map 数据。作为本地缓存，这些数据对象会长时间存在，如果占用内存太多， GC 都回收不过来。

分析一下特征。我们发现很多对象，都是一些个数有限的字符串，比如机场码，航司代码，航班号，舱位代码；还有一些日期的对象，只是精确到天；一堆定价的数值、一堆布尔值。

这些对象实际数据不大，但是对象的开销不小，比如一个两字节的航司代码的 String 对象，内存就要48字节，还有很多的小对象，由于 Java 的内存对齐，会导致大量的内存间隙，造成内存的浪费。

针对这些特点，我们做了一系列策略：

小的个数有限的字符串，做一个 Byte 类型的编码表，减少创建字符串对象。

针对一堆 Integer ，我们构造了一些 Short 数组，int数组来承载，减少对象开销，避免内存对齐产生的间隙。

针对日期，我们计算一个距离5年前的偏移量，存成 Short 数组。

总的来说，尽量减少内存的浪费，最后我们内存使用大幅减少，有接近50%的降幅。

这样一来内存也不是问题了，吞吐量就可以上去了。

除此之外，我们还在其他方面对系统进行了性能优化。

在计算中采用异步 Http 或者异步 Dubbo 方式，并行获取需要的资源；很多计算能并行的都并行来做，杜绝锁的出现，充分榨取多核 CPU 的计算能力；

对于一些复杂计算，结合业务进行剪枝，降低时间复杂度；

适当的用空间换时间，比如一些重复的循环计算，把中间结果缓存起来，后边直接用；

优化 Jvm 参数，缩短对象驻留内存的时间，减少 Gc 次数；

数据交换用 Protobuf ， Gzip 压缩，减少 IO ；

重启机器时候负载很高，每次发布都会影响服务性能，对此我们发现主要的问题在于 Jit 即时编译，在量上来的时候，启动 C2 线程进行的字节码编译，会耗费大量的 CPU 。对此我们做了预热机制，启动时对外服务前，先预跑让jit编译完成，同时会重建大部分本地缓存。

通过这些优化，这个集群的性能达到一个非常好的状态，在 QPS 达到5w的情况下，响应时间在50ms以内，负载也比较低。

以上就是我们搜索系统的设计和优化历程。我们回顾一下，对于搜索框架我们进行了水平分层，纵向分渠道，除了良好的扩展性，不同的层可以做不同的降级策略，流量控制，保证系统高可用。我们采用实时计算+阶梯式缓存，来做到成本与报价新鲜度的权衡。我们设计了闭环系统来保证缓存的更新。对于报价引擎我们设计了适合航线搜索的索引库，开发了高可用的实时同步系统。设计了一个分布式本地缓存，大大降低 DB 的压力，分享了我们是如何缩减对象内存的，还有就是如何合理利用一致性哈希做负载均衡。

我们会发现，不同的业务场景，有不同的特征，最好的思路是根据特征去进行设计和优化。由于木桶效应的存在，通用的实现大多数不是最优的，因为兼顾了通用性。高性能系统的设计，真的是需要量体裁衣。

百度取消新闻源影响很大这三个搜索的差距更大

Posted on 2019年5月22日 by fagaome

早上，看到很多媒体陆续发布了关于百度宣布调整新闻源的分析文章。简单再补充几条百度取消新闻源的影响和目的：

1、百度目前会大力支持原创内容。现在内容再次成为各个大型平台重视的服务，除了百家号等直观产品拉拢原创平台和作者外，百度新闻也会对原创新闻的资源倾斜，这对内容创作者是好事。

2、配合主管部门对不规范新闻内容网站的清理。重申昨天那个文章的观点：单纯依靠PC流量和网络转载发稿变现的平台将受影响，纵然不被抛弃，运营成本也会大幅上升。

3、对公关宣传和和媒体传播有影响。随着新闻源的变化，公关宣传和媒体运营的考量标准可能要变，带有统计或结果优先呈现或用户互动性好的平台将越来越受关注。另外就是针对网络宣传的预算要提高预算了。

4、或许也是业绩提升的需要。媒体报道：“2016年，百度营业收入为705亿元，刨除“去哪儿网”后，同比增长11.9%；全年净利润为116亿元，仅相当于2015年336亿元净利润的三分之一”，其中很大一个原因是医疗广告的拖累。

媒体对百度2016年财报的解读

估计管理层要求各项业务都在充分调动起来创收，提升新财年的收入，从而更有动力反哺人工智能等新业务的研发，毕竟这是未来翻身仗的重中之重，也许下一步，可能会看到基于百度当前业产品会出现更多的新商业服务。

其实，百度搜索的市场占有率和影响非常大的，虽然行内骂百仿佛成了政治正确，但是哪个公司没有被人诟病的问题呢？再者说，如果新闻源取消这个事情影响不大，怎么会引发多行内人如此关注？

百度、360和搜狗对新网站的搜索收录结果比较

百度新闻源不仅是很多新闻网站和网络媒体运营的重要指标，百度搜索更是无数网站收入的重要来源。而百度搜索市场占有率和在用户中的影响，并不是单纯是用户习惯，更有看不到的技术壁垒。这个差异可以通过3月22日上午10点30分后，三个搜索引擎对同一关键词的搜索结果看到。抛弃对不同品牌厌恶情绪，单纯看搜索结果就行。（为防止被人说是黑稿，特意同时粘贴上了照片和截图）

弱弱的说下：这个网站在3月20日下午就搜索到了。

百度搜索结果：第1条是“一带一路”官网，第2条是百度百科，后面是权威媒体的报道。

360搜索结果：第1条是360百科，后面是相关实时新闻，再后面是权威媒体报道，“一带一路”官网在前5页暂未发现。

搜狗搜索结果：第1条是爱奇艺的电视剧（不知是讲啥的），第2条是搜狗百科，后面是相关实时新闻，“一带一路”官网在前5页也未发现（不过，中国网的“一带一路官网”的专区倒是出现在了第1页，很懂SEO嘛）。

为什么搜索结果要翻5页？因为普通用户最多翻2页，行内人最多翻5页，如果5页内看不到想要的结果，大部分人就放弃或点击其他关联网站了。

搜索是个有技术含量的产品

一句话：搜索还是有很强的技术门槛的，不是单纯靠客户端覆和安装量就能弥补的，其中的算法、分析、优化等等，都需要多年的专业技术积累。所以，三个搜索引擎在新网站、新息的搜索收录上差异那么明显。

然后是一句无关本文的话：市场宣传很重要，但是没有好的产品，再好的宣传也会回归原点。这好比产品是1，市场是0，没有产品支撑，再多的宣传最终回成为0。

最后一句话：希望这次调整不会影响我们这个行业太多规则和就业。

百度宣布搜索整改提前完成商业推广每页不超过30%

Posted on 2019年5月22日 by fagaome

中国证券网讯魏则西事件后，国家网信办会同国家工商总局、国家卫生计生委成立的联合调查组要求百度整改，并提出了三点要求。百度宣布全面落实整改措施，对搜索页面调整完毕，比承诺日期5月31日提前了一周时间。

据新浪财经5月25日消息，百度新上线页面在推广信息数量、商业推广标识等方面均做出重大调整，这也是近年来百度在商业推广领域做出的最重大的一次调整。

百度全面实现每页面商业推广信息条数所占比例低于30%。相当于全新调整之后，每个页面上、下和右侧的推广信息合计起来不会超过4条。一系列调整举措将主导权更多赋予用户，有助于用户获得丰富优质的信息的同时，更便捷地区分商业推广与自然搜索结果，从而合理筛选信息，理性决策。

除了严格限制商业推广数量，优化展现形态，百度还采取了一系列关于医疗推广信息的整改措施，积极承担社会责任。在联合调查组调查期间，百度已对2518家医疗机构、1.26亿条医疗信息进行了下线处理。

在用户看不见的后端，百度也加大审核力度，力争从源头就最大限度地保障推广信息的真实有效性。针对医疗、药品、保健品、食品四大行业，百度商业推广采取了极为严格的审查机制。

百度方面表示，用户体验至上是此次调整依照的唯一准则，将切实做到为用户负责，让用户满意。

(编辑：liaoaili)

关键字：整改推广商业搜索

视频新版Pixel Launcher上手完整搜索栏回归

Posted on 2019年5月22日 by fagaome

今天进行的I/O大会环节中，Google向我们展示了新款Pixel Launcher即将迎来的诸多改变。从外媒拍摄的两段视频中来看，完整版搜索栏出现在主屏幕下方，会处于始终可见状态，方便用户单手操作和使用。

此外，在新版Pixel Launcher中Google扩展了搜索功能。当前版本允许用户搜索当前手机中已经安装的应用程序，不过新款工具中能够让用户直接在Play商城中搜索应用。而且新版本在Android Instant Apps的基础上会有更多高级功能。

在即将到来的Android O系统中，依然会保留Android Instant Apps功能，而且会兼容Pixel Launcher。Google近日已经面向所有开发者发布了Android Instant Apps的SDK，这意味着用户在不需要安装的情况下体验更多的应用。

Elastic秒杀数据搜索与实时分析开源技术开启了大数据应用新时代

Posted on 2019年5月22日 by fagaome

不管是百度，还是谷歌，甚至微软的Bing，对搜索引擎，大家都已经了然于心。这些引擎成为互联网生活中必不可少的工具，同时也占据了大部分互联网市场。

但是在今年10月，一家名叫Elastic的公司却因为搜索引擎技术和产品Elasticsearch正式登录纽交所，收盘股价 70美元，相较于发行价36美元涨幅高达 94.44%，市值接近50亿美元。

在美股市场整体表现黯淡环境下，开源软件公司Elastic 上市后市值几近翻倍的超预期表现，令人惊奇。能用开源技术，再造一个搜索引擎的独角兽或者科技巨大，Elastic靠的是什么？

Elastic副总裁Joen Van Driel在其“中国开发者大会2018”上表示，Elastic靠的是数据搜索和实时分析技术，在搜索数据的同时实时分析数据，给用户更多更精准的结果。同时依靠开源技术和商业模式，开拓了出大数据应用新格局。

Elastic副总裁Joen Van Driel

——//////////——

数据搜索与实时分析，开拓大数据应用新场景

一

搜索不仅仅是一个网站上的一个搜索框，搜索的结果也不仅仅是网页内容的简单呈现，企业用户需要数字搜索和实时分析。

细观搜索领域的竞争格局，包括Amazon 、Alphabet GOOGLE、Splunk 、百度等公司提供相关的企业服务，但Elastic着眼于赋能企业内部海量数据的实时搜索。

数字经济时代，企业拥有了更多的数据，并且每天都在新增数据，包括结构化的和非结构化的数据，以及来自许多不同数据源的数据，如数据库、网站、应用程序以及移动和连接设备等。

Elasticsearch希望搜索能为用户提供一种与其数据进行交互的新特征，包括：

一是速度，实时获得结果的能力；
二是规模，以毫秒级的性能查询千兆字节数据的能力；
三是相关性，获得准确和可操作的信息、见解和解决问题的能力。

Joen Van Driel说，用一句话来总结就是：Elasticsearch 是一个实时分布式搜索和分析引擎，可以应用在任何实时检索的场景中。

Elastic中国区总经理王刚向记者举例说明了数字搜索与实时分析的应用。当用户需要打车、送餐或者送货到家服务、上网购物时，数据搜索能够匹配乘客与司机、送货的骑手与顾客，为在线购物者提供相关的结果和建议另一方面，在传统的IT、运营和安全部门中，使用Elastic来聚合定价、报价和商业数据，每天处理数十亿日志事件，以监控网站性能和网络中断，并为数千个设备和关键数据提供网络安全操作，这些搜索和分析都是实时完成的。

Elastic中国区总经理王刚

既有自管理产品，也提供SaaS模式

二

客户可以使用Elastic基于云的版本，也可以自行设置和管理软件，Elastic既提供开源的产品，也提供商业插件和服务。

作为一家搜索公司，Elastic提供开源的Elastic Stack，包括Elasticsearch、Kibana、Beats、Logstash，同时提供商业功能的X-Pack，以及SaaS产品Elastic Cloud，包括托管Elasticsearch、托管应用程序搜索、托管网站搜索。除了高性能、实时、分布式搜索引Elasticsearch之外，Elastic提出了Elastic Stack的产品和服务战略体系，夯实其在该领域的霸主地位。

深圳开发者大会上多次出现这张产品全景图：

Elastic产品

Elasticsearch是Elastic Stack的核心。它是一个分布式、实时搜索分析引擎和数据存储工具，适用于所有类型的数据，包括文本、数字、地理空间、结构化和非结构化信息。

Kibana是Elastic Stack 的用户界面，是存储在Elasticsearch中的数据的可视化层，也是 Elastic Stack所有部分的管理和配置接口。

Beats是轻量级、单用途数据托运，用于将数据从边缘机器发送到Elasticsearch或 Logstash。

Logstash则是动态数据处理管道，可将数据从多个数据源同时导入Elasticsearch或其他存储系统。

Joen Van Driel说，Elastic也不断通过收购丰富产品线，如收购初创企业Insight.io ,为Elasti不断扩展的技术堆栈添加独立的代码搜索功能，还与Elastic其他用例和解决方案高度互补。

Elastic 收购网站搜索SaaS服务提供商Swiftype, Swiftype 创造了大受欢迎的基于 SaaS的网站搜索产品，最近还推出了企业搜索产品。通过与Swiftype合作，Elastic能够满足客户简单的网站或应用搜索需求。在未来，客户还可以利用高度定制和精细的SaaS或私有部署体验，应对更加复杂的企业搜索场景。

选择开源，坚持开源

三

开源是企业发展的动力与源泉，同时依靠订阅收入与商业产品、服务获得收入。这是这家开源技术公司独到之处。

云集的开发者

Elastic于今年10月成功上市是开源项目商业化成功的又一标志。最早Elasticsearch从大公司无法着力的垂直领域小工具开始做起，尝试以开源的方式创建易于使用的非结构化数据搜索引擎。而后，随着公司的发展，不断扩充产品线和应用场景，将核心产品以源代码开源方式给到客户，在开发者社区建立起技术公信力，同时推出商业版本解决方案。

Joen Van Driel说，Elastic选择开源技术，未来也会坚持开源。

首先，基于开源技术，Elastic迅速拉进了与用户的距离，由用户验证产品，由用户反馈最新需求；

其次，超过10万开发者的社区、超过3.5亿的产品下载和5000多家客户，为Elastic贡献了代码和大量的应用场景；

第三，基于开源的特性，Elastic形成一种自下而上的销售策略，潜在客户即为经常使用Elastic的技术人员，通过一系列销售和营销手段逐步渗透，为核心客户群提供更有效的企业级服务支撑，稳固其商业模式。

开源并不意味着公司没钱赚。2018 财年公司总营收1.599亿美元，同比增长81%。主营业务收入包括总订阅收入（许可证收入License + 订阅收入 Subion）与服务支持收入（Professional Service）两大板块构成，其中总订阅收入占2018财年营收的93%，服务于80多个国家5500余家企业；专业服务收入同比增幅25%主要来自于咨询服务的增加，导致产品被越来越多的采用。

另外收入来源还包括商业插件提供，以及培训业务的发展，包括在线培训和企业上门培训等。

巨头企业既是用户，也是合作伙伴

四

在开发者大会上，Elastic展示了两个榜单，一个是用户，大牌公司云集，创新公司和传统行业企业并存；另一个是合作伙伴，依然是群星云集。

王刚说，对用户而言，Elasticsearch的目标是让全文搜索变得简单，开发者可以通过它简单明了的RESTFul API轻松地实现搜索功能，能够轻松地进行大规模的横向扩展，以支撑PB级的结构化和非结构化海量数据的处理。

当然许多国际知名的巨头公司都在使用 Elasticsearch，包括 Cisco、eBay、Microsoft、高盛、美国国家宇航局等，下载量超过1 亿次。Google 通过 Google 云平台提供一个完全托管的版本，它可以让公司企业搜索庞大的非结构化信息数据库，通过使用机器学习，自动识别异常情况，执行根本原因分析，并减少实时应用误报。

Elastic希望与合作伙伴建立长久和卓有成效的合作伙伴关系。它与谷歌和阿里巴巴建立了合作伙伴关系，这些合作伙伴关系已经在他们的云上启用了Elasticsearch服务，以及与微软和IBM的关系，这些关系带来了“模板”以简化Elasticsearch的部署。

中国团队和合作伙伴已经Ready，服务中国快速增长大数据应用市场

五

Joen Van Driel说，Elastic看好中国大数据产业的发展，看好中国的巨大发展机遇。

随着移动互联网时代的推移、人工智能的革命性进展及其在行业应用落地需求的激增，海量结构化与非结构化数据进一步刺激数据爆炸，海量数据搜索、聚合、分析成为企业普遍面对的问题。对未来的企业而言，数据是所有业务的生命源泉，搜索可以成为企业从数据中获取价值的一种最简单的方式。

而中国是全球数据经济成长最快的国家，每年新增巨量的数据。发现数据以及数据的背后价值，是企业和组织的一项迫切需求。

中国政府鼓励发展云计算和大数据技术与产业，创新性企业如雨后春笋般涌现。

另外，在人工智能技术和应用方面，中国走在了世界前列。而人工智能的发展需要大量数据的积累、处理和发现，这也为Elastic的数据搜索和实时分析技术的发展提供机会。

因此，Elastic在中国将加大人力、资源的投资，加快中国市场的培养和发展。中国区已经成立，人员规模会不断扩大，合作伙伴数量不断增加。

中国团队已经准备好了，合作伙伴也已经准备好了！

——//////////——

作者简介

刘学习

前15年，专注于服务器、存储以及云计算

后5年，爱上基础软件、管理软件，以及国产化系统

冀望与企业一起成长，与产业一起发展！

微信：Fiyinghare在·

邮箱：邮箱：lxx@soft6.com

搜索竞价推广账户的恶意点击分类判定及处理办法大全-下

Posted on 2019年5月22日 by fagaome

关注老阳，免费为您提供竞价推广策略

在上一期的内容中竞价托管运营老阳介绍了搜索竞价推广账户的恶意如何判断，这一期，我们介绍如何对恶意点击行为进行处理，以此将损失降低。

当我们确定了恶意点击的存在的时候，不应该束手无策，或只找资源方客服，必须要自己第一时间将损失降低！

在此之前，我们需要对账户做常规操作：首先：根据产业结构及竞争对手分布情况有选择性屏蔽部分区域。

我们的广告是做给需求客户看的，不是给同行看的，如果您的产业存在产业集聚的区域，这个聚集区域内，你参与竞争并获胜的概率相对较小，因此广告投入产出比本身就较低，如果你在此投放了广告，必然遭遇同行的无意、恶意消费。因此，凡是同行聚集区域必须屏蔽！

并且根据区域市场特征进行分地域设定投放力度，在降低损失的同时还可以增加转化哦。

其次，设置好账户所提供的防止恶意点击的工具

不要觉得媒体资源方都是坏蛋，不要觉得没用，以商盾为例，还是能够有效的避免一些低级技术手段的恶意行为，设置好种是没坏处的！

接下来，当我们确认存在恶意点击后，老阳一般建议采用以下几类方式：一、首先采用的策略是躲避！

凡是恶意点击行为都是出于一种愤怒或变态的心理，多数情况是短期的，因此，躲避开减少损失就OK了。

采用的方式是: 暂停恶意点击集中发生的推广区域、暂停恶意点击发生的集中时段，暂停恶意点击投放的关键词，限制恶意点击关键词所在的计划消费，以此简单的应对方式避免造成过多的消费损失。

二、在躲避的同时，采用封锁手段屏蔽恶意行为。

封锁手段一般是通过访客标识码进行。

或者屏蔽对方的IP

三、如果恶意点击行为一直持续，可以考虑正对性停止投放一个时间段。

通过恶意点击的关键词分析，将恶意行为关键词进行“精准否定”

四、如果对流量需求明显且不愿意错过投放档期，可以考虑适当降低投放力度

通过修改恶意点击关键词所在单元的匹配方式可以适当放大匹配内容（不熟练的不要用，注意观察数据并否词哦），获得更多长尾流量；同时降低恶意点击精准关键词出价，将损失降低。

五、收集恶意点击证据向百度投诉。

如果损失较大，收集明确证据，暂停广告投放，要求媒体资源方赔偿返还费用后再投放。

当然，如果实在是被盯上了，那就只能不玩了…… 当前媒体流量入口丰富，可以一个时间段内容尝试其他广告。

除此之外，您是否有其他的处理恶意点击行的方式呢？欢迎留言交流！

iOS游戏用户来源数据报告超56%靠搜索

Posted on 2019年5月22日 by fagaome

　　近日，数据公司Sensor Tower发布了appstore下载来源分析报告，该报告统计了过去一年中各类应用的用户下载来源的情况，整体来看对iOS游戏来说搜索而来的玩家占比超过50%。

iOS游戏用户来源数据报告：超56%靠搜索

首先是指标解释：

Browse：通过浏览appstore推荐、榜单推荐下载。

Search：通过appstore搜索下载。

Web Referral：用户通过浏览器点击web网站链接进入appstore下载。

App Refeeral：通过点击应用内链接，比如移动广告来进行下载。

整体appstore应用来自搜索的下载量高达65%，appstore推荐下载占比为13%，web浏览下载占比为7%，而来自APP内广告和链接下载占比为13%。

游戏来看，搜索下载量占比为56%、其低于非游戏的69%。

而基于web浏览下载游戏产品占比仅3%、非游戏应用该项为9%。

游戏对苹果推荐依赖度更高，基于苹果推荐引导的下载量占比为24%、非游戏只有9%。

基于移动广告带来的下载量，游戏产品占比为17%、非游戏则为12%，可见游戏对移动广告更为依赖。

付费APP和免费APP来看，免费APP更依赖于搜索，其占比为67%、付费应用则只有46%。

付费应用很特别的在于对广告、苹果推荐的依赖度显著高于免费APP，其苹果推荐获量占比达到了21%、而广告来源的用户占比达到了23%。

可见，对做付费游戏的游戏开发者来说，争取苹果推荐是非常重要的。

从更长的时间跨度来看，游戏产品对广告的依赖度在持续上升，而搜索的占比则不断下滑，这反映了游戏市场竞争的白热化的程度。

搜索人流发现无资质医院

Posted on 2019年5月22日 by fagaome

在搜索引擎上发布“人流”广告，却不具备母婴保健技术资格，不仅无资质医院被立案调查，搜索引擎也难逃其责。昨天是《互联网广告管理暂行办法》实施第一天，本市工商部门严查互联网广告，百度、搜狗等搜索引擎涉嫌未尽审查义务，被立案调查。

百度搜狗被立案调查

昨天，市工商局监管人员在百度、搜狗等搜索引擎上，输入“人流”或“人工流产”字样，跳出了“上海南浦妇科医院”“上海安平医院”“上海徐浦中医院”等医疗机构的页面。然而，监管人员查证后发现，这些医院并不具备母婴保健技术资格。

根据广告法和《互联网广告管理暂行办法》，发布医疗广告应该事先由卫生行政部门对广告内容进行审查出证。对于上述不具备资格的医疗机构，卫生部门是不会允许其发布含有人流字样的广告内容。显然，这种将违法医疗广告医院顶至前列的做法，涉嫌违法。搜狗、百度等搜索引擎，发布这些广告，已涉嫌未尽审查义务。

目前，百度、搜狗等搜索引擎和上述不具备资质的医院，均已被立案调查。

“竞价排名”将被严查

对此，市工商局广告处副处长李华表示：“过去对竞价排名是否属于广告，各地监管部门看法不一。即使认定为广告，也常因为管辖权问题，难以对广告主和广告发布者、广告经营者一并查处。此次新规明确，推销商品或服务的付费搜索广告，属于互联网广告，并扩大管辖范围，认定广告主、广告经营者和广告发布者，任意一方所在地的监管部门，都对违法行为有管辖权。”

工商部门表示，维修、医疗、旅游、搬场、教育培训、出国留学中介等领域，较容易发生虚假、误导的付费搜索广告。下阶段，将围绕这些领域，进行关键词的排摸，依法查处侵犯消费者利益的违法广告。

微信转发须仔细甄别

除“竞价排名”被严管外，受新规影响的，还有微博、微信公众号、微信朋友圈等自媒体阵地。其中，软文推送、商业内容转发等应“三思而行”，发布者应仔细鉴别其合法性。

上海市工商局广告处处长应钧表示：“有些明星或‘大V’，在推送具有软文性质的文章时，应注明‘软文’，以免误导消费者。有些人会在微博、微信中受委托转发商业宣传内容，从而获得收益，比如在朋友圈转发商业内容活动获得优惠。此时，转发者已经具备了广告发布者的身份。如果发布的内容违法，转发者同样需要承担法律责任。”也就是说，每一个人都应该对自己转发的商业广告内容的合法性，有一定的鉴别能力。本报记者金旻矣

这些京东搜索排序规则你知道吗

Posted on 2019年5月22日 by fagaome

文 | 平台规则

京东搜索介绍

随着京东商品数量的增长，京东搜索怎样排序？如何做可以让商品得到更多曝光机会是各个商家特别关心的事情。与其他电商搜索类似，京东搜索排序就是将匹配关键词的商品按照对消费者需求满足程度依次展示，目的是帮助消费者快速方便地找到所需商品。此外，消费者还可以按照一定条件对商品进行精确筛选。

下面，我们将从以下几个方面详细介绍京东搜索排序。

1、排序算法

当消费者输入关键词进行搜索的时候，系统会根据消费者输入的关键词去和系统中的商品做匹配,并根据商品匹配程度和其他相关因素对商品进行排序最后将结果展示给消费者。

京东搜索排序考虑的因素如下：

1.1文本相关性

文本相关性即商品的文本描述信息（包括：商品标题、类目名称、品牌名、图书类商品还有作者、出版社等）和搜索关键词的是否相关或匹配。

文本相关性的计算我们采用评分机制，即跟消费者搜索词和商品的匹配程度给予不同的评分，通过评分来判断商品和搜索词的匹配程度。其中商品标题和关键词的相关度最为重要。

商品标题录入注意事项

商家为了提高自己商品的搜索曝光率，在商品名称中堆砌和自身商品完全无关的关键词，致使商品标题不规范，不仅会影响该商品的文本相关性得分，还会降低消费者体验。录入标题需要考虑以下原则：1.消费者搜索商品时常用搜索词；2.尽量简洁明了；3.名称中不得有错别字。被发现存在文本作弊的商品在搜索系统中将被屏蔽或做降权处理。

举例：

反面例子：金吉家广博窄书柜抽屉门板随意增减间厅柜可延长隔断不靠墙也稳定正反面通用创意组合书柜5X4列橡木色；

消费者根本无法找到商品标题重点，名称越短文本相关性越高，无须写乱七八糟的关键字

正面例子：乐爱家创意书柜收纳储物柜LF-W-1030细条棕橡。

1.2类目

京东搜索因子中，商品的所在类目（商品的分类）是否合理将影响到商品的排序结果。在京东，所有商品须放置在具体的分类下，例如iphone手机放在“手机”分类下，而iphone充电器则放在“苹果配件”分类下。在放置商品类目的时候，一定要注意，以防放置在不恰当的类目中，对商品排序造成负面影响。

关键词与类目也存在相关性，关键词与不同类目的相关性不同，通过搜索系统综合计算所得。关键词搜索排序规则是多个因素综合影响的结果，所以在其他排名因素相同的情况下，类目影响排序的综合得分。

综上所述，放置或优化商品类目时，需确保放于正确且合理类目，才可保证商品在消费者精准搜索词下得到有效曝光。

1.3商品人气

商品人气不仅影响商品的销量，还影响消费者对该商品所属店铺的信任度和认可度。

影响商品人气的因素如下：

a.商品销量

即近期商品销量，其中不同时间的销量进行加权计算；虚假交易销量不计算在内（虚假销量查出后会依平台相关规则处理）。

b.销售额

为防止低质量商品占用重要展示位置，影响消费者体验，销售额作为其中一个因素参与商品人气分计算。

c.消费者评论

消费者评论反映消费者对商品的满意程度；商品质量和好评率成正比。

d.商品属性

商品属性是消费者了解商品的重要渠道，商品属性信息和商品不匹配会降低消费者体验，商品属性信息和商品的一致性是影响商品排名的另一个重要因素。

除上述因素外，消费者关注度等也是影响商品人气的因素。另外，在计算商品人气分时所使用的数据都进行了反作弊处理，对于反作弊比例多的商品会有降权。

1.4用户搜索反馈

消费者搜索查询词后点击或购买商品的行为在消费者搜索反馈系统中计为该查询词与该商品的一次点击或购买数据。消费者搜索反馈数据反应了消费者对搜索结果的满意度，同时反应了对商品的满意度。

反馈数据包括：某查询词结果中商品的点击量和下单量，消费者通过搜索进入商品单品页的平均时间，商品的搜索点击转化率。对于部分商家恶意刷搜索点击和下单的商品，系统将其视为作弊商品，在排序中进行降权处罚。同时反馈数据也会剔除这些作弊数据。

1.5 京东平台风向标

为了促进店铺提升综合服务能力，京东平台通过京东大数据建模算法计算出京东平台风向标模型。商家的京东平台风向标的表现优劣将影响该商家店铺中的商品在京东搜索的排序结果，这将为京东商家和消费者构建更加优质的生态体系。

影响京东平台风向标的具体因素如下：

1.5.1 用户评价

用户评价是指消费者对店铺的商品质量评价、卖家服务态度评价、物流及发货评价、商品描述评价、退换货评价。消费者来到店铺购物时，需要知道该店铺的表现情况，而过去在该店购物过用户的评价，是值得消费者信赖的参考。

1.5.2 物流履约

物流履约是指店铺内订单的48小时揽件及时率和隔日达订单占比。消费者下单成功后，消费者能查到订单对应快递公司揽件跟踪信息的速度，以及消费者下单成功后72小时内能够收到商品的速度（即隔日达）。

1.5.3 特色产品

特色产品是指京东放心购和京东电子面单。京东放心购是京东平台服务品牌的标识，是对消费者的保障。如开通京东放心购会提升京东平台风向标排名。

京东电子面单使用占比是店铺使用京东电子面单发货的单量占比，无论京配的京东电子面单还是其他快递使用的京东电子面单都计算在内，使用京东电子面单客户信息更安全，在同行使用占比排名靠前会提升京东平台风向标排名。

1.5.4 转化能力

转化能力是指店铺短视频能力，随着碎片化的时代来临，快速阅读成了客户的购物习惯，而短视频的呈现方式比图片和文字的呈现方式更快的促进消费者进行购物决策。店铺短视频能力是综合计算店铺主图视频SKU覆盖率和店铺整体视频质量等级后得出。视频质量等级由视频播放次数、主图视频播放率（视频播放次数/视频曝光次数即商详UV/PV）、视频播放时长、用户完成度（用户平均观看时长/该视频总时长）计算得出。同行表现排名靠前的店铺会提升京东平台风向标排名。

1.5.5 成长指数

即店龄，指店铺最新开店时间到计算店龄时间的时长，如店铺中途关店则关店前的时间不做计算。开店时长越长的店铺优势越大，会提升京东平台风向标排名。

1.5.6 客服及售后

客服及售后是指售后审核及处理时长、退换货返修率、交易纠纷率、咚咚30秒应答率、咚咚平均响应时长。

1.5.6.1 售后审核及处理时长：消费者对售后处理结果及进度较关注，商家的处理时效会直接影响消费者体验。

1.5.6.2 退换货返修率：退换货返修率为一定周期内，实际发生退换货返修的服务单数在该周期内订单完成的商品件数占比。

1.5.6.3交易纠纷率：这部分数据可反映商家责任下的交易纠纷单量的占比，结果可参考性强。

1.5.6.4咚咚30秒应答率：顾客进入队列后，人工回复在30秒内的咨询量占比，响应越快，客户流失越少。

1.5.6.5咚咚平均响应时长：客服人工回复的消息与顾客消息之间时间差的均值

京东平台风向标详情了解可查看《京东开放平台风向标解读》

链接：2019/20190426A/F017241.aspx

1.6作弊

作弊指通过非正常手段快速提升商品在搜索结果的排序。作弊行为会严重影响消费者的搜索体验，对通过提升自身服务质量的商品或者商家是不公平的。为减少作弊行为对搜索的不良影响，被判定为作弊的商品将根据其作弊程度进行降权或屏蔽处理，商家可在被违规处理之时起7天内通过线上违规申诉入口提交申诉申请。目前京东搜索查询商家存在的作弊行为有：商品标题关键词堆砌、虚假交易、重复铺货、错放类目、更换商品等。具体的评判规则见附录一。商家的商品如果存在搜索作弊情况，该商家的违规行为京东会根据《京东开放平台商家积分管理规则》扣除相应的积分，商家积分过低会影响该商家的商品人气分、店铺服务质量分，从而影响商家商品搜索排序情况。

《京东开放平台商家积分管理规则》

链接：2019/20190426A/F017242.aspx

1.7个性化排序

为满足各类消费者在同一搜索词的不同需求，京东搜索已上线排序的个性化服务，实现搜索千人千面。个性化上线后，同一搜索词，不同的消费者可看到不同的搜索结果。

消费者行为个性化是指把消费者的浏览数据、购买数据使用到搜索排序中，当消费者用搜索时，可以快捷方便的找到这些商品。随后消费者性别模型、消费者购买力模型等数据也会被应用到搜索排序中，使排序多样化，满足不同消费者的不同搜索需求。

另外，为减少无货商品对搜索体验的影响，搜索结果中该消费者所在地区无货的商品在排序中将被做降权处理。

个性化搜索服务会继续调优，增加买卖匹配的精准性，提升消费者搜索体验的同时，为商家带来更精准流量。

2、非默认排序

非默认排序指按照价格、销量、评论、上架时间等单一维度排序方式。非默认排序与前文中提到的关键词与商品类目的相关性有很大的关系。

非默认排序的实现是根据消费者输入的搜索词，搜索算法系统会计算出该商品的相关类目。使用价格&销量&评论等非默认排序时，系统将相关性较差的商品类目过滤，不予以展示。

如果在非默认排序中，采销或商家发现自己的商品未展示，请确认自己商品所处的分类是否合理以及商品标题是否包含过多无用信息。对于错放类目等作弊行为，系统将进行降权或屏蔽处理。如：把沙发坐垫的分类设置为“精品沙发”或“休闲沙发”。

3、搜索结果页展示

搜索结果页针对不同类目设计展示样式，垂直化探索不同类目商品的最佳营销展示。目前京东搜索垂直化展示已包括服饰鞋帽等类商品的主从合并展示和图书类商品列表展示。

a．服饰鞋帽类主从商品合并展示

服饰鞋帽类商品主从合并展示是指合并同种商品展示，以增大其他商品的曝光机会，同时方便消费者快速浏览同种商品的不同款式。主从合并的策略是根据商品的主商品编号进行合并。

举例：由于同款商品不同颜色会默认只展示一个；

b.图书类列表展示

图书类商品列表展示增加商品信息量展示，以满足消费者搜索图书类商品的浏览习惯。

4、属性筛选规则

搜索消费者经常使用属性筛选功能进一步缩小搜索意图，丰富、准确、体验好的属性筛选给消费者带来价值。

例子：搜“T恤”，男装的三级类目T恤，女装的三级类目T恤都是相关性高的类目，则搜索后默认属性筛选区将对男装T恤、女装T恤等高相关性类目和所带属性进行并集展示，如下：

点击男装T恤类目后的属性区：

点击女装T恤类目后的属性区：

京东有权视实际情况调整搜索排序白皮书的内容，并随时向商家公布更新的内容，如商家对内容有异议，请暂停使用相应服务；如商家继续使用本服务，则视为商家接受变更内容，商家请应予以遵守。

标签：搜索

搜索权重无法入池导致排名卡住需要怎么破

高性能高可用机票实时搜索系统

百度取消新闻源影响很大这三个搜索的差距更大

百度宣布搜索整改提前完成商业推广每页不超过30%

视频新版Pixel Launcher上手完整搜索栏回归

Elastic秒杀数据搜索与实时分析开源技术开启了大数据应用新时代

搜索竞价推广账户的恶意点击分类判定及处理办法大全-下

iOS游戏用户来源数据报告超56%靠搜索

搜索人流发现无资质医院

这些京东搜索排序规则你知道吗

归档

分类