离开中国多年后 Google 搜索想回来了

8 月 1 日,外媒 The Intercept 获得的 Google 内部文件以及知情人士的消息显示,Google 计划让搜索服务重返中国。据悉该项目的内部代号为 Dragonfly,始于 2017 年春季。

近日,Google CEO 桑达尔·皮查伊(Sundar Pichai)在旧金山举行的 WIRED 25 大会首次公开回应了这一计划。

对于为何要回归中国市场以及需要面临的法律法规问题,桑达尔·皮查伊回应称:

Google 的目标是把信息传递给每一个人,中国人口占世界总人口的 20%,对我们来说非常重要。可能人们不太了解,每当我们进入一个国家的市场时,都要在不同的价值观之间做平衡,我们要提供简单易得的信息,保证信息的自由传递,保护用户隐私,还要遵守所在国家的法律法规。

中国的情况更加复杂。我们离开中国市场很多年了,现在研发了一个新的项目,中国市场正在不断创新。我们也想了解 Google 在目前中国市场上的情况,我们现在需要解决什么样的问题,能不能解决 99% 以上的问题,我们提供的搜索信息能不能比目前现有的更好,比方说接受癌症治疗,有的人找到的是假的癌症治疗的方法,他们想要找到真正有用的信息。考虑到中国市场的重要性和用户数量,我们必须花时间认真考虑一下。

此前,已经有 1000 名 Google 员工签署了一封请愿信,以抗议该公司在中国打造特别版搜索引擎。桑达尔·皮查伊此次回应似乎并没有受到内部抗议声音的影响。

此外,这份回应还透露出了其他的信息,比如桑达尔·皮查伊一直密切关注中国市场,特别是中国搜索引擎市场的老大——百度。毕竟特意提到“癌症治疗”这一例子,很难不让人联想到 2016 年的魏则西事件。

李彦宏与桑达尔·皮查伊

当然,百度 CEO 李彦宏在今年 8 月也针对 Google 返华的消息作出过回应:

我想说,中国的科技公司今天有足够的能力和信心,在与国际企业的良性竞争中变得更强,共享全球化红利。如果 Google 决定回到中国,我们非常有信心再PK一次,再赢一次。

今天的百度,已经是一家在全球人工智能领域有巨大影响力的公司,我们的全球生态合作伙伴已经超过 300 家。Google 也是我们国际市场上的合作伙伴。在产业的下一幕人工智能时代,百度已经做好充分准备,和世界共同拓展技术边界、分享创新成果。

再来看中国市场。这些年,我们的产业环境和发展规模已经发生了翻天覆地的变化,中国的科技公司在发现新问题,服务新需求方面已经走在了世界的前面,全球都在 Copy from China。这是每个想要进入中国市场的国际企业,都必须认真考量和面对的。

这些年来,百度一直被认为是占了 Google 退出中国的便宜。我们无法证明一件没有发生的事情。事实上,谷歌是 2000 年先于百度在中国市场上推出独立搜索服务的,2005 年更是加大投入,而百度是后来者居上,通过技术和产品创新反超 Google。到 2010 年,谷歌在市场份额持续下降的情况下退出中国时,百度的市场份额已经超过 70%。如果现在 Google 回来,我们正好可以真刀真枪地再 PK 一次,再赢一次。

虽然李彦宏表示不惧竞争,但 Google 能否顺利在推出中国特供版搜索服务目前仍然是一个未知数。

此前的消息称,Google 已经向中国政府展示了这个特供 APP,最终版本可能在未来 6~9 个月内推出,主要是等待中国政府的批准。

然而一波三折,桑达尔·皮查伊8 月份曾在 Google 的内部会议上表示,虽然 Google 对重返中国持开放态度,而且已经有团队探索一段时间了,但目前仍处于早期阶段,距离真正在中国发布一款搜索产品还很远。而且 Google 会不会这样做,以及能不能这样做,目前尚不明朗。

征稿啦

百度搜索封杀 屏蔽数千低俗恶意关键词

在被曝光互联网平台上出现了一批利用儿童熟知的动漫形象制作涉及黄色,暴力的视频,对儿童的心理造成了负面影响,不利于儿童健康成长,之后百度搜索就发布了这一则重要声明,此次百度搜索对相关关键词进行排查打击,已处理、屏蔽低俗等恶意关键词达数千个,并且还在进行屏蔽处理中…

据声明称,百度搜索已处理、屏蔽相关关键词及搜索结果数千个,并且通过24小时不间断检测及时对新增的关键词结果进行屏蔽处理。

净化网络环境是目前互联网时代留存一大解决问题,不过百度搜索行动也表现的越来越迅速,及早发现并处理。

此外,网民也应该做的是文明上网,谨慎分享传播内容,对传播恶意信息行为进行举报。

罗列世界各国最多人搜索的AV关键字 你搜啥词

看到《世界各国最多人搜寻的AV关键字》之后,料Sir马上翻出《女性向エロ关键字》这一篇,一对发现……果然不一样…或许是因为来源不同吧。根据西洋网站的调查,每个国家最多人搜寻的AV关键字是~

心灵纯洁的孩子欣赏完就该回上页吧~

每个国家最多人搜寻的AV关键字

▼美国:女同志

▼英国:潮吹

▼加拿大:幼齿(teen)

▼印度:嫂子

▼德国:熟女

▼意大利:老妈(Mom)

▼法国:北非移民女(Beurette)

▼墨西哥:变态(Hentai),图片重点只是那顶帽子

▼巴西:年轻美女

▼ 俄罗斯:俄罗斯熟女

▼荷兰:女同志马杀鸡

▼澳洲:按摩

▼波兰:老师

▼埃及:阿拉伯埃及

▼阿根廷:幼齿

▼菲律宾:变态

▼日本:人妻

▼瑞典:熟女

看来各国的口味都不太一样啊..

你会搜啥词,讨论下?小编会搜“H漫”

去哪儿网机票搜索系统的高并发架构设计

作者| 蒋志伟

编辑| Gary

“高并发”一直是大家感兴趣的话题。2010年~2012年,我曾在Qunar供职,主要负责机票搜索相关的业务,当时我们的搜索系统最高每天承载了亿级用户的高并发访问。那段日子,很苦很累,Qunar的发展很快,我也见证了搜索系统的技术演变历程,本文就来给大家讲讲机票高并发的故事。

业务背景

Qunar成立于2005年,那时候大家还习惯打电话或者去代理商买机票。随着在线旅游快速发展,机票业务逐步来到线上。在“在线旅游”的大浪潮下,Qunar的核心业务主要是线上机票搜索和机票销售。根据2014年9月艾瑞监测数据,在旅行类网站月度独立访问量统计中,去哪儿网以4474万人名列前茅。截至2015年3月31日,去哪儿网可实时搜索约9000家旅游代理商网站,搜索范围覆盖全球范围内超过28万条国内及国际航线。

Qunar由机票起家,核心产品包括机票搜索比价系统、机票销售OTA系统等。后来一度成为国内最大旅游搜索引擎,所以最开始大家知道Qunar都是从机票开始。

在Qunar,我主要工作负责机票搜索系统。当时,搜索业务达到了日均十亿量级PV,月均上亿UV的规模。而整个搜索主系统设计上是比较复杂的,大概包含了七、八个子系统。那时线上服务器压力很大,时常出现一些高并发的问题。有时候为了解决线上问题,通宵达旦连续一两周是常有的事。尽管如此,我们还是对整个搜索系统做到了高可用、可扩展。

为了大家了解机票搜索的具体业务,我们从用户角度看一下搜索的过程,如下图:

根据上面的图片,简单解释下:

  • 首页:用户按出发城市、到达城市、出发日期开始搜索机票,进入列表页。

  • 列表页:展示第一次搜索结果,一般用户会多次搜索,直到找到适合他的航班,然后进入详情页。

  • 产品详情页:用户填入个人信息,开始准备下单支付。

从上面的介绍可以看出,过程1和2是个用户高频的入口。用户访问流量一大,必然有高并发的情况。所以在首页和列表页会做一些优化:

  • 前端做静态文件的压缩,优化Http请求连接数,以减小带宽,让页面更快加载出来。

  • 前后端做了数据分离,让搜索服务解耦,在高并发情况下更灵活做负载均衡。

  • 后端数据(航班数据)99%以上来自缓存,加载快,给用户更快的体验。而我们的缓存是 异步刷新的机制,后面会提及到。

在过亿级UV的搜索业务,其搜索结果核心指标:一是保证时间够快,二是保证结果实时最新。

为了达到这个指标,搜索结果就要尽量走缓存,我们会预先把航班数据放到缓存,当航班数据变化时,增量更新缓存系统。 所以,Qunar机票技术部就有一个全年很关键的一个指标:搜索缓存命中率,当时已经做到了>99.7%。再往后,每提高0.1%,优化难度成指数级增长了。哪怕是千分之一,也直接影响用户体验,影响每天上万张机票的销售额。

因此,搜索缓存命中率如果有微小浮动,运营、产品总监们可能两分钟内就会扑到我们的工位上,和钱挂上钩的系统要慎重再慎重。

这里还有几个值得关注的指标:

  • 每台搜索实例的QPS(搜索有50~60台虚拟机实例,按最大并发量,每台请求吞吐量>1000)。

  • 搜索结果的 Average-Time : 一般从C端用户体验来说,Average-Time 不能超过3秒的。

了解完机票搜索大概的流程,下面就来看看Qunar搜索的架构。

搜索系统设计架构

Qunar搜索架构图

上面提到搜索的航班数据都是存储在缓存系统里面。最早使用Memcached,通过一致Hash建立集群,印象大概有20台左右实例。 存储的粒度就是出发地和到达地全部航班数据。随着当时Redis并发读写性能稳步提高,部分系统开始逐步迁移到Redis,比如机票低价系统、推荐系统。

搜索系统按架构图,主要定义成前台搜索、后台搜索两大模块,分别用2、3标示,下面我也会重点解释。

前台搜索

主要读取缓存,解析,合并航班数据返回给用户端。

前台搜索是基于Web服务,高峰期时候最大启动了50台左右的Tomcat实例。搜索的URL规则是:出发城市+到达城市+出发日期,这和缓存系统存储最小单元:出发城市+到达城市+出发日期是一致的。

Tomcat服务我们是通过Nginx来做负载均衡,用Lua脚本区分是国际航线还是国内航线,基于航线类型,Nginx会跳转不同搜索服务器:主要是国际搜索、国内搜索(基于业务、数据模型、商业模式,完全分开部署)。不光如此,Lua还用来敏捷开发一些基本服务:比如维护城市列表、机场列表等。

航班数据

上文我们一直提到航班数据,接下来简单介绍下航班的概念和基本类型,让大家有个印象,明白的同学可以跳过:

  • 单程航班:也叫直达航班,比如BJ(北京)飞NY(纽约)。

  • 往返航班:比如BJ飞NY,然后又从NY返回BJ。

  • 带中转:有单程中转、往返中转;往返中转可以一段直达,一段中转。也可以两段都有中转,如下图:

其实,还有更复杂的情况:

如果哪天在BJ(北京)的你想来一次说走就走的旅行,想要去NY(纽约)。你选择了BJ直飞NY的单程航班。后来,你觉得去趟米国老不容易,想顺便去LA玩。那你可以先BJ飞到LA,玩几天,然后LA再飞NY。

不过,去了米国要回来吧,你也许:

  1. NY直接飞回BJ。

  2. 突然玩性大发,中途顺便去日本,从NY飞东京,再从东京飞BJ。

  3. 还没玩够?还要从NY飞夏威夷玩,然后夏威夷飞东京,再东京飞首尔,最后首尔返回北京。

…… 有点复杂吧,这是去程中转、回程多次中转的航班路线。

对应国际航班还算非常正常的场景,比如从中国去肯尼亚、阿根廷,因为没有直达航班,就会遇到多次中转。所以,飞国外有时候是蛮有意思、蛮麻烦的一件事。

通过上面例子,大家了解到了机票中航线的复杂程度。但是,我们的缓存其实是有限的,它只保存了两个地方的航班信息。这样简单的设计也是有必然出发点:考虑用最简单的两点一线,才能最大限度上组合复杂的线路。

所以在前台搜索,我们还有大量工作要做,总而言之就是:

按照最终出发地、目的地,根据一定规则搜索出用户想要的航班路线。这些规则可能是:飞行时间最短、机票价格最便宜(一般中转就会便宜)、航班中转最少、最宜飞行时间。

你看,机票里面的航线是不是变成了数据结构里面的有向图,而搜索就等于在这个有向图中,按照一定的权重求出最优路线的过程!

高并发下多线程应用

我们后端技术栈基于Java。为了搜索变得更快,我们大量把Java多线程特性用到了并行运算上。这样,充分利用CPU资源,让计算航线变得更快。 比如下面这样中转航线,就会以多线程方式并行先处理每一段航班。类似这样场景很多:

Java的多线程对于高并发系统有下面的优势:

  • Java Executor框架提供了完善线程池管理机制:譬如newCachedThreadPool、 SingleThreadExecutor 等线程池。

  • FutureTask类灵活实现多线程的并行、串行计算。

  • 在高并发场景下,提供了保证线程安全的对象、方法。比如经典的ConcurrentHashMap,它比起HashMap,有更小粒度的锁,并发读写性能更好。线程安全的StringBuilder取代String、StringBuffer等等(Java在多线程这块实现是非常优秀和成熟的)。

高并发下数据传输

因为每次搜索机票,返回的航班数据是很多的:

  • 包含各种航线组合:单程、单程一次中转、单程多次中转,往返更不用说了。

  • 航线上又区分上百种航空公司的组合。比如北京到纽约,有美国航空,国航,大韩, 东京等等各个国家的各大航空公司,琳琅满目。

那么,最早航班数据用标准的XML、JSON存储,不过随着搜索量不断飙升,CPU和带宽压力很大了。后来采取自己定义一种txt格式来传输数据:一方面数据压缩到原来30%~40%,极大的节约了带宽。同时CPU的运算量大大减低,服务器数量也随之减小。

在大用户量、高并发的情况下,是特别能看出开源系统的特点:比如机票的数据解析用到了很多第三方库,当时我们也用了Fastjson。在正常情况下,Fastjson 确实解析很快,一旦并发量上来,就会越来越吃内存,甚至JVM很快出现内存溢出。原因呢,很简单,Fastjson设计初衷是:先把整个数据装载到内存,然后解析,所以执行很快,但很费内存。

当然,这不能说Fastjson不优秀,现在看 GitHub上有8000多star。只是它不适应刚才的业务场景。

这里顺便说到联想到一个事:互联网公司因为快速发展,需要新技术来支撑业务。 那么,应用新的技术应该注意些什么呢?我的体会是:

  • 好的技术要大胆尝试,谨慎使用。

  • 优秀开源项目,注意是优秀。使用前一定弄清他的使用场景,多做做压力测试。

  • 高并发的用户系统要做A/B测试,然后逐步导流,最后上线后还要有个观察期。

后台搜索

后台搜索系统的核心任务是从外部的GDS系统抓取航班数据,然后异步写入缓存。

首先说一个概念GDS(Global Distribution System)即“全球分销系统”,是应用于民用航空运输及整个旅游业的大型计算机信息服务系统。通过GDS,遍及全球的旅游销售机构可以及时地从航空公司、旅馆、租车公司、旅游公司获取大量的与旅游相关的信息。

机票的源数据都来自于各种GDS系统,但每个GDS却千差万别:

  1. 服务器遍布全球各地:国内GDS主要有中航信的IBE系统、黑屏数据(去机场、火车站看到售票员输入的电脑终端系统),国际GDS遍布于东南亚、北美、欧洲等等。

  2. 通讯协议不一样,HTTP(API、Webservice)、Socket等等。

  3. 服务不稳定,尤其国外的GDS,受网路链路影响,访问很慢(十几分钟长连接很常见),服务白天经常性挂掉。

  4. 更麻烦的是:GDS一般付费按次查询,在大搜索量下,实时付费用它,估计哪家公司都得破产。而且就算有钱 , 各种历史悠久的GDS是无法承载任何的高并发查询。更苦的是,因为是创业公司,我们大都只能用免费的GDS,它们都是极其不稳定的。

所谓便宜没好货,最搞笑的一次是:曾经在米国的GDS挂了一、两天,技术们想联系服务商沟通服务器问题。因为是免费,就没有所谓的服务商一说,最后产品总监(算兼职商务吧)给了一个国外的网址,打开是这家服务商的工单页面,全英文,没有留任何邮箱。提交工单后,不知道什么时候回复。可以想想当时我的心情……

虽然有那么多困难,我们还是找到一些技术方案,具体如下。

引入NIO框架

考虑GDS访问慢,不稳定,导致很多长连接。我们大量使用NIO技术:

NIO,是为了弥补传统I/O工作模式的不足而研发的,NIO的工具包提出了基于Selector(选择器)、Buffer(缓冲区)、Channel(通道)的新模式;Selector(选择器)、可选择的Channel(通道)和SelectionKey(选择键)配合起来使用,可以实现并发的非阻塞型I/O能力。

NIO并不是一下就凭空出来的,那是因为 Epoll 在Linux2.6内核中正式引入,有了I/O多路复用技术,它可以处理更多的并发连接。这才出现了各种应用层的NIO框架。

HTTP、Socket 都支持了NIO方式,在和GDS通信过程中,和过去相比:

  • 通信从同步变成异步模式:CPU的开销、内存的占用都减低了一个数量级。

  • 长连接可以支持更长超时时间,对国外GDS通信要可靠多了。

  • 提高了后台搜索服务器的稳定性。

消息队列

为了异步完成航班数据更新到缓存,我们采用消息队列方式(主备AMQ)来管理这些异步任务。具体实现如下。

有一个问题,如何判断缓存过期呢?这里面有一个复杂的系统来设置的,它叫Router。资深运营会用它设置可以细化到具体一个航段的缓存有效期:比如说北京—NY,一般来说买机票的人不多的,航班信息缓存几天都没有问题。但如果北京—上海,那可能就最多5分钟了。

Router还有一个复杂工作,我叫它“去伪存真”。我们长期发现(真是便宜无好货),某些GDS返回航班数据不全是准确的,所以我们会把某些航线、甚至航班指定具体的GDS数据源,比如北京—新加坡:直达航班数据 来自于ABAQUS,但是中转数据,北京—上海—新加坡, 或者北京—台北—新加坡 从IBE来会精准些。

因此Router路由规则设计要很灵活。通过消息队列,也其实采用异步化方式让服务解耦,进行了很好的读写分离。

GDS服务抽象虚拟Node

为了管理好不同GDS资源,最大的利用它们。我们把GDS服务器抽象成一组Node节点来便于管理,像下面这样:

具体原理:按照每个GDS服务器稳定性(通过轮休方式,不断Check它们的可用性)和查询性能,我们算出一个合理的权重,给它分配对应的一组虚拟的Node节点,这些Node节点由一个Node池统一管理。这样,不同的GDS系统都抽象成了资源池里面的一组相同的Node节点。

那么它具体如何运转的呢?

当缓存系统相关航班数据过期后,前台搜索告知MQ有实时搜索任务,MQ统一把异步任务交给Router,这个时候Router并不会直接请求GDS数据,而是去找Node池。Node池会动态分配一个Node节点给Router,最后Router查找Node节点映射的GDS,然后去请求数据,最后异步更新对应的缓存数据。通过技术的实现,我们把哪些不稳定的,甚至半瘫痪的GDS充分利用了起来(包含付费的一种黑屏终端,我们把它用成了免费模式,这里用到了某些黑科技,政策原因不方便透露),同时满足了前台上亿次搜索查询!

监控系统

鉴于机票系统的复杂度和大业务量,完备监控是很必要的:

1、整个Qunar系统架构层级复杂,第三方服务调用较多(譬如GDS),早期监控系统基于CACTI+NAGIOS ,CACTI有很丰富的DashBoard,可以多维度的展示监控数据。除此以外,公司为了保证核心业务快速响应,埋了很多报警阈值。而且Qunar还有一个NOC小组,是专门24小时处理线上报警:记得当时手机每天会有各种系统上百条的报警短信。

当然,我还是比较淡定了。因为系统太多,报警信息也不尽是系统bug,它可能是某些潜在的问题预警,所以,系统监控非常至关重要。

2、复杂系统来源于复杂的业务,Qunar除了对服务器CPU、内存、IO系统监控以外,远远是不够的。我们更关心,或者说更容易出问题是业务的功能缺陷。所以,为了满足业务需要,我们当时研发了一套业务监控的插件,它的核心原理如下图:

它把监控数据先保存到内存中,内部定时程序每分钟上传数据到监控平台。同时它作为一个Plugin,可以即插即用。接入既有的监控系统,它几乎实时做到监控,设计上也避免了性能问题。后期,产品、运营还基于此系统,做数据分析和预测:比如统计出票正态分布等。因为它支持自定义统计,有很方便DashBoard实时展示。对于整个公司业务是一个很有力的支撑。

到今天,这种设计思路还在很多监控系统上看到相似的影子。

机票销售系统

机票另一个重要系统TTS:TTS(Total Solution)模式,是去哪儿网自主研发的交易平台,是为航空公司、酒店在线旅游产品销售系统。

TTS有大量商家入驻,商家会批量录入航班价格信息。

为了减少大量商家同时录入海量数据带来的数据库并发读写的问题,我们会依据每个商家规模,通过数据库动态保存服务器IP,灵活的切换服务器达到负载均衡的效果。这里不再细说了。

最后,回顾整个搜索架构的设计,核心思想体现了服务的一种解耦化。设计的系统虽然数量看起来很多,但是我们出发点都是把复杂的业务拆解成简单的单元,让每一个单元专注自己的任务。这样,每个系统的性能调优和扩展性变得容易。同时,服务的解耦使整个系统更好维护,更好支撑了业务。

作者介绍

蒋志伟,前美团、Qunar架构师,先后就职于阿里、Qunar、美团,精通在线旅游、O2O等业务,擅长大型用户的SOA架构设计,在垂直搜索系统领域有丰富的经验,尤其在高并发线上系统方面有深入的理论和实践,目前在pmcaff担任CTO。

今日荐文

点击下方图片即可阅读

Google开源新算法,可将JPEG文件缩小35%

推荐一个对技术人员的成长很有帮助的线下会议,将于4月16~18日举行的QCon全球软件开发大会(北京站),目前已经邀请来自Google、Facebook、LinkedIn、Airbnb、百度、阿里巴巴、腾讯等公司的100多位一线技术专家,是难得的线下交流学习的机会。具体详戳 「 阅读原文 」惊喜不停!

重磅 小程序关键词搜索策略14日生效 你的关键词被搜索到了吗

早在6月3日微信公众平台宣布,6.9日将会开放微信小程序推广功能,关键词搜索策略作为首项功能开放自定义关键词。在9日前众多开发者在自己的微信管理后台申请并提交审核自定义关键词。

但是到了9日发现,自己添加的关键词并未在小程序搜索或者搜一搜功能中起到任何效果。很多开发者不解,我当时也很纳闷……

按照微信的套路,一场发布会总会携带者一些光环【今日在北京举行微信公开课,可惜直播因网络原因无法正常观看】,打开微信后台发现“关键词生效时间6.9日”几个蓝字没有了,难道是生效了吗?

也许你还处于懵逼状态,先来科普一下。

什么是关键词搜索策略?

通俗理解就是推广功能的一种,可以新增与小程序业务相关的关键词,方便用户搜索到相关小程序。

为什么推出关键词搜索功能?

为方便用户找到所需小程序,并帮助小程序更准确地触达用户,我们向小程序的开发者提供了自定义关键词的功能。届时,开发者完成关键词设置后,微信用户可以通过搜索关键词,找到相关的小程序。

如何添加关键词?

登录微信小程序管理后台【mp.weixin.qq.com】,左侧导航新增『推广』一栏,选择”添加”自定义关键词。用户根据小程序业务相关能力添加即可。

小李率先对两个产品做了搜索验证,因为我知道他们的部分自定义关键词

VMCloud:新商业应用云,主打企业微门户,微官网,微门店小程序。帮助企业轻松搭建小程序应用,触达10亿用户,拥抱互联新商业!

微门户、企业名片关键词快捷搜索VMCloud

企业官网、微官网,贴合小程序服务质量

关键词与小程序服务和内容相关性可优先排名

长按直达VMCloud体验服务

智创社区:微信小程序资讯动态,能力解读,交流问答社区;深度链接千位小程序开发者。

小程序学习是智创社区提供的服务内容

关键词策略不在限制输入小程序名字搜索

互联网新潮为智创社区唯一绑定公众号,相关性高

长按直达智创社区开启学习互动之旅

你的关键词可用度高吗?能否从小程序搜索或者搜一搜中正常被Search呢?

评论区域留下你的想法。

关于微信小程序关键词策略如何操作,小李强烈推荐阅读:

本文为互联网新潮原创,仅代表作者观点。

这个时代不缺内容

如果遇到引领你体验前沿生活的人,你会与他同路吗?

站在客户搜索的角度去想那些网站中的长尾关键词

第一步呢,要确定你网站的主关键词,再去考虑网站的长尾关键词,对关键词充分注意并科学的分析。可以选择对你网站产品或网站内容扩展处来的关键词,借一些关键词去推你自己或者你的网站。可以选择精准度高的词语,别人都不用的,常来你网站的人一看就懂,就知道的。搜索引擎优化不是哪个词热门就去优化哪个词,这需要根据自己网站的特点去做,不是什么词你都可以去做的。这只是大概的介绍,主要还是看你分析能力。然后再介绍下选择长尾关键词满足的几个条件:有一定关联性,想尽可能多的词汇去和你的关键词组合。须有搜索者可能会去搜索的,没人搜索你做了也白做。能满足访问者的访问需求,这一点说难并不难,但做起来很难。最后终结下:选择长尾关键词的时候不一定要去刻意的那么做,查什么百度指数,谷歌热榜什么的,完全没必要,注重自己的网站内容就行了。

文章来源http://www.youyi51.com.cn

App搜索功能探析(附原型模板)

说到一个应用的搜索功能,大家是否立刻会想到一个放大镜的图标和一个矩形输入框?搜索功能在众多app里都占据一个或重或轻的位置,为了充分利用到产品中的资源,让用户能够快速准确地找到目标信息,搜索功能就显得很有必要。但是不同类别的APP,不同的使用场景下,搜索功能的设计以及搜索结果的呈现也有所不同。今天我们就从搜索前后分别来分析app的搜索功能~

搜索入口

输入搜索内容前,我们可以看到的是搜索入口的设计。从入口的设计来看,大体有如下几种:

  • 独立的一级tab,将一级界面作为独立搜索页面的形式;
  • 顶栏为搜索栏,搜索输入框直接呈现的形式;
  • 呈现一个在顶栏的icon按钮点击展开的形式;
  • 下拉后展现搜索栏,非固定展现形式。

如下图:

以上面的截图为例分析,独立的一级tab体现搜索功能在app中级别相对较高,搜索功能相对重要;

搜索栏置顶存在,相较于第一种来说搜索功能层级更低,但也能方便用户不论是在浏览过程或是切换tab时都随时进行搜索操作,用户在使用app的过程中,如果没有即时能够进行的操作,易降低用户依赖度;

对于入口仅为一个icon按钮的情况下,减少了导航栏占用,但相对地也弱化了搜索功能。哔哩哔哩的视频大多由用户自己上传,即使是上线了最新官方内容,对于用户来说想要浏览的新内容都是未知的,既然依赖于推送,自然搜索功能也就相对弱化;

通过下拉手势展示的搜索框,可能表示该app较为弱化了搜索功能,对于多数用户来说下拉手势属于习惯性手势之一,由于用户的习惯性下拉操作,搜索栏在不占用顶栏的状态下也能让用户立刻找到。

搜索方式 1. 文字搜索

从搜索方式来看,搜索功能呈现出的形式越来越丰富。最基础最常见的就是文字搜索。但是丰富的其他形式也是作为一种搜索的辅助功能,引导用户在搜索上获得更便捷更高效的体验。

搜索时,直接输入文字,搜索到与输入文字相关的信息。大多app都有采用边输入边联想的输入模式,这样可以提高搜索效率,作为辅助搜索时获得信息更加快捷。

如下图:

淘宝的辅助多重筛选搜索,输入时展现的一系列联想内容,点击右边的一个拓展icon,就可以采用联想出的内容,在此基础上继续缩小范围筛选,从而帮助用户获得最接近需求的内容。如下图↓

点击这里查看示例→ xiaopiu-淘宝多重筛选示例

当应用里的内容涉及的类别较多、范围较为广泛,为了搜索出的内容更加准确,减少用户在众多相似的搜索结果中选择内容时的干扰,可采用分类标签的方式便于用户搜索。这种主要适用于用户已知需要搜索的内容的类别,缩小搜索范围。如下图:

对于用来获得最新资讯、热门、新闻等的应用,针对无目的性浏览搜索和对要搜的内容并没有多少了解的用户,目的就是为了让他们了解到这些内容,所以热搜标签会是一个很常见且高效的选择。这种提供降低了用户搜索成本,提供了搜索建议,在一定程度上还可以进行运营推广。如下图:

按历史搜索的出现给在搜索后临时退出app或要再次搜索之前搜索过的内容的用户提高了搜索效率。

多数用户会在重新输入一次搜索过的内容的时候失去部分耐心,因而降低用户体验。

举一个例子,买完火车票以后查看发车时间,如果每次回去查看都要重新输入,就会产生厌烦情绪。

在影视类app中,历史搜索使得用户能快速进入上次观看的影视内容,在购物类App中,历史搜索则使得对上次的购物满意的用户更快找到之前的店铺,降低思考成本。如下图:

2. 语音搜索

除了文字搜索,语音搜索的发展也逐渐在改变人们的使用方式。对于中老年人来说,语音搜索比文字搜索方便得多,他们使用智能机时不用再努力特意去学习打字,只要点击一个按钮就可以轻松输入他们想要的内容。而对于年轻人来说,虽然打字是件简单的事情,但是随着大多数的年轻人且越来越多在走路时也玩手机的趋势来看,语音搜索对于他们来说也是个十分便利的选择,如同语音聊天一样,人们会渐渐对语音输入产生依赖。如下图:

听歌识曲出现在多数音乐类app,年轻人喜欢听音乐,也喜欢在咖啡店或者走路时享受听音乐的乐趣,还有在即时听到音乐的时候想要立刻获得歌曲信息,这时候文字搜索就显得十分局限,让用户点开app就能直接根据歌曲片段搜索到该首歌曲,这便让用户体验达到绝佳效果,因此多数音乐类app会直接将听歌识曲放置在首页做成一个二级界面。如下图↓

点击这里查看示例→ xiaopiu-听歌识曲示例

部分音乐类app还针对一些场合做了些语音搜索上的优化,比如哼歌识曲。对于没能及时听歌识曲,没有记住歌词,突然想要找回以前听过的已经不记得名字和歌词的歌之类的情况,哼歌识曲就提高了搜索到用户想要的内容的可能。如下图:

3. 图像搜索

图像搜索也是一个便利的搜索方式。较为基础的是大家很熟悉的「以图搜图」,既可以当即拍照,也可以点击左下角上传图片进行识别。对于没有二维码和条形码的物品,如何快速搜索到并购买该物品呢?有时候在商场看到一件衣服,觉得价格太昂贵,或是看见其他人买了一个非常喜欢的东西,也想买一个同款,却又很难只根据颜色和表达不出的款式风格搜到最相近的物品。当场拍下物品的照片以后,用「以图搜图」模式搜索,识别出与拍摄物品相似的物品。如下图:

AR扫又是「以图搜图」的一个优化,直接扫描即可识别物品,减少了用户拍照又上传的操作成本,如下图:

搜索结果

从搜索结果看,又有许多不同形式的功能展现。搜索结果可能有纯文字列表的展示、文字加图片的展示、以及按分类显示的展示。以网易云音乐为例,纯文字的展示对于搜索结果来说已经是较为主要且明显的内容,显示出图片没有其他明显的作用。而对于购物类app,物品的展示图片就显得相对重要,用户会根据物品的样图来决定想要查看的内容。对于微信来说,微信并不是专门为用户想看的资讯内容而生,用微信搜索的用户可能是因为近期在微信某处看到的某个内容相关,但是突然忘记来源究竟是小程序还是朋友圈,展现的内容就按分类罗列,搜索不局限在某个区域内。如下图:

搜索结果还可以以其他形式展现。以大众点评为例,在给根据地图搜索附近商店可以给用户直观地展现,根据远近和路线决定目的地。如下图:

点击这里查看示例→ xiaopiu-地图位置搜索示例

除了搜索结果的展现形式不同外,还有搜索结果提供的可操作功能的不同。搜索范围可以是精确搜索,也可以是模糊搜索。模糊搜索比精确搜索的范围更广,对比精确搜索的准确度偏低。精确搜索无法识别其中的关键字而给出相关结果,而是将搜索词条整个作为整体进行的搜索,相对模糊搜索而言较为局限。如下图:

根据搜索的结果的范围度可进行分类筛选,为了让搜索结果缩小范围,搜索更精确,如下图:

搜索功能中搜索的内容也可以不局限于搜索的标题和一级展示内容,可能根据搜索的结果中的部分内容而得出与之相关的结果搜索。在音乐类app中较为常见是根据歌词搜索歌名,很多歌曲可能忘记歌名只会哼唱一两句歌词,比起书或文章来说,歌曲的歌词内容较少,因此根据歌曲内容搜索也容易实现。

如下图:

在影视类app里比较常见还有一种功能,在搜索结果项中给出可进一步操作的按钮。由于搜索出的结果项较少,搜索到的内容较为专一,直接操作对用户来说减少了操作成本。不同于淘宝之类的购物类app,这类app因为需要查看更多商品详情再做购买决定,而类似影视类app则搜到的内容基本符合用户需求,所以搜索的结果项放置可操作按钮。如下图:

总结

根据app的特性和用户需求分析,考虑用户在搜索时需要的搜索方式,不同app采用不同的搜索功能设计,可以提升用户体验。

根据用户需求,一步步优化和改善,从最基础的文字搜索,考虑无法满足在文字搜索上的用户需求,在合适的时候辅助以声音和图像搜索。

在图像搜索和语音搜索上进一步改善做出新的搜索优化,正如淘宝这样的app,从文字搜索到扫一扫,再到拍立淘,甚至复制粘贴淘口令,已经渐渐把淘宝里的搜索体系完善了。

搜索并不是只局限在一个放大镜图标和一个输入框上,先仔细考虑本身产品的内容特性和不同使用场景,再来决定搜索功能对于该产品的重要性及分类以及搜索结果呈现等其它设计。

附上搜索功能的页面原型以供预览和下载:xiaopiu-在线APP原型设计-app搜索功能示例

(下图为部分app搜索原型,所有搜索原型包含交互动画,需点击链接查看)

本文旨在从app的搜索功能这一小部分的讨论引导大家从每一个小的细节和功能上设计好app,希望大家在看完这篇文章以后能对搜索功能有一个更为细致的见解。从当前产品的具体形态来思考搜索功能的重要性以及它的使用场景,提供给用户便捷的搜索方式、合理的搜索建议及精准的搜索结果,提升搜索体验,让用户高效准确地找到目标信息。

本文由 @WOOSEVELT 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自 Pexels,基于 CC0 协议

移动搜索哪家更风生水起

电脑放在桌子上很久都不用,如果有问题下意识就拿起手机已经是很多网民的习惯,智能手机越来越普遍,随之增长的就是移动端搜索引擎的使用。

移动搜索

移动搜索水涨船高,越来越多的用户使用手机进行搜索行为。CNNIC数据显示2015年移动端搜索趋势增长11.3%,同期PC端搜索趋势增长8.4%。而根据艾瑞网数据显示,截止2016年第一季度,77.6%的移动搜索份额在于百度,其次14.4%,归属神马搜索。

百度在一次一次时间冲击之后,仍然是国内最大互联网信息入口。

搜狗搜索借助腾讯自己家的产品“微信头条”功能,则能让更多微信的优质内容被挖掘。而神马搜索,除了借助UC外,还布局了App搜索、购物搜索、小说搜索几大垂直领域。

而搜索功能也逐渐趋于人工智能助理服务,科技带给人们更多崭新体验。手机中内置的搜索应用也为用户提供更多便捷,比如Google Now、Apple的Siri、微软的Cortana,都是由此而生。它们能提供语音搜索、私人定制化服务、地理位置搜索等功能,为人们的日常工作与生活提供更多意想不到的便利。

有流量的地方就会有需求,搜索引擎营销就是这样开始的,移动搜索技术发展迅速,用户体验需求也会越发挑剔。搜索引擎最基本的满足需求完成之后,各大搜索引擎还会带给我们怎样的惊喜,商道通将持续为您关注。

淘宝 天猫关键词搜索背后挂靠坑产

电商老人都知道,以前不管是搜索,直通车,还是钻展,权重基本都在点击率上,随着硬软件和技术的更新,现在的搜索复杂了很多,越来越多的人开始关注我所提出的图搜玩法理念,想必大家心里门清都知道以坑产为导向的搜索坑产玩法长久不了,二维码,短链接,卡首品以及全标题和半标题的坑产玩法基本都死了,唯一存活的玩法就是以关键词布局为导向的搜索玩法,以核心词为导向布局关键词的玩法效果也大不如前。主要针对围绕核心引流词布局流量单一和人群不精准,以及流量缩小做了调整,让搜索流量爆发更大,人群精准度更高,很多人问我是怎么通过关键词优化人群的,其实不妨告诉你们,两个字—需求,消费者背后的搜索习惯以及需求反应了部分消费者需求,解决它就可以把人群优化精准。流量是用来成交的不是用来好看的。怎么理解关键词挂靠坑产这个概念?其实和直通车里面的关键词质量得分一样显示最高10分其实无限封顶,搜索关键词亦如此,每个关键词的背后都挂靠坑产值,每个关键词对应唯一反馈,也就是说连衣裙女夏这个词你可以搜索到,连衣裙女可能就搜索不到了,其核心就是对应的权重不到,连衣裙女对应得分100分让你上首页可能你99分的时候就放弃了,连衣裙女夏为什么能收到是因为它需要权重80分,这是很多同学玩坑产玩法容易犯的错误。真的是靠坑产值,搜索流量就能起来吗?其实不然,文章开头我就强调了一遍点击率在以前的重要性,在以前重要不代表现在已经不重要了,点击率特别是搜索点击率是搜索给不给你流量的第一关,这个问题我是第二次强调说明,过了这一关后面才是点击反馈,什么收藏,加购以及成交;第二关是点击量和成交量,这个玩直通车的同学很容易理解,如果你一直控制展现是点击几下点击率就很高,但是这样玩是降不了ppc的,只有展现和点击量同时递增放大才能解决直通车的一切难题。第三关:词根和词系的特俗维护,所有的竞争都是来至于行业和对手,要想打败竞争对手,首先要达到行业水平满足前提再比竞争对手优秀1.2倍就可以了,这是两个维护的考核,不是你认为你做的可以了就可以了,是系统后端说你可以了才可以,这也是很多同学犯的第二个错误,感觉自己数据以及曲线控制的都很好但是就不来大搜索,这部分同学考虑竞争太单一思维,总起来一句话权重不到,流量就不会来。第四关:需要什么流量就通过什么端口成交,需要搜索必须搜索途径成交,直通车是可以帮你带出来搜索但绝不是搜索继续递增的动力。

通过标题优化提高搜索流量(实战干货)

今天,我们又来谈到了标题优化这个操作。这些天不少商家找到知心说宝贝的自然搜索流量很低,要怎么提高流量。我说从基础优化做起,先去优化标题。我们知道标题就是宝贝的名字,这个标题是为了让系统更好的给我们的产品排序。但是很多人可能对怎么优化标题完全摸不到门道,一个产品从上架到下架一直用一个标题。也有的因为优化标题,把产品弄死了的。。这个这些都是源于你们没有摸到标题优化的操作,为什么淘宝说的优化宝贝能提升搜索流量,还会把宝贝弄死了呢,因为很多人不懂优化背后的原因,还有红线是在哪里。正确的优化标题都能提升我们的搜索流量,快速提升宝贝权重的。下面我一步一步教你们怎么通过标题优化来提升搜索流量。

一.分析思路

首先我们要知道一个标题是60个字符,30个字。通过生意经的标题分析,我们要学会分析标题,比方亏本保真沉香木文玩佛珠手串108颗念珠印尼黑油老料男女木手链 这样一个标题,我们如果不知道他究竟哪个词是没展现的词,哪个词是流量低,没转化的词,哪个词是流量多,没转化的词,哪个词是流量多,转化低的词。你都没列出来,这些随便去优化,那很容易就把一个宝贝给弄死了。在这里我们要分清一个主次,首先我们要优化的思路就是 没有展现的词〉流量低,没转化的词〉流量多,没转化的词〉流量多,转化低的词。这是我们一个完整的优化思路,在这里我提示一点,就是优化掉流量多,没转化的词的时候。虽然这个词没有转化但是他流量多,你如果把这个词换掉的时候,宝贝的流量就会下跌。这就是很多人优化标题后流量大幅度下降的原因。如果找不到更牛逼的词的时候,暂时就先别换掉这个词。

然后我们要怎么去找到替换关键词的目标查找。生意参谋-市场行情-行业热词排行榜-热门修饰词。淘宝鼓励的商家去优化主图,详情,标题的。在一些不懂的优化下,反而成为弄死宝贝的主要原因了。

二.标题优化实例

我们打开生意经-宝贝分析-标题分析。拉取宝贝最近7天的记录,从这里我们可以看到标题的每一个关键词所带来的流量,我们把这些词都收集起来做一个分析。

我们这样列出的时候就会发现男女这个流量是0,亏本这个流量是2.类似这种没展现的词可以直接删了的。那我们怎么看词有没有成交呢?我们在生意经里面还能看到无线端的成交词文档,通过文档后我们看到一些低转化,甚至没转化的词。这些词完全就可以替换掉了。

三.标题优化注意事项

1.标题优化每次优化改动6个字符之内,就算我们整个标题很差,也需要一步一步优化,你一下把整个标题换了,会让系统觉得你在换宝贝然后把宝贝降权。这就本末倒置了,本来想把标题优化,结果反而把宝贝搞死了。

2.一周不可超过3次改动,因为我们改动宝贝的时候,系统都会重新收录我们的宝贝。如果频繁的改动,跟一下换标题一样。会让系统觉得你在换宝贝从而降权。