每日一技 iPhone显示无服务 正在搜索怎么办

手机只能连接WiFi,不能拨打和接听电话,屏幕左上角一直显示无服务、正在搜索,这是怎么回事?

出现这种情况是因为手机没有信号,这时候应该查看是原因并尝试相应办法:

1、先查看手机是否插入SIM卡,如果没有插入SIM卡是无法连接信号的。

2、如果有插入SIM卡,还是显示无信号,那么查看手机卡槽有没有损坏,再将SIM卡插入其他手机看看有没有信号。

如果是卡槽损坏,建议更换卡槽,如果是SIM卡损坏,请前往营业厅更换SIM卡。

3、所处在地方信号不好无法搜寻到信号,可以换个地方再搜寻。

4、反复开关2次飞行模式。

5、如果是手机系统版本过低,请依次点击【设置】-【通用】-【软件更新】,更新系统。

6、还有可能是手机设置问题。点击【设置】-【通用】-【还原-【还原所有设置】。

7、另外,有些国外购买的有锁手机需要配合卡贴才能搜索信号,请购买卡贴装上使用,如果卡贴已损坏或者手机已升级,更换卡贴。

8、尝试以上方法后,若问题依然存在,如果还在保修期内,请携带购机发票、保修卡、手机包装盒和手机送到苹果售后服务中心,由专业的售后工程师帮助检测。

@被“痘痘”逼疯的你,95%的“战痘士”推荐的终极大招来了!

日本狮王祛痘膏

原价178元 粉丝特惠118元

【每日一技】这10个条件,符合3个强烈建议换手机!

号称第五大发明!中国“工兵铲”霸道走红世界!

爱车补漆伤不起,这块能让时光倒流的神奇抹布帮你轻松去除车辆划痕!

淘宝运营之搜索深度解析

2019的直通车,想通过技术操作将投入产出比做到盈亏平衡点以上,已经越来越难了。那么直通车的未来何去何从,什么样的情况下直通车能够接受亏损?

销量——但可能不是你所理解的销量

说到销量,大家都会有感触,搜索的综合排序中相对比较靠前的,拿到大量搜索流量的宝贝,往往都是销量比较高的宝贝。所以很多做电商的朋友都会认为,只要销量高,搜索流量就一定会很大。

这个理解并不完全正确,这其中有一些误区,而因为这个误区,很多朋友开始了盲目冲销量的征途。

这些盲目冲销量的行为,大多认为自己只要把销量冲到足够高,就可以带来足够的流量权重。慢慢的,很多人开始用上了一些超高佣金淘宝客、亏本冲量卖吆喝的方法,甚至还有些人开始铤而走险,开始作弊刷销量。

但是这样做真的有用吗?任何销量都会计算搜索权重吗?什么样的销量会计入搜索权重,什么样的销量不计入搜索权重?你的判断标准是什么?

今天给大家分享一下我的判断标准。一笔成交是否计入搜索权重,看的是这笔成交是否有在搜索场景下的搜索行为。

我举个例子,例如有一个买家,他个子不高,于是想买一双内增高的皮鞋。接着他打开手机淘宝,在搜索框中输入了“男士内增高皮鞋”这个关键词,得到了这个关键词的搜索结果。搜索结果中有很多款商品满足“男士内增高皮鞋”这个搜索条件。这名买家挑选了其中一个进行了购买。

上面这个例子中,买家的这笔成交是通过搜索功能查找关键词,从而找到了自己想买的“男士内增改皮鞋”这款商品,并产生了交易。

那么这笔交易是满足了用户在搜索场景下的行为所表达出来的需求。那么这比成交,也会计入搜索的排序权重计算。

我们总结出一个信息,一笔成交是否计入搜索,判定条件是这个用户是否是通过搜索渠道成交的。那么直通车的关键词投放,自然搜索关键词查找,都会计入搜索权重。

我们在看一个例子,还是这名买家,依然是搜索“男士内增高皮鞋”这个关键词。但是这名买家刚刚找到自己心仪的一款鞋子。

这个时候虽然这个买家不是通过搜索渠道进行成交的,但是这个买家是先通过搜索找到了这款商品,然后通过购物车成交了这款商品,他的一跳来源是通过关键词搜索行为成交的,那么这比成交依然会计入搜索的排序权重。

还有一个例子:

这名买家搜索了“男士内增高皮鞋”之后,把商品加入了购物车中。第二天打开手机淘宝,结果另外一家也销售“男士内增高皮鞋”的店铺,用钻展定向把广告投放给了这名买家。结果这名买家就在另外一家店铺成交了“男士内增高皮鞋”这个产品,那么另外的这家店铺,成交的这名买家,也是搜索了“男士内增高皮鞋”这个关键词,且是作为一跳来源,这笔成交也会计算搜索的排序权重。

通过上面的这两个例子,我们又总结出一个信息。如果一笔成交的一跳来源,是通过搜索关键词找到商品的,那么这比成交依然会计入搜索排序权重。

关键词——搜索权重的载体

一个宝贝的一笔销量,并不是记录在这个宝贝上的,而是记录在这个宝贝的关键词上的。也就是说成交的关键词不同,权重的计入也是不一样的。

例如有一款“笔记本电脑贴膜”,这款贴膜的宝贝标题是“13.3笔记本电脑贴膜15.6”,那么用户搜索“笔记本电脑贴膜13.3”可以找到这款宝贝,而搜索“笔记本电脑贴膜15.6”,也可以找到这款宝贝。

但是这款宝贝的竞争力是13.3寸的贴膜,15.6寸的贴膜价格相比竞争对手相对较弱。那么就会造成一种情况,搜索“笔记本电脑贴膜13.3”的用户大多能成交,而搜索“笔记本电脑贴膜15.6”的用户可能最后会选择别家店铺的产品。

这款宝贝近期成交了500笔交易,460笔是来自于“笔记本电脑贴膜13.3”这个关键词搜索后的成交,而“笔记本电脑贴膜15.6”的成交非常少。

对搜索而言,我们的商品是可以满足关键词“笔记本电脑贴膜13.3”搜索用户的需求。并不能满足关键词“笔记本电脑贴膜15.6”搜索用户的需求。那么当用户搜索“笔记本电脑贴膜13.3”这个关键词时,这款产品就会因为更能满足这个关键词搜索用户的需求,而被安排优先展示给用户。

但“笔记本电脑贴膜15.6”这个关键词并不会被优先推荐给买家。因为他并不能满足用户的搜索需求。用户的搜索行为不同,搜索关键词不同,则需求不同。不同的需求,也要通过不同的产品来进行满足。

通过上面的这个例子,我们得出一个结论。用户通过搜索行为成交带来成交销量,权重并不是隶属于某个宝贝的,而是属于这个宝贝标题中所包含的关键词。

用户通过搜索不同的关键词,带来的成交权重会累积到不同的关键词。而用户搜索不同的关键词时,宝贝排序也是由不同的关键词权重来进行排序的。

不知道说到这里,你是否对搜索的排序计算因素,也就是我们通常所说的权重,是否有了更加明确的认知?

通过这些知识点,我们应该理性的选择冲销量。有些销量(例如淘宝客)并不计入搜索的权重,但他可以改变商品的成交笔数、收货人数。对点击率、转化率这些效率指标有所影响,也会影响到搜索排序(具体的下一集会给大家详解),但是他并不会计入搜索的成交排序得分中来。

我们应该更加重视搜索成交的关键词,直通车成交的关键词。并且更加集中的去增加流量,增加转化率更高的成交关键词流量。

搜索展现排序逻辑

讲完了搜索成交关键词,接下来继续分享一下搜索展现排序的逻辑。

我们需要的是什么,我们需要的是流量。那么如何才能获获得流量呢?我们得在买家的关键词搜索排序中,获得更高的排名,从而获得更多的流量。而关键词排名的过程中,要经历了一个与所有竞争对手PK的过程。这个过程是这样的。

1.用户搜索“抱枕 慢回弹”这个关键词,首先搜索会在全网的宝贝中进行检索,找出所有标题中包含“抱枕”、“慢回弹”这两个词根的商品。这里我们将它称之为“匹配商品池”。

2.“匹配商品池”中会有很多宝贝是没有价值的宝贝,例如类目不符合优先展示类目的商品,或者是一些虚标价格没有用户成交的商品,又或者是上架很久但是没有用户成交的滞销商品。搜索会将这些商品剔除掉,留下相对活跃的商品。·这里我们将它称之为“活跃商品池”。

3.接下来在“活跃商品池”中,搜索会商品进行用户搜索词根的成交量比对。例如用户搜索的“抱枕 慢回弹”这个关键词,其中包含了“抱枕”、“慢回弹”这两个词根,那么搜索就会对比每个商品近一段时间“抱枕”这个词根的成交笔数,“慢回弹”这个词根的成交笔数。在综合词根对用户搜索需求的重要性进行拟合,得到商品词根成交量因素的排序。这里我们将它称之为“词根成交量排序”。

4.因为每个宝贝的点击率不同,转化率、客单价也不同。所以同样的流量带来的成交额也是有所不同的。这里给大家一个数据指标概念——展现价值。展现价值值得是,商品每获得一个展现量,能够带来的销售额是多少。

例如商品的单价是50元,转化率是7%,点击率是3%。那么,如果搜索分配给这个宝贝10000个展现量,它可以将展现量转变为300个访客数,300个访客数依照7%的转化率能带来21笔成交量,按照50元的单价,可以带来1050元销售额。

那么就是10000个展现量带来了1050元销售额,每个展现量可以带来0.105元的销售额。那么每个展现的价值就是0.105元,展现价值=点击率*转化率*客单价=3%*7%*50元=0.105元。展现价值越高的商品,在获得同样的展现量时,可以贡献更多的销售额。

在“词根成交量排序”的基础上,再综合这个宝贝的展现价值得到“商品原始排序”。假设在两款商品的词根成交量一模一样时,但由于A商品的展现价值比B商品要高,所以A商品的“商品原始排序”会更加靠前。

5.每个买家都会有自己的购物偏好,因为每个用户的认证信息不同、历史购物信息不同、与每家店铺的人店关系(老客户、老访客、新客户)不同等等,所以每个买家都会形成不同的用户标签。

因为每个宝贝自身的商品属性不同,以及成交用户身上所带的标签不同,所以每个宝贝也会形成不同的商品标签。在不同用户标签的买家进行搜索时,每个宝贝会根据自身的商品标签与这名买家身上的用户标签形成的不同的匹配程度,对该宝贝的“商品原始排序”进行加分或者减法,从而形成这个用户搜索结果的“个性化商品排序”。

每个买家的用户标签有所不同,每个宝贝的商品标签也有所不同,所形成的匹配度也大不一样。所以就出现了不同的“个性化商品排序”也就是我们常说的千人千面。

通过以上五个点的解读,希望你能够对搜索展现排序的逻辑有一个基本的认知。因为只有在能了解排序规则,相关因素的前提下,才能正确、高效的对他们进行优化

用百度搜索这些关键词 你还是可能会受骗

百度竞价医疗又出事了……宁波的周小姐想去复旦附属眼耳鼻喉科医院看鼻炎,但在百度搜索几次都显示的是上海场中路的复大医院。周小姐被对方诊断为慢性肥厚性鼻炎,当场缴费近万元做了切除鼻甲手术。由于病情并未好转,周小姐找到了位于上海汾阳路83号的眼耳鼻喉科医院就诊后,才知自己患的鼻窦炎仅配个药就可以。

原标题:用百度搜索这些关键词,你还是可能会受骗

央视曝光之后,百度「竞价排名」又回到了大家的视野当中。

对于这件事情,百度的回应也异常「硬气」:

简单来说就是我们百度在打击莆田系医院这件事情上已经很努力了,这次只是一个我们一不小心没有打击到的一家,纯属漏网之鱼;百度甚至还在结尾推广了一下自家的搜索软件……

就是这么硬气。

不是想用谷歌,是不敢百度

上次《谷歌搜索回国:愿百度从此不得安宁》发出去之后,很多人说我们是“为了黑而黑”,说现在“黑百度是政治正确”。为了证明百度的广告打的有多丧心病狂,我们拉来了外援谷歌,看看百度和已经离开中国接近 10 年谷歌对同一个词条的搜索结果有什么不同。

这些词条都是我们今天下午刚刚截的,绝对的「第一手消息」。

首先是饱受争议的医疗词条:

「胃疼」

「脑科」

「肠炎」

除了医疗,我们还查了一些和电子生活相关的词条。

「二手手机」

「苹果手机维修」

「Photoshop」

我们还查了一些广大学生党和已经工作人士可能会查到的词条。

「公积金」

「网贷」

「考研」

「会计师」

看出差距了吗?

简单来说,百度是努力把广告融入进搜索结果当中,让搜索者无法区分搜索结果里面的词条究竟是结果还是广告。

估计会有人说现在谷歌的工作重心不在国内,没有推广也属于正常,那你可能不知道谷歌还在中国的时候,用的是什么样的商业推广模式。

而 Google 当年还在中国大陆的时候是以全自动的搜索方法排除了人为因素对搜索结果的影响,不接受付费的竞价排名,亦不出售搜索结果中的排序位置,而是依照点击人气、质量等因素进行综合排列。投放在 Google 的广告(含谷歌中国),只会出现在搜索页面的右边或者顶部的独立区域,并且用竖线、底色与其它的自然搜索结果明显地区别开来和加上“赞助商链接”(“Sponsored Links”)的标识。另外,这些“广告”也不是纯粹根据广告主出价来排序,还会考虑到该广告对用户搜索词的相关度,不是出价最高就一定是排在第一。

看来现在大力发展 AI 的百度还不如曾经直接退出中国时期的谷歌,不知道这些年百度努力研发的 AI 都用在哪里了。

一个技巧,用上「干净」的百度

说实话,百度不是一点优点没有,事实上作为一家美国上市企业的开曼群岛公司,百度的中国本地化工作做的绝对超过一般的国际巨头。

比如算汇率:

比如查天气:

比如查快递:

比如算数:

尤其是在国际巨头「不愿意」进入中国的前提的下,如何科学地使用百度就成为了一个需要每个网民都掌握的技能了。

事实上想让百度变得简单易用非常简单,你只需要一个 Chrome 浏览器和一个 Tampermonkey 油猴插件就可以了。

在 Chrome 上下载安装好油猴之后,去脚本网站 greasyfork 上查找一个叫「百度广告(首尾推广及右侧广告)清理」的脚本,安装之后重启浏览器就可以使用了。

给大家看一下屏蔽广告之后的效果:

屏蔽前

屏蔽后

怎么样,是不是效果好了很多啊。

在我们公众号后台回复「油猴下载」即可获得 Tampermonkey Chrome 版本安装包的下载链接。

10 年过去了,百度依旧在道歉

百度竞价排行上线时间是 2002 年,而最早进入观众眼帘的应该就是 2008 年央视连续两天中午对百度竞价排行的报道。从此以后,百度竞价排行没事就出事,百度也跟着没事就道歉。这一道歉就道了十年。

10 年央视曝光百度推广假药,并抽成高达 75%;

11 年天涯论坛有网友曝光百度通过百度推广帮三鹿洗白;

16 年年轻的大学生魏则西通过百度到的医院失掉了自己年轻的生命;

尽管李彦宏曾经说过“竞价排名不会伤害用户体验”,但是百度这些年通过推广大赚特赚的同时也彻底失去了自己的口碑。

2017 年陆奇空降百度,上任之后的第一件事就是砍掉了百度的医疗事业部,我们本来以为这就是百度转好的开始,可是我们还是图样了,百度还是那个百度。

最令人失望的是,百度从一开始几乎都是直至被舆论关注并且不断追问、质疑才会回应,态度亦难称诚恳,称得上是头痛医头。我们不知道百度还准备道歉几次,不过一直有传言说谷歌回归中国,看来百度道歉的时间也不会太长了吧。

大家还有哪些在百度受骗的经历,或者不能在百度搜索的词条,可以通过留言的方式与我们分享,让更多的人免遭百度的「关爱」。

谷歌搜索20周年,靠AI让使用者更快找到想要的资讯

谷歌庆祝其搜索服务满20周年,在探索新的搜索方式后,谷歌推出三大基础功能更新,不只透过搜索历程,帮助使用者延伸搜索,也强化视觉沉浸式体验,提供使用者更多元的内容,所有改进的重点,就是要使用者搜索上瘾,越搜越多。

谷歌搜索在20年前开始发展,当时还是仅有2,500万页的索引,内容约只有一个小型图书馆的书籍,而现在谷歌搜索的索引已经高达数千亿页,比世界上所有图书馆加起来可提供的资讯还要多。服务范围涵盖190个国家提供超过150种语言,每天谷歌搜索都会执行数十亿次来自使用者的查询,其中有15%是前所未见的内容,而且在服务提供上,谷歌提到,他们看重每一次的更新,所有变更都经过实验以及谨慎评估。过去一年谷歌执行了20万次的实验,并且对搜索服务做了超过2,400次的修正。

而谷歌在其搜索服务20周年,重新思索了搜索的方式,并做出三大基础改变。第一个改变,谷歌借由过去的搜索歷史,进一步提供使用者更多的资讯。搜索界面将新增活动卡(Activity Card),帮助使用者从之前的搜索阶段继续接下来的任务,活动卡会显示使用者之前造访的页面,以及对该主题所做的查询。

搜索服务现在还会帮使用者动态组织搜索结果,谷歌提到,每个主题的搜索历程都不同,使用者可能对于某些主题不熟悉,而无法进一步搜索相关的资讯,谷歌引入了一种动态组织搜索结果的方法,会显示使用者搜索内容最相关的子主题。

谷歌表示,为了启用上述的这些更新,搜索服务必须了解兴趣以及兴趣推演的过程,Google将现有用来了解人事时地物关联的知识图(Knowledge Graph),新增了主题层,主题层透过分析特定主题网页上的内容而得,目的是要深入理解主题空间,以及兴趣随着时间推移而发展出熟悉度与专长的过程。

第二个基础功能改变则是针对Feed服务,Feed是2017年Google用来帮助使用者探索新鲜事的功能,现在谷歌将其改为更直觉的名称-探索(Discover),并更改了新外观。搜索页面会为使用者显示以主题名称分类的内容,点击该主题能获得更深入的资讯,每个主题名称旁都有一个关注按钮,使用者可以透过关注该主题持续获得主题资讯。

使用者在探索功能的新介面,会看到新类别的内容,包括更多的影片以及图片,并为使用者推送长青内容(Evergreen content),这类的内容不一定是在网上最新出现的,但可能是使用者近期想要了解的。谷歌举例,使用者可能会获得谷歌推荐一篇三个月前发表的旅游文章,其中包含绝佳的餐厅与景点,而之所以会有这篇文章推荐,可能是因为使用者最近正计划一趟新旅行,该篇文章不会是网络最新的,但对于使用者来说是很即时的资讯。

由于探索功能显示的内容取决于使用者的兴趣,谷歌也提供更多的控制项,供使用者调整想要观看的内容,使用者可以单纯的透过点击图标,来决定想要增加或是减少特定内容出现的频率。在新闻推荐方面,探索功能现在使用和谷歌新闻相同的全覆盖技术,确保推荐给使用者新闻包含各种观点。另外,最新的设计会为使用者推送更多语言的内容,帮助使用者进行英文阅读等活动。

搜索服务的第三个改变是要为使用者提供沉浸式的体验,在早些时候,谷歌搜索与AMP专案合作,推出了AMP故事功能,让任何人都能以故事的方式展示特定内容,现在谷歌应用人工智能技术,自动化创建AMP故事,开始提供像是艺人或是运动员的故事,以丰富的视觉形式提供使用者观看重要或是关键的时刻。另外,使用者现在也可以在搜索页面中,直接预览主题影片。

在过去一年,谷歌对图像搜索演算法进行了彻底的检验,以提供更好的图像结果排名。谷歌也提到,从这星期开始,他们将会于图片搜索页面中,在搜索结果图片的周围显示更多的讯息,以帮助使用者了解图片背后页面的资讯,同时也会在页面上显示更多的建议搜索信息,以帮助使用者探索更多信息。

​谷歌提到,他们应用神经嵌入技术,这是一种神经网络领域的方法,能让电脑理解字词中隐含的模煳概念,并将这些概念与查询中的概念进行配对,谷歌称这为神经匹配(Neural Matching)。这让系统现在能处理不具体的提问,像是「我的电视为什么看起来很奇怪?」这样的问句。谷歌提到,这些新功能都是基于人工智能技术的进步,现在神经网络不只能够理解字词,甚至可以理解概念,而这是一个重大的进展。

搜索智能提示suggestion 附近地点搜索

搜索智能提示suggestion

题目详情:百度搜索框中,输入“北京”,搜索框下面会以北京为前缀,展示“北京爱情故事”、“北京公交”、“北京医院”等等搜索词,输入“结构之”,会提示“结构之法”,“结构之法 算法之道”等搜索词。

请问,如何设计此系统,使得空间和时间复杂度尽量低。

题目分析:本题来源于去年2012年百度的一套实习生笔试题中的系统设计题(为尊重愿题,本章主要使用百度搜索引擎展开论述,而不是google等其它搜索引擎,但原理不会差太多。然脱离本题,平时搜的时候,鼓励用…),题目比较开放,考察的目的在于看应聘者解决问题的思路是否清晰明确,其次便是看能考虑到多少细节。

我去年整理此题的时候,曾简单解析过,提出的方法是:

直接上Trie树Trie树的介绍见:从Trie树(字典树)谈到后缀树」 + TOP Khashmap+堆,hashmap+堆 统计出如10个近似的热词,也就是说,只存与关键词近似的比如10个热词

方法就是这样子的:Trie树+TOP K算法,但在实际中,真的只要Trie树 + TOP K算法就够了么,有什么需要考虑的细节?OK,请看下文娓娓道来。

解法一、Trie树 + TOP K步骤一、trie树存储前缀后缀

若看过博客内这篇介绍Trie树和后缀树的文章http://blog.csdn.net/v_july_v/article/details/6897097的话,应该就能对trie树有个大致的了解,为示本文完整性,引用下原文内容,如下:

1.1、什么是Trie树

Trie树,即字典树,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。

Trie的核心思想是空间换时间。利用字符串的公共前缀来降低查询时间的开销以达到提高效率的目的。

它有3个基本性质:

  1. 根节点不包含字符,除根节点外每一个节点都只包含一个字符。

  2. 从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串。

  3. 每个节点的所有子节点包含的字符都不相同。

1.2、树的构建

举个在网上流传颇广的例子,如下:

题目:给你100000个长度不超过10的单词。对于每一个单词,我们要判断他出没出现过,如果出现了,求第一次出现在第几个位置。

分析:这题当然可以用hash来解决,但是本文重点介绍的是trie树,因为在某些方面它的用途更大。比如说对于某一个单词,我们要询问它的前缀是否出现过。这样hash就不好搞了,而用trie还是很简单。

现在回到例子中,如果我们用最傻的方法,对于每一个单词,我们都要去查找它前面的单词中是否有它。那么这个算法的复杂度就是O(n^2)。显然对于100000的范围难以接受。现在我们换个思路想。假设我要查询的单词是abcd,那么在他前面的单词中,以b,c,d,f之类开头的我显然不必考虑。而只要找以a开头的中是否存在abcd就可以了。同样的,在以a开头中的单词中,我们只要考虑以b作为第二个字母的,一次次缩小范围和提高针对性,这样一个树的模型就渐渐清晰了。

好比假设有b,abc,abd,bcd,abcd,efg,hii 这6个单词,我们构建的树就是如下图这样的:

当时第一次看到这幅图的时候,便立马感到此树之不凡构造了。单单从上幅图便可窥知一二,好比大海搜人,立马就能确定东南西北中的到底哪个方位,如此迅速缩小查找的范围和提高查找的针对性,不失为一创举。

ok,如上图所示,对于每一个节点,从根遍历到他的过程就是一个单词,如果这个节点被标记为色,就表示这个单词存在,否则不存在。

那么,对于一个单词,我只要顺着他从根走到对应的节点,再看这个节点是否被标记为红色就可以知道它是否出现过了。把这个节点标记为红色,就相当于插入了这个单词。

借用上面的图,当用户输入前缀a的时候,搜索框可能会展示以a为前缀的“abcd”,“abd”等关键词,再当用户输入前缀b的时候,搜索框下面可能会提示以b为前缀的“bcd”等关键词,如此,实现搜索引擎智能提示suggestion的第一个步骤便清晰了,即用trie树存储大量字符串,当前缀固定时,存储相对来说比较热的后缀。那又如何统计热词呢?请看下文步骤二、TOP K算法统计热词。

步骤二、TOP K算法统计热词

当每个搜索引擎输入一个前缀时,下面它只会展示0~10个候选词,但若是碰到那种候选词很多的时候,如何取舍,哪些展示在前面,哪些展示在后面?这就是一个搜索热度的问题。

如本题描述所说,在去年的这个时候,当我在搜索框内搜索“北京”时,它下面会提示以“北京”为前缀的诸如“北京爱情故事”,“北京公交”,“北京医院”,且“ 北京爱情故事”展示在第一个:

为何输入“北京”,会首先提示“北京爱情故事”呢?因为去年的这个时候,正是《北京爱情故事》这部电影上映正火的时候(其上映日期为2012年1月8日,火了至少一年),那个时候大家都一个劲的搜索这部电影的相关信息,当10个人中输入“北京”后,其中有8个人会继续敲入“爱情故事”(连起来就是“北京爱情故事”)的时候,搜索引擎对此当然不会无动于衷。

也就是说,搜索引擎知道了这个时间段,大家都在疯狂查找北京爱情故事,故当用户输入以“北京”为前缀的时候,搜索引擎猜测用户有80%的机率是要查找“北京爱情故事”,故把“北京爱情故事”在下面提示出来,并放在第一个位置上。

但为何今年这个时候再次搜索“北京”的时候,它展示出来的词不同了呢?

原因在于随着时间变化,人们对北京爱情故事这部影片的关注度逐渐下降,与此同时,又出现了新的热词,新的电影,故现在虽然同样是输入“北京”,后面提示的词也相应跟着起了变化。那解决这个问题的办法是什么呢?如开头所说:定期分析某段时间内的人们搜索的关键词,统计出搜索次数比较多的热词,继而当用户输入某个前缀时,优先展示热词。

故说白了,这个问题的第二个步骤便是统计热词,我们把统计热词的方法称为TOP K算法,此算法的应用场景便是此文http://blog.csdn.net/v_july_v/article/details/7382693中的第2个问题,再次原文引用:

寻找热门查询,300万个查询字符串中统计最热门的10个查询

原题:搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。假设目前有一千万个记录(这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门),请你统计最热门的10个查询串,要求使用的内存不能超过1G。

解答:由上面第1题,我们知道,数据大则划为小的,如一亿个Ip求Top 10,可先%1000将ip分到1000个小文件中去,并保证一种ip只出现在一个文件中,再对每个小文件中的ip进行hashmap计数统计并按数量排序,最后归并或者最小堆依次处理每个小文件的top10以得到最后的结果。

但如果数据规模本身就比较小,能一次性装入内存呢?比如这第2题,虽然有一千万个Query,但是由于重复度比较高,因此事实上只有300万的Query,每个Query255Byte,因此我们可以考虑把他们都放进内存中去(300万个字符串假设没有重复,都是最大长度,那么最多占用内存3M*1K/4=0.75G。所以可以将所有字符串都存放在内存中进行处理),而现在只是需要一个合适的数据结构,在这里,HashTable绝对是我们优先的选择。

所以我们放弃分而治之/hash映射的步骤,直接上hash统计,然后排序。So,针对此类典型的TOP K问题,采取的对策往往是:hashmap + 堆。如下所示:

  1. hashmap统计:先对这批海量数据预处理。具体方法是:维护一个Key为Query字串,Value为该Query出现次数的HashTable,即hash_map(Query,Value),每次读取一个Query,如果该字串不在Table中,那么加入该字串,并且将Value值设为1;如果该字串在Table中,那么将该字串的计数加一即可。最终我们在O(N)的时间复杂度内用Hash表完成了统计;

  2. 排序:第二步、借助堆这个数据结构,找出Top K,时间复杂度为N‘logK。即借助堆结构,我们可以在log量级的时间内查找和调整/移动。因此,维护一个K(该题目中是10)大小的小根堆,然后遍历300万的Query,分别和根元素进行对比。所以,我们最终的时间复杂度是:O(N) + N’ * O(logK),(N为1000万,N’为300万)。

别忘了这篇文章中所述的堆排序思路:‘维护k个元素的最小堆,即用容量为k的最小堆存储最先遍历到的k个数,并假设它们即是最大的k个数,建堆费时O(k),并调整堆(费时O(logk))后,有k1>k2>…kmin(kmin设为小顶堆中最小元素)。继续遍历数列,每次遍历一个元素x,与堆顶元素比较,若x>kmin,则更新堆(x入堆,用时logk),否则不更新堆。这样下来,总费时O(k*logk+(n-k)*logk)=O(n*logk)。此方法得益于在堆中,查找等各项操作时间复杂度均为logk。’–第三章续、Top K算法问题的实现

当然,你也可以采用trie树,关键字域存该查询串出现的次数,没有出现为0。最后用10个元素的最小推来对出现频率进行排序。

相信,如此,也就不难理解开头所提出的方法了:Trie树+ TOP K「hashmap+堆,hashmap+堆 统计出如10个近似的热词,也就是说,只存与关键词近似的比如10个热词」。

而且你以后就可以告诉你身边的伙伴们,为何输入“结构之”,会提示出来一堆以“结构之”为前缀的词拉:

方法貌似成型了,但有哪些需要注意的细节呢?如@江申_Johnson所说:“实际工作里,比如当前缀很短的时候,候选词很多的时候,查询和排序性能可能有问题,也许可以加一层索引trie(这层索引可以只索引频率高于某一个阈值的词,很短的时候查这个就可以了。数量不够的话再去查索引了全部词的trie树);而且有时候不能根据query频率来排,而要引导用户输入信息量更全面的query,或者或不仅仅是前缀匹配这么简单。”

扩展阅读

除了上文提到的trie树,三叉树或许也是一个不错的解决方案:http://igoro.com/archive/efficient-auto-complete-with-a-ternary-search-tree/。此外,StackOverflow上也有两个讨论帖子,大家可以看看:①http://stackoverflow.com/questions/2901831/algorithm-for-autocomplete,②http://stackoverflow.com/questions/1783652/what-is-the-best-autocomplete-suggest-algorithm-datastructure-c-c

附近地点搜索

题目详情:找一个点集中与给定点距离最近的点,同时,给定的二维点集都是固定的,查询可能有很多次,时间复杂度O(n)无法接受,请设计数据结构和相应的算法。

题目分析:此题是去年微软的三面题,类似于一朋友@陈利人 出的这题:附近地点搜索,就是搜索用户附近有哪些地点。随着GPS和带有GPS功能的移动设备的普及,附近地点搜索也变得炙手可热。在庞大的地理数据库中搜索地点,索引是很重要的。但是,我们的需求是搜索附近地点,例如,坐标(39.91, 116.37)附近500米内有什么餐馆,那么让你来设计,该怎么做?

解法一、R树二维搜索

假定只允许你初中数学知识,那么你可能建一个X-Y坐标系,即以坐标(39.91, 116.37)为圆心,以500的长度为半径,画一个园,然后一个一个坐标点的去查找。此法看似可行,但复杂度可想而知,即便你自以为聪明的说把整个平面划分为四个象限,一个一个象限的查找,此举虽然优化程度不够,但也说明你一步步想到点子上去了。

即不一个一个坐标点的查找,而是一个一个区域的查找,相对来说,其平均查找速度和效率会显著提升。如此,便自然而然的想到了有没有一种一次查找定位于一个区域的数据结构呢?

若看过博客内之前介绍R树的这篇文章2019/20190426A/F0112909 的读者立马便能意识到,R树就是解决这个区域查找继而不断缩小规模的问题。特直接引用原文:

R树的数据结构

R树是B树在高维空间的扩展,是一棵平衡树。每个R树的叶子结点包含了多个指向不同数据的指针,这些数据可以是存放在硬盘中的,也可以是存在内存中。根据R树的这种数据结构,当我们需要进行一个高维空间查询时,我们只需要遍历少数几个叶子结点所包含的指针,查看这些指针指向的数据是否满足要求即可。这种方式使我们不必遍历所有数据即可获得答案,效率显著提高。下图1是R树的一个简单实例:

我们在上面说过,R树运用了空间分割的理念,这种理念是如何实现的呢?R树采用了一种称为MBR(Minimal Bounding Rectangle)的方法,在此我把它译作“最小边界矩形”。从叶子结点开始用矩形(rectangle)将空间框起来,结点越往上,框住的空间就越大,以此对空间进行分割。有点不懂?没关系,继续往下看。在这里我还想提一下,R树中的R应该代表的是Rectangle(此处参考wikipedia上关于R树的介绍),而不是大多数国内教材中所说的Region(很多书把R树称为区域树,这是有误的)。我们就拿二维空间来举例。下图是Guttman论文中的一幅图:

我来详细解释一下这张图。

  1. 先来看图(b),首先我们假设所有数据都是二维空间下的点,图中仅仅标志了R8区域中的数据,也就是那个shape of data object。别把那一块不规则图形看成一个数据,我们把它看作是多个数据围成的一个区域。为了实现R树结构,我们用一个最小边界矩形恰好框住这个不规则区域,这样,我们就构造出了一个区域:R8。R8的特点很明显,就是正正好好框住所有在此区域中的数据。

  2. 其他实线包围住的区域,如R9,R10,R12等都是同样的道理。这样一来,我们一共得到了12个最最基本的最小矩形。这些矩形都将被存储在子结点中。

  3. 下一步操作就是进行高一层次的处理。我们发现R8,R9,R10三个矩形距离最为靠近,因此就可以用一个更大的矩形R3恰好框住这3个矩形。

  4. 同样道理,R15,R16被R6恰好框住,R11,R12被R4恰好框住,等等。所有最基本的最小边界矩形被框入更大的矩形中之后,再次迭代,用更大的框去框住这些矩形。

我想大家都应该理解这个数据结构的特征了。用地图的例子来解释,就是所有的数据都是餐厅所对应的地点,先把相邻的餐厅划分到同一块区域,划分好所有餐厅之后,再把邻近的区域划分到更大的区域,划分完毕后再次进行更高层次的划分,直到划分到只剩下两个最大的区域为止。要查找的时候就方便了。

下面就可以把这些大大小小的矩形存入我们的R树中去了。根结点存放的是两个最大的矩形,这两个最大的矩形框住了所有的剩余的矩形,当然也就框住了所有的数据。下一层的结点存放了次大的矩形,这些矩形缩小了范围。每个叶子结点都是存放的最小的矩形,这些矩形中可能包含有n个数据。

地图查找的实例

讲完了基本的数据结构,我们来讲个实例,如何查询特定的数据。又以餐厅为例,假设我要查询广州市天河区天河城附近一公里的所有餐厅地址怎么办?

  1. 打开地图(也就是整个R树),先选择国内还是国外(也就是根结点);

  2. 然后选择华南地区(对应第一层结点),选择广州市(对应第二层结点),

  3. 再选择天河区(对应第三层结点);

  4. 最后选择天河城所在的那个区域(对应叶子结点,存放有最小矩形);

遍历所有在此区域内的结点,看是否满足我们的要求即可。怎么样,其实R树的查找规则跟查地图很像吧?对应下图:

一棵R树满足如下的性质:

  1. 除非它是根结点之外,所有叶子结点包含有m至M个记录索引(条目)。作为根结点的叶子结点所具有的记录个数可以少于m。通常,m=M/2。

  2. 对于所有在叶子中存储的记录(条目),I是最小的可以在空间中完全覆盖这些记录所代表的点的矩形(注意:此处所说的“矩形”是可以扩展到高维空间的)。

  3. 每一个非叶子结点拥有m至M个孩子结点,除非它是根结点。

  4. 对于在非叶子结点上的每一个条目,i是最小的可以在空间上完全覆盖这些条目所代表的店的矩形(同性质2)。

  5. 所有叶子结点都位于同一层,因此R树为平衡树。

叶子结点的结构

先来探究一下叶子结点的结构。叶子结点所保存的数据形式为:(I, tuple-identifier)。

其中,tuple-identifier表示的是一个存放于数据库中的tuple,也就是一条记录,它是n维的。I是一个n维空间的矩形,并可以恰好框住这个叶子结点中所有记录代表的n维空间中的点。I=(I0,I1,…,In-1)。其结构如下图所示:

下图描述的就是在二维空间中的叶子结点所要存储的信息。

在这张图中,I所代表的就是图中的矩形,其范围是a<=I0<=b,c<=I1<=d。有两个tuple-identifier,在图中即表示为那两个点。这种形式完全可以推广到高维空间。大家简单想想三维空间中的样子就可以了。这样,叶子结点的结构就介绍完了。

非叶子结点

非叶子结点的结构其实与叶子结点非常类似。想象一下B树就知道了,B树的叶子结点存放的是真实存在的数据,而非叶子结点存放的是这些数据的“边界”,或者说也算是一种索引(有疑问的读者可以回顾一下上述第一节中讲解B树的部分)。

同样道理,R树的非叶子结点存放的数据结构为:(I, child-pointer)。

其中,child-pointer是指向孩子结点的指针,I是覆盖所有孩子结点对应矩形的矩形。这边有点拗口,但我想不是很难懂?给张图:

D,E,F,G为孩子结点所对应的矩形。A为能够覆盖这些矩形的更大的矩形。这个A就是这个非叶子结点所对应的矩形。这时候你应该悟到了吧?无论是叶子结点还是非叶子结点,它们都对应着一个矩形。树形结构上层的结点所对应的矩形能够完全覆盖它的孩子结点所对应的矩形。根结点也唯一对应一个矩形,而这个矩形是可以覆盖所有我们拥有的数据信息在空间中代表的点的。

我个人感觉这张图画的不那么精确,应该是矩形A要恰好覆盖D,E,F,G,而不应该再留出这么多没用的空间了。但为尊重原图的绘制者,特不作修改。

但R树有些什么问题呢?如@宋枭_CD所说:“单纯用R树来作索引,搜索附近的地点,可能会遍历树的很多个分支。而且当全国的地图或者全省的地图时候,树的叶节点数目很多,树的深度也会是一个问题。一般会把地理位置上附近的节点(二维地图中点线面)预处理成page(大小为4K的倍数),在这些page上建立R树的索引。”

解法二、GeoHash算法索引地理位置信息

我在微博上跟一些朋友讨论这个附近点搜索的问题时,除了谈到R树,有几个朋友都指出GeoHash算法可以解决,故才了解了下GeoHash算法,此文2019/20190426A/F0112924.com 清晰阐述了MongoDB借助GeoHash算法实现地理位置索引的原理,特引用其内容加以说明,如下:

支持地理位置索引是MongoDB的一大亮点,这也是全球最流行的LBS服务foursquare 选择MongoDB的原因之一。我们知道,通常的数据库索引结构是B+ Tree,如何将地理位置转化为可建立B+Tree的形式。首先假设我们将需要索引的整个地图分成16×16的方格,如下图(左下角为坐标0,0 右上角为坐标16,16):

单纯的[x,y]的数据是无法建立索引的,所以MongoDB在建立索引的时候,会根据相应字段的坐标计算一个可以用来做索引的hash值,这个值叫做geohash,下面我们以地图上坐标为[4,6]的点(图中红叉位置)为例。我们第一步将整个地图分成等大小的四块,如下图:

划分成四块后我们可以定义这四块的值,如下(左下为00,左上为01,右下为10,右上为11)

这样[4,6]点的geohash值目前为 00然后再将四个小块每一块进行切割,如下:

这时[4,6]点位于右上区域,右上的值为11,这样[4,6]点的geohash值变为:0011继续往下做两次切分:

最终得到[4,6]点的geohash值为:00110100

这样我们用这个值来做索引,则地图上点相近的点就可以转化成有相同前缀的geohash值了。

我们可以看到,这个geohash值的精确度是与划分地图的次数成正比的,上例对地图划分了四次。而MongoDB默认是进行26次划分,这个值在建立索引时是可控的。具体建立二维地理位置索引的命令如下:

其中的bits参数就是划分几次,默认为26次。

本章完。

作者:July

来源:http://www.cnblogs.com/v-July-v/p/3320869.html

————-—-

明明共同关注公众号,彼此却互不认识;

明明具有相同的爱好,却无缘相识;

有没有觉得这就是上帝给我们的一个bug!

想不想认识更多写程序的小伙伴?

C++,Java,VB……应有尽有。

还等什么?赶快上车加入我们吧!

(・ิϖ・ิ)っ算法与数学之美-计算机粉丝群

我们在这里等你哟

投稿邮箱:math_alg@163.com

商务合作:微信号hengzi5809

谷歌公布 2017 年搜索排行

2017 年快结束了,与往年一样,谷歌公布了年度搜索排行,一起来回顾下今年有哪些大事发生。

『搜索』

1. 飓风厄玛

2. iPhone 8

3. iPhone X

4. 马特·劳尔(性骚扰)

5. 梅格汉·马克尔(英国准王妃)

6. 13 个原因

7. 汤姆·派蒂(摇滚传奇去世)

8. 指尖陀螺

9. 查斯特·贝宁顿(林肯公园主唱)

10. India National Cricket Team

『消费者技术』

1. iPhone 8

2. iPhone X

3. 任天堂 Switch

4. 三星 Galaxy S8

5. Xbox One X

6. Nokia 3310

7. Razor Phone

8. Oppo F5

9. OnePlus 5

10. Nokia 6

『全球新闻』

1. 飓风厄玛

2. 比特币

3. 拉斯维加斯枪击案

4. 朝鲜

5. 日食

6. 飓风哈维

7. 曼切斯特

8. 飓风何塞

9. 飓风玛利亚

10. 长颈鹿“四月”分娩

『人物』

1. 马特·劳尔(性骚扰)

2. 梅格汉·马克尔(英国准王妃)

Nadia Toffa

4. 哈维·韦恩斯坦(性骚扰)

5. 凯文·史派西(性骚扰)

6. 盖尔·加朵

7. 梅拉尼娅·特朗普

8. 弗洛伊德·梅威瑟(拳击)

9. 迈克尔·弗林(美国国家安全顾问辞职)

10. 菲利佩·库蒂尼奥

『电影』

1. 小丑回魂(IT)

2. 神奇女侠

3. 美女与野兽

4. 金刚狼3

5. 正义联盟

6. 速度与激情8

7. 巴霍巴利王(下):终结

8. 敦刻尔克9. 爱乐之城

10. 雷神3:诸神黄昏

『电视节目』

1. 怪奇物语

2. 13 个原因

3. Big Brother Brasil

4. 权力的游戏

5. 铁拳

6. Bigg Boss

7. 河谷镇

8. 美国众神

9. The Kapil Sharma Show

10. 心灵猎人

『音乐人』

1. Ariana Grande

2. Linkin Park

3. Lady Gaga

4. Mariah Carey

5. Ed Sheeran

6. Travis Scott

7. Kendrick Lamar

8. Lil Pump

9. Katy Perry

10. Cardi B

『表情包』

1. Cash Me Outside Meme

2. United Airlines Meme

3. Elf on the Shelf Meme

4. What in Tarnation Meme

5. Spongebob Mocking Meme

6. Romper Meme IT Meme

7. Joe Biden Meme

8. Game of Thrones Meme

9. Hot Dog Meme

ASM时代来临 苹果应用商店加入搜索广告,免费推广越来越难做

今天6月9日端午节,本来打算今天吃点粽子放个假,结果一大早醒来就看到朋友圈被“苹果应用商店引入竞价排名”的消息刷屏了:苹果全球市场营销高级副总裁菲尔·席勒(Phil Schiller),在全球开发者大会开幕前(WWDC)扔出重磅消息:苹果应用商店搜索中即将加入广告。

ASM(AppStoreMarketing)时代终于还是来了,朋友圈也是操碎了心做各种解读,其实归根到底,就是再次强调了一个大家很早就懂的道理:这年头,没钱你还做什么APP推广?!

苹果引入了竞价排名,如果最后证实效果不错,土豪们一定肯定确定百分百会霸占,如果作为推广人的你没钱,你依旧是干瞪眼。所以姑婆就不跟风聊什么“对业内的深刻影响了”,我们就聊聊苹果应用商店为什么引入竞价排名,业内推广人对于苹果竞价排名的反应,竞价广告的投放要求,以及吐槽免费推广越来越难做的现状吧。

1,苹果应用商店为什么引入竞价排名?——一张图说明一切

任何一个搜索系统,都会经历“自然排序—刷广告——竞价排名”三个阶段。“竞价排名”机制最早由谷歌所创,早已成为被验证过的盈利模式,每年可以为谷歌带来几十亿美元的收入,早在今年2月份,谷歌Google Play也引入了竞价排名机制。

现在iPhone出货量下滑,股价下跌,所以苹果通过这种方式变现是一种必然。

2,业内推广人对于苹果竞价排名的反应?—期待规范推广市场

正是因为预料到了苹果应用商店商业化的必然,所以可以看出,业内朋友的反应还是比较平静,甚至有一点点小期待。

之前一家网站进行过广泛调研:

如果花钱竞价,拿下iOS系统中App Store搜索页的首条推荐位,你愿意参与吗?——

几乎没有应用开发者选择“不”,他们首先想到的是买买买以及感觉至少会比刷榜公司强,紧接着才反应过来具体价格和性价比的问题。

姑婆在朋友圈也看到很多圈内朋友表示很淡定。

3,投放苹果竞价广告有什么要求——门槛不高,比较有诚意。

在App Store的搜索结果中增加推荐广告后,用户搜索相关内容后,将会显示一条置顶的推荐广告。我们来看一下官方网站给出的广告位说明及投放须知。

广告位的要求怎样?

1,广告会有蓝色背景和图标,会被清晰的标识出这是一个广告;

2,与搜索结果关联度很高的才会出现在广告位置上;

3,搜索结果只是App,不能通过搜索得到别的东西;

4,13岁以下的青少年不会看到搜索广告;

另外还有些关于保护用户隐私的细节,例如不会追踪用户信息,不会与开发者分享用户数据等。

广告主如何投放?

1,按点击收费(CPC);

2,竞价机制,每次广告展示的收费位于第1和第2出价之间;

3,可以设定目标CPA(获客成本),系统会据此进行优化,但不保证能达到;

4,预算随意无门槛;

5,没有时间门槛;

6,没有最低消费。

苹果也允许广告主进行以下设置——

1,关键词(系统会自动推荐相关关键词,广告主也可以添加新的关键词);

2,人群定向(新用户,老用户,甚至是自家其它App的客户群);

3,辅助定向条件有:性别,年龄,设备类型,地理位置;

4,特定时段定向;

5,每日消耗上限。

此外,苹果特意强调了他们将一如既往的注重用户隐私,如不会追踪用户信息,不会跟广告主分享用户数据,13岁以下青少年不会看到任何广告等等。

4,免费推广越来越难做了,推广成本越来越高

苹果的竞价排名究竟对现有的推广市场有多大影响,还是要看最后竞价排名的实际带量效果,不过姑婆预计这只是苹果商业化的开始,免费推广越来越难做,付费推广也会越来越规范。

(1)积分墙产品受到冲击,行业混乱无序的方式会得到一些改善。

受冲击最大的,首先是积分墙产品,其次是刷榜公司。苹果推出ASM,几乎可以预见大CP会砸钱做第一,因此一部分原来交给积分墙产品的预算会交给苹果。积分墙产品虽然依旧可以用ASO做后面的位置,但是僧多粥(广告费)少,被冲击不可避免。

现在广告主做付费推广也不容易,一些广告公司可能为了挣钱而数据造假,广告主付钱后还需要甄别真实数据,而且恶意刷榜还可能被苹果下架,现在暗刷变明刷,或许还真的是一种省心的推广方式呢?

另外,中小APP也有更多的选择余地,很多推广渠道不愿意接受量小的APP,现在除了和广告公司合作,也多了一条和官方合作的渠道。

(2)应用市场商业化全面到来,免费推广越来越难做

目前App自增长(指不进行任何干预或营销)很难,付费推荐的商业模式其实早已经在安卓应用商店流行,这次其实算是苹果“跟风”而已,苹果的入局,标志着应用商店商业化全面到来,且应用商店推广越来越规范化,常态化。

付费推荐的商业模式早已是不少安卓应用商店的公开事实,推荐位,CPT,CPD等等推广方式正在逐渐开发成熟。

但快钱赚起来容易,想可持续却不简单。在目前的情况下,每一个安卓应用商店都在追求成为行业老大,这样潜在的商业模式一定程度上会失去公信力, 不利于最终影响力的打造,而且如果没有一定数据量的支撑,能够实现智能化、个性化的推荐,应用商店内的竞价排名,钱赚得不会太大。

姑婆只是好奇,打开了这个应用商店变现的大门,不知道苹果未来会不会还会做首页推荐和信息流呢?

(3)没钱的开发者面临更大的压力,挖掘新的渠道势在必行

竞价推广是一把双刃剑,某种意义上来说,原来的ASO玩法依旧可以做,现在又多了ASM,对于没钱或者预算少的开发者来说,可以说推广更难做了(想到这里,姑婆也不禁捏了一把汗)。

不过苹果还没有透漏具体时间,能不能实行还是位置,要真的竞价,相信苹果肯定也会有权衡。

对于中小开发者来说,随着原有渠道体系的逐渐成熟,挖掘新的优质渠道就显得更为迫切,如直播,网红,VR,都值得大家关注。

数说区块链 5年前现身搜索 如今指数同比增1000%

2008年,一个自称中本聪的人第一次提出区块链概念,并发明了一种电子现金系统,区块链技术就此诞生。

如今十年过去了,区块链开始被当做改变世界的变革技术,受到热捧。2017年春节期间,大佬们在微信社群的热烈讨论,更是将区块链推到了大众眼前。

由区块链构想的未来,兴奋地让人无眠。仿佛所有人都在为此奔呼,生怕错过了这个拥抱时代的机遇。Bianews愿以一页区块链数据图谱,给你一双慧眼。

5年前“第一次”有人搜索

如今指数增1000%

区块链诞生的年代,还是电商购物正兴起的年代,京东商城也刚刚出现,互联网正进入千家万户,改变着我们的衣食住行。

最初的几年里,区块链基本没人提起,直到2013年6月份左右,百度中才出现了相应的搜索。

从上面的百度指数可以得知,当时通过网络了解区块链的人少的可怜。

当时的百度指数只有8,参考一下现在40000左右的指数,我们可以想象一下当时的惨状。

时间来到2015年年底,区块链的百度指数爬升,开始超过1000。这和“两会”这个词在闭会期间的搜索情况大概相当。

但在2017年底,指数突然飙到10000上下。2018年1月11号,指数一度超10万,但前后只持续三天。

通过百度指数提供的信息,11日当天几篇关于区块链游戏、区块链A股公司的新闻获得了大量流量。

随后出现下滑至12000,又开始上浮过40000,现在保持着上升趋势。

查询近七天和三十天情况,更是让人惊讶。区块链整体和移动端的搜索指数均同比增长1000%左右。

Bianews也查询微信指数的相关数据,对比百度指数数据,二者在动态趋势上基本一致。

区块链在最近的几个月里迎来了大爆发,来到了它的“春天”。

谁在关注区块链?

区块链那么火,那到底都是什么人在关注呢?

通过分析关注者的年龄、性别、地域、关注的话题等角度,Bianews试图为你还原真实的人物画像。

年龄分布:区块链关注人群主要分布在30-49岁的年龄区间,占到82%。性别上以男性为主,比例为79%。

地域分布:主要集中在北上广深等一线城市,多为经济发达的沿海省份。

另外,百度指数还提供了需求图谱数据,也能从一个角度刻画人物画像。

需求图谱:通过用户在搜索该词的前后的搜索行为变化中表现出来的相关检索词需求。

通俗来说,就是用户由哪些词(或句子)联想搜索到了“区块链”这个词汇。

需求图谱显示,排名前五名的来源相关词为:

1. 区块链是什么

2. 区块链技术

3. 区块链怎么赚钱

4. 技术

5. 区块链 知乎

综合以上的信息,区块链关注者的人物画像已较为清晰。

这基本是一群处在经济较为发达地区的男性群体,他们对新的科技十分感兴趣,也对金钱很感兴趣。

他们有一定的经济基础,在事业上也较为稳定,应该是希望多了解新的技术和潮流,以应对未来的发展。

当然,考虑到区块链的火热,不排除有一部分人是区块链投机者,想借风口赚点热钱。

万种区块数不清

不见当年中本聪

区块链火了,也有无数人的狂奔而来。投机者在,朝圣者在,排斥者在。

众多打着区块链旗号的项目也在表演,但这些真的需要吗?

如果中本聪还躲在世界的某个角落,那么他也许正是不想成为“神”,老老实实的做个践行者或许更有用。毕竟,实践才是检验真理的唯一标准,而神都已经死了。

南航全站搜索功能上线 有问题来搜一搜

姐,查机票真假在哪里弄呢?最近机票紧张,好多小伙伴在不同网站上抢票….怕不安全

菜大嘴

菜小胖

在南航APP首页,有全站搜索功能,搜一下关键字就出来啦~

过年回家拿好多东西,想看看行李携带规定,在哪里可以看?

菜大嘴

菜小胖

在南航APP首页,有全站搜索功能,搜一下关键字就出来啦

这是自动回复???!

菜大嘴

不是自动回复~

全站搜索功能,

是真的能帮你解决各种出行问题!

航旅信息万事通的小帮手~

全站搜索

南航APP首页,可以搜索南航的服务信息、出门指引、热门活动,立即展示相关信息或功能入口,帮你快速了解出行信息或办理服务

比如:快捷协助你做客票验证,让你放心~

再比如:快速搜索到行李携带的相关规定,棒棒哒~

出行时遇到问题,

节省找东西的时间,

快速告诉你想要的信息,

帮你便捷解决难题

快去试试吧~

还没下载南航APP?

戳 马上下载

案件搜索神器 你用过几个 | iCourt

Alpha律助功能上线

一键智能检索

即刻生成报告

作者:董娟娟

来源公众号:公司法案例解读

编者按:

古诗有云,工欲善其事,必先利其器。大数据时代,为了不面对海量数据却找不到自己想要的信息,律师必须学会有效利用各种工具。今天,法秀为大家整理10款检索工具,赶快将它们收入囊中,用起来吧~

作为法律人,学会使用案例搜索工具必须掌握的一项基本技能。也常有人问我,怎么才能快速找到需要的司法案例?今天,就跟大家分享几款我常用的高效率的案例搜索工具。

1.中国裁判文书网

截至2017年8月23日,裁判文网中案列总量为32490233篇虽然这个案例数据库的内容只包括刑事、民事、行政、赔偿、执行几个类型,较其他的一些案例数据库少,但这个是网站是由最高人民法院创办,也即官方公开的裁判信息,所以它具有权威性。

正因为中国裁判文书网是官方网站,其内容文本比较单调,只有裁判文书全文,没有其他分类的功能。在中国裁判文书网上搜索案例前要先登录输入验证码等一堆繁琐的程序,所以我个人不是很喜欢用,但是有时候还是不得不用。

中国裁判文书网也有网页版和app版。只是安装手机app版需要扫网页提供的二维码进行下载。

2.北大法宝

这个也是我用的最多的工具,也是法律行业工作者使用较多的案例检索工具。原因有两点:一是在北大法宝数据库中,相关的法规、案例基本都能查得到,二是在购买账号后能够无限次下载。

但是,在使用时,还是觉得北大法宝数据库内容的数量不全,常出现需要的案例在数据库中找不着的情况。如果没有购买北大法宝账号,也是可以使用,但是无法看到完整的案例,同时也无法下载。

3.Alpha案例库

Alpha大数据库是Alpha系统的专业工具部分,分为Alpha案例库和外部数据库集合。

Alpha案例库根据参照级别、案由、法院级别、地域、审理程序、文书类型、标的、裁判日期进行多维度分类,智能检索,不仅可以自动生成可视化分析,检索报告还可以一键导出,这点非常省时。

Alpha案例库在搜索栏右侧的高级搜索下拉菜单中,可以通过选择代理律师、法官、法院观点等不同的检索维度进行检索。以此可获得某法官就某一类案件的审理情况和观点等。这一优势是其他案例数据库难以与之相比的。

外部数据库包含24个外部网站的链接,包括威科、律商等。可在输入关键词后选择相关网站和资源库进行搜索,一键打开所有选择的数据库。“一站式”的查询,省去了来回切换数据库查询的时间,更易找到所需案例,进而提高工作效率,节省工作时间。

(搜索关键词:非法转租)

4.CaseShare

法宝,是免费的北大法宝,是同一公司——北京北大英华科技有限公司生产的不同产品,只是一个是免费版本,一个是付费版本。

5.法信

法信是由人民法院出版社创办的。内容版面较为中规中距。涉及的内容多,所以不只是专注于案例搜索一项内容。

但是法信提供的内容是可以信任的,只是用户体验上一般。

6.无讼案例

“无讼案例提供精确、易用的案例检索工具,通过独特的关键词系统提供更快、更准、更全的案例、法规和律师搜索体验。”

我对案例搜索工具是否好用的标准是案例是否全、搜索是否能准确。截至2017年8月23日,无讼案例已经收集案例42104231篇。这个数量,是其他网站难以与之抗衡的。

无讼案例有网络版和app版两个版本。

7.聚法案例

第二个工具是聚法案例。被称为“法律人的智能管家”。

截至2017年8月23日,聚法案例的数据库已收录裁判文书41356219 篇。聚法案例的智能化搜索功能,尤其是其全面的区段搜索的功能,是很实用的。

聚法案例设置了下拉菜单按钮,只要选择需要的区段,就可以有针对性地进行搜索。

聚法案例的app版与网页版风格一致。反应速度较快,界面简洁,搜索简单方便,智能化明显。当然,聚法案例也有这个优点:免费。

8.最高人民法院裁判文书

第八个是最高人民法院网中的裁判文书。也是一个官方网站。

这个网站的只能检索到2014年1月1日到目前的最高人民法院裁判的案例,所以内容相对比较少,但是比较新。

9.OpenLaw

Openlaw,截至2017年8月14日,收集了30451583份判例。

这个搜索工具的最大特点是多了评价和批注,增加了数据的评估报告。当然Openlaw现在也是免费的。

10.知识产权裁判文书网

第十个是知识产权裁判文书网。这是个分类更加细化的,专门性更强的案例网站。

总的来说,为了查询一系列的案例,我会多个工具一起用,取长补短,保证得到一手的资料,保证自己查到的资料是准确而全面的。

上面的案例搜索工具你用过几个?

专栏编辑 | 雪梨卷 排版编辑 | 七麦