百度祛痘推广如何优化着陆页

最近,有个朋友说自己感觉百度祛痘推广怎么越来越难做了,现在推广钱是花出去了,就是没有咨询。对于这个情况,相信很多做百度祛痘推广的客户都曾遇到过,而且也是最关注的问题。

其实,做百度祛痘推广,钱花了,没有咨询,可能存在很多原因:推广的精准性、恶意点击、网站吸引力等等,今天我就针对最后一点—网站吸引力,和大家简单聊一聊。网站吸引力,简单一点就是网站的推广着陆页及相关页面的内容、文字对访客的吸引力。说到百度推广着陆页优化方面,可以简单归纳到五个方面。

1、多用图片,少用文字

这点恐怕会让很多习惯了写长长的销售信的人感到不舒服,但是事实就是如此。基本上没有一款产品或者是服务,可以靠销售信就卖出去几个亿的。大部分的人是没有耐心看那些长长的文字的,比如我,一般都是跳读的,这样销售信本来的效果就会大打折扣了。而百度推广着陆页“一图胜千言”把图片做好了,可以省去很多的功夫。

2、页面要精美

竞价页宁可多加很多图片,稍微影响一下网页的加载速度,也要让你的推广着陆页面精美。因为中国人普遍有这种心理:精美的就是正规的,官方的。而速度慢点是可以理解的,君不见新浪首页加载多慢,照样有人每天必看。但是,在提高页面精美程度的同时,我们还是要注意网页的加载速度,如果加载太慢,客户没进来就跑了,推广着陆页做的再精美也没用。

3、相关的风险承诺及信誉保障

一般来说,客户是非常有怀疑精神的。他们害怕买到假货、害怕产品对自己有害、害怕质量问题、害怕售后服务不到位等等。所以正规而强有力的风险承诺对于竞价页是非常重要的。一般来说,设计竞价页面都要考虑到如何让顾客的担心降到最小。

4、产品介绍的专业和美观

竞价页专业的描述是必须的,否则观众会认为你并不比他专业,从而降低了购买的欲望。不能使用太过通俗的语言,,搞些什么一般人都不会接触到的专业词汇上去,美观就不用说了,给观众一种心理上的期待,他们一般会认为图片上的东西就是他们的买到的东西。这样可以加强购买的欲望。谁也不愿意买一个破烂回来噻~但是要注意的是不能太失真,太夸张了退货率就高了。

5、客服的专业能力、沟通技巧

这个是竞价页的灵魂。这话一点都不假。顾客都是怀疑者、都是瞎子。他们看到了图片、看到了文字、看到了产品。但是最重要的一点,是要看到活生生的人!只有活生生的人才让他们有安全感。所以无论如何,你的竞价页面都必须要让顾客可以很轻松地找到你的客服,可以抓住客户的心里,很快地很人性化地解答他们心目中的疑问。

只要大家做好这些,通过合理的准备就可以把百度祛痘推广的整体转化效果做得更好。

重病患者百度

#文章来源36氪,作者扯氮集 魏武挥,原标题《重病患者百度》,图片来源原文章配图及网络,如有侵权,请联系删除。更多精彩资讯,请登录众筹之家

(这张看着完全没有任何设计感的图片,文中我会解释)

前南方周末记者现于美国攻读新闻传播学博士学位的方可成,在他的公号《新闻实验室》以“搜索引擎百度已死“为题,对百度进行了一番批评。

主要事由是一篇谣言性质的文章:美国CIA承认9.11元凶搞错了人,不是本拉登,还说给拉登家族赔款千万美元云云。这篇文章的原文刊发在国外着名的假新闻炮制者“洋葱新闻”上,由国内一些自媒体(号)进行了翻译后予以传播。

这篇文章显然很抓人眼球,在手机百度上排序靠前,成为方可成对百度进行批评的导火索。

不过,方可成并没有说百度已死,他说的是作为一个搜索引擎,百度已死。

这是有一定差别的。

PC时代,百度作为一个搜索引擎,是数百万网站的入口。网民通过各种各样的关键词搜索,到达目标网页。在这样一种使用中,搜索引擎百度有如下特点:

1、百度并不拥有目标网站,也就是说目标网站上各种广告收益(或者其它什么收益),与百度无关;

2、百度的商业模式是用户在搜索特定关键词时匹配相应的关键词广告。而借助事实上的互联网内容入口这样一个拥有巨大流量的中心地位,关键词广告的收入相当可观。百度通过这个广告收入,于2007年超越新浪广告收入,成为中国互联网公司中头号广告营收选手;

3、百度的搜索结果排序基本按照网页权重度进行,这点仿照谷歌。而这套规则,得到最广泛的认可。当然,有争议的地方是,百度将自家的百度知道、百度百科等内容进行了“置顶”操作。但有鉴于搜索用户可能的确存在需求,以及这些内容在PC诺大的屏幕上占据位置不多,故而争议虽有,但不算太大;

4、结果上,百度截流了大量内容网站的广告收入,因为作为甲方,选择上百万网站进行投放显然是不切实际的,而直接选择百度,省心省事,更何况百度提供的是效果广告,有一定的转化保证。内容网站对搜索引擎的敢怒不敢言,其实不仅百度如此,谷歌也背负过同样的骂名。

到了2016年,百度迎来了它历史上最危急的时刻——这里我不加之一,应该不算太夸张。

其一,魏则西事件直接导致百度在上年年报里所提示的风险成为现实:政府管理部门将百度的网络营销定义为广告。而根据广告法要求,它需要承担更大的审核责任,以及,部分既有的客户不能再成为其广告客户。

其二,移动互联网渗透率越来越大,百度作为PC流量入口的优势正在迅速消解。

2013年开始,百度的运营利润率(代表获取利润的效率)开始显着地逐年下滑,2016年更是创造了自07年超过新浪之后的历史最低水平:只有14%。(题图)

百度向移动端进行转型,这一步并不是发生在魏则西事件之后,但魏则西事件提醒百度,你要更快地做一些改变。而且,魏则西事件所导致的财报不合预期,使得百度做事的长远度是欠奉的,因为它觉得它需要满足资本市场对它盈利增长的要求。

百度真正面临的难题是:移动端用户对搜索的需求的确有,但手机小屏,再堆关键词广告是不合适的(更不用谈什么左侧右侧广告了)。加之魏则西事件对百度关键词广告体系有着巨大的冲击,百度需要改变既有的PC时代那种搜索结果配关键词广告的模式。

百度想出来的方法之一是:PC时代不掌控内容网站但我可以做关键词广告,到了移动时代,我能不能直接掌控内容,在内容网页上加载广告?

这就是百家号出现的逻辑之一。

百家号的起源,来自于百度的一个带有公关效果的产品:百度百家。

百度百家一度审核非常严格,基本上采用邀请制,邀请相关互联网评论者观察者进驻。在百度百家的内容上,会加载广告,但百度100%给予作者。由于彼时百度新闻的巨大引流作用,百家的内容很有可能获得相当巨大的访问量。我作为第一批百家作者,某单篇文章的广告收入就超过了一万元人民币。

由于百度百家严格的邀请制度,一度各大互联网公司PR在选择内容合作时,不能进入百度百家的写作者,会被认为不入流而不予考虑。这句话只是客观事实描述,至于是褒还是讽,读者可以自行体会。

另外一个有趣的客观事实是——也是我称之为带有公关效果的原因——百度百家最兴盛的时候,互联网舆论场上很少有关于百度的评论。个中原因,读者亦可自行体会。

在百度百家的基础上,产生了百家号。百家号对接的基本都是自媒体人和媒体。而当年依靠百度兴起的站长们,则被归纳到熊掌号这一序列。再到后来,两者得以合并。

今天的百家号,有点像当年的各路网站站长们,当然,也有大量的自媒体。只是,内容都在百度服务器上,百度在这些内容上加载广告,得以可能。

这个量其实不小。在方可成一文出现后的次日,百家号正好举办一场论坛。百度官方骄傲地宣布,有102位作者,获得了百万年薪的收入。考虑到这是百家号头部收入者的分成数字,百度总盘子也应该斩获颇丰

百家号在今天,是百度非常重视的一个部分。在其搜索结果导流中,百家号的地位,宛如当年的百度知道、百度百科等百度内容产品。

但这其实是有问题的。

微信公号的所有内容,都在微信服务器上。微信公号内容有没有问题呢?当然有。比如关于美国向拉登家族赔款这个假新闻,我在周一就在某公号上看到了。

但微信公号生态里,流量分配不重要。或者说,公号的访问量多寡,其实微信并不进行操控。当我看到这条假新闻的时候,我责怪的并不是微信公号平台,我责怪的是这个公号本身。

事实上,我是在朋友圈里看到的。我也不太想苛责这位朋友,毕竟一般人转个信息,没必要那么严肃认真地考察真实与否再转发。这样未免活得也太累——在我通过一些方法核实此信息为假新闻并留言后,我这位朋友也迅速删除了这条转发。

但对于百度来说,这种宽容,就不成立了。

1、你是一个流量分配者;

2、你从流量分配上获得了巨大的好处;

3、再怎么说,你也是中国一线互联网公司,与阿里腾讯并称BAT。

这三点,使得我们无法对百度宽容:你怎么就把一条这样的假新闻,放在了那么重要的位置?你的责任在哪里呢?

流量分配者,都有这样的议题需要小心:你必须对你的流量分配,承担一定的责任。国内称之为“主体责任”(当然,主体责任对微信公号平台其实也适用),国际通行的说法,叫红旗法则:那个不合规的东西宛若一面红旗,你应该看得到且你必须看得到。

在这样一种情况下,百度对于百家号传播假新闻——按照时下的普遍认知——是需要承担责任的。

但问题更严重的事是:文章排序规则。

方可成在他的文章里这么说:

你在第一页看到的搜索结果,基本上有一半以上指向百度自家产品,尤其频繁出现的是“百家号”。

百度的回应说:

目前百度搜索结果中,百家号内容全站占比小于10%。

不得不承认,这种回应有那么点逃避问题的诡辩感觉:方可成批评的是第一页结果,百度回应是说“搜索结果”——其实可以理解为全部结果。但问题是,除非具有特殊目的,很少有用户会对三页之后的内容感兴趣。

百家号内容全站占比小于10%这种申辩是没有什么意义的。

在过去,搜索结果里出现一条百度知道、一条百度百科、或者再加一条百度贴吧,也许也就忍了。因为占据的位置也就三条,姑且认为你做了三条广告。但现今百家号内容蜂拥而上,这就不是两三条广告的事了,尤其是在手机小屏中。

更让人郁闷的事情是:百度新闻在百度导航条中已然消失不见,替代为百度资讯。(百度新闻被隐藏到百度产品大全中,你需要从密密麻麻的产品里挑出百度新闻。这个产品不是没有了,而是严重弱化)

熟悉国内新闻媒体规则的人都知道,百度新闻的结果,都是所谓拥有一级或二级新闻资质的媒体来源。我并不是说这些来源保证真实可靠,但作为机构媒体,好歹有一些采编规则,类似美国CIA向本拉登家族赔款这种看上去特别劲爆的大新闻,好歹会去核实一下。

百度资讯并不是只有一级或二级新闻资质的媒体来源,大量的都是百家号内容(占据面积更为夸张,有时候甚至第一页整页都是,在手百客户端里则是不知道要拉多少屏)。而百家号内容——我不得不说——质量之鱼龙混杂,比百度新闻更甚。

如果说过去网页排序还有所谓权重度法则的话,那么:

1、百家号凭什么可以超越其它网站内容排序靠前?

2、百家号与百家号,到底怎么个排序法?

百度不是没有一些说法,比如说原创度,比如说影响力。但原创度这件事早就被广为诟病,百度对于内容抄袭这件事的惩治力度是非常弱的。而说到影响力,不就是访问量为王?

于是,这又产生了下一个问题:百家号的运营逻辑,和微信公号,有什么不同?

微信公号也存在标题党,也存在夸张不实内容。但在微信屡次打击下,早期营销号的制作者,空间日益减小。我个人所知有些搞营销号的,已经转型去做小程序里的小游戏了。

微信公号运营者比较清晰的一件事是:粉丝转化率相对更重要。过于标题党,过于夸张不实,即便用户打开文章,也很难形成粉丝转化。

但百家号的运营者并不这样想问题。

在百度构建的场景中,粉丝的重要度是不高的。

这是手机百度的开屏广告,看一下它底下那句slogan的后半句

没事看一看,意思就是闲逛。没有特别目的。

搞流量分发的产品,粉丝意义相对较小。因为一篇文章的访问量多寡,最重要的变量是流量分配者是怎么分配你的,而不是你拥有多少粉丝。

在这样一个情况下,只要文章被打开阅读,就是目的,就是胜利,因为广告出现即可分钱。文章质量好坏所导致的粉丝转化,是不太需要放在心上的,转化出来也没有什么实际意义。

所有在流量分配为基本逻辑的产品上做号的,都是这样一个方法论,没有例外。

你可以想想震惊体为什么会在某平台上出现。

可以这么说,整个手百的运作逻辑,是有相当大的问题的。

那句有事搜一搜没事看一看的slogan,也有着诡异的内在矛盾:搜一搜是希望搜索花的时间越少越好,看一看则是希望你花的时间越多越好。

但百度糟糕的财务表现,正在让它变得越来越短视。

12年以前,百度的运营利润率都在50%以上,之后开始逐年下降,到了2016年,出现14%这样一个让资本市场深感沮丧的数字。

17年,有所回升,达到19%。18年第一季度到第三季度,分别是22%、21%、16%。很显然,百度赚钱的效率,依然没有摆脱最低谷。

从用户和社会的角度看,百度当然应该为它所分配的流量负责。这句话换一种通俗的说法:加大审核力度。

但这意味着又要抬高成本,运营利润率这个赚钱效率的指标,甚至有可能会创下新低。

阑夕在他的“谈谈百家号”一文最后这么说:

“是非自有公论”这些话说了想必也没什么卵用,一切都该如人饮水,冷暖自知,百度要是觉得这样挺好,或者也没其他办法只能这么做,那就祝它开心好了。

特别让我想不通的是百度的品牌及产品策略。

方可成批评的出发点建立在搜索引擎的公共性上:你不能在搜索里都是你百家号自己的东西且审核薄弱。故而,他提出作为搜索引擎,百度已死。

但其实百度有一个相对非常干净的搜索:简单搜索,有兴趣的可以下载去看看,的确没有什么广告,也没有什么百家号。

这种树牌坊的事,连百度二字都不给,奇哉怪也。

好歹当年强公关效果的百家,还是叫百度百家的。

演讲实录 百度大规模深度学习应用实践和开源AI框架PaddlePaddle

导语:本文根据PaddlePaddle技术负责人、百度NLP技术委员会主席于佃海在今年英特尔人工智能大会上的演讲——《百度大规模深度学习应用实践和开源AI框架PaddlePaddle》整理而成。

PaddlePaddle技术负责人、百度NLP技术委员会主席于佃海

正文:

很高兴能有机会来介绍百度AI相关的工作,我们知道,此次AI浪潮主要由深度学习来推动的,深度学习的崛起也可以认为是神经网络技术的再次重新崛起。这一次不同的是,工业界在其中发挥了相当重要的作用。此外深度学习的成功和大数据,以及计算力密切相关。对于工业界而言,在数据资源和硬件资源方面都占有优势。

今天首先介绍一下百度在大规模深度学习应用方面的实践,之后会介绍一下我们的深度学习开源框架PaddlePaddle。

时至今日,深度学习已经不是一个新的话题。不过我们可以看到深度学习依然保持一个火爆的局面。对于老牌的机器学习神经网络的会议NIPS,这两年的门票销售相当火爆,今年在12分钟之内就销售完毕。深度学习也催生了一些新兴的会议,像ICLR,它的投稿数量也是指数级增长,今年又创最新高度。对于产业界,当然应用也非常火爆,我们也可以看到国内也是在制定相关的技术标准、人才的认证等等。

百度的AI之路

对于百度而言,其实一直走在深度学习研究和应用的前沿。百度拥抱机器学习并不算太晚,但从世界范围内对比来看也不算是特别早,对于深度学习而言,我们可以说百度在一开始就把握住了机遇,紧紧走在前沿。早在2012年百度就成功将深度学习DNN模型应用到语音识别、OCR任务中,随后的2013年在百度的核心业务凤巢和搜索排序中我们就上线了深度学习模型,这在业内都是第一次。在此之后,百度基本上可以说全面进入深度学习的阶段。在深度学习的框架开发、平台建设以及应用创新方面都走在行业前列,在企业内的应用具有很高实用性、很大规模化的特色。下面我会介绍一下百度几个典型场景的深度学习应用,会讲一下它的规模特点,也会提到我们最新的工作。

首先我们从深度学习最相关的语音、视觉和自然语言处理这些基础AI领域谈起。

·语音

在语音方面,百度是最早在深度学习的领域取得突破的公司之一,从2012年开始我们持续在语音基础上有深度研究和突破,2016年,百度语音在深度学习上的工作被MIT科技评论评为当年十大技术突破之一。在今年初我们也发布了最新的语音识别系统Deep Peark2,在技术和效果上又实现了新的飞跃,大家可以用百度手机输入法来体验我们的语音输入效果。值得一提的是现在的语音识别深度学习训练的规模已经非常巨大,我们一般的训练都会使用十万小时级别以上的数据。TTS这一块,在合成领域我们也做了很多的工作,去年我们知道听说过百度语音合成的Deep Voice 今年我们又新发布了CLariNet。

·视觉

对于视觉而言,大家可能对之前百度参加最强大脑人脸识别有一些印象,在当时的系统中,我们利用了200万的人脸数据来进行预训练,最近我们也是更多的将研究投入到三维人脸活体识别技术方向,其实百度也一直在构建一个超大规模的图像分类系统,到现在我们已经实现拥有10万类Tag、近亿图片的大规模识别系统,支持百度的广泛应用。除了刚才说的规模化的特点之外,我们在视觉的各个领域技术创新上做了很多工作,仅在2018年我们在参加的三项国际评测比赛任务中,都崭获桂冠,大家可以看到这些任务它的难度和规模都是非常大的。

·自然语言处理

对于自然语言处理任务,其中最典型的可能要数机器翻译。很多人并不知道,全球第一个深度学习神经网络机器翻译系统的线上系统是百度首先在2015年发布的。这几年百度在翻译领域一直持续深耕,我们现在的训练系统所基于的语料也是相当大的规模,我们也针对不同的产品场景进行定制的优化,打造最好的翻译效果。我们最近有一个工作可以给大家介绍一下,类似于同声传译的同步翻译,它的意思是当原语言的输入还没有结束的时候,目标语言的翻译同步进行,这里面也有技术上的困难,因为不同语言之间的语序是有所差别的。

除了翻译之外,自然语言处理方向上我们也是在各个方向都有很多的技术创新,比如在开放领域对话和机器阅读理解方面。我们实际的自然语言处理系统的后台所依赖的数据比这些评测集合规模更大,可以看到我们开放领域的对话系统,我们实际用于训练的数据达到千万级别以上,上亿的语料库。基于机器阅读理解我们发布中文大规模阅读理解数据集合,规模达到150万的文档集合和30万的问题集合。

百度的深度学习应用场景

前面主要回顾一下在AI几个基础方向的深度学习应用,下面我会特别讲一下百度在几个重要产品线上深度学习的应用状况,和前面所说的几个基础方向上的深度学习应用还是有很大差别的。

·语义匹配计算

对于搜索这个产品,我们现在最重要的深度学习应用场景是语义匹配计算。语义匹配计算是用深度学习来建模Query和网页的相关性,从2013年我们在业内首次上线深度学习模型之后,我们持续的优化创新到现在深度学习语义匹配的特征已经占到百度搜索相关性特征权重的一半以上,这非常好的打破了以前依赖关键词匹配的一些弊端。当然这个任务的训练规模也是非常巨大的,我们实际的训练语料是达到千亿级的规模,对于参数的规模也有上亿级别。我们对这个任务下的单个模型都是用了数十台CPU机器离线并行的训练,得到这样一个产出。

·广告CTR预估

对于广告而言,最核心的应用场景是CTR预估,预测广告的点击率。它和搜索应用的差异在于,我们引入了更多的离散特征,包括一些组合特征,一些ID特征,使得它的记忆能力更强。在这样的设计之下,我们可以看到,它整个的参数规模达到了千亿级别,模型的大小达到TB的规模,使得普通的单机都无法加载,这对并行训练带来很大的挑战,我们在这类任务上都使用百亿级别以上的机器进行训练,我们的训练系统已经打造成了在线训练系统,实时数据进行输入,模型再实时更新。

·信息流

对于信息流,这是百度一个相对较新的产品。在策略架构构建开始,我们就全流程的使用到深度学习技术,包含从语义召回和排序序列生成、评估等各个阶段,信息流的场景和搜索、广告有相通之处。相对于广告而言,我们在建模的时候更多的考虑了历史的这种序列点击信息,整体上也使得它的模型更加复杂,它的参数量也比我们广告上的模型更加庞大,对于它的训练难度也是进一步有了更大的挑战。我们现在也是采用这样一个在线上百台机器进行并行训练的方式进行深度学习的训练和预测。

从前面的介绍,我们也可以看到不同场景下深度学习的特点和规模化都存在着一定的差异。比如像图像这类的任务,很多模型的特色是非常的深,对于文本任务而言,它的特点在于基本上是通过一个Word Embedding的机制来支持深度学习建模,每个词语有几十到上千维的向量表示,这就给文本的任务带来了很大的差异性,因为光Word Embedding这个参数量就会达到非常大的规模。到实际应用任务场景下,像刚才我们讲到的Feed信息流和广告搜索的场景,我们可以设计使得这个模型的参数量更加巨大,在我们的实际应用当中,刚才讲到我们可以达到千亿级别这样的特征,再加上这样一个Embedding的表示,整个的模型是非常巨大的,给并行带来了更大的挑战。

我们考虑大规模深度学习的问题不只是说数据量大,网络比较复杂,其实我们要同时考虑特征量以及计算特异性的问题。可以看到虽然有这样的一些差异,这些给深度学习框架的设计带来了挑战,但是整体上而言,神经网络的计算模式相对还是统一的,所以我们可以通过精巧的设计来打造更好的深度学习框架,支持广泛的深度学习应用任务。

百度深度学习框架PaddlePaddle

下面我介绍一下百度打造的深度学习框架PaddlePaddle,首先回顾一下,PaddlePaddle的原形要追溯到2013年,当时的它的名字叫做Paddle,这个名字表示是一个并行分布式深度学习。2013年的时候,工业界的深度学习框架还并不多见,我们当时也是刚刚在几个大产品线上成功应用了深度学习技术,在这样一个时刻,我们决定去打造一个通用的深度学习框架,就看到了这个框架对未来深度学习发展和应用的巨大意义。另一方面,在我们建设Paddle之初就提出了并行分布式这样的概念,也注意到在工业界大规模训练的重要性。

在2016年我们进行了开源,当时这个品牌名字升级为PaddlePaddle,希望大家一起来共建这样深度学习框架。到了今年我们Paddle整体在公司的战略地位更加明确,我们进行更多的投入,在前些天百度事业大会上我们发布了PaddlePaddle的套件。

下面我会更详细的来介绍Paddle框架。对于PaddlePaddle而言,从开源之初我们就希望它能够具有易学易用、安全高效这样的特色。我们分别制定了相应的策略来使得这样的目标可以达成,希望能够提供更灵活、更快捷的Modeling,能够更高效并行的训练,以及广泛快速的部署能力。

关于Paddle框架,我们可以回顾一下,最早的深度学习框架是基于Layer的概念,后来出现了Graph of Operators的组合,对于Paddle而言,保留了底层基于Tensor的表示和基于Operator的计算单元,但是我们在网络的定义上使用了Program的概念,希望能够比Graph在定义阶段可以更加简洁,让编程的同学可以使用深度学习。

我们一开始就把Paddle定位为真正支持实际应用的深度学习框架,非常重视它的预测和部署能力,我们现在实现了多平台预测部署的能力,包括Paddle Serving和Paddle Mobile,我们分别针对服务器端和移动端做了不同的优化,然后在移动端我们现在支持广泛的硬件平台,我们未来也希望Paddle能够部署到更多的场景当中。

除了框架之外,从利于开发者的角度,我们建立了一个平台层面的设施,也包含了像底层的模型库,像自动的AutoDL的网络搜索技术。进一步,我们又开发了和深度学习相关的组件,形成全功能的套件。对于PaddlePaddle整个套件的布局大体是这样的结构,分为核心框架、服务平台和模块组件三个部分。

·特色模型库,我们把它作为核心框架的一个特色功能。Paddle支持的官方模型在同类框架模型中支持数量最多,也是希望通过我们持续的维护,一些经典高频模型能够给开发者带来更大的便利。

另外,是我们最近做的一个深度强化学习的框架PARL,它的意思是PaddlePaddle强化学习框架,它主要是两个功能:一是大规模的深度学习+强化学习的训练框架,二是提供了计算任务模型和算法的丰富组件。

在NIPS 2018的强化学习评测中,百度参赛队伍使用基于PARL的系统获得第一名,比第二名领先非常多的分数。这个任务还是非常困难的,是戴假肢人体运动的控制,计算量非常大,竞争也非常激烈,前五名的队伍都是非常强的竞争对手。PARL在这个框架的支持下,我们通过算法优化和近千台CPU和GPU组合并行训练的框架下,非常出色地完成了这个任务。

·配套组件,我们也进行了丰富的建设,包括VisualDL这种看得见的深度学习,以及EDL作为Linux Foundation的深度学习基因会的创始项目而实现容错可伸缩的弹性的深度学习。

·服务平台,我们针对不同的场景需求,也是打造了不同特色的一些服务平台,像针对小白用户更零成本的EasyDL和针对更全面的一站式开发的开发平台。在平台层面之上我们着力建设了AutoDL,希望能进一步降低大家在网络建模这方面的工作难度。我们希望AutoDL实现三个目标:一是可以自动的设计学习网络,二是进行数据迁移建模,三是能够适配边缘计算,可以自动进行模型的裁减压缩来适配移动端的场景。可以看到在图像分类的Benchmark上,我们用AutoDL来自动设计的网络效果已经全面超越了专家手工设计的网络效果。

前面我对PaddlePaddle整个套件的关键部分做了一个介绍,最后我还是想强调一下,对于PaddlePaddle,我们立志打造一个支撑工业级应用的高性能AI框架

最近很多人提到算力就是生产力,对于机器学习框架而言,它的性能优化是非常重要的,因为对于算力而言,不只是丰富的硬件资源,还需要软硬结合来更好的发挥硬件资源的能力以实现更好的计算能力。对于PaddlePaddle,我们是采用了自上而下的推进策略,除了通用的技术框架的高效设计之外,我们会投入比较多的精力在底层的优化包括通用底层优化,以及和硬件相关的一些优化。

与英特尔强强联手,优化深度学习

英特尔拥有丰富的强大的芯片能力,在芯片能力之上他们也在自下而上构建他们的AI栈,特别是在AI高性能计算库指令集合这一块非常有特色。在这个层次上,我们的合作空间非常的广泛。过去一段时间,我们也是和英特尔多地团队在多个方向上进行了深入的工作配合,截至目前,英特尔工程师对PaddlePaddle的代码贡献已经超过了一万行。

下面我们可以看一下,回想一下我前面讲过的内容,可以看到CPU在实际业务场景当中现在的作用还是非常重要的。一方面对很多的场景而言,CPU的性价比是非常好的,另外特别是对我们刚才讲到的一些超大规模数据特征的训练,CPU集群的优势还是比较明显,当然很重要的一方面是英特尔也是更加重视深度学习这个方向,英特尔的芯片也是在变得越来越强大,越来越适配深度学习。

下面我会简单展示一下英特尔在Paddle上工作的部分成果。在性能优化这一块,我们进行了广泛的配合工作,英特尔同事进行了深入的支持,我们在图像、文本好多任务上从训练到推理性能都有了很大的提升,相比我们之前线上自己手写的系统,性能都有了很好的改进。比较重要的是MKLDNN底层库,它的优化效果确实比较突出,除了在最新的像类似6148芯片上加速比确实非常高之外,在一些更传统的芯片上也有提升的作用。

我们和英特尔在低树脂精度计算方面的工作,英特尔下一代指令集合VNNI提供强大的INT8乘加运算的效率,我们也和英特尔基于Paddle之上对一些模型进行尝试的验证工作,这也体现了英特尔对深度学习计算任务的重视,因为对于深度学习而言,它确实有很多的特色,除了我们经常感受到的它的向量矩阵运算之外,其实对于深度学习而言,它并不是追求一个精确的数值计算的结果,在某些情况下,低精度的运算在不损失效果的前提下,它的加速效果是非常的可观。英特尔这方面的工作我们也是非常期待。

还有一个重要的合作就是nGraph,nGraph可以认为是英特尔针对深度学习做的中间表示或者编译器,无缝的衔接不同的硬件后端和上层的框架,Paddle和nGraph的对接非常简洁,通过nGraph Bridge,可以把拍到的一些OP转化成nGraph后台更高效的计算。英特尔的工程师也是基于PaddlePaddle之上做了初步的实验,我们可以看到在ResNet-50上的效果的提升比较明显,英特尔最新的PR也被集成到PaddlePaddle上。

构建大规模分布式深度学习集群

除了单机之外,对我们的业务而言,大规模分布式并行式是非常重要的。我们构建了一个大规模分布式深度学习集群,从最底层的硬件到资源的管理调度都做了大量的工作,有数万台机器在这样的环境下可以提供内部各个业务的训练的支持。当然我们也会通过公有云结合PaddlePaddle对外来提供更多的服务。

对于Paddle框架本身而言,我们在并行上做了很多特色工作,除了同步、异构并行之外,我们特别对稀疏参数的支持进行优化,我们支持千亿级别稀疏特征,在百余节点上的并行训练。今天主要是讲这些,希望大家能够多多试用、支持PaddlePaddle,可以给PaddlePaddle做一些贡献,让我们共建PaddlePaddle,打造更好的深度学习框架。谢谢大家!

关于PaddlePaddle的更多信息,可前往2019/20190426A/F015935

关注 因骚扰电话软件推广信息 百度 奇虎360 搜狗被工信部约谈

据工信部官网4月1日消息,北京市通信管理局针对互联网上发现的骚扰电话软件销售推广信息的问题,日前集中约谈了百度、奇虎360、搜狗等搜索服务提供商。

工信部官网截图

约谈中,北京管局指出,搜索服务提供商要认真履行社会责任,严格落实工业和信息化部等十三部门综合整治骚扰电话专项行动的相关要求,从源头上切断骚扰电话相关软件、设备的信息来源。针对网络上依然存在的“喵池”、“改号APP”等骚扰电话软件、设备的变体词、关联词组等问题要进行全面清理排查,建立动态监测和屏蔽机制,对骚扰电话软件和设备信息要发现一起屏蔽一起。三家搜索服务提供商表示,将严格贯彻落实工业和信息化部及北京管局的要求,深化骚扰电话源头治理工作,全面排查存在的问题,立即进行整改。

来源: 工信部官网、北京市通信管理局

编辑:陈思成

百度亿元买下90后 李叫兽 挽救这届公关不行

作者 | 魏晓

来源 | 蓝媒汇

假如“太子”李明远两个月前没被百度拿下,他很可能会感慨,真是长江后浪推前浪,前浪死在沙滩上。因为从今天起,他已不再是厂里“最年轻的副总裁”,而是另有新人。

成为百度“最年轻副总裁”时,李明远,80后,29岁;新人李靖,90后, 25岁。

前者先以实习生身份做起,用10年爬到如此高位;后者则直接空降,创业不过两年,百度不仅送上副总裁的职位,还把其据称估值近亿的公司全资收购了。

什么创业,让一个毫无管理经验的人,进驻百度这样的巨头任VP,答案是自媒体。

李靖这个人名,没那么值钱,但“李叫兽”就不一样了。这个奇葩的名字,是一个营销类公众号,从2014年起,每周发布一篇原创内容,代表作《你为什么会写自嗨型文案,X型与Y型文案的区别》曾获得接近30万次的图文页阅读,粉丝数积累下来有50万。

从数据上看,这个号并不算是头部大号,顶多勉强算得上知名,根本唬不住百度。让百度在意的,据“李叫兽”自称,是看重了其对于营销的方法体系以及思路。

跟创业公司以造概念的方式提升自我估值一样,“李叫兽”也提出了“营销科学化”,不仅有理论,还要做产品。资本市场是要会讲故事的,更何况“李叫兽”还是专业干营销的,就更会包装了。

说白了,百度就是看中了“李叫兽”的营销包装、看中了他对于文案的理解。

市场营销是有方法的,4P再到4C,还有SWOT、定位理论等等,每一个大学市场营销专业讲师都口若悬河。

李靖正是该专业出身,不论是在公众号“李叫兽”上,还是四处分享演讲,灌输着论“自嗨型”文案,“如何让文案说人话”等等。很长一段时间,他是360的营销顾问,为360、儿童手表、超级插座等一系列360的项目做咨询。

百度招揽李靖团队,是把他放在广告创意业务上。

发出内部邮件通告,并欢迎其加入的百度高级副总裁、百度搜索公司总裁向海龙,在百度一直都是搞销售,搞推广的,现在更可谓是百度主要营收来源的实际负责人。

互联网资本投资布局很常见,但很少有像百度这么兴师动众地收购营销公司。这让业内人士很不解,认为这是“不务正业”。

其实恰恰相反,百度从商业模式上来看,就是一家广告营销公司,还是全世界数一数二的广告公司,用搜索入口积累的流量,为广告主提供曝光、展示以及推荐等等服务。竞价排名、关键字,都是精准的营销服务之一。

且,广告收入在百度的整体营收构成占比9成以上,成为百度其他业务的主要输血方。在与AT的竞争中, O2O烧钱、打车烧钱,外卖烧钱,百度都进行了重金投入,但效果都不怎么乐观。还有现在搞得无人驾驶,智能化等等,都是需要大量投入,且未来较长一段时间都见不到利润的活。

争夺未来如此关键的当下,百度赖以生存的广告模式却遭遇了空前的舆论危机。 今年, “血友病吧被卖”、“魏则西事件”等,舆论争议的焦点,就是以竞价广告建立起来的百度营收体系,这一业务正是向海龙主要负责。

甚至批评百度,一时间成为了政治正确。百度迫不得已砍掉了医疗广告业务,一个季度少了20个亿的收入。很明显,这对于正处于高投入的百度其他业务是极为不利的。但这块收入,百度也无法再拿,转而寻求开发其他营销产品、服务,也是顺理成章。

李靖团队能否帮助百度实现这一点,估计也会面临诸多挑战。对于营销水平的认知,并没有一个客观的标准。况且,其目前虽然有个人品牌,其实是没有多少实战经验的,更多基于理论和文案,不说是纸上谈兵,至少没有在一家像样的互联网公司独立做出一款产品。

在知乎上,有网友对他的评价也是两极,“对于学习传统营销与广告理论的人或没有学过营销的人,一定会被他的文章理论所震惊”,“对业内人士来说,这些是常识共识,只不过很多人没有系统整理”。

在李靖之前,9月份,百度还挖来了前1号店CEO王路,也是出任百度公司副总裁,负责公司级的战略合作,大市场、公关和政府关系等业务,直接领导“这届百度公关”。

建立口碑很难,维护更难,一夕崩塌,覆水难收。无论是李靖,还是王路,百度大手笔招揽的另一层意义,就在于重建口碑。期间,还整出了个自黑、自嘲的“这届百度公关”官方微信公众号来更好的与用户互动。

李彦宏说,百度要成为一家伟大的公司。

但现在在部分舆论看来,对百度的期望,是不再作恶。很大程度上表明了,百度所遇到的形象危机的严重性。李彦宏也曾进行了深刻反思,他全员发信指出“从管理层到员工对短期KPI的追逐,我们价值观被挤压变形”,将百度的不好,归罪于自己,并进行了相关调整。

谁都想恢复形象,不过,百度口碑危机的化解,并非一两个营销、公关高手便能解决。在成为伟大之前,百度还欠缺说服力。

百度上线新算法 是否真能改善用户体验

日前,百度推出了新的搜索引擎算法——“蓝天算法”,严打新闻源网站卖目录、发软文的问题。触犯算法的网站除了清理出百度新闻源,还会被搜索降权。百度称此举意在改善用户体验,还用户一片搜索蓝天。果真有用吗?

先说说软文

软文是很多企业进行网络营销不可缺少的一种推广途径,新闻源网站因为内容传播范围广投放成本低,所以备受广告主青睐,这其中甚至有很多中小资讯网站靠此为生。这种营销手段经过多年的发展,已经形成了一套完整的商业模式,百度“蓝天算法”真能奏效吗?我们拭目以待吧。

再谈谈百度

刺客发现百度最近在推一种叫“信息流”的广告,跟今日头条的广告类似,百度推广门部已经在电话推销了。10月份以来百度搜索广告位也从之前的4个增加到了5个。不少的原创网站被垃圾程序全站镜像,垃圾网站竟然在百度获得的排名比原网站还好。最让刺客感受深刻的是:有时候搜索一个关键词,会有一大堆的百度知道、百度百科、百度文库和百度贴吧的内容罗列在前面,往往要翻几页才能找到有用的信息,甚至得搬梯子上Google。

你感觉百度搜索在用户体验上真的有大改变吗?

作者:刺客SEO,关注刺客SEO微信公众号(cikeseo),交流学习网络营销、自媒体运营、网站SEO、淘宝开店盈利等相关思维和技术。(转载务必注明此版权)

百度宣布取消新闻源数据库 你看到的未必是真相

当部分PR人这两天还在为承诺客户的新闻源KPI是否达标挣扎时,3月20日,一则关于百度宣布要取消新闻源数据库的公告将其瞬间击倒; 还没回过神来,便被各种各样的关于“百度宣传取消新闻源数据库”的解读稿刷屏。然而,你看到的是真相吗?下面,跟着智鹊的视角一起来看这则事件。

所有内容都千篇一律地在表达了一个观点—— “百度要取消新闻新数据库了”、 “一个旧时代结束,一个新时代要开始”。所有内容都在围绕百度站长的公告解读,但实际上百度站长公告当中的内容也极其有限,只是提到要取消新闻源数据库,并提及站长平台VIP俱乐部,并没有过多地描述其它细节。

可能很多PR人到现在都没弄明白,到底这个事对我们有什么影响?对我们现在正在服务的客户以及未来要服务的客户有什么影响?百度取消了新闻源数据库,新闻源频道还存在么?目前发稿的网站还会被收录吗?智鹊认为,对于PR人来讲,这才是值得关注的重点。

百度在3月20日发布《新闻源取消,VIP申请升级公告》后,紧接着又在3月21日发布了另外一则《【深度解读】新闻源取消公告深度解读》的公告。综合这两个公告,智鹊联盟可以对PR人所关心的问题做个简单的解读。

1、 百度新闻源频道是否存在

根据官方公告可以看出,百度强调取消的是新闻源数据库,这只是后台的一个变化。而在我们能看到的前台,新闻源频道还是存在,没有任何变化。未来估计也不会有大的变化,只不过规则会有所变化。

2、 近期及未来的PR稿在百度新闻源收录排名变化

智鹊认为,这才是此次百度关闭新闻源数据库的重中之重,调整结束后,对于以后新闻源收录排名一定会有变化。

百度新闻源制度自问世以来,各大网站都在争先恐后加入百度新闻源。提交申请、审核通过后,一些网站因为有百度新闻源带流量,在内容创作方面逐渐失去了动力,慢慢沦落为拉圾站点,但还是存在于百度新闻源数据库当中。根据此次公告不难看出,这次的调整主要是要针对不产生优质内容的网站,通过VIP俱乐部制度剔除不良网站;而优质网站的排名则不会有大的变化,比如新浪、搜狐为首的综合门户网站,人民网、新华网为首的央媒,还有一些行业媒体网站,它在新闻源的收录排名应该不会有大的变化。

智鹊认为,目前百度对新闻源关闭做出的调整,完全是顺应移动互联网时代的潮流。众所周知,以微博为代表的社交媒体自出道以来,极大程度上打乱了互联网入口格局,尤其在移动端,百度不再是一家独大掌握流量的入口。微博、微信、今日头条、一点资讯、凤凰新闻、腾讯新闻等各类头条客户端都在布局内容计划,在马不停蹄地抢夺着移动互联网的流量。在各大巨头的围剿下,百度新闻源存在的价值已经明显下降,所以百度在这个阶段,取消新闻源制度,完全是为内容生态布局。

从这次百度新闻源调整我们可以看出,流量为王的时代已经过去,内容为王的时代已经来临。作为深耕社会化媒体营销多年的自媒体联盟平台,智鹊希望以丰富的社交媒体营销经验及优秀的社会化内容供给,帮助企业精耕微博、微信、直播等社媒平台,以好内容做有效传播。