独角兽百度来袭这类股可提前埋伏

最近这盘面,不知道说啥好了,被独角兽吓得不轻,然而独角兽还没有停止的迹象…

不知道大家看过电影《环太平洋》没有,就算没看过,那奥特曼想必是看过的。里面的怪兽一个个来,一个比一个厉害。先是来了个独角兽药明康德、然后是富智康工业互联、再就是宁德时代,之后是小米,现在百度也明确要来了。

既然要来了,那还能说啥呢,既来之则安之,看看哪些机会可以捞一把呗。

一、事件导火索:

本次炒作的导火索是因为这则消息:据财新报道,从接近百度人士处获悉,百度目前正在冲刺准备CDR材料,已经确定保荐机构为中信证券和华泰联合,进度反超阿里巴巴和京东集团。由于小米是IPO和CDR同步,这意味着,百度会成为第一家回归境内市场的已上市新经济巨头。

二、影响力巨大

影响力:★★★★★

这则消息不过是整个进程中的一环,但是对于百度这种影响力的企业而言,任何风吹草动都会牵动资本市场的神经。何况,前有富士康工业互联概念,后有小米概念做垂范,必然是资本市场的宠儿。

地位:百度,中文搜索引擎龙头!百度成立于 2000 年 1 月,是全球最大的中文搜索引擎、最大的中文网站。

市值:公司 2005 年在美国纳斯达克上市,2018 年 1 月,其市值已超过 870 亿美元。百度的互联网及移动互联网业务,如搜索业务、手机百度,占据百度营业收入主要部分。

品牌力:在中国,绝大部分人知道百度,互联网用户中的绝大部分人也都使用过百度的产品。

特殊性:百度会超越其他在外上市的互联网巨头,成为第一家回归境内市场的已上市新经济巨头。

以上种种,可以预见,百度回归A股,会牵动着A股市场每一个的神经,是每一个资本市场人争相讨论的话题。这就是影响力!影响力意味着题材高度!

三、百度老树开新花,现在依然优秀

战略聚焦 AI,搜索引擎龙头公司再起航。2017 年起,公司 AI 作为重点战略方向,2017 年 5 月,百度将公司使命从“让人们最平等便捷地获取信息找到所求”变为 “用科技让复杂世界更简单”。

百度的核心业务是搜索,搜索业务长期积累的核心能力,计算力、数据量、算法正是 AI 的核心。百度 All in AI 整体战略是采用“云+端”模式构建 AI 开放生态,开拓新兴业务并拥抱现有业务。

图1:AI平台能提供的业务

从收入总额来看,在经历2016 年 6.3%的增速低点后,2017 年年度公司实现营业收入 848 亿元人民币,同比增长20.28%,增速开始回升,2012-2017 CAGR 达 24.9%;2017 年净利润为人民币 183 亿元,同比增长 57.33%。业绩增长影响因素包括百度利用 AI 优势优化搜索功能,并推出信息流产品。

图2:百度经营业绩图

四、可比事件炒作高度

百度的大致情况上面介绍了,影响力大,也很优秀,这些毋庸置疑。现在重点看一看可对比的题材炒作高度。

拿最近的小米概念股举例。自小米传出以CDR+H的形式在内地和香港两地同时上市后,资本市场对小米相关概念股进行了一系列的炒作。

其中龙头宇环数控在如此疲弱的行情下,实现了6天4板,底部启动涨幅60%的高度。另外,次龙头京泉华实现了5天3板的高度。

图3:小米概念龙头宇环数控走势图

资本市场为什么选择宇环数控?

宇环数控,次新股,启涨的时候流通市值10个亿左右。

公司一直专业从事数控磨削设备及智能装备的研发、生产、销售与服务,为客户提供精密磨削与智能制造技术综合解决方案。与苹果产业链企业建立了长期的合作关系,如富士康、蓝思科技、捷普集团、小米等,为苹果公司提供制造服务。既是富士康概念股也是小米概念股还是苹果概念股。

那么百度概念股的标的以小市值且多概念最佳

五、可关注标的

今天百度概念股盘中崛起,涨停了四只,分别为华阳集团、路畅科技、创维数字、佳云科技。

华阳集团:华阳现拥有全资、控股、参股企业10余家,在香港等地区建立了分支机构。是中国大型汽车电装企业之一,全球最大的激光头和各类机芯生产制造基地之一;是中国最大的汽车影音产品制造商之一。与百度有着密切的合作。

路畅科技:深圳市路畅科技有限公司是一家集产品研发、生产和销售于一体的民营高新技术企业、国家火炬计划重点高新技术企业、软件企业。公司主要是车载地图以及汽车自动化领域,是百度的重要合作伙伴。

创维数字:公司成立于2002年,2014年10月在深圳A股成功上市。创维数字专注于智能终端及软件系统与平台的研究、开发、生产、销售、运营与服务,推出了数字电视、智能网络、IPTV等全系列智能盒子终端、智能网络接入终端、汽车智能及车联网等系列产品及运营与服务。

佳云科技(300242):6月11日在互动平台表示,公司是小米、百度等企业商业化核心合作伙伴。另外,经和控股股东确认,按照融资协议约定,控股股东质押股权目前不存在爆仓情况。

除了以上涨停个股外,其它标的如下图

个人认为龙头会是在今天涨停的四只股票中产生,就市值、资本市场的第一反应以及关联度来看,路畅科技具有很大优势,最终怎么选,看市场选择了。

广东SEO百度搜索右侧相关企业推荐和知心搜索

今天再来分享一些干货,就是关于百度搜索结果右侧的相关企业推荐与百度知心搜索。在2015年百度与去哪儿网合作推出了一种新的算法为“知心算法”通过用户搜索需求智能化判断所属行业相关,将该行业的内容、产品、服务整合后展示给用户。

而后来百度的信息越来越丰富演算出了一套完整的算法。在用户搜索关键词的时候右侧出现了相关企业、相关设备、相关公司、相关网站、相关平台、相关软件、相关产品、相关品牌、相关书籍、相关词汇等。

当用户在搜索某个领域关键词的时候,右侧能够出现相关企业推荐。

而且百度不需收费,相比关键词排名、竞价广告更具权威影响力。

广东SEO优化师认为在企业营销中这是一个需要关注的点,对公司品牌提升有较好的帮助。

如何才能做到让公司出现的百度搜索右侧的相关企业推荐栏呢?

广东SEO优化师总结了几个方面的因素:

1、百度百科

要出现在右侧该公司应该有完整的百度百科介绍,并且有一定的搜索量。

2、搜索指数:

该公司要出现在右侧推荐需要有一定的搜索指数,搜索指数少则百度不会推荐。

3、新闻报道:

在互联网知名的媒体网站或政府网站有过新闻报道,百度会增加信任度为该企业加分。

4、百度地图:

在百度地图搜索该企业的公司名称或品牌名称,有准确的导航位置,百度会加分。

5、网站备案:

无论是互联网服务网站还是企业网站、个人网站应该有明确的备案信息。

企业网站必须以公司名义进行备案;以证明网站主体的合法性,百度会加分。

6、百度推广

百度推广是百度自己的产品,如该公司有开通百度推广帐号,百度会增加好感。

综合来讲一个企业是否值得被百度推荐在右侧相关企业,是经过多方面是因素总结的。

搜索引擎相当于一台庞大的机器每天都在运转抓取互联网信息;

通过数据库的综合判断再将信息推送出来展示给搜索的用户。

百度地图分析报告语音交互功能详析

1.分析背景

随着我国互联网的快速发展及智能设备的日趋饱和,国内手机地图应用市场生态也已形成,百度地图、高德地图、腾讯地图、搜狗地图几大厂商占据了市场。截止2017年6月手机地图用户累计规模已经达到6.75亿人,随着人口红利的消耗,用户增长逐年放缓。地图各家地图应用纷纷借助自身技术、资源,深耕使用场景与用户体验,提供越来越精细化、智能化的功能服务。

手机地图核心高频功能为导航、定位、路线规划,经过O2O、网约车与共享单车等线下业务的协同发展,行业领先者已进入全面升级期,数据采集、大数据应用、语音交互、人工智能、无人驾驶又为地图市场带来了更多的想象空间。

现以百度地图、高德地图、腾讯地图、Google地图与搜狗地图为分析对象,以百度地图为核心,进行数据、用户、功能全方位的竞品分析,旨在分析百度地图的优劣势与发展方向。

注:本文是笔者为求职所做的分析,目的在于了解手机地图行业格局、发展趋势。

2.竞品简介

2.1百度地图

百度地图是百度公司提供的电子地图服务,于2005推出,现已覆盖209个国家和地区,全球POI(地图兴趣点) 总数达1.4亿,室内图覆盖超过4,000座大型购物中心。

产品定位为“世界很复杂,百度更懂你”“科技让出行更简单”。百度地图的特色功能是智能导航,大数据运算推荐路线、躲避拥堵;智能语音,人机对话解放双手;AR步行导航和360°全景地图。

2.2高德地图

高德地图是由GIS服务商出身的高德软件有限公司于2004推出,“高软”是全国第一家获得导航电子地图甲级测绘资质的民营企业,于2010年在美国纳斯达克上市,2014年阿里巴巴完成全对高德地图的资收购。

现已覆盖全国364个城市、全国道路里程352万公里,2000万POI信息点。产品定位“导航专业,数据准确”,其核心竞争力就是优质的电子地图数据库和相对精准的导航。

2.3谷歌地图

谷歌地图是谷歌公司的电子地图服务。谷歌在2004年底收购了地图测绘公司Keyhole,于2005年6月陆续推出谷歌地图相关服务,其提供的街道(街景)360度全景视图为人称道,目前广泛覆盖全球各大洲,并通过海陆空、个人街景采集器Trekker等多种方式持续进行多视角的数据采集。

由于谷歌在国内没有相应测绘与采集资质,于是在2006年底与高德地图达成了中国区数据方面的合作,即谷歌地图中国区的地图数据由高德地图供应。

整体而言地图谷歌在国内的数据更新慢,无本地精准数据。网页版(google.cn/maps)可以正常使用,谷歌地图APP则无法连接服务器。本土互联网地图服务厂商经过充分竞争如今产品体验已经有很大提升而历经波折后,谷歌地图在中国的存在感已经十分微弱。2017年谷歌AI中国中心落地北京,谷歌地图或可卷土重来。

2.4搜狗地图

搜狗地图原名“图行天下”,成立于1999年,是中国第一家互联网地图服务网站,于2005年被搜狐收购,并改名为搜狗地图。目前数据覆盖全国近400个城市3000个区县,数千万poi信息点。于2017年4月推出“智能副驾”语音交互助手汪仔,产品定位为“语音对话,智能出行”

2.5腾讯地图

腾讯地图,前称SOSO地图,是腾讯公司的互联网地图服务。目前数据覆盖全玻400个城市,产品slogan是较为玄幻的“怀抱梦想,勇于探索”。

腾讯地图错过国内地图产业红利期,目前处于奋力追赶阶段,于2013年战略投资搜狗,并逐步与海外GIS服务商达成合作。

3.竞品数据分析

3.1地图资源数据

巧妇难为无米之炊,地图数据的高质量与大数量是手机地图的核心功能和扩展功能的保障。

各手机地图品牌的数据来源丰富多样,国内各家均在在四维图新、中国四维、DigitalGlobe等优质数据提供商处有数据获取,且都采用了UGC、自采等方式作为补充。

3.2.排名与用户量

(Android(左)与ios(右)排名数据[20180125])

Android与ios导航/出行分类排名,百度地图与高德地图在第一、第二名徘徊,百度地图在Android市场排名第一,ios市场排名第二,高德地图在ios市场排名第1,在Android市场排名第二。腾讯地图、Google地图在3、4名争抢,而搜狗地图排名靠后。

(艾媒咨询2017年Q1-中国手机地图市场)

从艾媒咨询2017年Q1数据来看,谷歌与百度“双雄”争霸,以细微差距占据了60%以上的市场份额。腾讯系的腾讯地图、搜狗地图整体超过20%,其余地图分得另外10%。

4.竞品用户分析

手机地图市场上,各家用户高度重叠,由于数据有限、业务不精,无法准确区分,仅仅对手机应用市场和搜索数据做一个分析。

4.1用户群体画像

用户群整体年龄在20~50岁之间,其中30~39岁用户占比最大,约为45%,40~49岁用户占比第二大,约为25%;横向对比各家用户,明显可见百度的用户在20~29岁的年轻化用户群中人数更多。

(数据源自百度指数)

手机地图应用的用户主要为男性,整体男女比例大概为7:3。而整个男女比例中,可见百度地图的女性用户相比其他五个产品来说,占更大比重。

宏观来看,百度地图的产品相比其他地图应用来说,更受年轻用户、女性用户青睐

4.2核心用户分析

核心用户是一个产品的灵魂。他们高频而广泛地使用产品各项功能,是产品价值最高的用户群体。

根据QuestMobile2016年10月数据显示,有车一族在百度地图与高德地图的渗透率分别约为达44%和42%,而TGI(有车一族该APP的渗透率/整体用户中该APP的渗透率x100)则分别达到177和256。也即是说,手机地图应用中,有车一族比重远远超过整体平均水平。而性别和年龄分布与有车用户的重合、各地图产品对车用导航的功能倾斜也完全印证了这一判断。

现对手机地图市场的核心用户简略分析如下:

5.竞品功能分析

5.1竞品功能总体分析

本部分将竞品功能整合为一个清单,自上而下大致为核心基础功能、衍生功能、特色功能三部分。而各个功能又根据其重要程度占20分、10分或5分的总分值;再横向对各个地图应用功能进行打分。没有功能则为0分,另根据其功能优劣程度进行打分。(此处评分略微直观,不是精准判断)

从打分结果来看,百度地图与高德地图仍然难分高下,而搜狗地图在衍生功能和特色功能处加分不少,排名第3,腾讯地图与Google地图则相对简洁。

百度的AR步行导航、AR智能导游、主题地图、智能语音交互功能十分亮眼,从功能和场景的创新层面来说属于业内领先。

5.2特色功能之语音交互功能对比

(各地图应用2018.1月最新版本)

目前高德地图、腾讯地图和Google地图并不具备语音交互的功能,仅能算作语音输入。所以本小节重点聚焦百度地图的智能语音助手小度和搜狗地图的智能副驾汪仔

5.2.1 基本情况

2017年07月11日,搜狗地图9.0版本上线了智能副驾功能;2017年07月24日,百度地图10.0.0版本上线了“小度小度”语音全局操控功能。

在手机地图的场景之下,搜狗地图和百度地图的语音交互功能定位更偏向于车主智能秘书,搜狗地图在此功能命名上就是“智能副驾”,百度地图则是语音交互场景下默认进行驾车出行导航。相对而言,百度地图的定位没有那么局限,有更多的非导航场景。

5.2.2语音功能覆盖

百度地图语音交互功能覆盖率整体优于搜狗地图。搜狗地图由于场景过于聚焦车主行车导航,在其他场景覆盖不足,如公交路线、天气查询、共享单车等非行车导航场景指令无法响应。

5.2.3性能对比分析

分析方法:

区分嘈杂和安静环境,对百度小度和搜狗汪仔各进行30次唤醒,唤醒成功率=成功唤醒/30×100%。导航类指令、资讯类、操作类指令按照2:1:1的比例列举30条,区分嘈杂和安静环境对百度小度和搜狗汪仔做使用测试。识别准确率=正确识别语音条数/30条x100%;解析准确率=正确识别的语音中正确分析了语音意图的条数/正确识别语音条数x100%。

可见百度地图的唤醒成功率、识别成功率、解析成功率均优于搜狗地图;百度地图对嘈杂环境的处理能力更强,唤醒和识别更为稳定。整体而言,在基础性能上百度地图更胜一筹。

5.2.4优缺点对比分析

1.唤醒流程

2.交互设计

百度地图语音交互页面为04浮窗深蓝底白字,仅显示引导文案与特定动效;搜狗地图全屏黑底白字,并同步显示播报文字。

百度的交互设计弱化了界面交互场景,真正解放眼手,以动效表示小度状态,简单、效率高,更具智能感。而搜狗地图的交互设计使得场景聚焦,更清晰,便于一瞥既得,播报文字显示便于用户“理解”汪仔,更多控制感;但不利于解放双眼、阻碍语音交互习惯。

6.结论

6.1宏观结论

市场增长放缓,各家进入全面存量用户抢夺和综合能力的竞争。基础功能高德领先;特色功能百度领先。基础数据精准、算法上继续深化,提升准确率与精度。实景、语音助手、 AR等功能上先行一步,景区导游、室内导航(腾讯)的进一步探索。与其他智能硬件结合,深入更多的使用场景;智能耳机、智能车载。

6.2语音交互功能趋势

语音交互是AI时代举重若轻的入口,地图语音交互又是一个不可多得的使用场景之一(另一个是居家智能音响)。

当前百度地图的语音交互领先行业,不论是从基础性能还是功能覆盖上,都远超同行业;搜狗地图紧随其后,这两家都自有语音识别和解析的能力,先入场获取了大量的使用数据,具备一定先发优势。预计高德地图将使用第三方提供的语音能力跟进地图语音交互功能,腾讯地图或与搜狗地图打通或合并,总之各家均有跟进地图语音交互的可能。

现阶段的地图语音交互还未完全覆盖所有场景、功能,预计未来可见的一段时间百度、搜狗将会持续拓展语音交互的功能覆盖面、不断提升和优化产品性能,并延伸非功能性对话功能,更多地满足用户的聊天、娱乐和情感需求。

目前语音识别技术已经充分发展,而语义识别乃至真正的理解、对话、交互还远远达不到。更进一步的语音交互依赖于语义、情绪、环境理解技术的突破。

本文由 @殷大侠 原创发布于人人都是产品经理。未经许可,禁止转载。

题图由作者提供

软文助力企业营销鸿博seo学习博客

  百度算法频繁调整,企业SEO成本剧增之后怎么办?让软文出现在百度相关信息的搜索结果里面,让你的企业品牌瞬间获得SEO流量,从此企业不再单单依靠SEO,但是却获得了软文和SEO的双重效果。互联网技术发展,人们的注意力被分割的支离破碎,想要在纷繁的信息海洋里获得关注并非易事。而一篇出色的软文不仅可以为网站或企业带来流量和关注度,而且还能通过文章获得排名,因此,软文营销对企业的推广有着极大的帮助。

  什么是百度相关信息软文营销?百度的相关信息就是百度相关新闻的改版,但是点击进去之后并非是进入了百度新闻,而是将文章类的页面排在了最前面,进入百度相关信息搜索结果页面,可以很容易发现,在这个结果列表里全是与这个关键词相关的内容页面,没有一个网站首页或者无关的链接。百度相关信息相比传统的相关新闻,它的及时性与准确性都有很大的提升,更能满足用户的需求。

  软文通常使用在在什么方面呢?软文推广在品牌宣传、产品销量、企业形象、服务理念、消费理念、企业领导、战略意图、产品的概念、危机公关等领域具有重要的作用。中国从开始进行市场经济改革开始,就已经出现了软文,至今,软文已经铺天盖地,媒体有80%以上含有软文或广告,读者已经分不清哪些是新闻,哪些是软文。中国几乎所有的门户网站都可以发布软文,新华网央视网被称为国家的喉舌,也可以发软文宣传,所以媒体的公正性、监督性也已经受到普遍质疑。

  通过门户网站发布软文,合理有效的向网民定向传播品牌信息;依靠门户网站的权威性和门户网站的公信力作为支撑点,逐渐提高企业品牌的知名度、好感度、忠诚度!用较少的投入,吸引潜在消费者的眼球,增强产品的销售力和美誉度,提升网站的品牌度。在软文的潜移默化下,达到产品的策略性战术目的,引导消费群的购买的广告。门户网站的新闻时效性长,可随时引用做为企业宣传的上等材料,而且门户网站在搜索引擎中享受着高排名的优势,在门户网站传播的信息容易在网民搜索相关时检索到,并常常被各中小网站、博客和论坛等转载,形成二次传播,对提升公司的品牌影响力具有重要作用!

  信息爆炸的时代,口碑营销被誉为市场攻坚的杀手锏。发布契机的把握与对当时新闻热点的巧妙跟从是软文的高级技巧。软文发布以月度传播为基础:每周结合企业宣传点和社会热点撰写一篇新闻稿件,并发布于3个门户网站;每月4周,每月4篇稿件轮番出现在12个门户,长期建设品牌。传统门户网站:权威性不言而喻,在传统门户网站传播企业信息,有着传统门户的公信力作为支撑,容易在网民心中积累企业品牌好感度。地方门户网站:由于面对网民地域集中,更容易被本地网民接受,对于在大都市的网民心中积累企业品牌知名度具有极强针对性。行业门户网站:近年迅速兴起,由于受众精准,因此是高效传播并不可少的途径,容易在网民心中积累企业品牌忠诚度。

  大量的产品依靠软文推广在创造着一个又一个和网络销售奇迹,也造就一个又一个新型的百万、千万乃至亿万富翁。软文推广追求的是一种春风化雨、润物无声的宣传效果,是目前中国最精准、最有力又最廉价的营销手段。未来软文发展方向是把软文用到营销的各个环节,软文推广营销将是中国企业发展的必由之路。

  以上信息是由鸿博seo整理发布,转载请标明出处!

百度终于要放大招了除了人工智能百度手上还有哪些神兵利器

5月23日,以“智能革命生态进化”为主题的2017百度联盟峰会于5月23日在重庆举办。百度创始人、董事长兼首席执行官李彦宏,及众多高管来到峰会现场,与数百位联盟伙伴、互联网创业者共同探讨了百度联盟的生态进化。

百度在这次会议上也多次申明了百度的目标和企业方向,“用科技让复杂的世界更简单”的脚步却不止于此,从让无人车“飞入寻常百姓家”的“阿波罗”计划,到百度寻人帮助走失家庭快速团圆,都在印证着百度的新定位,也意味着属于人工智能的未来已经到来。

AI最近几年被传得神乎其神,但是目前在商业上大规模的运用,但是百度却笃定AI一定可以引领可以下一波的商业未来。

那对于李彦宏来说AI的思维方式是什么呢?

1.手机还会长期存在,但移动的机会已经不多。新的时代带来了新的机会,仅仅盯着手机,做一些常规的做法,就无法跟上时代的步伐。

2.我们的思维方式要发生转变,fromthinkmobiletothinkAI。要像Facebook的mobilefirst一样,“如果PM使用PC截屏,扎克伯格就会拒绝开会。”

3.软硬结合,重新定义“以人为本”。无论是PC互联网还是移动互联网,虽然硬件的成长也很快,但大家更多还是关注软件问题。现在已经大不相同,比如智能音响的交互方式,已经不再是键盘输入,而是变成人和麦克风打交道。麦克风技术,就是一个典型的软硬件结合技术。与之比较,更明显的是无人驾驶汽车。

4.数据秒杀算法,算法推动社会进步。这是大家在AI时代观察到的第一个事情,数据就像蒸汽机时代的煤炭,蒸汽机在瓦特之前早已经存在,但是瓦特的蒸汽机(算法的改良)改变了世界。

5.用AI思维做互联网产品,就是降维攻击。“早些转变思维方式,我们就能站在时代最前列。”

除了AI以外百度还有哪些神兵利器呢?

百度联盟就死除了AI的百度神器。迄今为止,百度联盟已经走过了15年。百度副总裁王路表示,“过去15年不仅是中国互联网发展的15年,也是百度发展的15年,更是我们联盟伙伴携手百度发展的15年,联盟伙伴和我们百度一起携手并进,缔造了无数的奇迹,也经历了无数的风雨。”

百度联盟总经理邓明生指出,15年中,联盟伙伴分成达400亿元,仅2016年分成就达142亿,其中分成超亿元的联盟顶级俱乐部会员达20家。

百度带着AI以及百度联盟开始了新的征程,那结局到底如何呢?还是希望他们自己告诉我们答案吧。

头条与百度互相攻讦不如反躬自省

(图片来源:全景视觉)

互联网巨头间的公关大战,这年头见多了,但是百度和今日头条最近一周的互撕看上去委实不是太体面。除了双方互爆的小动作略显阴损之外,更深层的原因恐怕是,双方自己该做的都还做得不够好。自己家的篱笆还没扎牢,就想着如何攻讦别人,总会让人有狗咬狗一嘴毛的不堪观感。

双方发展到今日互撕互咬的阶段并不奇怪。也许有人会说,今日头条之崛起正是钻了百度自家篱笆没扎紧的空子,但也要看到,新的用户需求总要有人去满足。如今头条月活DAU逼近两亿用户,估值稳定在200亿美金左右,更重要的是,今日头条多方面业务迅速发展,问答类产品悟空问答、视频类产品西瓜视频、抖音、微头条、火山小视频,均相当火爆,头条的内容大河水涨船高,对百度多年主盘业务之一——内容分发,已经构成了实质性威胁。

最近几年,无论百度承不承认,中国社会舆论对百度是不满意的。无论是竞价广告的弱肉强食还是知识产权保护的虚与委蛇都让人相当失望,而作为百度立身之本的搜索引擎技术的落后低效更是大众槽点。直接点说,盼着有一种更好用更高效的产品替代百度,不说是共识,起码是相当一部分人的期待。有趣的是,这个替代品不是大家呼唤多年的隐形竞品谷歌的回归,也不是搜狗、360,也不是阿里、腾讯搞出一个更牛的搜索引擎,居然是两三年前还名不见经传的今日头条。

这有点像一个著名理论,打败柯达相机的不是其他相机,而是数码相机,打败诺基亚的不是摩托罗拉,而是智能手机。百度自以为凭借“世界第二”的搜索技术和国情壁垒就可以永远垄断中国市场,它处心积虑打击的潜在对手也都是专注于搜索引擎技术的公司,但它没想到,颠覆它的不是搜索技术,而是算法推荐。

本质上说,搜索是“产品让人更聪明”,用户对搜索引擎的诉求很简单,“精准找到他们要找到的信息”。虽然最终目标是获取信息,但这种找到信息的路径是由人的指向和搜索引擎技术共同指引的。但是算法推荐是“产品替代了人的能动性”。用户在今日头条上不需要思考。甚至,按照今日头条的设想,当个性化推荐算法达到极致时,用户需要什么信息,都会自动呈现到眼前,根本不需要用户发挥主观能动性去配合。有点像给孩子吃饭,一种是,这里有个大厨房,什么都有,你想吃什么你自己去找,一种是,你想吃什么我都知道,你动都不用动,躺着就好,我能把你最需要的食物找到送到你嘴里,你要做的事情只是动动嘴而已。

这种新局面出现后,百度变得愈发被动是相当正常的。两种信息流的喂食方式,在当下中国环境下,今日头条会更受欢迎。当然,对这两种信息流传送方式会有伦理层面的讨论,今日头条这种方式也有很多弊病。但是,百度把自己的危机完全归罪于头条也是不对的。毕竟,在信息流平台中,用户绝不是只有“躺吃”这种懒人模式,同样有很多用户有主动寻找信息的需求。搜索技术提供的信息流和算法推荐的信息流本质上还是两种生意,两种需求其实都很大。

百度现在其实就在学头条。百度最近多次声称百度要做“搜索+推荐”双引擎模式。我认为,这种做法还是自家篱笆没扎紧,天天想着去薅邻居家的草。诚然,信息流总量是此消彼长的关系,但是百度如果把自己篱笆筑牢,把搜索技术做到极致,从搜索引擎进入的信息流流量仍然是相当可观的。如今百度不顾主业,想办法去跟今日头条争夺算法推荐的信息流市场,有可能既蒿不来别人地里的草,又荒了自家的田。

当然,我同样认为,今日头条也不要盛气凌人。这不是给双方各打五十大板的乡愿说和,而是,今日头条的篱笆同样也没有完全扎牢,护城河其实也筑得不够深。今日头条最大的问题在于,它必须取得信息流内容质量和点击率之间的平衡。张一鸣声称“算法没有价值观”,但今日头条最近被约谈整改的被动处境已经说明问题。今日头条虽然已经在大量招聘编辑以把控内容质量,但提高信息流的质量并不是只用去政治化和泛娱乐化的策略就能解决问题。在内容领域,今日头条务必得抛弃工具理性成见,拥抱价值理性,否则这种模式会不断遭受各方挑战。

对于海量用户来说,百度有没有成立所谓“打头办”(打击今日头条办公室),头条有没有恶意强黑百度,这些卑琐细节并不重要,互相强怼、撕逼也不能在公关上真正挽回各自的体面。在真实战场上,还得靠各自产品说话,双方谁能够彻底反思改革,谁能刮骨疗毒脱胎换骨,谁就能赢得用户和舆论的承认,而谁忽视基本商业伦理,谁忽视内容伦理,谁就可能最终被用户抛弃。

(作者系财经作家)

一文读懂FM算法优势并用python实现附代码

作者:ANKIT CHOUDHARY

翻译:张媛

术语校对:冯羽

文字校对:谭佳瑶

本文共3933字,建议阅读9分钟。

本文带大家了解因子分解机算法并解析其优势所在,教你在python中实现。

介绍

我仍然记得第一次遇到点击率预测问题时的情形,在那之前,我一直在学习数据科学,对自己取得的进展很满意,在机器学习黑客马拉松活动中也开始建立了自信,并决定好好迎接不同的挑战。

为了做得更好,我购买了一台内存16GB,i7处理器的机器,但是当我看到数据集的时候却感到非常不安,解压缩之后的数据大概有50GB – 我不知道基于这样的数据集要怎样进行点击率预测。幸运地是,Factorization Machines(FM)算法拯救了我。

任何从事点击率预测问题或者推荐系统相关工作的人都会遇到类似的情况。由于数据量巨大,利用有限的计算资源对这些数据集进行预测是很有挑战性的。

然而在大多数情况下,由于很多特征对预测并不重要,所以这些数据集是稀疏的(每个训练样本只有几个变量是非零的)。在数据稀疏的场景下,因子分解有助于从原始数据中提取到重要的潜式或隐式的特征。

因子分解有助于使用低维稠密矩阵来表示目标和预测变量之间的近似关系。在本文中我将讨论算法Factorization Machines(FM) 和Field-Aware Factorization Machines(FFM),然后在回归/分类问题中讨论因子分解的优势,并通过python编程实现。

目录

1. 因式分解的直观介绍

2. FM算法如何优于多项式和线性模型

3. FFM算法介绍

4. 在python中使用xLearn库进行算法实现

因式分解的直观介绍

为了直观地理解矩阵分解,我们来看一个例子:假设有一个用户-电影评分(1-5)矩阵,矩阵中的每一个值表示用户给电影的评分(1-5)。

从上述表格中我们可以看出,一些评分是缺失的,我们想设计一种方法来预测这些缺失的评分。直观上来讲,利用矩阵分解来解决这个问题的关键是应该有一些潜在的特征决定用户如何评价一部电影。举例来说 – 用户A和B都是演员阿尔·帕西诺的粉丝,那么他们就会对阿尔·帕西诺的电影评分较高。在上述例子中,对特定演员的偏好是一个隐藏的特性,因为我们没有明确地将其包含在评分矩阵中。

假设我们要计算K个隐藏或潜在的特征,我们的任务是找出矩阵P (U x K)和Q (D x K) (U – 用户, D – 电影),使得 P x QT 近似等于评分矩阵R。

P矩阵的每一行表示用户与不同特征的相关性,Q矩阵的每一行表示该特征与电影同样的相关性。为了得到用户ui对电影dj的评分,我们可以计算对应于ui和dj两个向量的点积。

接下来要做的就是求出矩阵P和矩阵Q。我们使用梯度下降算法来计算,目标函数是使用户的实际评分与通过矩阵P和Q估计的评分之间的平方误差最小,这里的平方误差由以下方程求出。

现在我们要给pik和qkj定义一个更新规则,梯度下降法中的更新规则是由最小化误差值的梯度来定义的。

获得梯度值后,接下来可以定义pik和qkj的更新规则。

这里α是控制更新步长的学习速率,使用上述更新规则,我们可以迭代地执行操作,直到误差收敛到最小,同时使用下面的公式计算总的误差,以此来确定什么情况下应该停止迭代。

上述解决方案很简单并且经常会导致过拟合,即现有的评分都被准确预测到,但是不能很好地推广到未知的数据上。为了解决这个问题,我们可以引入一个正则化参数 β,它将分别控制矩阵P和Q中向量“用户-特征”和“电影-特征”,并给出一个更好的评分的近似值。

如果对利用python实现上述功能和相关细节感兴趣,。一旦我们用上述方法计算出了矩阵P和Q,得到的近似评分矩阵如下:

现在,我们既能够重新生成现有评分,也能对未知的评分进行一个合理的近似。

FM算法如何优于多项式和线性模型

首先考虑一组点击率预测数据的训练示例。以下数据来自相关体育新闻网站(发布商)和体育用品公司(广告商)。

当我们讨论FM或者FFM的时候,数据集中的每一列(比如上述表格中的出版商、广告商等)将被称为一个字段,每一个值( ESPN、Nike 等)都被称为一个特征。

线性或逻辑回归模型在很多问题上表现很好,但缺点是这种模型只能学习所有变量或者特征各自的影响,无法学习变量之间的相互作用

在上述等式中,w0、wESPN等代表参数,xESPN、xNike等代表数据集中的各个特征,通过最小化上述函数的对数损失,得到逻辑回归模型。捕获特征之间相互作用的一种方法是使用多项式函数,将每个特征对的乘积作为单独的参数来学习,并且把每一个乘积作为一个独立的变量。

这也可以称为 Poly2模型,因为每一项都只考虑了两个特征之间的相互影响。

问题在于,即使面对一个中等大小的数据集,也需要一个庞大的模型,这对存储模型所需要的内存空间和训练模型所花费的时间都有很大的影响;

其次,对于一个稀疏数据集,这种技术不能很好地学习所有的权重或参数,因为没有有足够的训练样本使每一个特征对的权重是可靠的。

救星FM

FM算法解决了成对特征交互的问题。它使我们能够根据每一对特征组合中的可靠信息(隐藏特征)来训练模型,同时在时间和空间复杂度上更有效地实现上述目标。具体来讲,它将成对交互特征作为低维向量的点积(长度为K)进行建模,以下包含了一个二阶因子分解的方程。

FM(K=3)项中每个参数的表示方法如下:

上述等式中,我们分别计算了与2个特征对应的2个长度为3的潜因子的点积。

从建模的角度来看,这是非常强大的,因为每一个特征最后都会转换到一个相似特征被互相嵌套的空间,简而言之,点积基本上表示了潜在特征的相似程度,特征越相近,点积越大。

对于余弦函数,当 θ是0时,得到最大值1;当 θ是180度,得到-1,所以当 θ接近于0时,相似性最大。

FM算法的另一个巨大优势是能够在线性时间复杂度下使用简单的数学方法计算模型中成对特征的相互作用。如果你想进一步了解具体的实现步骤,请参考链接中关于FM算法的原始研究论文。

示例:FM算法性能优于 POLY2算法的演示

考虑以下一组虚构的点击率数据:

这个数据集由作为发布者的体育网站和体育用品广告商构成。广告是以弹出的方式来显示的,用户可以选择点击广告或者关闭广告。

特征对(ESPN,Adidas)只有一个负的训练数据,那么在Poly2算法中,这个特征对可能会学到一个负的权重值wESPN,Adidas;而在FM算法中,由于特征对(ESPN,Adidas)是由wESPN·wAdidas决定的,而其中的wESPN和wAdidas分别是从其他特征对中学到的(比如(ESPN,Nike),(NBC,Adidas)等),所以预测可能更加精确。

另一个例子是特征对(NBC,Gucci)没有任何训练数据,对于Poly2算法,这个特征对的预测值为0;但是在FM算法中,因为wNBC和wGucci可以从其他特征对中学到,所以仍然有可能得到有意义的预测值。

FFM算法介绍

为了理解FFM算法,我们需要认识field的概念。field通常是指包含一个特定特征的更广泛的类别。在上述训练示例中,field分别指发布者(P)、广告商(A)和性别(G)。

在FM算法中,每一个特征只有一个隐向量v,来学习其他特征带来的潜在影响。以ESPN为例,wESPN被用来学习特征Nike(wESPN·wNike)和Male(wESPN.wMale)之间的潜在作用。

但是,由于ESPN和Male属于不同的field,所以对特征对(ESPN,Nike)和(ESPN,Male)的起作用的潜在作用可能不同。FM算法无法捕捉这个差异,因为它不区分field的概念,在这两种情况中,它会使用相同参数的点积来计算。

在FFM算法中,每个特征有若干个隐向量。例如,当考虑特征ESPN和Nike之间的交互作用时,用符号wESPN,A来表示ESPN的隐藏特征,其中A(广告商)表示特征Nike的field。类似的,关于性别的field的一个重要的参数wESPN,G也会被学习到。

事实证明,FFM算法对获得由 Criteo、Avazu、Outbrain举办的点击率(CTR)比赛第一名是至关重要的,同时也帮助赢得了2015年RecSys挑战赛的三等奖。关于点击率数据集可以从Kaggle获得。

在python中使用xLearn库进行算法实现

一些在python中实现FM & FFM的最流行的库如下所示:

为了在数据集上使用FM算法,需要将数据转换为libSVM格式。以下为训练和测试的数据文件格式:

:: …

在增加了field的概念之后,每个特征被唯一编码并被赋值,上述图中,特征ESPN用1表示,特征Nike用2表示,以此类推。每一行包含一个等效的训练示例并以“ n”或换行符结尾。

对于分类(二进制/多类),是一个指示类标签的整数。

对于回归,是任何实数的目标值。

测试文件中的标签仅用于计算准确度或误差,未知的情况下可以用任何数值填写第一列。

同样,对于FFM算法,需要将数据转换为libffm格式。在这里,我们也需要对field进行编码,因为该算法需要field的信息来学习。格式如下:

:::: …

有关数值特征的重要说明

数值特征需要被离散化(通过将特定数值特征的整个范围分成较小的范围并且分别对每个范围进行标记编码而转换为分类特征),然后如上所示转换为libffm格式。

另一种可能性是添加一个与特征值相同的虚拟field值,它将是该特定行的数值特征(例如,具有值45.3的特征可以被变换为1:1:45.3)。 但是虚拟field值可能不包含任何信息,因为它们仅仅是这些数值特征的复制品。

xLearn

最近推出的xLearn库提供了一个在各种数据集上实现FM和FFM模型的快速解决方案。 它比libfm和libffm库快得多,为模型测试和调优提供了更好的功能。

在这里,我们将用一个例子来说明FFM算法,数据来自Criteo点击率预测挑战赛中CTR数据集的一个微小(1%)抽样。 你可以从这里[Office1] 下载这个数据集。

但首先我们需要将其转换为xLearn所需的libffm格式以拟合模型。 以下函数将标准数据帧格式的数据集转换为libffm格式。

df = Dataframe to be converted to ffm format

Type = Train/Test/Val

Numerics = list of all numeric fields

Categories = list of all categorical fields

Features = list of all features except the Label and Id

xLearn可以直接处理csv以及libsvm格式的数据来实现FM算法,但对FFM算法而言,我们必须将数据转换为libffm格式。

一旦我们有了libffm格式的数据集,就可以使用xLearn库来训练模型。

类似于任何其他机器学习算法,数据集被分成一个训练集和一个验证集。xLearn使用验证/测试对数损失来自动执行提前停止的操作,并且我们还可以在随机梯度下降的迭代中为验证集设置其他的监控指标。

下面的python脚本可以用于在ffm格式的数据集上使用xLearn来训练和调整FFM模型的超参数。

该库还允许我们使用cv()函数进行交叉验证:

可以使用以下代码片段对测试集进行预测:

结语

在这篇文章中,我们已经演示了对一般分类/回归问题的因式分解的用法。如果您在执行这个算法的过程中遇到任何问题请及时告知我们。有关xLearn详细文档将在这个链接中给出,并会得到定期更新和支持。

http://xlearn-doc.readthedocs.io/en/latest/python_api.html

原文链接:

张媛,某云计算公司不务正业服务工程师一枚。喜欢下雨天,读闲书,缺乏技术细胞,欣赏并喜欢有态度有立场的人,爱浪漫,注重仪式感,喜欢记录。最近的愿望是拥有自己的小窝,给想念的人写一封信。

更多精彩请关注清华-青岛数据科学研究院官方微信公众平台“数据派THU”

百度信息流广告提供精准广告解决方案

日前,随着百度资讯流产品在用户端引起巨大反响,百度信息流广告也随之上线。目前已经趋向成熟,据介绍,百度信息流广告是基于百度资讯流精准推荐,借助百度大数据和意图定向、智能投放等多重领先技术,在百度资讯流中穿插展现的原生广告。目前百度信息流广告已在手机百度客户端和百度浏览器移动端上线,相比于传统网络投放,百度信息流广告再次全面发挥了百度的数据和技术优势。

三大媒体优势,精准触达6亿用户

好的广告产品首先要一个强大的媒体平台。相比其他资讯平台,百度资讯流拥有庞大用户基础、海量优质内容、精准推荐算法三大优势。根据百度第三季度财报,百度移动搜索月活跃用户数量已达6.6亿,牢牢占据了移动互联时代流量入口。

内容层面,百度资讯流打通了百度新闻、百家号、百度百科、百度贴吧等众多内容平台,为用户精准推荐高质内容。借助于百度人工智能(AI)、自然语言处理(NLP),深度学习(DeepLearning)等技术,百度资讯流不仅实现了“手机百度看资讯,千人千面大不同”,也可以把不同用户感兴趣的高质内容进行精准分发。

四大数据资产,让广告更精准找到用户

作为一款信息流广告产品,海量的用户数据是实现个性分发的首要基础。借助多年商业推广经验和大数据积累,百度信息流广告凭借四大数据资产,包括搜索数据、地理位置数据、知识图谱数据、交易数据,让原生广告更智能更精准的触达目标用户。

在搜索数据方面,百度信息流广告可以通过分析用户短期搜索行为、长期搜索历史、用户多模式交互和浏览数据,为广告主更快找到细分用户,精准推送广告信息。根据地理位置数据,百度信息流广告能够打通用户的百度地图位置数据、百度地图历史到访数据等,针对用户所在地域信息实现精准推送。知识图谱数据能够根据用户在百度百科、百度知道等平台的结构性知识大数据,提供更立体的用户画像标签。而糯米交易数据和合作伙伴交易数据,则从用户过往交易大数据方面为精准找到细分人群提供了依据。

五大技术能力,为精准广告保驾护航

一直以技术见长的百度在信息流广告上也下了不少功夫。据介绍,百度信息流广告拥有流量分配、意图引擎、机器学习、智能创意和智能投放五大技术支撑,可以智能匹配数据,满足各层级广告主所需。基于百亿级用户行为数据,百度信息流广告可以帮助广告主判断用户的当前意图,为广告“在对的时间找到对的人”。

移动互联时代,用户的注意力成稀缺资源,只有精准触达目标用户才能获得更大的商业价值。基于“千人千面大不同”的百度资讯流,百度信息流广告实现了广告信息的精准推送,让细分广告更智能的主动找到目标用户,正在受到越来越多的广告主的青睐。

最难抢票年百度糯米动用人工智能帮旅客抢票

临近年底,所有在外漂泊游子的一个主题就是回家,没有什么能够阻挡游子回家的急迫心情,但总有一些人回家的步伐,被一张薄薄的火车票拦住。尽管在传统的售票窗口之外,铁路部门还开通了电话订票、网络订票等多购票入口,但由于抢票时段、技术壁垒等原因,很多人依然抢不到票,无法与家人团圆。

  而今年的一个好消息是,由百度糯米开发、上线的春运预约抢票功能可以帮助旅客减轻购票压力,这一功能可以在12306放票前,支持旅客提前填好个人信息并完成支付,在放票当天第一时间帮助旅客抢票,提升抢票成功率。同时,使用百度钱包支付的新老用户还会获得价位不等的优惠。

(火车票日历规划抢票时间)

  据悉,此次春运抢票预约活动从今年11月15日一直延续到明年2月21日,旅客不仅可以直接在百度糯米app、手机百度app这两大常态入口上购买汽车票、火车票、飞机票,还可以在百度地图app、百度搜索上实现这一需求。这一预约抢票功能,可以帮助旅客告别0点的等待、网络的崩溃以及紧张慌乱的付款环节,让旅客回家不再难。

  在具体的操作环节上,百度糯米、手机百度app在首屏上分别都有入口,旅客打开百度糯米、手机百度app就可以看到抢票功能,操作便捷简单。手机地图上也有两个入口:

  一是点击地图上的“路线”功能,公交频道搜索跨城市线路,自动弹出火车线路解决方案,并且可直接购票;

二是手机地图的“发现周边”功能,也设置了车票购买入口,旅客点击即可购票。

  同样,在百度搜索上,旅客输入“火车票”“飞机票”等关键词,网页会自动弹出时刻表查询与车票/机票预定,一样便捷高效。

  百度糯米联合百度几大入口级产品发力,让这个冬天要回家的旅客有了更多选择,也让他们的回家之路不再艰难。已经体验过这一功能的旅客王琦瑶女士表示,“以往每年年底自己都会守在电脑前抢票,但往往12306一开票车票就被抢得精光,只得空手而归。今年试验了一下百度的这一抢票功能,不仅顺利抢到了票,而且不用随时紧张地等待,只要系统一放票,百度就会自动帮助抢票,购票效率大大提升。”

  据了解,百度糯米预约抢票功能之所以能大大提高购票成功率,一是因为百度糯米接入了携程、去哪儿等多个渠道,对接资源丰富;更主要的是,这一功能倚仗的是百度强大的技术能力:智能算法和百度云计算。强大的技术支持,是其他抢票软件公司无法望其项背的。

  首先是智能算法功能强大。百度火车票覆盖全国3000多个车站的所有线路和班次信息,基于这些数据,系统计算出发地与目的地之间的多种乘车方案,比如预约购票、中转联程,甚至结合百度汽车票和机票的全量数据,提供火车+汽车+飞机的联程方案,以最经济便捷方式帮助旅客顺利回家。其次,百度火车票构建在支持弹性伸缩的百度云服务器BCC基础上,其云计算功能实时同步余票信息,第一时间出票,帮助旅客顺利下单、快速出票,提供极佳体验。

  据悉,百度糯米作为国内领先的本地生活O2O平台,打造一站式生活服务平台从来就是其宗旨,车票购买这一重要生活场景成为其业务范围,是经营逻辑使然。现在,背靠具有强大技术能力的百度,百度糯米在本地生活服务上的杀手锏也是大数据、云计算、人工智能等技术,这些“黑科技”已经被百度糯米广泛应用于餐饮、酒旅等业务部门。而运用于火车票,只是百度糯米走技术路线的一个具体体现。李彦宏在乌镇互联网大会上就曾表示,移动互联网时代已经结束,接下来是人工智能的天下。百度糯米的火车票预约功能已经大量使用了人工智能、云计算等黑科技,正是一个典型案例。

细看百度Q3财报你会发现一个今日头条

百度今天公布的第三季度财报数据亮眼,其中的信息流业务特别引起了互娱资本论的注意——百度表示,信息流业务以第三季度业绩为基准的年化收入超过10亿美元,这一收入超过了今日头条去年的收入。

也就是说,在信息流之战中,今日头条和百度的攻守之势发生了变化。

绕不开的对手

百度在去年Q3推出了信息流业务,它没有独立app入口,主要是通过手机百度首页搜索框下面以及百度浏览器首页、百度移动端首页等渠道进行分发,也就是说,它是作为搜索的一种补充形式出现的。

搜索和信息流原本是两回事,前者是用户主动获取信息的行为,后者是被动行为。如果你还不理解信息流是什么,打开今日头条就知道了——一种以算法为基础,根据用户主动选择的喜好以及阅读习惯推送内容的信息产品。

不过,在如今的人工智能时代,这两种获取信息方式之间的区别和界限已经越来越模糊。

抛开冠冕堂皇的说法,对于百度来说,做信息流肯定绕不开今日头条。两者曾经在广告市场恶战——百度原本在国内广告市场地位一枝独秀,无人能敌,没想到冒出一个新的产品形态信息流,被逐渐分食了蛋糕。

百度决定反击。百度2016年Q1百度财报发布时,李彦宏首次提及“内容战略”;去年6月,百度正式在联盟峰会上启动“内容战略”、上线百家号平台,来自百度官方的说法是,李彦宏会每天关注手机百度信息流内容,随时反馈问题给手机百度内容团队。

图:百度宣布加入内容分发战团

到2016年第三季度,百度就正式推出了信息流产品。

百度也不避讳把今日头条当作竞争对手,今年1月《财经》在采访陆奇的稿件中写到,百度高层表示百度已直起对标今日头条,“一年内打趴它。”

从数据看来,百度似乎的确做到了。

从今年开始,百度开始在财报中披露信息流的数据,比如第一季度,手机百度信息流日活用户达到8300万,超越今日头条的7478万;

第二季度手机百度资讯流用户日活超过1亿,成为行业最大的信息流应用。

而根据今天公布的财报,第三季度的收入也再次超越了今日头条——百度信息流业务以第三季度业绩为基准的年化收入超过10亿美元。而根据市场调研公司86 Research分析师张雪茹(音译,Zhang Xueru)在今年5月的评估,今日头条去年的营收超过人民币60亿元(约合8.69亿美元)。

从用户基数遗迹变现能力几个关键维度来看,百度已经进入了信息流市场的第一阵营。而做到这一点,它只用了一年时间。

赛道抢跑

实际上,百度和今日头条的战争已经“打了起来”。最近有某锁具商家老板接受媒体采访称,其遭到今日头条销售人员威胁,如果继续在百度投放广告,而不在今日头条投放广告,销售团队将一起点击直到商家百度余额为负。

在广告市场,原本百度是“守城”,今日头条这样的新兴产品是“攻城”,但百度用了一年时间转“守”为“攻”,让今日头条不得不出下策。

除了今日头条,目前国内做信息流产品的还有一点资讯和天天快报。

根据最新披露的信息,这两者在二季度MAU分别达到1.8亿、7800万。除此之外,信息流赛道还有两大类玩家,比如微博,2015年底从社交转型信息流平台,2016年以来市值翻了近9倍;一类是从编辑驱动型的资讯App转型而来的,比如腾讯、网易、搜狐和凤凰等。

在信息流玩家中,百度算是入局比较晚的。但百度除了有原有的搜索入口助力外,还有一个重要的武器:人工智能。

图:陆奇在AI开发者大会的演讲

事实上,陆奇入驻百度之后,提出的施政纲领就是以信息流和人工智能为“主航道”。目前一条很清晰的路径是,人工智能作为一个产品,也是支持百度内部其他产品的基础技术,其中就包括信息流产品。

陆奇在财报中表示:“为了扎实推进AI相关战略业务,并提供更好的用户体验和更精准的客户价值定位,我们不遗余力的推动核心产品创新。”

数据也显示出人工智能这样的基础技术发挥出的作用。财报显示,百度第三季度流量获取成本(TAC)为25亿元(约合3.72亿美元),在总营收中所占比例为10.5%,这个数据在上年同期为14.2%,在上一季度为11.9%。

百度这样解释了他们的做法——

用AI算法能力和大数据,促进百度信息流核心算法的迭代HE 优化,促进了核心产品指标CTR和用户SAT的健康发展,简单来说,就是帮助个性化信息推荐进一步优化。

由于有AI为基础技术,百度也在尝试丰富信息流产品。例如,手机百度9.0版本单独为视频开了一个底栏按钮,该调整提升了短视频内容的权重和分发能力。而在其他关键领域,,比如UGC、体育、文化等新兴垂直行业,内容创新也有了更多探索,比如产出了动画、文字等不同类型的具有较强吸引力的内容。

一年之内刮骨疗伤

根据艾瑞咨询数据,2016年中国移动端信息流广告收入同比增长 89.5%,在整体广告类型的份额占比达到 11.2%,与此同时,搜索广告的份额从 31.2% 跌到了 26.4%。

也就是说,在一年之前,如果百度不转型,就只能眼睁睁看着市场流失。

百度转型的决心不可谓不大。

今年上半年,百度取消了新闻源,不再认为来自于新闻源网站的内容才是优质内容,而是综合评价百家号等内容生态的品质,让用户搜索关键词时,直接能找到来自百家号的优质内容。

这一举措直接改变了站长内容生态的利益格局,也就是说,百度直接把跟随了他们多年的盟友的关系切断了。

此后,百度尝试打破基于“超链接+点击”的传统排序模式,推出基于移动搜索的全新产品。超链接+点击正是李彦宏所提出的超链分析算法的应用,也是搜索引擎最基础的排序算法,这也意味着百度在彻底的颠覆自我。

而在看不到的底层销售层面,百度也放弃了原有市场,主推信息流广告——相比以上种种变革,这更像一场决绝的自我颠覆。

《好奇心日报》曾经采访到媒介代理公司安布思沛,去年年末时,百度就派人到他们公司为信息流广告产品进行了一轮新的培训。另一家代理公司华扬联众搜索表示,“百度今年所有的政策基本都以信息流广告为基础。比如我 2016 年只要完成一个大盘的量,就能拿到百度给我的所有利润和返点。但今年必须先完成信息流的指标。”

一年时间里,百度做到了转守为攻,进入到信息流产品第一阵列。现在来看,帮助其实现成功转身的原因主要有这些:

◆ 百度的信息流内容基于手机百度、贴吧和手机浏览器这三个亿级App分发,而这三个App的核心价值,本身就是帮助用户获取信息,因此百度信息流业务可以快速获取海量用户;

◆ 在内容层面,百度通过“百+计划”、“百亿分润”等等政策吸引了大量的创作者加入;

◆ 在变现层面,百度原有的百度联盟、百度中小广告主资源、广告销售体系等商业生态资源,也被导入到信息流上。

事实上,信息流本质就是内容分发,这正是百度能够后来居上的根本原因——内容分发正是百度的老本行。李彦宏曾经在今年初的内部信中指出:“内容分发是我们的核心,我们之所以能够存在,我们之所以很多业务能够做的起来,是因为我们有内容分发这样一个坚强的大盘。”

总的来说,百度在内容分发市场的表现还是非常值得期望。在视频成为分发重要形式的当下,百度还有爱奇艺这样的独家内容合作伙伴。

信息流市场的战争远未结束。