数据新闻内容运营的新风口

做运营的都知道,现在内容越来越难做。这个问题可能在SaaS初创企业中尤其明显,由于成本预算的问题,企业往往希望通过inbounding的方式解决一切问题,但却发现越来越难。主要卡在以下这几点:1、一窝蜂追同一波热点;2、用同一种姿势蹭热点;3、表情包是同批生产的就罢了;4、连梗都是同卵多胞胎。总结说来,就是内容同质化越来越严重。这得“怪”李叫兽、三节课、关健明等营销大咖们了,他们总结出的“套路”,让内容实现量产。可怕的是,当所有内容都一样的时候,消费者不但很容易对单个的内容生产者产生疲劳,甚至会厌倦“内容”这种形式本身。于是,文字热过一波,表情包热过一波,一图到底热过一波,直播/视频正热着,但终有一天要凉,眼见着各渠道阅读量越来越低,文章底下的评论越来越少,大家连收藏都懒得收藏了,下一个“内容运营”的风口在哪儿?让我来大胆预测一波,接下来的世界,属于数据新闻(Data Journalism)。

什么是数据新闻?

简而言之,数据新闻就是“用数据处理的新闻”。[ 《The Data Journalism Handbook》]也可以理解为“以计算机辅助的新闻报道”(Computer-Assisted Reporting)。跟一般的新闻报道不同,在数据新闻中,观点通常由数据支撑、以数据可视化的形式来展示。经典案例包括拉斯维加斯太阳报对医院治疗拒绝伤害的报道、美联社的伊拉克战争记录报道等。以太阳报为例:

这系列报道通过分析超过29万条医院帐单纪录,揭示了3600件以上可避免的损伤、传染和手术医疗事故。除了精妙的叙事技巧之外,还运用了各种数据元素,包括医院手术损伤情况的可交互图表、医院间疾病传染情况的时间轴等,读者可以在网站上探索这些图表,深入了解真相,并进行传播。而这个报道的影响力也是巨大的——最终,内华达州立法会就此颁布了六条法规。

为什么是“数据新闻”?

太阳报的“拒绝伤害”只是诸多经典数据新闻的案例之一。但从这里案例之中,我们或可发觉“数据新闻”在众形式之中的独特之处:1、效率更高:比起从诸位目击者的口述、博客文章中搜寻蛛丝马迹,然后拿着放大镜与纸笔一层层接近真相的“慢”,通过对全量数据进行分析,可以快速构建出故事的轮廓,并发现崭新的视角。2、说服力更强:人们向来坚信“口说无凭”以及“公说公有理、婆说婆有理”。在这种情况下,从真实、公开的数据中挖掘出的真相,比采访100个医生与病患来得更让人信服。3、理解成本降低、趣味性升高:通过精美的可视化图表,读者可以轻松理解文章的主旨,甚至在交互中自行探索数据,在新闻中完成“沉浸式体验“。4、增添专业感与高级感:最后,表情包人人会扔,机灵人人可抖,但数据可不是人人都能玩儿得转。

基于“You are what you 赞“、“You are what you 转”理论(小观瞎编,如有同感,握握小手),再加上大数据时代,人人口不离数据,数据新闻必将成为内容运营的下一个战场。能以“数据新闻”的姿势蹭热点、甚至造热点者,胜!

如何炮制数据新闻

“数据可以是数据新闻的来源,也可以是讲述新闻故事的工具,还可以两者兼具。”英国著名记者、数据新闻博客Online Journalism Blog博主Paul Bradshaw如是说。需要注意的是,因为我们不是新闻机构,而是企业的内容运营部门,我们只是借助“数据新闻”这一形式,去传播我们想传播的内容,所以更精确地说来,我们炮制的是“伪数据新闻”或“半数据新闻”(在此对真正奋战在数据新闻前线的英雄们道一声“失敬”)——Never Mind,无论叫什么名字,应有的一些基础数据知识,还是需要配备的。下面,我就从“数据获取数据处理数据可视化提取洞察并形成文章”四个步骤来简单说明一下,如何炮制一篇数据新闻。

(一)、数据获取

先说比较难的外部数据。尽管数据不容易找,但实际上很多数据库都已经被搜索引擎收录了,如何快速地把它们“揪”出来呢?试试精确搜索。以谷歌为例:直击filetype:假如你只想搜索电子表格,可以使用关键词+“filetype:xls”或“filetype:csv”。假如只想搜索数据库提取的文件,则可以使用关键词+“filetype:MDB,filetype:SQL,filetype:DB”。以此类推。直捣site:通过“site:agency.gov Database Listing”搜索该网站可提供批量数据的位置。当然,如果你是运营中的技术高手,可以试试“爬数据”。自己不会写爬虫的话,还可以选择比较自助式的工具,比如八爪鱼、火车采集器等。那么,有没有已经整理好的数据来源呢?当然也有,文末会以附件的形式给到大家。当然,需要注意的是,即便是“伪数据新闻”,也应当注重真实性、客观性与时效性。所以,日常看看真的新闻,然后从里面提取自己的内容灵感(并思考是否能与本品牌完美嫁接),变成关键词去搜索相关数据,如果能够找到,真可谓是当天的“小确幸”了。

(二)、数据处理

在我们刚刚接触“数据新闻”的时候,经常会被其中各种美轮美奂的图表所吸引,所以我们会理所当然地认为“可视化”是“数据新闻”的重头戏。错了么?没错。在最后的呈现当中,可视化当然非常抢镜。但实际上,如果你把全部时间中的70%拿出来保障图表炫酷,那么最后的结果可能会招致各种质疑。《Data at Work》一书的作者Jorge Camoes在一次演讲中,建议大家把70%的时间用来减少错误、构建数据、确保概念正确等工作上。试想,如果太阳报的医院数据分析错误,那么它的报道就会成为诬陷,而不会推动立法!在对数据进行处理之前,你至少需要知道以下两个关键点:数据通常是不规范的,在使用之前需要进行清洗;清洗后的数据可能不会完全干净,有时候需要反复清洗;干净的数据也不能直接就用,如果需要与其它数据关联,还需要注意统一数据粒度等问题。

作为运营我们不可能花费大量时间学习《数据清洗:三个月从开始到放弃》,那么可以利用的就是自助式的数据处理工具,也就是online ETL 。ETL是{Extract-抽取;Transformation-转换;Load-载入}的缩写,把原始数据从各种数据源中抽取出来,然后经过各种转换,载入到数据仓库或是数据中心或是可以分析、交互的平台当中。

就是这样啦,鼠标拖拽即可完成各种处理工作,成本低效率高,是最推荐运营们学习的数据处理工具。

(三)、数据可视化

终于到了可视化的环节。关于这一部分,可以讲的太多。在PMCAFF中我也写过几篇文章,大家可以按图索骥:1、干货丨最全的数据分析图表说明,看这一篇就够了2、进阶丨如何让你的数据分析更加简洁专业印象非常深刻的一篇真正的数据新闻,是财新传媒数据可视化实验室出品的一篇报道,它以互动页面的形式清晰展现事件中千丝万缕的关系网,点击量超过400万,获得了亚洲出版业协会颁发的“卓越网络新闻奖”优秀奖、世界新闻设计协会多媒体设计奖特稿(单一报道)优秀奖等,被认为是中国数据新闻的代表性作品。而在一篇采访中,该作品的创作者称,这篇数据新闻整整耗时3个月。作为一个运营,肯定是不会拿出3个月的时间去酝酿一篇单一报道的。我们做“伪数据新闻”,借数据的光蹭新闻的势,所图不过是要做第一批发声中最专业、最专业里面最有态度的那个。快速、专业、酷——需要工具的帮助。

同样借助鼠标拖拽,实现三步飞速出图,并可将图表制作成文图并茂、可以交互的数据故事,比如说:

(四)、提取洞察并形成文章

最后,从数据中提取洞察,找到与本品牌的结合点,并形成文章。

数据观,一站式商业分析平台。让数据说话,让商业智能。