数据新闻的制作流程
《数据新闻手册》将数据新闻的制作 分 为 三 个 流 程 :获 取 数 据(GettingData)、理解数据(Understanding Data)和传达数据(Deliver Data)。获取数据是制作数据新闻的第一步。记者编辑可以通过在互联网或社交媒体上设置关键词来搜索公共数据源,也可以向一些政府等机构申请,要求开放数据。现在越来越多的国家都开设了数据门户网站。除了查找公开的数据,电脑程序员还可以利用专门的抓取工具抓取网页上的数据。
理解数据是对获得的数据进行处理和可视化的过程。数据团队需要将获得的数据进行过滤和筛选,剔除无效数据,保留有用信息。有时还需要重组数据以便深入挖掘数据中隐含的新闻故事。关系、情感、空间、行为都可以成为挖掘的潜在对象。理解数据是制作数据新闻非常关键的一个环节。理解数据的过程即分析数据,就是呈现新闻故事的过程。而数据可视化又是展示数据的最强大方式,它可以清晰地向用户展示某一抽象数字代表的直观意义。《数据新闻手册》列出了一些数据可视化和数据处理的工具 :
电子表格,如 LibreOffice、Excel 或 Google 文档 ;
统计编程架构,如 R(r-project.org) 或 Pandas(pandas.pydata.org);
地 理 信 息 系 统(GIS), 如Quantum GIS、ArcGIS 和 GRASS ;
可视化程序包,如 d3.js(mbostock.github.com/d3)、Prefuse(prefuse.org);
数 据 加 工 工 具, 如Google Refine、Datawrangler ;
非编程可视化软件,如 ManyEyes 和 TableauPublic。
传达数据是制作数据新闻的最后一个环节。数据新闻团队会将可视化数据以多种形式向用户开放。用户可以下载原始数据,参与互动评论,甚至参与制作数据新闻。
数据新闻在国内外新闻媒体的实践
国外很多知名媒体开展了数据新闻业务,包括《卫报》、澳大利亚广播公司(ABC)、英国广播公司 (BBC) 和《芝加哥邮报》等。
《卫报》是英国的第二大全国性报纸,在传统媒体拥抱新技术方面也是为业界所公认的先锋。它属于最早一批涉及数据新闻领域的传统媒体,在两年前就开设了数据博客(Datablog),现在又在其网站上设置了专门的数据频道(DataStore)。《卫报》的数据博客包括一个首页、全国和全球范围的发展数据引擎、网络上和《卫报》的数据视觉化作品,以及探索公共开支数据的工具。他们使用 Google Spreadsheets 来分享完整的数据,分析这些数据并使其能够以可视化的方式呈现。之后,他们利用这些数据为报纸和网站提供新闻故事。澳大利亚广播公司在 2011 年 11 月 24 日推出了他们的首个数据新闻专题“数字上的煤层气”。这个专题由 5 个页面的互动式地图、可视化数据和文本组成。此外,其他一些国外媒体也开始进行数据新闻报道的实践。
国内新闻网站、电视和传统纸媒也纷纷开始数据新闻报道的尝试。搜狐“数字之道”自 2011 年 5 月开始推出第一期数据新闻。网易“数读”、新浪“图解天下”和腾讯网的“数据控”也都从2012 年开始了数据新闻报道专题。这几大门户网站的数据新闻专题形式各不相同,有的以新闻导语和图片组成,有的是以图表模块和文字模块相结合的方式,还有的是纯图表新闻。它们的共同点是仅仅简单地将数字用图表展示出来,并未发掘其中隐含的新闻故事。数据新闻是基于大量数据挖掘与分析生产出来的新闻,通常是用图表等形式,最主要的还是对一系列简要事实做相关性展示,揭示数据背后隐藏的含义。因而,这几大门户网站的图表新闻严格来说并不能算是真正意义上的数据新闻。
今年春节前夕,央视新闻频道推出了一个新节目《据说春运》。央视借助百度大数据来解说春运,“百度迁徙”对其拥有的 LBS(基于地理位置的服务)大数据进行计算分析,并采用创新的可视化呈现方式,全程、动态、即时、直观地展现中国春节前后人口大迁徙的轨迹与特征。
在 2014 年 3 月的两会报道中,数据新闻大放异彩。尤其是在国务院总理李克强答中外记者问时,人民网呈现了总理答中外记者问的实时舆情展示专题。人民网的技术支持合作团队在李克强总理答记者问时,抓取网友对问题的评论,对评论文本进行处理分析,采用分词技术,并进行词频统计,提取关键词,最后生成词云图。用可视化方式展现总理答记者问时互联网网民的实时舆情动态。随着时间的变化,网友评论关键词的词云也在改变。
数据新闻的创新价值
通过以上的分析,我们看到,相较于传统的新闻报道,数据新闻在很多方面展现了创新性。
1. 颠覆了传统的新闻生产方式。大数据时代的数据新闻颠覆了传统新闻的生产方式,无论是新闻素材的获取,还是新闻的编辑加工与呈现都发生了巨大的变化。传统的新闻生产方式中,记者通过采访搜集第一手资料,将其编辑整理,撰写新闻报道进行发布。而数据新闻报道一般由一个团队来打造。处理的素材也由采访稿转换成数据,团队中既有处理文字的编辑记者,也有负责挖掘数据、分析数据的工程师,还有擅长数据可视化的工作人员。数据新闻团队借助计算机软件,可以从众多的数据中发掘新闻角度,编辑新闻并将其可视化。
2. 提升了报道的广度和深度。数据新闻的本质还是新闻。《数据新闻手册》提到 :数据新闻从数据开始,以故事结尾。这里的故事,应该是新闻故事,有新闻价值的故事。借助于计算机辅助工具,数据新闻团队可以从海量的数据中发现故事,寻找出对公众对社会有意义的新闻。大数据重相关轻因果,数据分析的结果可以呈现多个事件的相关性,甚至有时是违背常规逻辑的。传统“单枪匹马”的记者工作模式是难以实现的。而对数据的多角度分析和解读,提升了新闻报道的广度和深度。
3. 更重视用户体验。数据新闻通过可视化报道,将复杂晦涩的数字转化为简单明了的图表,便于用户理解,新闻的传播效果更突出。数据新闻呈现数据的方式,有统计图表、时间轴、信息图、数据地图和动画视频等。数据新闻还可以设计交互式界面,便于与用户互动。用户可以投票、评论,甚至下载原始数据,直接参与新闻的制作过程。这样可以提升用户的参与程度,使新闻更真实,丰富新闻的内容与层次。