互联网云技术时代深刻地变革着我们的社会生活,移动互联网、物联网的海量信息将人类带入大数据时代。云技术、大数据同样也改变着传统新闻报道的呈现方式:一种可视化的、交互的新闻报道样式,被称之为数据新闻(Data Journalism)。数据新闻在一定程度上消解了传统新闻采集、写作、报道,甚至是传者与受者之间的疆界。海量新闻的抓取、挖掘、处理分析与可视化呈现,这个制作流程不仅需要传统新闻从业者的专业知识与实践经验,同时也离不开信息处理、计算科学以及其他专业领域的从业者通力协作。数据新闻带给新闻传播领域新的视界,引起国内外业界、学界的高度关注。文本将对数据新闻制作流程的类别特性做一梳理,以期为数据新闻教学与实践提供有益的思考。
一、数据新闻出现的背景
数据新闻的出现,与互联网云技术时代相伴相随,且与大数据紧密相联。云计算相当于硬件资源的虚拟化,而大数据则是海量数据的高效处理。如果把云计算比喻为计算机的操作系统、它将大量的硬件资源虚拟化后再进行分配使用的话,那么,大数据则是海量数据的“数据库”。前者如Amazon,为云计算提供了商业化的标准。后者如Google、facebook、Twitter等前沿互联网公司为人类带来了SQL(Structured Query Language,简称SQL。SQL语言是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统)的操作。技术的不断发展为数据新闻的发展提供了可能。就全球而言,欧美国家的一些主要媒体首先觉察出网络技术发展之于新闻报道的巨大影响,并迅速作出应对。《泰晤士报》《卫报》及《纽约时报》都已组成数据新闻团队,对一些重要新闻事件进行数据的深度挖掘与呈现。如《卫报》数字新闻部针对新闻选题搜集海量数据,过滤后,通过图表、互动效果图等可视化转换方式完成事件的新闻叙事。再如《纽约时报》在2007年成立互动新闻技术部(Interactive News Technologies Department)探索在线新闻报道。其利用美国总统大选、奥运会等重大新闻事件搜集海量信息、挖掘其中有价值的新闻线索,以互动图表的可视化方式呈现在《纽约时报》网站上。
2012年,由“全球编辑网络(Global Editors Network, GEN)”在全球评选“数据新闻奖”。这一奖项的设立为数据新闻的制作与普及树立了标杆。纵观其三年来的参赛及获奖作品,大多集中在欧美国家,反映出我国数据新闻与世界顶级媒体在数据新闻领域的差距,同时,也为我国数据新闻的发展起到某种示范作用,启发我们对数据新闻的探索与实践。
二、大数据背景下数据新闻的制作与呈现
如前所述,数据新闻与云技术、大数据之间有着十分密切的关系。有学者对大数据的特点归纳为4V,即多样性(Variety)、海量(Volume)、快速(Velocity)以及价值(Value)。大数据的总体架构共分为三层,数据存储、数据处理和数据分析。类型复杂的海量的数据存储依托云技术解决,数据新闻的快速和时效性有赖于数据处理层解决,最后,数据新闻的价值由数据分析和可视化呈现解决。数据新闻首先要解决存储问题,然后根据新闻事件的需要和目标价值建立起相应的数据模型和数据分析指标体系,对数据进行深层次挖掘,揭示数据所蕴含的宏观意义。由于计算机技术的飞速发展,可对数据进行并行计算和分步计算已成为可能,以保证新闻事件的时效性并通过可视化呈现出来。
(一)数据新闻的采集、处理与分析
数据新闻的生产过程包括了数据的采集、处理分析与呈现等几个环节的过程。大数据时代产生海量的即时数据,对数据抓取、挖掘与处理提出了很高的技术要求。数据新闻制作依据一定的报道意图,把存储在云端的大数据挖掘出来,再结合编辑记者的新闻理念对数据进行处理分析。这不仅要求传统的新闻从业者具有从纷繁复杂的大数据中对有价值的新闻事件的敏感与“嗅觉”,即所谓“新闻鼻”或“新闻眼”,而且也要求其具备基本的数据分析与处理能力,它同时也为与信息处理、计算科学等专业领域人士进行协作提供了平台。当面临海量、复杂的大数据时,寻求与专业人士的合作,组建数据新闻团队更能提高数据新闻报道的质量和效率。
较早开始数据新闻实践的一些世界顶级媒体,也正是以这样的理念进行数据新闻的实践操作的。芝加哥论坛报的APP制作小组自称为“潜入新闻编辑部的快乐黑客”,他们的工作包括:“与编辑和记者密切合作,帮助他们1.调查和报道故事;2.在线描绘故事;3.为芝加哥当地的特定群体建立永久的网络资源。最重要的一点是我们就在编辑部里工作,常常能在与记者面对面交谈中找到我们需要做的东西。”在这些世界顶级媒体,雇佣类似的“黑客”进行数据的采集已不再新鲜。黑客能够熟练利用互联网络技术,根据记者的需求编写有针对性的工具软件,抓取记者想要采集的网络数据,或者对大量文本资料进行数据化转换,以便记者处理分析。
BBC的数据新闻团队也是包括由记者编辑、设计师、研发人员在内的人员组成,这样的团队包揽着复杂的数据新闻制作。记者编辑提供设计建议,技术人员提供技术支持和建议,合作完成数据的采集与分析处理。ABC(澳洲广播集团)的团队成员都包括:一位网页开发及设计人员、一位主编记者、一位制作人顾问、一位长于数据采集分析与整理的兼职研究员、一位专长于数据挖掘与图形可视化以及其他技术的皇冠9393体育平台顾问、一位项目经理以及ABC跨媒体平台部门的行政支持,尤为重要的是,还有一支由记者及相关人员组成的顾问团队。这支团队从政府网站和公开报告的数据中汲取灵感,并让记者编辑与技术顾问在一起工作,以便及时交流沟通各自的思想。记者编辑、技术专家、数据专家一起对数据的处理分析提出建议,面对海量数据快速反应,通过合作对数据进行专业分析,并从中发现新闻报道的线索和故事。新闻记者与数据专家这两个过去没有交集的职业,在ABC的办公室里逐渐融合,共同完成数据新闻的跨领域制作。对数据采集、处理和分析的跨域合作,不仅更好地实现了大数据的采集挖掘,也促进了数据处理分析专业性与新闻性的结合。
(二)数据新闻的呈现
大数据不仅提供了多样性、海量、快速变化的信息,更重要的是提供了隐含在这些信息背后的价值。数据新闻通过对信息的采集与分析,能够挖掘出信息背后的有价值的事件线索。但如何传播这些信息,如何在新闻呈现时体现信息的价值,是数据新闻制作必须解决的难题。在尝试数据新闻的起始阶段,媒体直接将文字新闻的页面链接到APP,但这样的做法并没能带来访问量的大幅提升。于是数据新闻开始尝试将文字新闻向可视化新闻样式的拓展,利用可视化的呈现方式帮助受众理解数据,解读数据所蕴含的价值。并在大数据的基础上,试图让读者从数据中发现自己的故事。英国《卫报》是研发数据新闻较早的媒体,在其数据新闻博客(Guardian Datablog)上,《卫报》分享着新闻报道背后完整制作故事,包括数据采集、数据的可视化分析作品、以及一些以公共数据为基础的搜索引擎。受众通过个性化的搜索,寻找数据中的自己,加深对数据的理解和情感联系。然而,《卫报》并未就此停步,而是以这些数据和可视化作品为基础,继续进行数据挖掘探索,并将其编辑成一系列的新闻故事和深度报道,充分开发数据所蕴含的价值。相比于传统媒体直接将原始统计数据呈现给公众而言,数据新闻呈现更侧重于对数据的意义提供解释,呈现数据的价值。《卫报》西蒙?罗杰斯(Simon Rogers)曾举例说明数据新闻可视化的有效呈现方式,“当英国首相声称2011年8月发生的暴乱与贫困无关时,我们在有贫困指数的地图上标注了骚乱者的地址,以此来揭示这份声明背后的真相。”
通过海量数据的呈现来反映新闻的内在价值,需要的不仅是可视化的技术手段,更重要的是指导数据分析与呈现的新闻理念和编辑思想。不同的新闻理念,反映在可从数据中发现不同的新闻价值。《纽约时报》的可视化作品《重塑纽约(Reshaping New York)》展示了12年来纽约城市的变迁,从房屋建筑到区域划分,再到各区房价、物价及教育水平等资源的流变。报道既客观平静地展示了纽约的变化,又让这些立体的图景以无声的语言一一道出了彼时最具争议的市长布隆伯格在任12年来对纽约城市所做的工作。变化的图表展现了纽约市貌的改进,却没有体现这些改变对普通居民带来的困扰;经济指标表现了纽约经济水平的提升,却回避了高房价逼走的本土居民。数据的呈现方式给新闻披上了貌似客观公正的外衣,却遮掩了背后的事实真相。通过不同编辑理念的新闻思维和不同呈现方式的选择,可以体现出事件背后不同的内在价值。数据是会说谎的,在海量、即时的大数据面前,挖掘出数据背后的真正价值,仍然需要专业的新闻理念和编辑思想的支撑。