数据新闻何以重要?——数据新闻的发展、挑战及其前景
发布时间:2020-10-14 18:00:42 点击次数:222
在一些走在前沿的实践者手中,数据新闻是个强大的工具。它融合了电脑科学、统计学以及社会科学几十年来在大数据研究方面的成果。数据记者可以通过编写算法寻找趋势,勾勒出影响力、权力或消息源之间的关系图。在全球,数据新闻记者的数量在增加,他们所做的工作不仅限于数据可视化或者发布互动地图,他们正运用这些工具追踪腐败,向权势者问责。
关键词:数据新闻;APP;新闻传播;新闻记者;大数据;机器人记者;新闻业
作者简介:
【作者简介】郭恩强/华东政法大学科学研究院助理研究员,法学在站博士后。
在一些走在前沿的实践者手中,数据新闻是个强大的工具。它融合了电脑科学、统计学以及社会科学几十年来在大数据研究方面的成果。数据记者可以通过编写算法寻找趋势,勾勒出影响力、权力或消息源之间的关系图。在全球,数据新闻记者的数量在增加,他们所做的工作不仅限于数据可视化或者发布互动地图,他们正运用这些工具追踪腐败,向权势者问责。
2014年,数据新闻成为主流,诸如FiveThirtyEight.com网站 、Vox.com网站、《镜报》旗下的Appp3d.com网站、大西洋媒介集团(Atlantic Media Group)的QZ.com网站、《经济学人》和《卫报》的数据博客、《纽约时报》的Upshot都崭露头角,网络平台及实践的发展已经大大改变了这个领域。
APP是最重要的讲故事方式之一
今天,很多记者不仅将注意力放在为调查收集数据,更注意将数据与鲜活的故事或者新闻应用程序相结合。对于千禧一代来说,新闻应用程序(News APP)是最重要的讲故事的方式之一。
新闻应用程序和新闻编辑室分析,将成为媒介机构向移动用户发布信息方式中的核心要素。同时帮助媒介机构厘清谁是你的读者,在哪里、如何、何时成为你的读者,甚至为什么会成为你的读者这样的问题。 这两点对于成功的数字产业都不可少。在此背景下,新闻应用程序不仅仅讲故事,他们还讲述“你”的故事,比如帮助手机用户更好地理解周遭世界,从新闻、天气和交通,到棒球联赛的比赛成绩。
有时人们需要理解一个复杂的主题,但缺乏处理原始数据的相关能力。而新闻应用程序则可以让大量的数据变得有意义。比如,2014年5月ProPublica新闻网发布了一个有关治疗追踪的专题。他们的数据分析发现,2014年,在全美2亿人次的患者就诊中,只有4%是因为病情特别复杂,而被医生收取昂贵的医疗费的;但却有1800个医生成为收入排行榜上90%的时间内的名列前茅者。ProPublica网站的资深记者查尔斯·奥恩斯坦(Charles Ornstein)在邮件中披露:
专题花了我们很长时间。数据本身庞大而复杂。我们找了专家,好搞清楚比较哪些数据是最有意义的。我们寻找那些读者能够很快搞明白的数据。其中之一是每个病人接受的医疗保险服务,另外一个是每个病人支付的费用。我们同时也仔细研究并将病人就诊的频率当作参照,这个很有趣而且读者也容易明白。有些领域的医生,比如精神病科医生或者肿瘤科医生的接诊频率,比起同行们来说要高而且费用昂贵。但是在其他科目,医生们接诊的频率没有那么高,医生们的表现也各不相同。如果你发现,你的医生接诊病人比起一般同行要多得多或少得多,这并不代表一定有问题,但也会成为你的参考因素之一。
让我们的应用程序与众不同的是,它允许你将自己的医生与同一领域和地区的其他医生做比较。比如通过应用程序观察医生们是如何进行诊疗的(他们采取的医疗手段、他们诊治病人的百分比、病人的看病频率等)。
新闻应用程序可以让人们以另一种方式浏览数据,这是单靠简单的地图、统计数据或表格所办不到的。“设计数据时,可以使重要的数字比不重要的细节显得更大和更突出。”ProPublica网站主编助理斯科特·克莱因(Scott Klein)表示,“在浏览网页时,人们知道通过下拉方式来获得更多细节。在‘为公众’网站,我们通过设计引导读者来体验各种不同的注意力层级,从最宏观的全国性的例子到最本地化的例子”。
新闻应用程序的开发者,正越来越多地考虑以用户为中心进行设计。全国公共广播电台(NPR)视觉团队的编辑布瑞恩·博耶(Brian Boyer)对这一原则的解释是:
我们并不是从数据开始,也不是从技术开始来思考问题。我们所做的一切,都始于一个以用户为中心的设计流程。我们会讨论想要吸引的用户的需求,然后才讨论做什么和如何做。从好点子或是技术选项上开始也不错,不过我们尽量不这么做,而是关注于如何为特定的人群做出最好的产品,也就是那些最能从我们的数据产品中获益的人。
数据并不天然地意味着真实
与真人形式的消息源一样,不是所有数据都等同于事实。它们必须接受怀疑主义的检验,从来源到质量,再到是否有隐藏的偏见。TOW数字新闻研究中心的研究者尼克·蒂亚克普洛斯(Nick Diakopoulos)写道:“数据并不天然地意味着真实。是的,通过诚实的推理过程,我们可以在数据中找到真实,但是我们也可以找到多个真实,甚或是全然的虚假。”
如果新闻报道确实会随着时间推移变得更加科学,那它将使读者和整个社会受益。一个执行主编可能会提出新闻背后隐藏的线索或假设,然后指派一名调查记者去找出究竟是真是假。这名记者(或者数据编辑)必须去收集数据、证据和相关知识。为了向执行编辑和多疑的读者证明,他们所提供的结论是正确的,记者需要从数据来源到使用方式,全面展示他的工作。这也意味着记者需要接受怀疑主义的理念,避免确定性的偏见,同时对被观察的有关联的事物不轻易下结论。
西北大学人文与社科学院教授布瑞恩·基冈(Brian Keegan)在一篇文章中呼吁:“在当代,对于信息过载,以及恐惧、不确定性和怀疑等情绪的焦虑氛围下,数据驱动的新闻可以起到关键性的作用。它们可以为关于政策、经济趋势、社会变革的讨论提供更为坚实的经验基础。但是,除非新的行业领袖能仿效科学界的标准来设立和强化准则,否则数据驱动新闻很可能会掉入消解公众信任和科学界信任的陷阱。”对此,基冈为数据记者提出了几个有效的原则:开放数据、集思广益、开放合作以及数据监管。
数据新闻记者可以在代码托管网站分享他们的数据和代码,比如GitHub,以备同行们检阅、复制、扩充(ProPublica网和其他机构已经在这么干了)。记者们还可以与科学家和分析家合作,提出问题和共同分析数据,并写出文章或者专题。另外,记者还可以将作品提交学术同行进行评议。
做数据新闻的机构,应当让自己的分析和发现接受经验式的批评。将整理妥当的数据公布,或者找到合适的专家合作,这些都是十分费时的。不过如果你打算发布原创的实证研究,你就应该接受和回应合理的批评。
数据新闻机构也许会考虑任命独立的核查人员来代表公众利益,以及提升科学性规范。数据作品的作者很可能得出轻率的结论、使用不合适的方法、分析私人数据,甚至为了自己牟利。此核查职位的设立,就是为了对上述行为进行核查。
透明性很可能意味着新的客观性。在科学领域,不能被重复验证的研究和结果,是其真实性被怀疑的一个理由。基于严格审核过的数据而得出的经验性证据,将赋予编辑和记者这样的能力:他们将告别“这个人说,那个人又说”的报道方式,因为此种方式只会让读者疑惑真相究竟在哪里。