大数据:融合新闻生产中的“金矿”
《大数据时代》作者、英国牛津大学网络学院互联网研究所教授维克托•迈 尔-舍恩伯格(Viktor Mayer-Schonberger)在接受《文汇报》专访时说:“大数据” 的存在“已经不仅仅是一种炒作或者什么宏大的宣言了,而将实实在在地改变我们的工作、生活以及整个社会”。“大数据时代的巨大资源是未来时代的金矿,那些拥有这些数据资源的人获得的回报将是不可想象的。” 新闻传播学者和新闻媒介业者也看到了大数据金色的光芒,并积极思考如何充分挖掘大数据背后潜 藏的巨大新闻价值和经济价值,探索作为新闻生产者又需要具备怎样的智慧与 能力,大数据推进新闻生产变革的号角已经吹响。
一、数据挖掘将让新闻更简明
“大数据”之所以称为“大”,是因为其海量的数据已经大大超出目前软硬件 环境的处理能力。事实上,处理大数据的瓶颈不仅仅是数字化技术的软硬件水 平,而在于人自身。牛津大学进化人类学教授罗宾•邓巴(Robin Dunbar)的“邓 巴数字定律”即150定律(Rule Of 150)认为:人的大脑新皮层大小有限,提供的 认知能力也是有限的,即便数字化的技术可以让你在社交网络中拥有无限数量 的好友和“粉丝”,但最终你能够建立频繁交流的也就是在150人(实为148人) 左右,而这其中能建立亲密关系的更是只有寥寥数人。人们感慨,社交网络给了我们联系,却未必给我们交流;拉近了我们的距离,却未必增加我们的亲密;激发了我们社交的天性,却可能磨平了我们沟通的能力。社交的幸福感来自社交的质量而不是数量,来自于沟通的深度而不是频率。小心,莫让技术令你的人际关系变得越来越扁平和肤浅。因为,再先进的传播技术也很难突破人类本身的生理瓶颈。大数据更是如此,庞大的数据量显然早已超出了人脑处理的能力,它最终的价值需要通过计算机进行挖掘、分析和深度解读,并形成相对简单直接的形式让人们得以接受和理解。对于新闻生产而言,这意味着新闻生产者必须将复杂的数据简单化、庞杂的事项简洁化,而且越简明越好。简明的新闻可能会失去微观层面上的精确度,但能获得宏观层面上的洞察力。
为了实现将大数据简单或简明的要求,数据挖掘(Data Mining)的概念便被提了出来。海量的大数据不易被人们所直接利用,而数据挖掘正是一个将“冰冷数据信息人性化”的过程,也是一个把“数据分析的范围从‘已知’扩大到4未知’, 从4过去’推向‘将来’”的过程。在这个过程中,需要经历从数据准备、数据理 解、模型建立、模型评估、最终得出结果的一系列步骤,而完成这些步骤需要的不 仅是庞大数据量,更需要专业化的数据分析方法和掌握这些方法的数据管理和 分析专家。这在媒介融合和大数据时代,对媒体从业者的能力提出了更大的挑 战,或者意味着今后的融合新闻报道需要有数据分析专家参与或信息挖掘公司 辅助。西方新闻媒体已经在试图突破这种技术上的难题。譬如,“2007年4月路透社就以2500万美金的价格收购了著名的文本信息挖掘公司ClearFor- est”®,通过收购并利用其资源来弥补媒体自身在搜索引擎和数据挖掘方面的不足。
二、让新闻可视化和图表化
建立在大数据基础上的融合新闻作品不仅要简明化和人性化,而且要可视化(Data Visualization)和图表化。数据可视化和图表化可以被追溯到20世纪50年代的计算机图形学,当时人们便开始利用计算机创建了首批图形、图表。 如今随着人类数据规模的不断膨胀,以及数据复杂性程度的不断增强,数据可视 化和图表化变得十分必要。
数据可视化和图表化作为一种信息技术,“其主要目标就是信息沟通,通过将数据设计成为功能与审美并重的图形、图像、地图、动画等形式,让信息的沟通交流更为直观、清晰和高效”®。“生理学也证明,人的大脑皮层当中,有40%是视觉反应区,人类的神经系统天生就对图像化信息最为敏感。而数据可视化的技术,可以通过图像在逻辑思维的基础上进一步激发人的形象思维和空间想象力,吸引、帮助用户洞察数据之间隐藏的关系和规律。”
融合新闻生产也是一种传播者和受众之间信息沟通交流的过程,要让具有大数据特点的新闻信息在这一过程当中清晰、流畅地传递,数据可视化和图表化显然是一个最有效的途径,而融合新闻产品更是为数据可视化和图表化提供了空间和可能。譬如,2010年7月19日《华盛顿邮报》制作的“美国绝 密”(Top Secret America)报道专题,就是数字可视化和图表化的典型例子》 “两位调査记者用了两年多时间,对数百个现任及前任军事、情报官员、政府机构工作人员等进行采访调査,在绘图专家、数据研究员、摄影记者、图表设计者的协作下,用融合报道的形式将美国自‘9 • 11’事件以来的国防和情报系统公之于众。”
在“美国绝密”专题的页面,我们可以看到网站的设计人员通过视频、动画、地图、图表等多种可视化方式的结合将庞大的数据转变成为网站用户可以直观了解的可视化信息,甚至这些信息还具有互动功能,用户可以根据兴趣输入邮编或点击地图获取自己想了解的地区的情况。
清华大学陈昌凤、刘少华也举例说明:彭博社的大数据挖掘类报道栏目“今日图表”(Chart of the Day)就是通过图表和简单的事实而非说教来阐明道理,是彭博新闻“show, don't tell”理念的体现,是一种“简单而优雅的呈现观点以及 点燃想象力的”方式。
图7-2彭博社“今日图表”(Chart of the Day)页面
三、以关联思维创新新闻生产
如果说人们看待数据的方式正在由局部数据转向全部数据、由纯净数据转向凌乱数据,那么现在正在由数据的因果关系转向数据的相关联系。这意味着世界即将告别总是试图了解世界运转方式背后深层原因的态度,向仅仅需要弄清数据之间的关联,以及利用这些关联信息来解决问题、预测未来的方向转变。
因果关系的思维方式是人类长期社会经验积累所形成的一种认识世界的方法。我们习惯性地将所有的问题用因果关系来解释.无论是打雷下雨的天气变化,或者是金融市场的风起云涌,甚至自己突如其来的情绪变化,我们都希望能够找到这些事情的前后因果。事实上,人类长期以来对于因果关系的执着,并不是无理由的,这种快速的思维模式可以帮助人们在短时间内做出判断,并采取行动,这也确实推动了人类社会的发展和进步,帮助我们在关键时刻驱灾避祸、化险为夷。
在新闻生产中执着于探讨事物的因果关系也是人类的天性使然。我们追求新闻报道的完整性,这种完整性不仅要求新闻元素5W缺一不可,而且要求新闻事件有前因后果的逻辑性和连贯性,甚至希望有追踪报道或后续报道;我们追求新闻报道的深度,这种深度不仅是新闻事件不同方式和角度上的立体覆盖,更是对新闻事件前因后果的不断挖掘和深化.人们还希望知道新闻为何发生和未来将产生什么后果。但是,这些因果关系是否真的存在呢?
《大数据时代》的作者则认为.人类通过因果关系了解世界的方式正在被大数据所改变。“在小数据时代,很难证明由直觉而来的因果联系是错误的。将来,大数据之间的相关关系,将经常会用来证明直觉的因果联系是错误的。最终也能表明,统计关系也不蕴含多少真实的因果关系。”®作者所说的“相关关系”, 也就是以关联物的方式帮助我们认识事物和分析现象,通过找到一些现象的良好关联物来捕捉现在和预测未来。而我们现在所拥有的如此庞大的数据量恰好可以使我们的关联性分析变得更准确、更快捷,且更不易受到主观偏见的影响。
大数据的关联思维方式对人类的思维方式有着颠覆性的影响,也使传统新闻生产可以突破固有因果思维的束缚,以一种关联的视角重新审视社会。并不是每一个新闻事件都可以用因果关系来解释,也并不是每一组看似正确的因果关系就真是可靠的。新闻生产中经常出现的错误就是把没有因果关系的两者胡乱地搭配在一起,或者是将复杂的非线性关系简单地归纳为线性的因果关系,甚至在金融报道中经常出现的是勉强为之的倒推式因果解释。新闻生产似乎已经习惯于建立这种简单的因果联系:小悦悦事件是因为公众的冷漠、道德的滑坡,地沟油是因为商家的逐利、道德的沦落,贪污受贿也是因为官员的素质太低和道德水准不高,于是最终的解决途径就都变成了极为简单的加强道德教育和法制建设。但是,在很多情况下,实际情况与常识往往正好相反,或者根本没有因果关系。例如,人们的收人水平与幸福感并不是一个正比的关系,感冒也未必就是 因为受凉,用餐后生病不一定是食物问题。
强调时间、历史和因果关系的传统观念正在受到挑战,而推崇空间、现状和相关联系的新型观念正在逐步占据上风。知识的占有曾经意味着对时间、历史和因果之间关系的洞察和了解,如今知悉知识的存贮空间、发展现状并能预言知识的未来趋势则显得尤为重要。融合新闻生产需要有一种大数据时代下开放与关联的思维理念,要真正致力于揭示社会现象中的复杂关系,不能一味追求或迷信所谓的因果联系。
四、以精准测算生产媒介个性化产品
传统的大众化的新闻生产是一种集中的和粗放的生产方式,新闻媒体在 “车间”以标准化的形式生产新闻产品,再通过特定渠道和媒介向所有人传递和发送,产品内容缺乏针对性和精确性。媒介也是被迫无奈的,因为受众不仅数量众多、成分复杂,而且流动不居、分布广泛、需求各异,甚至那些基本的受众信息在数字化技术发展之前都是隐匿不明的。传统的受众分析方法采用的都是抽样式的调查方法,这种抽样式的调查方法有赖于样本数的大小,如果没有足够的样本数其结果显然也无法体现整体受众市场的真实情况。与此同时,受众抽样调查的方式“更多地关注‘受众’语境下的独立的媒介使用习惯(如阅读、收看、点击 等),而忽视了用户的综合行为习惯以及这些习惯对他们的媒介使用的影响” 。 因此,没有大样本的抽取,没有全方位的调査,媒介根本无从知晓受众到底是怎样的一群人,他们到底又需要些什么。而受众也只是被动接受各种各样并不一定需要的信息.随时随地受到各种信息的“轰炸”,个人十分有限的注意力被各种碎片化的内容“瓜分”。
从营销传播的角度来看,受众分析中媒介企业和一般企业一样试图建立的是受众的“360度视图”。所谓“360度视图”就是指各部门将客户的数据库信息集合成为一个整体,形成一个更为庞大的客户数据库系统。在这个系统中,客户不再是一个模糊的群体,而是一个个独立的个体,他们有自己的1D、姓名、地址、年龄、家庭、收人情况等。在此基础上,企业还不断地将客户的消费时间、地点、 产品、数量、金额、消费频率、消费种类、消费范围等信息存人其中,甚至也包括客 户的消费行为、兴趣爱好等信息,使原有的数据量急剧膨胀,很快爆发性地生成 为大数据群,于是企业可以通过对大数据群的深人挖掘,更深层次地理解客户行 为和消费趋势,使企业不仅能够对每一个客户做到了如指掌,而且对企业生产的 现状和趋势也心中有数。
这样的客户信息收集工作,不少企业早在几十年前就已经开始。譬如,五星级酒店往往会仔细地记录一些VIP客户的生日、兴趣爱好、特殊要求等。但由于数据存储和处理技术的限制,这些工作还处在较低水平。也就是说.在小数据时代,企业存贮的数据其实无法真正满足建立和分析所有用户的“360度视图”。 但在大数据时代则可能完全不同。首先,大数据的采集本身就不是一种样本的抽取和选择.而是无遗漏、全覆盖的数据采集。其次,大数据的采集是24小时全方位、全天候的,尤其是移动智能终端的普及及GPS等定位技术的应用,使得数据追踪和地理信息、位置信息的采集成为可能。
在大数据时代.媒体要建立这样的受众“360度视图”其实更为容易,因为媒介中所有的信息都是数字化的,受众在进行新媒体和网络阅读、浏览时必然会留下他们的足迹。每一位受众有固定的IP地址,计算机通过cookie等技术手段可以精心、细致地记录下受众所有的使用行为。譬如,选择在什么时间上网、上了哪些网站、浏览了哪些信息、下载的是什么内容、对哪些信息有特别的兴趣爱好、 如何评论和转发、如何消费时间等。对这些大数据的存储和分析,将使得媒体生 产的产品和提供的服务更有针对性、更加精准化和个性化,能够选择最适合的时 间、在最适合的空间更准确地向受众推送出最符合其需求的信息内容。
相关试题
判断题 新媒体下一代的研究方向大体上包括智慧媒体、环境媒体、自然媒体。
判断题 通讯重于叙述、描写;
判断题 新闻传播相正确于公共关系活动中的各种传播形式有其自身的特征,其第一特征就是免费性。
判断题 采访有哪几个阶段,每个阶段又应该注意哪些事项或技巧?新闻采访活动是一个系统工程,一般分为第一阶段、第二阶段、第三阶段,通常也称为采访前期、采访中期和采访后期。(1)采访的第一阶段,即采访的策划与准备阶段,这一阶段的步骤是:确立报道思想、获取新闻线索、进行采访准备、明晰对方心理、创造访问条件。①报道思想是新闻报道的目的以及为实现这一目的的内容、范围、方法。报道思想是编辑部根据党在一个时期内有关的宣传报道方针、政策而制定的新闻报道所要达到的目的和要达到目的的方式和方法的大体框架。其中既体现包含了新闻从业人员以往工作经验和教训的科学总结,又在正确揭示宏观事物的基础上,给采编人员指出了今后采写新闻报道如何克服盲目性、明确目的性指明了大致方向。新闻采访目的受报道思想制约并朋务于报道思想;报道思想要符合客观实际。②新闻线索是新近发生事实的简明信息和信号。新闻线索不等于完整的新闻事实,不能现成地拿来构成新闻报道。它比较简略,没有细节,只是一个片段和概况,是事物的个别属性在记者头脑中的反映。新闻线索的获取在新闻采访过程中对于报道思想的确立和进行采访准备之间。新闻线索是决策的基础,获取较多的新闻线索能有助于选择方案的最优化。新闻线索的作用是,可以为记者指明到哪里采访、采访什么的大体方向和范围,给记者提供了想知直至认识整个事物的前提和基础。获取新闻线索的主要渠道包括:从党和政府的政策、决议以及主要负责同志的活动、讲话中获取;从会议、简报中获取;通过记者的耳闻目睹获取;通过记者的日常情况的积累获取;通过受众、亲友提供新闻线索。获取新闻线索应该注意四点:注义验证,不要顺藤摸瓜;尊重规律,不要拔苗助长;讲究时宜,不要大材小用;合理安排,不要齐头并进。③采访准备包括平时准备和临时准备。平时准备包括:理论的准备;政策的准备;情况的准备;知识的准备。知识准备的好处是:有助于同采访对象迅速有效地展开交谈;有助于敏锐捕捉有价值的新闻事实;有助于深刻揭示新闻主题。临时准备包括:搜集新闻事实的有关材料,打有准备之仗;熟悉和研究采访对象的基本情况,找准理论依据;拟定采访计划和调查纲目;检查有关物货的完备情况。④记者掌握采访对象的被访问心理,可使访问准备工作做得更有针对性和更趋完善。采访对象的访前心理包括先期性心理和临访性心理。先期性心理指采访对象对新闻事业、新闻单位、新闻记者以及新闻采访活动的观念。这是采访对象访前心理活动的基础。一般情况下,先期性心理是由采访对象对新闻记者的信任爱戴和对新闻工作的神秘感、好奇心组成。临访性心理指采访对象接受记者采访请求后的心理,通常也称为采访对象临访期间的原始心理。这一心理,一般由采访对象对自己新闻位置认识和临访心境组成。新闻位置即采访对象是中心人物还是边缘人物,是局内人物还是局外人物,是新闻素材提供人物还是新闻素材佐证人物构成,新闻位置影响到采觚对象思维活劢的广度、情绪程度以及参与的积极程度。临访心理包括顺境和逆境等。仅表现形式上看,采访对象的心理分为积极配合型、一般协作型、蓄意应付型。为了创造良好的访问条件,要做到以下七点:商定较适宜的访问时机;和访问对象自己约旪间,和访问对象一起工作生活片刻;设计得体的仪表形态;讲究较文明的言谈举止;摆正较合理的相互关系;调节较融洽癿访问气氛:简单表明身份;扫视一周;以该亊物为话题;穿插较丰富的形态语言(面部、体态、手势);掌握较灵活的注意转换,强调采访意义,约束神情语态,排除外来干扰,变换活动方式。(2)采访活动的第二阶段的内容包括:创造访问条件、掌握提问技能、主持调查座谈、注重现场观察、协调听觉功能、强调当场笔录。①创造访问条件:在采访活动即将金入或已进入执行阶段时,除了一些必要的采访方法、技能、技术要掌握外,应特别注意创造一系列必不可少的、良好的辅助条件,这是采访活动有效率的重要保证。如商定适宜的访问时机,设计得体的仪表风度,讲究较文明的言谈举止。调节较融洽的访问气氛,摆正较合理的相互关系,穿插较丰富的形态语言。掌握较灵活的注意转换。②掌握提问技能。提问,实质是运用谈话的方式研究采访对象心理的一种方法,是记者采访活动的主要实施形式,也是关系采访活动成败的关键。③主持调查座谈。采访活动的基本形式除了个别访问外,通常还采用开调查座谈会的形式。④注重现场观察。新闻采访的现场观察,是指记者的大脑及眼、耳、鼻、舌、身感视器官同时运作,以眼为主从而使主观认识与客观实际相一致的现场采访形式。通俗讲,就是指记者用眼睛采访。⑤协调听觉功能。除了现场观察、查阅资料方式外,在个别访问、开座谈会、蹲点、参加会议等采访活动形式中,听觉的作用甚至大于视觉。⑥强调当场笔录。做好采访记录,是记者采访活动全过程中不可忽略和缺少的一环。采访中许多场合的现场笔录所创设的亲近感、亲切感、真实感、信任感等现场气氛,是任何“高科技”手段所无法替代的。(3)采访活动的几个阶段包括:深入采访,验证材料,整理笔记,积累剩余材料,提炼主题。①深入采访。新闻采访要抓住事物的特点和本质,这就要深入采访。深入采访的方法是:a.悉心抓特点具体方法有看准形势抓特点、通过比较抓特点、选择角度抓特点。通过比较抓特点包括:纵断面的比较,也叫顺序比较法,即用历史的眼光看问题,把一事物同它过去的同类事物相比较,找出量和质上的相异之处,就是特点之所在;横断面的比较,也叫对照比较法,即把一事物与同一时期的同类事物相比较,找出量和质上的相异之处,也就是特点之所在。选择角度抓特点要注意,一要比,二要小,三要异。b.悉心抓本质记者对问题要想得宽一点、远一点;对间题要钻研透一点,深一点。c.要克服阻碍采访深入的思想障碍如盲目自满,重视数量忽视质量,怕苦畏难不愿下基层,先入为主,重理论轻实践。②验证材料。记者必须把前阶段采访所得的有关材料,再放入实践中进行验证。验证材料要通过两个途径:投入记者智力进行验证;通过再采访直接进行验证。不仅要寻找新闻源和当事人,还要注意佐证,同时要克服侥幸心理和主观主义,代之以实事求是的科学态度。③整理笔记。每次采访活动告一段落后,记者不管多么疲劳,都应当尽力克服之,并毫不迟疑地立即整理采访笔记。这是因为,人皆会产生遗忘现象。整理笔记的步骤如下:通读所记的笔记,对采访过程进行回忆,将采访时心记的内容迅速添加到笔记中去,并纠正、修改原笔记中难以清晰辨认的笔记;通读整理以后的笔记,标出页码,并在可能用的材料边上标出记号;根据已经确定的新闻主题,将笔记材料进行分类,整理出写作提纲。④积累剩余材料。剩余材料积累的重要性表现在:可以使记者在写作时更好的理解过去,认识现在,预测将来;可以使新闻写作更加有新意、有深度;可以有利于记者产生联想进而获取新闻线索。积累材料应当从点滴入手,第一要勤奋读书,勤做笔记,二要持之以恒。⑤提炼新闻主题。提炼主题,就是记者占有了大量材料和初步确定新闻主题后,开始了认识的第二阶段,即从感性认识上升到理性认识,这一上升和飞跃,就是提炼主题,或称深化主题。深化主题根据以下两个因素,一是对全局的把握,二是对材料的认真有序的综合分析。
判断题 自由主义女权主义提倡中性文化来打破传统社会性别制度。
判断题 “横看成岭侧成峰,远近高低各不同”对寻找新闻角度有哪些启迪意义?6927新闻角度是指记者发现事实、挖掘事实、表现事实的着眼点或入手处。中国古代著名诗人苏东坡的诗句“横看成岭侧成峰,远近高低各不同”描写的是站在远处、近处、高处、低处看,庐山所呈现出的不同的旖旎风光。这对寻找新闻角度具有一定的启迪意义,具体表现在以下几个方面:(1)一个角度好比一个“窗口”,从不同的“窗口”看去,所见的风景不一样。角度选准,入手就能抓住事物的特征,就容易表现其新闻价值。(2)从不同的角度拍摄庐山,可以正面拍、侧面拍,也可以仰拍、俯拍,选择的角度不同,拍出的照片景物与意境也千姿百态、风光迥异。而事实就像庐山一样,是由丰富多彩的诸多侧面组成的,是一个“多面体”,每一面都可能呈现出不同的表象与特点。因此,对同一件新闻事实,可以从不同的角度报道它。角度不同,新闻价值就可能不同,表达的思想意义也就不同。(3)新闻角度的选择直接关系到记者从什么方向、在哪个立足点上、用什么视角,或者通过什么突破口去透视、寻找、挖掘、选择和表现新闻事实,以更充分、更鲜明地体现其新闻价值和思想性。因此,受苏东坡的这一诗句的启迪,新闻学借鉴摄影的概念,要求记者要学会站在不同的方位去看待客观事物,从不同的角度发去现新闻价值。(4)媒体生产出的新闻产品,最终要“卖”给受众,所以媒体在发布新闻时,应考虑受众的感受。事实有很多侧面,从不同角度观察,会有不同的收获,但读者需要的是最佳的角度。所以,在选择角度时,应充分考虑受众的需要。
判断题 根据你对“新闻评论的新闻价值”的认识,写一篇文章。示例如下:新闻评论的新闻价值新闻评论是媒体编辑部或作者对最新发生的有价值的新闻事件和有普遍意义的紧迫问题发议论、讲道理,有着鲜明针对性和引导性的一种新闻文体。“盛世多危言”,这些年新闻评论尤为活跃。有价值的新闻评论,或直抒民意,振聋发馈;或如同航标,引领航向。著名报人戈公振先生曾说过:“报纸不仅报告事实,对于重要问题,且独立加以评论,且其评论乃以个人丰富知识为依据,有时可以超越普通仅由事实观察者之意见,甚至超越一报纸之意见因而成为一般公众之意见,是即谓之舆论。”表层价值:感知事态信息新闻文本最基本、最直接的功能就是“告事”,新闻评论亦是如此。我们将接受主体获取事态信息视为其从新闻评论中获取的最基本需求,即表层的新闻价值。这里所定义的表层价值只是对新闻价值的分层概念,而并非其重要性的判定。事实上,可以将其理解为普遍价值,因为“就大多数读者来说,读报主要是了解,而不是研究;是主动性的选择,而不是被动式的接受;是享受一种知晓的权利,而不是完成指定的任务”。基于客观事实基础卜的分析论证,往往具有纯粹说理性的时评文章所无法企及的说服力。尤其是在当下中国,信息公开透明的渠道与程度依然不足的情况下,我们乐见有心人向读者披露他们的发现,从而分析解决问题。例如,有细心读者从公开数据中发现,一个编制为72人的不以赢利为目的的事业单位,每年从增值收益中扣除的管理费超过2000万元,而管理费用列支的则是公积金中心的基本工资、补助工资、职工福利费、社会保障费等,保守估计人均超过27万元/年。笔者认为,应该分几个层次进行分析解读。首先要分析一下“一个72人的不以赢利为目的的事业单位”年管理费用达到2000多万元,人均27万元,是多还是少?感知事态信息是接受主体从一篇新闻评论中获得其他方面价值的必经途径。接受主体只有通过表层新闻价值。
判断题 访问量在一定程度上反映获得顾客的潜在能力。