大数据:融合新闻生产中的“金矿”
《大数据时代》作者、英国牛津大学网络学院互联网研究所教授维克托•迈 尔-舍恩伯格(Viktor Mayer-Schonberger)在接受《文汇报》专访时说:“大数据” 的存在“已经不仅仅是一种炒作或者什么宏大的宣言了,而将实实在在地改变我们的工作、生活以及整个社会”。“大数据时代的巨大资源是未来时代的金矿,那些拥有这些数据资源的人获得的回报将是不可想象的。” 新闻传播学者和新闻媒介业者也看到了大数据金色的光芒,并积极思考如何充分挖掘大数据背后潜 藏的巨大新闻价值和经济价值,探索作为新闻生产者又需要具备怎样的智慧与 能力,大数据推进新闻生产变革的号角已经吹响。
一、数据挖掘将让新闻更简明
“大数据”之所以称为“大”,是因为其海量的数据已经大大超出目前软硬件 环境的处理能力。事实上,处理大数据的瓶颈不仅仅是数字化技术的软硬件水 平,而在于人自身。牛津大学进化人类学教授罗宾•邓巴(Robin Dunbar)的“邓 巴数字定律”即150定律(Rule Of 150)认为:人的大脑新皮层大小有限,提供的 认知能力也是有限的,即便数字化的技术可以让你在社交网络中拥有无限数量 的好友和“粉丝”,但最终你能够建立频繁交流的也就是在150人(实为148人) 左右,而这其中能建立亲密关系的更是只有寥寥数人。人们感慨,社交网络给了我们联系,却未必给我们交流;拉近了我们的距离,却未必增加我们的亲密;激发了我们社交的天性,却可能磨平了我们沟通的能力。社交的幸福感来自社交的质量而不是数量,来自于沟通的深度而不是频率。小心,莫让技术令你的人际关系变得越来越扁平和肤浅。因为,再先进的传播技术也很难突破人类本身的生理瓶颈。大数据更是如此,庞大的数据量显然早已超出了人脑处理的能力,它最终的价值需要通过计算机进行挖掘、分析和深度解读,并形成相对简单直接的形式让人们得以接受和理解。对于新闻生产而言,这意味着新闻生产者必须将复杂的数据简单化、庞杂的事项简洁化,而且越简明越好。简明的新闻可能会失去微观层面上的精确度,但能获得宏观层面上的洞察力。
为了实现将大数据简单或简明的要求,数据挖掘(Data Mining)的概念便被提了出来。海量的大数据不易被人们所直接利用,而数据挖掘正是一个将“冰冷数据信息人性化”的过程,也是一个把“数据分析的范围从‘已知’扩大到4未知’, 从4过去’推向‘将来’”的过程。在这个过程中,需要经历从数据准备、数据理 解、模型建立、模型评估、最终得出结果的一系列步骤,而完成这些步骤需要的不 仅是庞大数据量,更需要专业化的数据分析方法和掌握这些方法的数据管理和 分析专家。这在媒介融合和大数据时代,对媒体从业者的能力提出了更大的挑 战,或者意味着今后的融合新闻报道需要有数据分析专家参与或信息挖掘公司 辅助。西方新闻媒体已经在试图突破这种技术上的难题。譬如,“2007年4月路透社就以2500万美金的价格收购了著名的文本信息挖掘公司ClearFor- est”®,通过收购并利用其资源来弥补媒体自身在搜索引擎和数据挖掘方面的不足。
二、让新闻可视化和图表化
建立在大数据基础上的融合新闻作品不仅要简明化和人性化,而且要可视化(Data Visualization)和图表化。数据可视化和图表化可以被追溯到20世纪50年代的计算机图形学,当时人们便开始利用计算机创建了首批图形、图表。 如今随着人类数据规模的不断膨胀,以及数据复杂性程度的不断增强,数据可视 化和图表化变得十分必要。
数据可视化和图表化作为一种信息技术,“其主要目标就是信息沟通,通过将数据设计成为功能与审美并重的图形、图像、地图、动画等形式,让信息的沟通交流更为直观、清晰和高效”®。“生理学也证明,人的大脑皮层当中,有40%是视觉反应区,人类的神经系统天生就对图像化信息最为敏感。而数据可视化的技术,可以通过图像在逻辑思维的基础上进一步激发人的形象思维和空间想象力,吸引、帮助用户洞察数据之间隐藏的关系和规律。”
融合新闻生产也是一种传播者和受众之间信息沟通交流的过程,要让具有大数据特点的新闻信息在这一过程当中清晰、流畅地传递,数据可视化和图表化显然是一个最有效的途径,而融合新闻产品更是为数据可视化和图表化提供了空间和可能。譬如,2010年7月19日《华盛顿邮报》制作的“美国绝 密”(Top Secret America)报道专题,就是数字可视化和图表化的典型例子》 “两位调査记者用了两年多时间,对数百个现任及前任军事、情报官员、政府机构工作人员等进行采访调査,在绘图专家、数据研究员、摄影记者、图表设计者的协作下,用融合报道的形式将美国自‘9 • 11’事件以来的国防和情报系统公之于众。”
在“美国绝密”专题的页面,我们可以看到网站的设计人员通过视频、动画、地图、图表等多种可视化方式的结合将庞大的数据转变成为网站用户可以直观了解的可视化信息,甚至这些信息还具有互动功能,用户可以根据兴趣输入邮编或点击地图获取自己想了解的地区的情况。
清华大学陈昌凤、刘少华也举例说明:彭博社的大数据挖掘类报道栏目“今日图表”(Chart of the Day)就是通过图表和简单的事实而非说教来阐明道理,是彭博新闻“show, don't tell”理念的体现,是一种“简单而优雅的呈现观点以及 点燃想象力的”方式。
图7-2彭博社“今日图表”(Chart of the Day)页面
三、以关联思维创新新闻生产
如果说人们看待数据的方式正在由局部数据转向全部数据、由纯净数据转向凌乱数据,那么现在正在由数据的因果关系转向数据的相关联系。这意味着世界即将告别总是试图了解世界运转方式背后深层原因的态度,向仅仅需要弄清数据之间的关联,以及利用这些关联信息来解决问题、预测未来的方向转变。
因果关系的思维方式是人类长期社会经验积累所形成的一种认识世界的方法。我们习惯性地将所有的问题用因果关系来解释.无论是打雷下雨的天气变化,或者是金融市场的风起云涌,甚至自己突如其来的情绪变化,我们都希望能够找到这些事情的前后因果。事实上,人类长期以来对于因果关系的执着,并不是无理由的,这种快速的思维模式可以帮助人们在短时间内做出判断,并采取行动,这也确实推动了人类社会的发展和进步,帮助我们在关键时刻驱灾避祸、化险为夷。
在新闻生产中执着于探讨事物的因果关系也是人类的天性使然。我们追求新闻报道的完整性,这种完整性不仅要求新闻元素5W缺一不可,而且要求新闻事件有前因后果的逻辑性和连贯性,甚至希望有追踪报道或后续报道;我们追求新闻报道的深度,这种深度不仅是新闻事件不同方式和角度上的立体覆盖,更是对新闻事件前因后果的不断挖掘和深化.人们还希望知道新闻为何发生和未来将产生什么后果。但是,这些因果关系是否真的存在呢?
《大数据时代》的作者则认为.人类通过因果关系了解世界的方式正在被大数据所改变。“在小数据时代,很难证明由直觉而来的因果联系是错误的。将来,大数据之间的相关关系,将经常会用来证明直觉的因果联系是错误的。最终也能表明,统计关系也不蕴含多少真实的因果关系。”®作者所说的“相关关系”, 也就是以关联物的方式帮助我们认识事物和分析现象,通过找到一些现象的良好关联物来捕捉现在和预测未来。而我们现在所拥有的如此庞大的数据量恰好可以使我们的关联性分析变得更准确、更快捷,且更不易受到主观偏见的影响。
大数据的关联思维方式对人类的思维方式有着颠覆性的影响,也使传统新闻生产可以突破固有因果思维的束缚,以一种关联的视角重新审视社会。并不是每一个新闻事件都可以用因果关系来解释,也并不是每一组看似正确的因果关系就真是可靠的。新闻生产中经常出现的错误就是把没有因果关系的两者胡乱地搭配在一起,或者是将复杂的非线性关系简单地归纳为线性的因果关系,甚至在金融报道中经常出现的是勉强为之的倒推式因果解释。新闻生产似乎已经习惯于建立这种简单的因果联系:小悦悦事件是因为公众的冷漠、道德的滑坡,地沟油是因为商家的逐利、道德的沦落,贪污受贿也是因为官员的素质太低和道德水准不高,于是最终的解决途径就都变成了极为简单的加强道德教育和法制建设。但是,在很多情况下,实际情况与常识往往正好相反,或者根本没有因果关系。例如,人们的收人水平与幸福感并不是一个正比的关系,感冒也未必就是 因为受凉,用餐后生病不一定是食物问题。
强调时间、历史和因果关系的传统观念正在受到挑战,而推崇空间、现状和相关联系的新型观念正在逐步占据上风。知识的占有曾经意味着对时间、历史和因果之间关系的洞察和了解,如今知悉知识的存贮空间、发展现状并能预言知识的未来趋势则显得尤为重要。融合新闻生产需要有一种大数据时代下开放与关联的思维理念,要真正致力于揭示社会现象中的复杂关系,不能一味追求或迷信所谓的因果联系。
四、以精准测算生产媒介个性化产品
传统的大众化的新闻生产是一种集中的和粗放的生产方式,新闻媒体在 “车间”以标准化的形式生产新闻产品,再通过特定渠道和媒介向所有人传递和发送,产品内容缺乏针对性和精确性。媒介也是被迫无奈的,因为受众不仅数量众多、成分复杂,而且流动不居、分布广泛、需求各异,甚至那些基本的受众信息在数字化技术发展之前都是隐匿不明的。传统的受众分析方法采用的都是抽样式的调查方法,这种抽样式的调查方法有赖于样本数的大小,如果没有足够的样本数其结果显然也无法体现整体受众市场的真实情况。与此同时,受众抽样调查的方式“更多地关注‘受众’语境下的独立的媒介使用习惯(如阅读、收看、点击 等),而忽视了用户的综合行为习惯以及这些习惯对他们的媒介使用的影响” 。 因此,没有大样本的抽取,没有全方位的调査,媒介根本无从知晓受众到底是怎样的一群人,他们到底又需要些什么。而受众也只是被动接受各种各样并不一定需要的信息.随时随地受到各种信息的“轰炸”,个人十分有限的注意力被各种碎片化的内容“瓜分”。
从营销传播的角度来看,受众分析中媒介企业和一般企业一样试图建立的是受众的“360度视图”。所谓“360度视图”就是指各部门将客户的数据库信息集合成为一个整体,形成一个更为庞大的客户数据库系统。在这个系统中,客户不再是一个模糊的群体,而是一个个独立的个体,他们有自己的1D、姓名、地址、年龄、家庭、收人情况等。在此基础上,企业还不断地将客户的消费时间、地点、 产品、数量、金额、消费频率、消费种类、消费范围等信息存人其中,甚至也包括客 户的消费行为、兴趣爱好等信息,使原有的数据量急剧膨胀,很快爆发性地生成 为大数据群,于是企业可以通过对大数据群的深人挖掘,更深层次地理解客户行 为和消费趋势,使企业不仅能够对每一个客户做到了如指掌,而且对企业生产的 现状和趋势也心中有数。
这样的客户信息收集工作,不少企业早在几十年前就已经开始。譬如,五星级酒店往往会仔细地记录一些VIP客户的生日、兴趣爱好、特殊要求等。但由于数据存储和处理技术的限制,这些工作还处在较低水平。也就是说.在小数据时代,企业存贮的数据其实无法真正满足建立和分析所有用户的“360度视图”。 但在大数据时代则可能完全不同。首先,大数据的采集本身就不是一种样本的抽取和选择.而是无遗漏、全覆盖的数据采集。其次,大数据的采集是24小时全方位、全天候的,尤其是移动智能终端的普及及GPS等定位技术的应用,使得数据追踪和地理信息、位置信息的采集成为可能。
在大数据时代.媒体要建立这样的受众“360度视图”其实更为容易,因为媒介中所有的信息都是数字化的,受众在进行新媒体和网络阅读、浏览时必然会留下他们的足迹。每一位受众有固定的IP地址,计算机通过cookie等技术手段可以精心、细致地记录下受众所有的使用行为。譬如,选择在什么时间上网、上了哪些网站、浏览了哪些信息、下载的是什么内容、对哪些信息有特别的兴趣爱好、 如何评论和转发、如何消费时间等。对这些大数据的存储和分析,将使得媒体生 产的产品和提供的服务更有针对性、更加精准化和个性化,能够选择最适合的时 间、在最适合的空间更准确地向受众推送出最符合其需求的信息内容。
相关试题
判断题 审批制是我国报刊管理的基本制度。()
判断题 新闻采访活动中的双主体一、采访者:新闻采访的重要主体记者的社会角色:1、社会守望者角色2、信息传播者角色3、文化传承者的角色采访对象的特点:1、具有相当的复杂性(准备充分)2、与新闻事实有一定的关联(以听为主)3、出于利益考虑与采访者进行博弈(采访技巧)
判断题 新闻背景是指对于新闻事实发生的历史、环境和主客观条件所作的说明。它通过引用有关材料,应用交代、说明、解释、对比、衬托等手法,显现或暗示新闻事实的成因、意义等,藉以深化新闻主题,帮助受众透过新闻事实的来龙去脉,更好地理解事实的本质及其对周围事物的影响。新闻报道中的背景材料,被称为是“新闻背后的新闻”。对它所下的最简单的定义是“用来说明事实的旧事实”。背景材料不是新闻事实,是有助于理解新闻事实的必要材料,运用时务必精挑细拣,尽量控制在“必要”的限度以内。
判断题 光圈大,通光量(多)。
判断题 融合新闻生产的采访理论新闻采访是融合新闻生产的前提,是新闻工作者为搜集新闻生产素材而进行的一种职业性的调查研究活动。人们常说:“新闻报道是七分采三分写。”新闻采访在融合新闻写作中具有重要地位和作用。没有过硬的新闻采访基本功就写不出好的新闻。每个学新闻的人都很清楚,从事新闻工作的人不仅需要丰富的知识素养、扎实的专业知识和实用的专业技能,而且需要强壮的体魄、良好的人际交往和沟通能力,要“手勤、眼勤、嘴勤、脑勤、腿勤”。一、“五勤”——新闻采访的基础新闻采访被称为记者感觉器官的全方位调动,不是简单的问与答,写与录,而是记者大脑及眼、鼻、口、耳、舌全身感觉器官的同时运作。有经验的老记者们常常将成功的采访过程总结为“五勤”,也就是手勤、眼勤、嘴勤、脑勤、腿勤。还有“六勤”“七勤”之说,也就是在“五勤”的基础上加上“耳勤”,或加上“勤学”和“勤练”。1.手勤——“好记性不如烂笔头”手勤更是记者的基本功,所谓“好记性不如烂笔头”。“记”便是记者一项主要工作内容。在新闻采访中记者要勤于记录、快速记录,更要懂得如何记录,知道怎样记重点、难点、疑问点、特色点,怎样将趣闻逸事、生活琐事等都记录或摄录下来。今天的记者无论你是用笔记录、用键盘记录,还是用手机记录、用机器摄录,采访记录的过程等于新闻生产的前期素材采集过程,它将直接决定新闻后期生产的费力程度和新闻产品的最终质量。2.眼勤——炼出“火眼金睛”新闻采访要求记者们都有“火眼金睛”,一走进新闻现场就能发现新闻线索,找到新闻价值。记者们要有一双具有穿透力的敏锐眼睛,能发现身边的新闻。要懂得用眼睛扫描和过滤,目光掠过之处便能迅速捕捉最有价值的新闻素材。他们能掌握看的规律,总是先捕捉动态的再留意静态的,先捕捉宏观的再观察微观的,由近及远,由上而下,由内到外。他们的眼睛就好比一台不断按动快门的照相机,拍摄着新闻现场的一个个鲜活画面。他们还要用心去看.用心去记.将看到、记住的画面转化成为客观的文字;他们还要带着思考去看,思考读者和公众所关注、需要的是什么。3.嘴勤——“多问也是金”新闻采访是沟通交流的职业,要通过人际间的沟通交流搜集和获取新闻素材。因此,如何通过自己的巧妙提问打开对方的“话匣子”,显得十分重要。这些都使得记者的嘴不能闲着。会说话的记者懂得如何拉近与采访对象之间的距离,懂得如何同采访对象建立彼此间的信任关系.懂得如何让新闻当事人据实讲述自己的所见所闻、所作所为和所思所想。而要达到这样的目标,记者嘴巴不勤是办不到的。只有多开口、勤提问,才能得到新闻生产所必需的新闻素材。4.脑勤——勤动脑、多思考脑勤,就是记者的脑子要动得快,要勤动脑、善动脑,懂得自己去独立思考问题、分析问题,而不是人云亦云。孔子说过:“学而不思则罔,思而不学则殆。”通过思考拨开新闻的迷雾看到事物的本质,通过思考发现新闻背后的新闻,发掘新闻的潜在价值和深刻的报道内涵。因此,好新闻必然是新闻生产者思想的结晶,没有思考的新闻生产是机械的,也是缺乏新意和价值的。5.腿勤——“好新闻是跑出来的”新闻现场对于新闻报道而言是至关重要的,没有深人第一现场的脚踏实地的采访,没有亲历现场的真切感受,新闻就如同“水中花、镜中月”。那些自己编织、想象出来的新闻现场是经不起推敲和检验的,唯有亲自去听、去看、去核实、去记录,才能获得第一手的新闻素材,才能建立独立的思考和认识,进而生产出生动鲜活的好新闻。“好新闻是跑出来的”,走南闯北、东奔西走是新闻记者们的工作特色,腿勤也就成了好记者的典型特征。在融合新闻采访和生产中,新闻生产者的“五勤”依然发挥着决定性的作用。“背包记者”“全能记者”马不停蹄地奔波在一个又一个新闻现场,他们操弄着各式各样的先进数码设备,眼观四面,耳听八方,问这问那,精心记录,勤奋采集,积极思考,目的就是完成高质量的报道任务。二、虚拟空间——新闻采访的新场域在传统意义上,新闻采访的“五勤”要求是建立在现实社会的客观基础之上的,它要求记者将自己的全部精力用于新闻采访活动之中,必须深人基层、亲临现场、脚踏实地,要用自己的眼睛看、嘴巴问、耳朵听、脑子想,因为所有的新闻元素都来源于此,需要通过人与人之间实实在在的沟通交流才能获取。但是,在网络传播与社会化媒体迅速崛起的当下,不仅新闻事件的发生时空已经与往日有很大的不同,而且新闻来源、新闻变异、新闻生产也变得越来越多样化,网络虚拟空间中的论坛、博客、微博、微信、短信等也已成为热点新闻的发源地,于是新闻采访的“五勤”要求也必须与时俱进,相应地改变原先的运作姿态和活动方式。2011年6月20日,有一个名叫郭美美的20岁姑娘在新浪微博上突然蹿红,晒豪车、晒别墅、晒名包的她自称是红十字会商业总经理。这个经过新浪微博认证的“红十字会”身份一时间激起了网友的关注,事件的新闻效应在网络虚拟空间中不断发酵。不断聚集的网友关注和讨论、对于红十字会的质疑,以及有人透过各种渠道提供报料,短短几天时间郭美美事件就成了国内媒体争相报道的焦点。直到当年8月事件仍然未能平息,郭美美母女甚至还在宁夏卫视的《解码财经》栏目中接受财经学者郎咸平的专访。更为严重的是,郭美美事件引发的红十字会的信任危机仍然在之后的很长一段时期中持续,并直接引起了之后红十字会的相关改革措施。此后,有关方面还提出“要重查郭美美事件”。就是这样一个震动了社会各阶层的重大新闻事件,它的来源竟然是网络虚拟空间中的无知和炫富。在现实社会中这样的新闻或许根本发掘不了,但是在网络空间中来得却是如此容易。虚拟空间是一个信息快速传递的场域,在这个场域中人与人并不做面对面的沟通与交流,无论是传播者还是受众都隐藏在网络终端的背后。这使得虚拟空间中的信息交流可以变得更加隐秘、更加随意。更多的人也并不将虚拟空间中的表达等同于现实世界,现实社会中的束缚和压力在这里得到解脱,进而形成了巨大的信息汇集的市场,在这个市场中自然也包括了新闻信息,甚至包括了很多具有重要价值的新闻信息。因此,在融合新闻生产时代.新闻生产者的“五勤”事实上已经突破了现实社会的局限,勤奋的记者不仅应是现实社会中的活跃者,而且应是虚拟空间中的网络达人。这也就是说,互联网对于记者而言不仅仅是简单的使用,更是要融人生活和工作中去,要对虚拟空间中的新闻信息有敏锐的嗅觉,深谙网络传播之道,知道哪里是网络新闻最有可能出现的地方,它们会首先传播到哪里,造成怎样的影响。同时,网络虚拟空间中的信息虽然是丰富的,参与网络信息交流的也是网络终端背后的个人,但虚拟空间中使用虚拟身份发言,往往并不像现实社会中一样,需要对自己的言行负责。因此,新闻生产者在网络空间中采访获取信息时更要学会判断、懂得甄别。再好的信息素材,只要是杜撰的,就没有任何价值。三、公民记者——新闻采访的新力量在传统的新闻报道中,记者的“勤”是有限度的,新闻生产者不可能无限制地对新闻展开没日没夜的调查和挖掘。作为个体的记者,无论在时间上、精力上,还是在空间上、在新闻生产的视野上,都不可能做到真正的全方位报道和无限制的深度挖掘。个体的限制在客观上造成新闻报道无论在深度上、广度上,抑或角度上,都有其局限性,适度的新闻报道成为新闻生产中的一种必然选择。在实际的新闻报道中,无论新闻生产者多么勤奋地投人工作,都可能岀现新闻采访调查中无法顾及或是疏漏的现象。好的新闻题材往往不可能在一次性报道中完全到位,或是采访不周全、新闻聚焦有偏差,或是受众的兴趣点没有完全找准,新闻的深层次价值尚有挖掘的潜力,这些都成了传统新闻报道方式的局限性。在融合新闻报道时期,原本新闻产品的接受者——受众成了新闻采访调查的热情参与者和新闻产品的积极生产者,他们从传统新闻信息的被动接受者转变为积极响应者、互动者和传播者。对于那些能够激发他们激情和兴趣的新闻报道,他们主动地投人精力搜集、上传相关新闻信息,他们乐于奉献自己的聪明才智、时间和精力:有的积极动用自己的资源优势介人到新闻调查和采访中来,并将自己所掌握的内部信息或秘密分享给他人;有的撰写、制作新闻,开始发挥专业新闻生产者所担负的传播职能;还有的在挖掘新闻旧题材和老新闻潜在新闻价值上乐此不疲,同专业新闻工作者较劲。我们不得不承认,公民记者正试图通过对生活原生态接近真实的记录,改变媒体记者和编辑习以为常的新闻视角;试图通过自己的行动对少数媒体垄断者手中的传播权力发起挑战或进行革命;或者试图通过强调个性化表达和个人对社会和自身的关注,显示出对传统新闻学和主流媒介的不屑与嘲讽,进一步强化和推动新闻自由;或者是想通过自己的行动,对社会中的丑恶和不公进行监督和揭露;同时,在处理和报道突发性事件中,公民记者也以自己的神勇和眼线多、信源广、少遗漏的优点,让主流媒体自叹不如。受众的广泛参与使得新闻素材在网络空间中交汇融合越聚越多,分散在网络虚拟空间中的每一个受众都可能成为公民记者。也正因为有越来越多热心的公民记者开始不计酬劳、不辞辛苦地参与新闻的生产过程,为新闻报道提供素材,提供意见建议,或直接参与新闻作品的撰写和制作,才使得融合媒体新闻生产的深度和广度都得到了极大延伸,打开了一个更为广阔的新闻生产空间。面对虚拟空间中的众多可能,无论新闻记者多么勤奋,都不可能预知在无边界的虚拟空间中谁可能成为推进报道的“深喉”。因此,在网络时代,新闻记者不仅要努力调查和采访.还要努力建立自己的网络资源和社会资本,让自己成为零散信息汇聚的中心或网点;要懂得如何运用网络时代的媒体工具,将媒体的号召力和影响力拓展到网络的虚拟空间中,让受众在掌握新闻信息的时候能够通过网络即时与媒体取得联系。
判断题 变焦镜头的优越性(操作方便),(易于携带),(构图快捷)。
判断题 虚假新闻和失实报道的本质区别在于有无事实依据。(√)
判断题 在“建安诗人”与“唐宋八大家”中,分别有一个家族,占据了“建安诗人”与“唐宋八大家”中的三席。