大数据:融合新闻生产中的“金矿”
《大数据时代》作者、英国牛津大学网络学院互联网研究所教授维克托•迈 尔-舍恩伯格(Viktor Mayer-Schonberger)在接受《文汇报》专访时说:“大数据” 的存在“已经不仅仅是一种炒作或者什么宏大的宣言了,而将实实在在地改变我们的工作、生活以及整个社会”。“大数据时代的巨大资源是未来时代的金矿,那些拥有这些数据资源的人获得的回报将是不可想象的。” 新闻传播学者和新闻媒介业者也看到了大数据金色的光芒,并积极思考如何充分挖掘大数据背后潜 藏的巨大新闻价值和经济价值,探索作为新闻生产者又需要具备怎样的智慧与 能力,大数据推进新闻生产变革的号角已经吹响。
一、数据挖掘将让新闻更简明
“大数据”之所以称为“大”,是因为其海量的数据已经大大超出目前软硬件 环境的处理能力。事实上,处理大数据的瓶颈不仅仅是数字化技术的软硬件水 平,而在于人自身。牛津大学进化人类学教授罗宾•邓巴(Robin Dunbar)的“邓 巴数字定律”即150定律(Rule Of 150)认为:人的大脑新皮层大小有限,提供的 认知能力也是有限的,即便数字化的技术可以让你在社交网络中拥有无限数量 的好友和“粉丝”,但最终你能够建立频繁交流的也就是在150人(实为148人) 左右,而这其中能建立亲密关系的更是只有寥寥数人。人们感慨,社交网络给了我们联系,却未必给我们交流;拉近了我们的距离,却未必增加我们的亲密;激发了我们社交的天性,却可能磨平了我们沟通的能力。社交的幸福感来自社交的质量而不是数量,来自于沟通的深度而不是频率。小心,莫让技术令你的人际关系变得越来越扁平和肤浅。因为,再先进的传播技术也很难突破人类本身的生理瓶颈。大数据更是如此,庞大的数据量显然早已超出了人脑处理的能力,它最终的价值需要通过计算机进行挖掘、分析和深度解读,并形成相对简单直接的形式让人们得以接受和理解。对于新闻生产而言,这意味着新闻生产者必须将复杂的数据简单化、庞杂的事项简洁化,而且越简明越好。简明的新闻可能会失去微观层面上的精确度,但能获得宏观层面上的洞察力。
为了实现将大数据简单或简明的要求,数据挖掘(Data Mining)的概念便被提了出来。海量的大数据不易被人们所直接利用,而数据挖掘正是一个将“冰冷数据信息人性化”的过程,也是一个把“数据分析的范围从‘已知’扩大到4未知’, 从4过去’推向‘将来’”的过程。在这个过程中,需要经历从数据准备、数据理 解、模型建立、模型评估、最终得出结果的一系列步骤,而完成这些步骤需要的不 仅是庞大数据量,更需要专业化的数据分析方法和掌握这些方法的数据管理和 分析专家。这在媒介融合和大数据时代,对媒体从业者的能力提出了更大的挑 战,或者意味着今后的融合新闻报道需要有数据分析专家参与或信息挖掘公司 辅助。西方新闻媒体已经在试图突破这种技术上的难题。譬如,“2007年4月路透社就以2500万美金的价格收购了著名的文本信息挖掘公司ClearFor- est”®,通过收购并利用其资源来弥补媒体自身在搜索引擎和数据挖掘方面的不足。
二、让新闻可视化和图表化
建立在大数据基础上的融合新闻作品不仅要简明化和人性化,而且要可视化(Data Visualization)和图表化。数据可视化和图表化可以被追溯到20世纪50年代的计算机图形学,当时人们便开始利用计算机创建了首批图形、图表。 如今随着人类数据规模的不断膨胀,以及数据复杂性程度的不断增强,数据可视 化和图表化变得十分必要。
数据可视化和图表化作为一种信息技术,“其主要目标就是信息沟通,通过将数据设计成为功能与审美并重的图形、图像、地图、动画等形式,让信息的沟通交流更为直观、清晰和高效”®。“生理学也证明,人的大脑皮层当中,有40%是视觉反应区,人类的神经系统天生就对图像化信息最为敏感。而数据可视化的技术,可以通过图像在逻辑思维的基础上进一步激发人的形象思维和空间想象力,吸引、帮助用户洞察数据之间隐藏的关系和规律。”
融合新闻生产也是一种传播者和受众之间信息沟通交流的过程,要让具有大数据特点的新闻信息在这一过程当中清晰、流畅地传递,数据可视化和图表化显然是一个最有效的途径,而融合新闻产品更是为数据可视化和图表化提供了空间和可能。譬如,2010年7月19日《华盛顿邮报》制作的“美国绝 密”(Top Secret America)报道专题,就是数字可视化和图表化的典型例子》 “两位调査记者用了两年多时间,对数百个现任及前任军事、情报官员、政府机构工作人员等进行采访调査,在绘图专家、数据研究员、摄影记者、图表设计者的协作下,用融合报道的形式将美国自‘9 • 11’事件以来的国防和情报系统公之于众。”
在“美国绝密”专题的页面,我们可以看到网站的设计人员通过视频、动画、地图、图表等多种可视化方式的结合将庞大的数据转变成为网站用户可以直观了解的可视化信息,甚至这些信息还具有互动功能,用户可以根据兴趣输入邮编或点击地图获取自己想了解的地区的情况。
清华大学陈昌凤、刘少华也举例说明:彭博社的大数据挖掘类报道栏目“今日图表”(Chart of the Day)就是通过图表和简单的事实而非说教来阐明道理,是彭博新闻“show, don't tell”理念的体现,是一种“简单而优雅的呈现观点以及 点燃想象力的”方式。
图7-2彭博社“今日图表”(Chart of the Day)页面
三、以关联思维创新新闻生产
如果说人们看待数据的方式正在由局部数据转向全部数据、由纯净数据转向凌乱数据,那么现在正在由数据的因果关系转向数据的相关联系。这意味着世界即将告别总是试图了解世界运转方式背后深层原因的态度,向仅仅需要弄清数据之间的关联,以及利用这些关联信息来解决问题、预测未来的方向转变。
因果关系的思维方式是人类长期社会经验积累所形成的一种认识世界的方法。我们习惯性地将所有的问题用因果关系来解释.无论是打雷下雨的天气变化,或者是金融市场的风起云涌,甚至自己突如其来的情绪变化,我们都希望能够找到这些事情的前后因果。事实上,人类长期以来对于因果关系的执着,并不是无理由的,这种快速的思维模式可以帮助人们在短时间内做出判断,并采取行动,这也确实推动了人类社会的发展和进步,帮助我们在关键时刻驱灾避祸、化险为夷。
在新闻生产中执着于探讨事物的因果关系也是人类的天性使然。我们追求新闻报道的完整性,这种完整性不仅要求新闻元素5W缺一不可,而且要求新闻事件有前因后果的逻辑性和连贯性,甚至希望有追踪报道或后续报道;我们追求新闻报道的深度,这种深度不仅是新闻事件不同方式和角度上的立体覆盖,更是对新闻事件前因后果的不断挖掘和深化.人们还希望知道新闻为何发生和未来将产生什么后果。但是,这些因果关系是否真的存在呢?
《大数据时代》的作者则认为.人类通过因果关系了解世界的方式正在被大数据所改变。“在小数据时代,很难证明由直觉而来的因果联系是错误的。将来,大数据之间的相关关系,将经常会用来证明直觉的因果联系是错误的。最终也能表明,统计关系也不蕴含多少真实的因果关系。”®作者所说的“相关关系”, 也就是以关联物的方式帮助我们认识事物和分析现象,通过找到一些现象的良好关联物来捕捉现在和预测未来。而我们现在所拥有的如此庞大的数据量恰好可以使我们的关联性分析变得更准确、更快捷,且更不易受到主观偏见的影响。
大数据的关联思维方式对人类的思维方式有着颠覆性的影响,也使传统新闻生产可以突破固有因果思维的束缚,以一种关联的视角重新审视社会。并不是每一个新闻事件都可以用因果关系来解释,也并不是每一组看似正确的因果关系就真是可靠的。新闻生产中经常出现的错误就是把没有因果关系的两者胡乱地搭配在一起,或者是将复杂的非线性关系简单地归纳为线性的因果关系,甚至在金融报道中经常出现的是勉强为之的倒推式因果解释。新闻生产似乎已经习惯于建立这种简单的因果联系:小悦悦事件是因为公众的冷漠、道德的滑坡,地沟油是因为商家的逐利、道德的沦落,贪污受贿也是因为官员的素质太低和道德水准不高,于是最终的解决途径就都变成了极为简单的加强道德教育和法制建设。但是,在很多情况下,实际情况与常识往往正好相反,或者根本没有因果关系。例如,人们的收人水平与幸福感并不是一个正比的关系,感冒也未必就是 因为受凉,用餐后生病不一定是食物问题。
强调时间、历史和因果关系的传统观念正在受到挑战,而推崇空间、现状和相关联系的新型观念正在逐步占据上风。知识的占有曾经意味着对时间、历史和因果之间关系的洞察和了解,如今知悉知识的存贮空间、发展现状并能预言知识的未来趋势则显得尤为重要。融合新闻生产需要有一种大数据时代下开放与关联的思维理念,要真正致力于揭示社会现象中的复杂关系,不能一味追求或迷信所谓的因果联系。
四、以精准测算生产媒介个性化产品
传统的大众化的新闻生产是一种集中的和粗放的生产方式,新闻媒体在 “车间”以标准化的形式生产新闻产品,再通过特定渠道和媒介向所有人传递和发送,产品内容缺乏针对性和精确性。媒介也是被迫无奈的,因为受众不仅数量众多、成分复杂,而且流动不居、分布广泛、需求各异,甚至那些基本的受众信息在数字化技术发展之前都是隐匿不明的。传统的受众分析方法采用的都是抽样式的调查方法,这种抽样式的调查方法有赖于样本数的大小,如果没有足够的样本数其结果显然也无法体现整体受众市场的真实情况。与此同时,受众抽样调查的方式“更多地关注‘受众’语境下的独立的媒介使用习惯(如阅读、收看、点击 等),而忽视了用户的综合行为习惯以及这些习惯对他们的媒介使用的影响” 。 因此,没有大样本的抽取,没有全方位的调査,媒介根本无从知晓受众到底是怎样的一群人,他们到底又需要些什么。而受众也只是被动接受各种各样并不一定需要的信息.随时随地受到各种信息的“轰炸”,个人十分有限的注意力被各种碎片化的内容“瓜分”。
从营销传播的角度来看,受众分析中媒介企业和一般企业一样试图建立的是受众的“360度视图”。所谓“360度视图”就是指各部门将客户的数据库信息集合成为一个整体,形成一个更为庞大的客户数据库系统。在这个系统中,客户不再是一个模糊的群体,而是一个个独立的个体,他们有自己的1D、姓名、地址、年龄、家庭、收人情况等。在此基础上,企业还不断地将客户的消费时间、地点、 产品、数量、金额、消费频率、消费种类、消费范围等信息存人其中,甚至也包括客 户的消费行为、兴趣爱好等信息,使原有的数据量急剧膨胀,很快爆发性地生成 为大数据群,于是企业可以通过对大数据群的深人挖掘,更深层次地理解客户行 为和消费趋势,使企业不仅能够对每一个客户做到了如指掌,而且对企业生产的 现状和趋势也心中有数。
这样的客户信息收集工作,不少企业早在几十年前就已经开始。譬如,五星级酒店往往会仔细地记录一些VIP客户的生日、兴趣爱好、特殊要求等。但由于数据存储和处理技术的限制,这些工作还处在较低水平。也就是说.在小数据时代,企业存贮的数据其实无法真正满足建立和分析所有用户的“360度视图”。 但在大数据时代则可能完全不同。首先,大数据的采集本身就不是一种样本的抽取和选择.而是无遗漏、全覆盖的数据采集。其次,大数据的采集是24小时全方位、全天候的,尤其是移动智能终端的普及及GPS等定位技术的应用,使得数据追踪和地理信息、位置信息的采集成为可能。
在大数据时代.媒体要建立这样的受众“360度视图”其实更为容易,因为媒介中所有的信息都是数字化的,受众在进行新媒体和网络阅读、浏览时必然会留下他们的足迹。每一位受众有固定的IP地址,计算机通过cookie等技术手段可以精心、细致地记录下受众所有的使用行为。譬如,选择在什么时间上网、上了哪些网站、浏览了哪些信息、下载的是什么内容、对哪些信息有特别的兴趣爱好、 如何评论和转发、如何消费时间等。对这些大数据的存储和分析,将使得媒体生 产的产品和提供的服务更有针对性、更加精准化和个性化,能够选择最适合的时 间、在最适合的空间更准确地向受众推送出最符合其需求的信息内容。
相关试题
判断题 微信更具有媒体特性,更适合进行企业品牌的曝光、公共关系和媒体关系的维护、客户关系的维护等。
判断题 我国最早的中文的近代报刊《察世俗每月纪传》,于1815年8月在华人较为集中的马六甲创刊。担任刻印和发行工作的梁发被认为是我国最早从事新闻工作的报业人员之一。
判断题 “现在世界上除了军事上的星球大战之外,还有另一场星球大战,它所涉及的不是导弹,而是通过无线电向世界上各个偏僻地区传播的新闻和意识形态。”(美国《国际论坛先驱报》)“如果我们教会苏联的年轻人唱我们的歌曲并随之舞蹈。那么我们迟早将教会他们按我们所需要他们采取的方法思考问题。”(英国《泰晤士报》社论引美前中情局长杜勒斯语)“卫星电视使印度人感到,印度的一切都是小好的,而西方文化都是那么美妙,传统的社会价值观正在被摧毁……”(印度作家理查德·克拉斯达)“如今美国最大的出口产品不再是地里的农作物,也不再是工厂里制造的产品,而是批量生产的流行文化——电影、电视节目、音乐、书籍和电脑软件。”(保罗法里《华盛顿邮报》)这些材料从不同的角度反映了信息全球化时代的信息侵略问题。信息侵略是指一个国家或民族试图利用自己在传媒和信息上的优势,将自己的核心价值观渗透和推广到其他国家或民族的传播体系和精神领域,最终达到嫁接和取代的目的。信息侵略与信息交流的根本区别在于:打破善意平等、自觉自愿的前提,实施信息侵略的一方往往凭借其独特的经济实力和传播优势,有预谋地引诱或迫使对方接受自己的核心价值观。1983年里根政府推出“广播星球大战”计划,美国《国际先驱论坛报》对此评论,又一场通过无线电向世界上各个偏僻地区传播的新闻和意识形态的星球大战已经开始。布什甚至号召欧盟各国“参战”,融化掉社会主义。实际上,当今的信息侵略已不只是针对社会主义国家,全世界范围内的信息大战已经打响。(1)信息侵略的性质①信息侵略的渊源尼克松在1988年出版的《1999——不战而胜》中历数了美国在朝鲜、越南战场的失败和推行和平演变战略的经验教训:“进入21世纪,采用武力侵略的代价将会更加高昂,而经济力量和意识形态的号召力,将成为决定性的因素。”主张开辟“思想战场”,用美国人引以为自豪的“自由、民主、人权”的价值观去统治世界,实现“思想的征服”。“思想的征服”,其实质还是政治的斗争,而信息侵略则是手段。1984年英国《泰晤士报》的社论引用美国前中央情报局局长杜勒斯的话说明输出文化,吸引对象国青年乐意听摇滚乐,跳摇摆舞,穿上饰有星条旗的圆领紧身汗衫和美国牛仔裤,会使他们不喜欢《国际歌》,逐渐脱离社会主义的“束缚”而获得“自由”。②以电视媒介为先导的文化侵略针对以电视媒介为前导的西方文化,尤其是美国文化的入侵引起了全世界的关注。以色列前外长佩雷斯曾说过,对以色列而言,最大的威胁并不是军事入侵,而是文化入侵。法国、加拿大、英国等欧洲国家都对美国的文化入侵表示忧虑,有的提出批评。印度作家理查德·克拉斯达认为:卫星电视使印度人感到西方文化是那么美妙,进而摧毁了传统的社会价值观,此次外来文化的入侵,不敢说我们一定能顶得住,因为电视的诱惑力太大了。③英语的广泛应用成为信息侵略的助推器语言作为思想和文化的载体,成为抵御外来文化侵略的一道重要防线。语言在竞争中失败,文化和知识亦会随之消失。随着英语的广泛使用和借助于广播、电视以及信息高速公路的强力传播,英语逐渐成为世界语。如果英语真的一统天下,那么英语文化必将吞噬其他国家的文化而成为世界文化和霸权文化。非英语国家学习英语在吸收先进科技、借鉴优秀外来文化同时,也为腐朽文化的入侵、反动思想的渗透打开了城门。因此,信息侵略一旦突破语言的防线,其后果不堪设想。(2)信息侵略的危害保罗·法里在《华盛顿邮报》写道,如今美国最大的出口产品是批量生产的电影、电视节目、音乐、书籍和电脑软件。信息侵略借助于强大的传播网络、先进的传播科技、庞大的采编队伍、雄厚的经济实力和强劲的信息优势,形成一种压倒性的不可阻挡的信息洪流或“传播顺差”。作为文化资源大国,目前我国文化产业占GDP比重不足4%,占世界文化产业市场份额不足3%。与之相比,发达国家文化产业占GDP比重平均在10%左右,美国达25%,其在世界文化产业市场中所占份额则高达43%。如果不反抗英语文化帝国主义,就如新加坡资政李光耀所说,我们可能演变成不伦不类的西方社会,那将是我们的一场巨大灾难:①信息侵略垄断信息资源,控制态度行为,干扰正确决策;②信息侵略污染和毒化社会风气,腐蚀和败坏人的灵魂,摧残和销蚀民族文化,动摇和破坏社会稳定。特别是当两国关系紧张或爆发战争时,媒体强国就会马上开足马力,不惜造假和散布谣言,以扰乱人心,煽动惊慌、恐惧和仇恨心理,引发社会动乱,瓦解国人斗志。(3)世界各国对信息侵略问题的对策面对媒介强国的信息侵略,世界各国为保护和捍卫传播资源和国家主权,都在积极备战:①提高国民自身素质和判断力,号召国民自觉抵制。有些国家要求国民自觉抵制西方的信息侵略,与政府一道击败来自国外的竞争。②国家立法保卫自身文化传统,严格审查限制外来文化及传播媒介落地。新加坡对外国影视、声像制品进行审查,凡认为不洁的镜头,一律剪除。日本规定进口外国影视片必须经过三道审查关,凡是有伤公安及风俗的视像作品绝对禁止播放。1994年欧盟规定欧洲电视台播映的节目中必须有50%是欧洲制作的,且不许在黄金时间播出美国电视剧。③加强国语教育,缩小英语使用范围。加拿大魁北克省规定在工作场所禁止讲英语,街道上也禁止英文标志。甚至连英国本土西部的威尔士人都正在发起告别英语、重新推广威尔士语的运动。(4)中国对信息侵略问题应采取的对策①要健全和强化大众传播法制,对信息的品质、级次和传播范围、比例等做出严格规定。②要加强思想文化建设,用正确思想和理论武装人民群众,使其能自觉抵御外来的信息侵略,提高辨别力和免疫力。④要发展和完善本国的传播体系,形成自己的传播优势和传播特色,从而增强它同西方传播的竞争力。④要深入挖掘中华民族文化的资源,积极弘扬优秀的中华民族文化、东方文化和世界文化,向受众提供适合其需要的健康的精神食粮。⑤要创立和发展本国的跨国传播网络,团结第三世界国家,利用各国华人社团,积极在海外布点设台,从天上到地下,从有线到无线,与各媒介强国展开全方位的立体传播竞争,切实改变以往那种消极被动的局面。
判断题 新闻背景从作用分为(对比性、说明性、注释性);
判断题 网站的主页面以及网站的各个频道的主页面大部分是通过标题得到展示的,网民上网首先看到的是各个频道的页面,其次是网站的主页面。因此,利用好网络稿件标题,对于网站页面的美化将起着非常重要的作用。
判断题 决定宣传效益的因素:任何宣传都是为了达到预定的宣传目标即争取良好的宣传效益,宣传的7个环节是决定宣传效益的七个因素:(1)宣传者—谁来宣传(who)。这不但指某一个人,也包括一个团体或宣传机构(例如报社、电台、电视台)。宣传者不但是宣传活动的组织者,是一切宣传的信源,而且宣传者的自身形象是决定宣传成败的重要因素,在有些情况下,是决定性因素。宣传者的自身形象主要是指宣传者在受众心目中的信任度,信任度和宣传效益成正比。(2)宣传对象—向谁做宣传(whom)。宣传对象是一批人,他们有自己的利益,有自己的认知结构,有自己的记忆和思想。对十一切宣传,他们会做出能动的反应。在整个宣传活动中,他们是积极的参与者,会以各种方式影响宣传过程。宣传对象是宣传效果的承担者,也是宣传效果的最后鉴定者。(3)宣传内容—宣传什么(what)在宣传效益中,起最后决定性作用的是宣传内容。这包括:宣传者是宣传真理还是宣传谬误;宣传者是提供真实材料、向受众讲真话还是弄虚作假;宣传内容是维护人民利益还是损害人民利益。(4)宣传场合—在什么样的社会环境、什么地方做宣传(where)从宏观的社会背景而言,有封闭环境和开放环境。在封闭的环境下,信息渠道单一,外界的干扰小,没有竞争性的或敌对性的信息、观点,宣传就容易取得预期的效果。在开放的环境下,信息渠道多样,各种各样竞争性的或敌对性的信息、观点都设法争取受众,受众的思想比较复杂,宣传要取得预期的效果就比较困难。善于组织和选择具体的宣传场合是取得预期效益的重要一环。(5)宣传时机—在什么样的时机做宣传(when)在不同的历史时期,人们对宣传需求是不同的,宣传效益也不同。例如,在局势动荡时期,社会问题错综复杂,人们急于寻求各种解决问题的方法,此时的宣传对于受众有很大的吸引力;在局势平稳时期,信息的透明度高,人们对自己已有的思想观点充满信心,强化宣传是最易被人们所接受的。在遇到挫折、遭到困难时,人们感到老的一套办法不灵,人心思变,就比较容易接受革新宣传,对强化宣传会产生厌烦。(6)宣传动机—为什么要宣传、要达到什么样的预期目的(why)宣传要取得成功,动机必须纯正,那就是要为人民利益而宣传。为小团体的利益而损害广大群众利益,或为个人自私的目的而进行宣传,那必然口是心非,这样的宣传终究要失败。(7)宣传方法—怎样宣传(how)这包括所采用的媒介、途径和宣传的手段、技巧。任何宣传都必须借助于一定的媒介、途径,采用一定的手段、技巧。问题在于宣传者是否运用得当、运用得巧妙。各种媒介、途径各有特点,宣传的手段、技巧也多种多样。宣传的成败是上述七种因素共同作用的结果。在一次成功的宣传中,可能有其中的一两种因素起突出的作用,但并不等于其他因素不起作用。
判断题 编辑可以根据版面的需要对新闻事实进行任意删改。34
判断题 时务体:时务体是指中国近代史上以维新派为代表的报刊政治家在写作中形成的一种报章文体。以康有为、梁启超为代表的维新派报刊政治家继承王韬报刊政论的传统,在政论写作中不断突破框框进行革新,逐渐形成了一种新的报章文体。这种文体以梁启超在《时务报》上发表的政论最为典型,故被称为“时务文体”。这种新文体的特点:半文半白,平易畅达,笔锋常带感情,有时还夹以口语和外来语。这种新文体出现后,风行一时,成为文言文与白话文之间的一种过渡文体,为“五四”时期的白话文运动开了先河。