大数据推动媒体转型升级
早在1980年,托夫勒在《第三次浪潮》中就曾预言:“如果说IBM的主机拉开了信息化革命的大幕,那么大数据则是第三次浪潮的华丽乐章。”在世界史上,人类第一次浪潮是争夺对胃的控制权,靠把功能专业化,实现生存主动权;第二次浪潮是争夺对钱包的控制权,靠把价值专业化,实现发展主动权;第三次浪潮则是争夺对大脑的控制权,靠把数据专业化,实现“意义满足”主导权。
因此,“大数据”不是一个新概念,而只是在2012年引起社会广泛关注的热同,媒体甚至将2013年称为“大数据元年”。目前,几乎所有世界级的互联网企业,都将业务触角伸至大数据产业。其他行业也都在思考如何将大数据转变为一种竞争优势.转变为未来发展的驱动力,各大媒体则在思考如何利用大数据推动产业转型升级。但是,大数据(Big Data)到底是什么呢?
一、大数据与大数据时代
2012年以来,“大数据”(Big Data)概念虽然成为这一时期的热点词汇,却没有一个统一的定义。它更多地被人们描述为一种现象或一种状态。2011年第一季度的Teradata Ma兄中Gartner公司的工程师Merv Adrian就将“大数据”描述为:“超出常用硬件环境和软件工具在可接受时间内为其用户收集、管理和处理数据的能力。”麦肯锡全球数据分析研究所的观点则认为:“大数据是指大小超出了典型数据库软件工具、存储、管理和分析能力的数据集。” 由此可见,人们用“大数据”来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。所谓大数据只是一个相对的概念,指的是相对传统数据而言,大数据在数据量的大小尺度上已经超越了传统意义上的尺度,到了一般硬件和软件无法承受的地步。
大数据不仅是一个尺度的概念,也是一个变动的概念。“这些定义暗示着大数据的界定会随着技术的进步而变化,以往的大数据或今天的大数据.在明天将不再是大数据。”®也就是说,大数据的“大”并不是一个在量的尺度上明确的、普遍适用的概念。也许在我们曾经使用1.44M容量的软盘年代里,一张700M容量的光盘就已经可以称得上是大数据,而在今天的大数据时代里,我们所用来计量数据的单位已经从G发展到T,并迅速地突破到P,直奔E、Z、Y等计量单位。 数据存储单位之间的关系是以1024为换算单位,譬如,1G= 1024M,1T = 1024G,1P=1024T,1E=1024P,也就是说人类的数据存储和处理能力每上一个 新的台阶,就意味着1024倍的数量级增长。
这样的数量级描述似乎还是有点过于抽象,《大数据时代》一书的作者打了一个更为形象且直观的比喻:“2013年人类存储的数据预计能达到约1.2Z 字节,其中非数字数据只占到不到2%。如果把这些数据全部记在书中,这些书可以覆盖整个美国52次。如果将之存储在只读光盘上,这些光盘可以堆成五堆,每一堆都可以伸到月球。”而根据国际数据公司(IDC)的估算显示. 2020年全球数据总量将较目前增长44倍,达到35. 2ZB,而年增长率将维持 在40%以上。
大数据还是一个具有应用价值和战略意义的概念。解放日报报业集团社长尹明华曾说:“新媒体的本质就是数据分析。我们已经从信息时代走到了数字时代和智能时代,如果数据被赋予背景,它就成了信息;如果数据能够提炼出规律,它就是知识;如果数据能够借助于各种各样的工具在分析的基础之上为我们提供正确的决策,它就是资源。” 如果大数据不加以利用或者没有应用价值,那么它也就没有任何意义。
美国政府2012年3月发布了《大数据研究和发展计划》Research and Development Initiative),认为大数据是“未来的新石油”,表示一个国家拥 有数据的规模、活性及解释运用的能力将成为综合国力的重要组成部分.未来对 数据的占有和控制甚至将成为陆权、海权、空权之外的另一种国家核心资产。美国政府声称要将大数据研究提升为国家意志,并宣布投资2亿美元拉动大数据相关产业发展。这是美国继1993年宣布“信息高速公路”计划后的又一次重大科技部署。联合国也在2012年发布了大数据政务白皮书,指出大数据对于联合国和各国政府来说是一个历史性的机遇,人们如今可以使用极为丰富的数据资源,来对社会经济进行前所未有的实时分析,帮助政府更好地响应社会和经济运行。
对此,李国杰院士认为:进人大数据时代,人们关注的重点将转向数据。 “作为重要战略资源,大数据关系到国家的经济结构调整和产业升级。”“大数据还将引发科学思维与研究方法的一场革命。”“大数据是与自然资源、人力资源一样重要的战略资源,是一个国家数字主权的体现。”“在大数据领域的落后.意味着失守产业战略制高点,意味着国家安全将出现漏洞。因此,我国需要尽快制定国家大数据战略。”用数据说话是数字化时代的重要特征。国家大数据战略应该能够覆盖包括政治、经济、文化、教育、传媒在内的各个重要领域。不论是从事传媒研究还是进行媒介产品生产,在未来也都需要建立大数据集聚、研究和共享平台,构建大数据良性发展的生态环境,形成全程的、立体的大数据产业链。
二、大数据3VS模型与4V特点
如果说互联网重塑了人类信息交流的方式,那么大数据则颠覆了人类思考世界的方式。随着时间的推移,互联网企业正在利用数据筛选工具,对海量数据进行集中挖掘、钩沉,以便向用户提供更有用的数据洞察和趋势预测。大数据既然作为一种区别于传统数据的概念而提出,那么它的模型和特点分别是怎样的呢?
2001年META集团的分析师道格.莱尼(Doug Laney)就率先提出:“数字时代下数据增长的三个维度,即增加量(Increasing Volume)、速度(Velocity)、类型(Variety)以及来源(Sources),这被称为大数据的3VS表述模型,在很长一段 时间中被人们所使用。”@具体分析如下:
(1)数据增量巨大。无处不在的信息感知和采集终端不仅采集了海量数据,
而且数据急剧增加且从不删除,但数据急剧增加其价值密度则相对减少。
(2)处理速度极快。大数据低密度的现实状况要求数据公司必须建有强大的数据分析系统,以便更迅速、更高效地完成数据的价值“提纯”,并及时做出预测和提出对策。
(3)数据类型繁多。大数据几乎无所不包,音频、视频、图片、文字、网络日 志、兴趣爱好、收入支出、地理位置信息等.都会自动存储在数据库存。
(4)数据来源广泛。上至天文地理,下到鸡毛蒜皮,从公共事务到个人生活, 庞大的数据感知和采集系统几乎都能无一遗漏地予以收取、存贮。
此外,从大数据运营管理方面来讲,也有人总结出了挖掘大数据价值的七种运营模式:模式①,数据存储空间出租;模式②,客户关系管理;模式③,企业经营 决策指导;模式④,个性化精准推荐;模式⑤,建设本地化数据集市;模式⑥,数据 搜索;模式⑦,创新社会管理。
2012年国际数据公司(IDC)更新了大数据的观点:“大数据是一种通过高速 捕捉、发现或分析.从大量数据中获取价值的新型技术架构。他们在3VS的基 础上将大数据的特点概括为4V,即Volume(海量)、Velocity(高速)、Variety(多 样)、Value(价值)。”&
1.海量(Volume)
海量显然是大数据最为显著的特征。数字时代中信息的快速膨胀已经成为一种常态,数据越来越多,存储设备的容量越来越大,我们曾经用“信息爆炸”“信息泛滥”来形容.但是今天这些词汇已经难以用来形容数据急骤膨胀的新发展。大数据海量信息主要来源于存量信息和增量信息两个部分。对于存量信息,《大 数据时代》的作者之一维克托迈尔-舍恩伯格在其另一本著作Delete中感慨: “数字技术已经让社会丧失了遗忘的能力,取而代之的则是完善的记忆。”在他看来,不论是商业机构或是公共机构,它们都在大tt地收集并稳妥地保管信息,这些信息不管是否真的有价值,从来没有被删除过。
另一方面则是越来越多的增量信息构成了大数据的重要组成部分。据统计,全球每天会有220万TB的新数据增加。这些庞大的数据自然不可能都是人类运用大脑智慧创造的增量信息,事实上90%的增量信息都是这两年人类依赖于机器自动生产的。“在新数据的产生过程中,并不会涉及人工参与,它们完全由机器自动生产。这就如同飞机引擎中的传感器,在没有任何人下达指令的情况下,它也会自动生成周围环境的数据”©,飞机上的“黑匣子”则自动收集、记录和存贮这些数据。
通常,人们对增量信息比较重视,因为它能立即产生现实的利益。殊不知,这是短视。如果将中国5000多年的文化典籍和文化遗产作为存量信息数字化,加上生成和创造的增量信息,采用大数据处理方法加以合理运用,那么必将产生超岀常规的巨大的生产力和创造力,使经济社会的发展突飞猛进。
2.高速(Velocity)
高速(Velocity)是大数据得以呈现的重要基础。高速传输数据既包括数据进人硬件终端的速度,也包括数据输出的速度,甚至包括数据在软硬件系统中运行、被检索和分析的速度。因此,没有数据传输速度的提升,也就不可能产生大数据的采集、存储、传递、检索、分析、预测等。今天,一方面互联网速度已经从最 初的KB发展到MB再到GB,并且还在继续向更快的速度发展;另一方面软硬件终端中电子元器件间的传输速度也在经历着跨越式发展,而与此同时大量网络设备的增加也在推动着数据传输速度的提升,例如,不少城市正在进行的无线城市、智能城市项目,就直接将整个城市的无线传输速度提升到百兆的水平。时间就是生命,效率就是金钱。追求高速度正成为大数据时代许多互联网公司、政府、企业和媒体的重要目标。
3.多样(Variety)
大数据的多样性特点主要来自两个方面:首先是数据来源的多样性。我们今天所看到的大数据并不是来源于某一国家、某一地区、某一行业或某一家机构,而是来源于全球范围内数不胜数的采集主体,如搜索引擎、社交网站、新闻门户、购物系统、公共服务系统、信息接收系统和通信系统等,甚至那些被置于城市中的摄像头、设备中的传感器,它们无一不是大数据的来源,大数据也正是这些不同来源信息的总称。其次,数据格式的多样化。在大数据中主要包含了三种数据类型,即结构化数据、半结构化数据和非结构化数据。其中传统的标准化、结构化的数据只占到大数据的15%左右,“85%的数据属于广泛存在于社交网络、物联网、电子商务等之中的非结构化数据。这些非结构化数据的产生往往伴随着社交网络、移动计算和传感器等新的渠道和技术的不断 涌现和应用”。
今天,这些非结构化数据在大数据中占比越来越大,对这些信息的采集、挖掘和分析的能力也正是大数据的特色所在。以Facebook为例,“作为目前最大的社交平台,坐拥数亿计的用户群,上传照片数达到3亿张,每半小时通过Hive扫描的数据就达105TB之多,而Facebook的工程总监Parikh解释了这些数据对于公司的意义:大数据的意义在于真正对你的生意有内在的洞见。 如果你不能好好利用自己收集到的数据,那你只是空有一堆数据而已,不叫大 数据”。
4.价值(Value)
正如Parikh所说,大数据的意义和价值还需要拥有着敏锐的洞察,否则大数据也就是一堆冷冰冰的数字。海量的原始数据只有经过分类、加工、整理、分析,才能满足人们个性化和专业化的需求,体现其价值。不断增加的庞大数据带来的不仅是风险与压力,也是挑战和机遇。从量变到质变,通过对海量数据的深人挖掘和科学分析,人们能够拨云见日,在碎片化的信息中发现事物的整体走向,在杂乱无章的困境中找到解决问题的出路.可以洞察原本极易错过的商机, 可以预测一般难以发现的趋势。但是,只有不断更新、优化大数据处理分析模式和软件,才能具有更强的决策力、洞察发现力和流程优化能力。
大数据的价值无处不在。在医疗卫生行业,大数据具有流行病预测和防治的价值;在销售行业,大数据具有把握流行趋势和定位消费市场的作用;在金融股票市场,投资家可以利用大数据评估市场波动和预估股票走势;政治家们则可以通过大数据描绘公众的“情感地图”和测量不同地区的“舆情温度”,感知民众的政治偏向;文化学者还可以通过中国五千年历史典籍和文化收藏来分析和提炼文化基因,为文化走向世界提供助力;新闻业界已经可以根据大数据定期不定期地绘制新闻“今日图表”、经济“全球脉动”、时尚“流行趋势”。
在全球复杂网络研究权威、无尺度网络的创立者艾伯特-拉斯洛•巴拉巴西 (Albert-Laszlo Barabisi)的眼中,大数据是观察人类社会的“显微镜”。他认为, 人类正处在一个聚合点上,在这里数据、科学及技术都联合起来共同对抗那个最 大的谜题——我们的未来。“人类跟悬浮在水中的花粉微粒其实没什么不同,受 到某种跟左右花粉运动一样神秘的原因的驱动,人类大部分时间也是运动不止。
随着手机、GPS以及其他手持设备的迅速普及,很多新工具能够追踪人类的活动。有了这些机器设备,如今我们的一举一动都在无数个‘显微镜’下现形。”可见,大数据意味着不限量的样本数,意味着全方位的信息采集,也意味着人类的行为不再是小概率、不可预测的随机事件。这些看似凌乱的甚至充斥着垃圾信息的大数据中蕴藏着人类行为的基本规律,而对于这种规律的挖掘,以及不断提高它的精度,这是所有大数据的价值所在。
关于大数据特点,还有一些与国际数据公司(IDC)不同的观点。譬如,IBM 就提出了自己的大数据4V特点或理论,以真实性(Veracity〉替代了价值(Val- ue),说明虚假数据不仅一文不值,而且极其有害。还有观点认为,大数据的特点也包括它的杂乱无章和自动生成,这也是有道理的。
三、大数据时代媒介新角色与新使命
在数字化信息无处不在的今天,大数据急剧膨胀,应用范围十分广泛,甚至在大数据的概念还没出现或没被人注意的时候,很多先驱型的企业就已经开始使用大数据来创造价值。譬如,耐克公司2006年便开始通过捆绑在iPod中的Nike+产品建立了覆盖全球的跑步者数据库,通过大数据挖掘得到不同市场中用户的使用习惯,进而制订不同的市场策略;美国零售企业Target则通过对用户购买记录的数据分析,对消费者进行划分,从而制订了有针对性的营销推广方案。这样的例子很多,如金融服务行业、医疗卫生行业、保险行业、网购系统等,都利用大数据对客户市场进行细分,进而制订有针对性的服务项目和整合营销传播方案。
在媒介融合和大数据时代,各行各业都已经同大数据密不可分,它们一方面生产数据,另一方面又消费数据,大数据如影随形、挥之不去。融合新闻生产从信息采集、鉴别、加工、制作、传播到市场分析、经营管理等,都需要对庞大的传播 者(记者、编辑、主持人、导播、摄影、摄像、编剧等)数据、内容(文字、声音、图片、 图像等)数据、媒介(报纸杂志、广播影视、图书、网络等)数据、受众(读者、听众、 观众、网民等)数据等进行挖掘、分析和整理,以进一步提高媒介经营管理的水平 和新闻传播的效果,不断提高媒介的社会效益和经济效益。大数据时代呼唤大 众媒介必须承担和履行新角色和新使命。
1.大数据的提供者
大数据的提供者来源于社会各部门数据的集合,这些数据中包括了结构性 数据(即行数据,存储在数据库里.可以用二维表结构来逻辑表达实现的数据),也包括非结构性数据(包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频、视频信息等)。例如,金融服务领域中的证券、投资、信贷等 提供了大量的结构性数据.而政府、学校、媒体等则可能提供了大量的非结构性 数据。麦肯锡公司下属的全球研究院(McKinsey Global Institute)在2011年5 月出版的一份关于大数据的研究报告中,对美国包括生产制造业、媒体业、银行、 教育等17个行业所拥有的数据量进行了估算,并指出:“美国新闻传媒业(Communication and Media)共拥有数据量为715Petabyte,位列第三,仅次于离散制 造业(Discrete Manufacturing)的966Petabyte 和美国政府的848Petabyte,而在 估算中新闻业的数据质量要远高于医疗、教育等其他行业。与此同时,报告还发 现在众多行业当中新闻媒体存储了更多的视频和音频数据,且在存储时间上也 有优势。”®因此,作为人类社会信息采集、加工、制作、编辑、传播的专业性组织 机构.媒介必然成为大数据的重要提供者或生产者。随着网络和新媒体的迅速 崛起,媒介内容生产的速度得到了极大提高,数据呈几何级数增长。同时,社交 媒体的出现又让社会大众都成了数据生产者和提供者,也极大地丰富了大数据 的内容资源。
2.大数据的传播者
大数据的显著特点就是高速传输数据。作为专业的传播机构.新闻媒体显然是高速传播大数据特别是非结构性数据最称职的传播者。一方面,新闻媒体本身的目标就在于以更加快速、高效、及时的方式准确传递新闻信息,最大限度地缩短新闻事实的发生与接受之间的时间距离,这是新闻生产的重要特征,是新闻存活及构成新闻价值的重要条件。新闻姓“新”.是易碎品,慢了就成了“旧闻”。过去新闻报道注重“抢今日”,如今新闻传播注重“争分秒”。 所以,长期以来新闻媒介不断发展演化的过程,正是不断追求传播速度、创新传播方法和优化传输渠道的过程,从烽火到信鸽,从电报到电话,从广播到电视,从有线到无线,从电脑到网络.再到今天的融合媒介和大数据.随着传播技 术和数字化水平的提高,媒介信息传输的速度实现了一次次新的飞跃,不断登上新台阶。另一方面,新闻媒介的信息传输也在追求最大的信息覆盖面和人 口到达率,力争获得最大的信息认知、理解和记忆效果。广播电视从有线到无线、从光缆到卫星,报纸杂志也从印刷转向网络、由单媒介转向多媒介等,媒介可能的覆盖范围和人口到达越来越大。大众媒介与受众之间的传播活动构成了当今社会数据流通的主要形式,媒介也理所当然地成了大数据时代一道最亮丽的风景。
3.大数据的挖掘者
大数据的价值并不是显而易见的,它需要经过挖掘、分析及深度的解读,这恰恰也是媒介职能的一部分。新闻媒体需要满足受众对社会信息需知、想知而未知的欲望,大数据挖掘可以像“显微镜”一样把握受众的心理需求、审美趣味和 接受习惯,探查受众的年龄层次、收人水平、工作单位、职业特点、家庭人口等,从 而可以提供有针对性的、个性化的、精准的信息和服务。全球数据正以几何级数 增长,其中75%为非结构性数据,能够对大数据进行深度挖掘的政府、媒体等非 结构性数据会变得越来越重要。陈昌凤和刘少华在《大数据时代如何做新闻》一 文中认为:“数据挖掘的新闻往往比传统新闻报道更有力度,也对记者提出了更 高的要求。”“西方媒体对数据的运用越来越重视,出现了不少专门与数据打交道 的记者,通过数据挖掘的方式进行新闻报道。他们在繁杂琐碎的非结构化数据 之后,发现常规新闻中不能体现的逻辑,帮助读者对新闻事件进行深度解读。”® 未来新闻媒体在大数据的挖掘和分析中,将不仅会向受众展示新闻报道的历史 纵深、现实状况,而且会向受众提供新闻事件的空间结构、发展趋势和应对措施 等,使媒介真正成为受众的良师益友和生活指南。
4.大数据的应用者
媒介利用大数据创造价值并不仅是通过挖掘大数据生产有针对性的个性化的新闻报道,媒介大数据既包括了社会信息的大数据,也包括了媒介用户的大数据,用途十分广泛。比如,受众的个人信息资料,浏览的内容和路径偏好.阅读的内容、时长和习惯,发表、评论和转发的特点,崇拜对象、粉丝情况和互粉对象等, 这些信息在传统媒体时期获取是相对困难的,但在新媒体与融合媒体时期,这些 信息可以无一遗漏地被媒体采集、存贮,并可加以反复挖掘、分析、解读和应用。 科学、合理地应用大数据,掌握受众的心理需求和行为特点,可能引发传统的媒 介产业流程发生革命性的变化,使得媒介生产效率和信息传播效果大幅提高,未
来甚至还可能形成媒介数据服务、数据咨询、数据治疗、数据保健等一系列新兴 产业。同时,“大数据的出现颠覆了实验科学、理论科学与计算科学的传统.催生 了一种新的科研模式”。数据密集型科学可以从计算科学中区分出来,称为科学 研究的“第四范式”。这将使新闻学、传播学和媒介研究如虎添翼。大数据已 经可以成为媒介获取竞争优势和主动权的制胜法宝。
相关试题
判断题 编辑工作的特点采编区别:1.性质,一是线面社会现实,一是二线修改加工2.目的,一是写稿,产品是单个体,一是出版产品综合体3.工作方式,一是记者独立承担,一是集体作业导致的采编矛盾:1.编辑指挥得当正确影响记者采访的成败和水平发挥2.编辑对稿件的取舍修改关系记者劳动成果的体现3.编辑的人品修养业务素养影响采编的合作效果特点:1.相对于报纸及其新闻传播活动而言是“总设计”与“总指挥”(1)报纸编辑是报纸编辑方针的制定者,是报纸整体形象的设计师(2)报纸编辑是每一阶段新闻报道活动的策划者和组织者(3)报纸编辑是记者从事采访写作的指挥者和参谋2.相对于新闻传播活动而言是“集大成者”和“总把关人”3.对于新闻素材的“再认识”和“再创作”主要体现在:(1)对新闻素材的重新选择和组合(2)对表现形式的再创造。
判断题 网络空间应该成为我们党凝聚共识的新空间。
判断题 公有制为主体、多种所有制经济共同发展的基本经济制度,是中国特色社会主义制度的重要组成部分,也是完善社会主义市场经济体制的必然要求。
判断题 党中央把军民融合发展上升为国家战略,从党和国家事业发展全局出发进行总体设计,组织管理体系基本形成,战略规划引领不断强化,重点改革扎实推进,法治建设步伐加快,军民融合发展呈现整体推进、加速发展的良好势头。
判断题 记者采访犯罪嫌疑人、罪犯的亲属前应征得他们的同意。20
判断题 通讯:是运用叙述、描写、抒情、议论等多种手法,详细地报道新闻事件或典型人物的一种报道形式。
判断题 导语,一般指“电头”后的第一句或第一段文字,用来提示消息的重要事实,使读者一目了然。
判断题 播音工作具有鲜明的传媒工作的属性?