《数据新闻概论》课件第六章.pptx
《《数据新闻概论》课件第六章.pptx》由会员分享,可在线阅读,更多相关《《数据新闻概论》课件第六章.pptx(26页珍藏版)》请在文库网上搜索。
1、认识数据可视化第六章数据可视化简介 第一节虽然数据可视化(data visualization)不是实现数据新闻的唯一途径,但它是制作和传播数据新闻的一种有效途径。一、数据可视化的定义(一)引发争议的“可视化”“到底什么是可视化呢?每个人都有自己的答案。有些人认为只有严格意义上的传统图形图表才是可视化。而另一些人的观点则更加开放,他们认为只要是在表现数据,不管是数据艺术品还是微软Excel表格,都可以算是可视化。我个人较为倾向于后者,但有时也发现自己站在前一阵营。毕竟,这一问题上孰是孰非并不是那么重要,只要能达成我们的目的就行了。”从探索的角度看,可视化是探索和理解大型数据集的有效途径。人类对
2、图形的理解能力很强,将数字置于视觉空间,可以激发大脑去发现和探索其中潜藏的意义。在统计学中,统计图形的应用已经广泛地证明了这一观点。从展示的角度看,数据以可视化方式呈现不仅仅可服务于研究,更有助于读者理解,围绕新闻故事设计的可视化带有很强的娱乐和艺术因素,能给读者一种传递信息的高效途径。从表达的角度看,可视化不是冷冰冰的工具,视觉传达已经超出了工具的范畴,发展为传达理念的媒介,通过各种可视化组件的设计,媒体不仅仅能让读者看懂新闻故事,还能在其中传达情感和理念、表达媒体的观点。一、数据可视化的定义(二)可视化与信息图要进一步理解“可视化”,还需要将之与一个极易混淆的词相区别,这个词就是信息图。一
3、方面,信息图是一种将数据与设计结合起来的图,有利于个人或组织简短有效地向用户传播信息。可视化和信息图之间并非泾渭分明,从广义的可视化概念入手,信息图是隶属于可视化范畴的。但是正如前面分析的,可视化并不限于“图形”,“可视化”的外延更广,为了更好地探索、展示和表达信息,人们正在借助不同的手段与方法拓展可视化的方式,这使可视化的未来呈现出更大的可能性,而不仅仅是信息图。另一方面,如果将可视化的定义限制在“数据可视化”的范畴,信息图和数据可视化之间的差异就在于它们聚焦的对象不同,信息图处理的对象是“信息”,它未必以数据的方式呈现,而“数据可视化”处理的对象是“数据”,其着重于对数据进行结构化的呈现。
4、“信息图”这个概念的产生更多的是出于设计领域对信息传播的包装和设计目的,而“数据可视化”概念的兴起则不仅仅是为了对数据信息的包装和设计,还有对数据信息的探索和研究的目的,所以两者也存在一定的差别。总体上看,可视化是个更广阔的概念,也更能与时俱进地表达数据传播的未来走向。知识窗:Column Five对信息图的分类 2008年,Column Five由3个年轻人罗斯克鲁克斯(Ross Crooks)、詹森兰克(Jason Lankow)和乔希里奇(Josh Ritchie)在美国加利福尼亚州创建。最初它只是一个创意代理,目前已经发展成由40余人组成的,致力于创作信息图表、动态图像及其他数据可视化
5、作品的媒体公司,并且是此领域中的佼佼者。他们的作品曾刊登在时代、福布斯杂志、华尔街日报等知名媒体上。Column Five按照信息和互动两个维度对信息图表进行划分。对于信息的固定(fixed)和更新(updating)是比较好理解的,即信息图表的信息来源随着时间演进是否会发生变化。对于互动的主动(active)和被动(passive)更容易混淆。Column Five是这样定义的:被动的互动主要是指阅览、聆听以及对于动态图像的暂停、快进等操作;而主动的互动包括搜索具体的数据、重塑展现的内容或者选择获取信息的形式。简而言之,就是受众是否可以基于个人需求接收信息图表的内容。Column Five对
6、信息图的分类示意图二、数据可视化的由来 公元前6200年,世界上最古老的地图出现了,说明人类历史上很早就开始运用视觉传达信息。16世纪,伴随着人类观察和测量技术、工具的进步,人们开始尝试用图像、表格来记录信息,这成为早期可视化的“雏形”。19世纪是现代数据图表技术突飞猛进的时代,在这个时期,统计图表中所有展示数据的形式条状图、饼图、直方图、折线图、时间序列图和等值线图等都已出现,且被广泛用于经济、社会、医学、物理学等诸多领域中,19世纪的后半期被业内人士视为数据图表发展的“黄金时代”。经历了全球动荡的20世纪上半期,“数据可视化”概念真正兴起于20世纪60年代。在美国,约翰托奇开创了统计学新的
7、分支:探索性数据分析(EDA),并在一篇名为数据分析的未来的论文中号召将数据分析视为统计的一个分支,与高度抽象化的数理统计学区别开来。在法国,制图师和图形理论家雅克贝尔廷出版了具有里程碑意义的图形符号学一书。这本书中提及根据数据的联系和特征,来组织图形的视觉元素,为数据可视化提供了理论基础。与此同时,计算机科学的快速发展推动了计算机图形学的产生,专门的统计计算和图形软件工具问世,适合图形的输入和显示技术也逐步成熟。这些共同促使当代的“数据可视化”以新的形式呈现于世人面前。如今,越来越多的新闻机构开始重视用可视化这种媒介来讲述故事。杰夫麦考吉(Geoff McGhee)曾任职于纽约时报与ABC新
8、闻,20092010年他在斯坦福大学研究数据可视化,并发布了一组名为数据时代的新闻的系列视频,邀请各大媒体的主要技术人员和数据记者来阐释他们如何用数据可视化做新闻。案例:早期数据可视化的经典作品约翰斯诺的伦敦霍乱地图 一张地图能改变世界吗?答案是能。1854年,一张由约翰斯诺(John Snow)医生制作的地图彻底改变了世界,也因此成为早期可视化的经典作品而被人津津乐道。1854年,伦敦霍乱流行,现在流行病学奠基人斯诺通过研究霍乱死者的日常生活情况,寻找到他们的共同行为模式,发现了霍乱与饮用不洁水的关系。在他的呼吁下,政府及时关闭了不洁水源,有效制止了霍乱的流行。他还推荐了几种实用的预防措施,
9、如清洗肮脏的衣被,洗手和将水烧开饮用等,效果良好。虽然约翰斯诺没有发现导致霍乱的病原体,但他创造性地使用空间统计学查找到传染源,并以此证明了这种方法的价值。今天,绘制地图已成为医学地理学及传染学中一项基本的研究方法。”斯诺的霍乱地图“成为一个经典案例。数据可视化的构成要素 第二节可视化作为一种媒介,是设计者通过数据和其他视觉元素的协作而生成的。设计可视化的过程相当于对这些视觉元素进行编码的过程,这个过程依赖于人类大脑对这些视觉元素长期存储的认知模式,即人们已经习惯于在日常生活中针对相应的视觉元素的相互组接和影响形成较为固定化的视觉暗示。一、可视化编码的静态视觉变量(一)位置 可视化中的“位置”
10、是展示数据在给定空间或坐标系中的相对分布状况的。在坐标系中,每一个点都代表一个数据,这些数据点大小相同,但是“位置”有差异。数据在坐标系中即可通过“位置”呈现数值大小的差异,也可运用“位置”反映数据之间的顺序差别。当大量数据出现在坐标系中时,可以运用“位置”一目了然地做数据离散程度的判断。(二)长度 长度是从图形一端到另一端的距离,其经常出现在条形图中,用以展示或比较数据值的大小。一般长度越大,数据值也越大。用长度比较数据值时要注意必须让读者看到线条的两端。图表应该展现一条基线(baseline),基线是从零点开始的一条垂直线。在现实中有一种误导读者的做法,即在纵坐标的单位设置上省略了一些数字
11、或者没有从原点0开始,而是故意选择一个数字作为起点,或是纵坐标的单位不是等距的,省略了一些数据。这样比较的“长度”通常会夸大差异或数据波动,是不准确的。案例:华盛顿邮报可视化报道深度的难题 2014年3月,马航MH370失联是当年最为轰动的国际新闻之一。当各国都投入大量人力在相关海域展开搜救时,澳大利亚海军的海洋盾号舰船宣称截取了来自深海的飞机黑匣子信号,随即澳大利亚官方称希望能在数日内找到失踪的MH370航班。但是华盛顿邮报网站编辑对此不以为然,他们制作了名为深度的难题的报道,意在以可视化方式揭示定位黑匣子是一件挑战极大的工作。这张长图以相应的比例微缩展现了海下15 000英尺的世界,画面每
12、隔1 000英尺设计一道白线,并标注数据以示分隔,读者用手指不断点击观看的同时,既能感受到深海之深,也能从分隔线条和数据标识中了解所处的实际海下深度,而不至于迷失在画面中。画面中有一个颇具匠心的“长度”设计,即将海平面以上的最高建筑以相应的映射方式呈现在海下,从而反衬出海下之深。如作为美国华府的地标,华盛顿哥伦比亚地区最高的建筑华盛顿纪念碑如果倒立于海底,只不过到555英尺深,美国人熟知的纽约帝国大厦如果倒立于海底,也只有1 250英尺深,而当今世界最高的建筑迪拜的哈利法塔倒立于海底也不过2 717英尺深,这些与海盾号发现信号的15 000英尺深度海域相比,简直是微不足道的深度了。编辑通过找到
13、读者熟知的建筑物的长度来做参照,以展示海底的深度,相当于用读者熟悉的事物来做陌生话题的“引渡”,使该可视化效果更加便于理解。一、可视化编码的静态视觉变量(三)角度 角度是经常出现在饼图中的视觉变量,角度取值范围可以从0度到360度不等,能体现总体中不同组别数据所占的比例,从而呈现总体数据内部的具体结构。2013年11月25日,网易“数读”栏目推出了一则关于空气质量满意度的数据新闻,该新闻来自盖洛普公司针对空气质量在全球160个国家和地区调查的居民们的主观感受数据。调查发现中国内地居民对空气质量满意的比例为77%,不满的仅有21%,在受调查的160个国家和地区中排在第70位。而香港人则是全世界对
14、空气质量最不满的人群,因为满意空气质量的香港人仅占34%,不满的达到65%。在该报道中,编辑选用了饼图来做态度的可视化设计,将不同态度所占的比例以角度的差异呈现,并将不同年龄组的数据进行对比。从饼图中角度的差异和色彩的区别可以清晰地看到内地和香港民众对空气质量的态度差异。值得注意的是,因为调查中除了不满意和满意两种态度以外,还有一些其他的态度,因而编辑在制作饼图时还设计了以浅灰色的楔形来代表这部分态度,以使饼图更加客观地反映真实的数据。一、可视化编码的静态视觉变量(四)方向 一些可视化研究专家将“方向”这一视觉变量称为“斜度”,这两个概念是相同的。如果说角度是相交于一个点的两个向量,方向则指一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据新闻概论 数据新闻概论课件 第六章 数据 新闻 概论 课件 第六