收藏 分享(赏)

《数据新闻概论》课件第六章.pptx

上传人:bubibi 文档编号:16057409 上传时间:2023-09-14 格式:PPTX 页数:26 大小:3.96MB
下载 相关 举报
《数据新闻概论》课件第六章.pptx_第1页
第1页 / 共26页
《数据新闻概论》课件第六章.pptx_第2页
第2页 / 共26页
《数据新闻概论》课件第六章.pptx_第3页
第3页 / 共26页
《数据新闻概论》课件第六章.pptx_第4页
第4页 / 共26页
《数据新闻概论》课件第六章.pptx_第5页
第5页 / 共26页
亲,该文档总共26页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、认识数据可视化第六章数据可视化简介 第一节虽然数据可视化(data visualization)不是实现数据新闻的唯一途径,但它是制作和传播数据新闻的一种有效途径。一、数据可视化的定义(一)引发争议的“可视化”“到底什么是可视化呢?每个人都有自己的答案。有些人认为只有严格意义上的传统图形图表才是可视化。而另一些人的观点则更加开放,他们认为只要是在表现数据,不管是数据艺术品还是微软Excel表格,都可以算是可视化。我个人较为倾向于后者,但有时也发现自己站在前一阵营。毕竟,这一问题上孰是孰非并不是那么重要,只要能达成我们的目的就行了。”从探索的角度看,可视化是探索和理解大型数据集的有效途径。人类对

2、图形的理解能力很强,将数字置于视觉空间,可以激发大脑去发现和探索其中潜藏的意义。在统计学中,统计图形的应用已经广泛地证明了这一观点。从展示的角度看,数据以可视化方式呈现不仅仅可服务于研究,更有助于读者理解,围绕新闻故事设计的可视化带有很强的娱乐和艺术因素,能给读者一种传递信息的高效途径。从表达的角度看,可视化不是冷冰冰的工具,视觉传达已经超出了工具的范畴,发展为传达理念的媒介,通过各种可视化组件的设计,媒体不仅仅能让读者看懂新闻故事,还能在其中传达情感和理念、表达媒体的观点。一、数据可视化的定义(二)可视化与信息图要进一步理解“可视化”,还需要将之与一个极易混淆的词相区别,这个词就是信息图。一

3、方面,信息图是一种将数据与设计结合起来的图,有利于个人或组织简短有效地向用户传播信息。可视化和信息图之间并非泾渭分明,从广义的可视化概念入手,信息图是隶属于可视化范畴的。但是正如前面分析的,可视化并不限于“图形”,“可视化”的外延更广,为了更好地探索、展示和表达信息,人们正在借助不同的手段与方法拓展可视化的方式,这使可视化的未来呈现出更大的可能性,而不仅仅是信息图。另一方面,如果将可视化的定义限制在“数据可视化”的范畴,信息图和数据可视化之间的差异就在于它们聚焦的对象不同,信息图处理的对象是“信息”,它未必以数据的方式呈现,而“数据可视化”处理的对象是“数据”,其着重于对数据进行结构化的呈现。

4、“信息图”这个概念的产生更多的是出于设计领域对信息传播的包装和设计目的,而“数据可视化”概念的兴起则不仅仅是为了对数据信息的包装和设计,还有对数据信息的探索和研究的目的,所以两者也存在一定的差别。总体上看,可视化是个更广阔的概念,也更能与时俱进地表达数据传播的未来走向。知识窗:Column Five对信息图的分类 2008年,Column Five由3个年轻人罗斯克鲁克斯(Ross Crooks)、詹森兰克(Jason Lankow)和乔希里奇(Josh Ritchie)在美国加利福尼亚州创建。最初它只是一个创意代理,目前已经发展成由40余人组成的,致力于创作信息图表、动态图像及其他数据可视化

5、作品的媒体公司,并且是此领域中的佼佼者。他们的作品曾刊登在时代、福布斯杂志、华尔街日报等知名媒体上。Column Five按照信息和互动两个维度对信息图表进行划分。对于信息的固定(fixed)和更新(updating)是比较好理解的,即信息图表的信息来源随着时间演进是否会发生变化。对于互动的主动(active)和被动(passive)更容易混淆。Column Five是这样定义的:被动的互动主要是指阅览、聆听以及对于动态图像的暂停、快进等操作;而主动的互动包括搜索具体的数据、重塑展现的内容或者选择获取信息的形式。简而言之,就是受众是否可以基于个人需求接收信息图表的内容。Column Five对

6、信息图的分类示意图二、数据可视化的由来 公元前6200年,世界上最古老的地图出现了,说明人类历史上很早就开始运用视觉传达信息。16世纪,伴随着人类观察和测量技术、工具的进步,人们开始尝试用图像、表格来记录信息,这成为早期可视化的“雏形”。19世纪是现代数据图表技术突飞猛进的时代,在这个时期,统计图表中所有展示数据的形式条状图、饼图、直方图、折线图、时间序列图和等值线图等都已出现,且被广泛用于经济、社会、医学、物理学等诸多领域中,19世纪的后半期被业内人士视为数据图表发展的“黄金时代”。经历了全球动荡的20世纪上半期,“数据可视化”概念真正兴起于20世纪60年代。在美国,约翰托奇开创了统计学新的

7、分支:探索性数据分析(EDA),并在一篇名为数据分析的未来的论文中号召将数据分析视为统计的一个分支,与高度抽象化的数理统计学区别开来。在法国,制图师和图形理论家雅克贝尔廷出版了具有里程碑意义的图形符号学一书。这本书中提及根据数据的联系和特征,来组织图形的视觉元素,为数据可视化提供了理论基础。与此同时,计算机科学的快速发展推动了计算机图形学的产生,专门的统计计算和图形软件工具问世,适合图形的输入和显示技术也逐步成熟。这些共同促使当代的“数据可视化”以新的形式呈现于世人面前。如今,越来越多的新闻机构开始重视用可视化这种媒介来讲述故事。杰夫麦考吉(Geoff McGhee)曾任职于纽约时报与ABC新

8、闻,20092010年他在斯坦福大学研究数据可视化,并发布了一组名为数据时代的新闻的系列视频,邀请各大媒体的主要技术人员和数据记者来阐释他们如何用数据可视化做新闻。案例:早期数据可视化的经典作品约翰斯诺的伦敦霍乱地图 一张地图能改变世界吗?答案是能。1854年,一张由约翰斯诺(John Snow)医生制作的地图彻底改变了世界,也因此成为早期可视化的经典作品而被人津津乐道。1854年,伦敦霍乱流行,现在流行病学奠基人斯诺通过研究霍乱死者的日常生活情况,寻找到他们的共同行为模式,发现了霍乱与饮用不洁水的关系。在他的呼吁下,政府及时关闭了不洁水源,有效制止了霍乱的流行。他还推荐了几种实用的预防措施,

9、如清洗肮脏的衣被,洗手和将水烧开饮用等,效果良好。虽然约翰斯诺没有发现导致霍乱的病原体,但他创造性地使用空间统计学查找到传染源,并以此证明了这种方法的价值。今天,绘制地图已成为医学地理学及传染学中一项基本的研究方法。”斯诺的霍乱地图“成为一个经典案例。数据可视化的构成要素 第二节可视化作为一种媒介,是设计者通过数据和其他视觉元素的协作而生成的。设计可视化的过程相当于对这些视觉元素进行编码的过程,这个过程依赖于人类大脑对这些视觉元素长期存储的认知模式,即人们已经习惯于在日常生活中针对相应的视觉元素的相互组接和影响形成较为固定化的视觉暗示。一、可视化编码的静态视觉变量(一)位置 可视化中的“位置”

10、是展示数据在给定空间或坐标系中的相对分布状况的。在坐标系中,每一个点都代表一个数据,这些数据点大小相同,但是“位置”有差异。数据在坐标系中即可通过“位置”呈现数值大小的差异,也可运用“位置”反映数据之间的顺序差别。当大量数据出现在坐标系中时,可以运用“位置”一目了然地做数据离散程度的判断。(二)长度 长度是从图形一端到另一端的距离,其经常出现在条形图中,用以展示或比较数据值的大小。一般长度越大,数据值也越大。用长度比较数据值时要注意必须让读者看到线条的两端。图表应该展现一条基线(baseline),基线是从零点开始的一条垂直线。在现实中有一种误导读者的做法,即在纵坐标的单位设置上省略了一些数字

11、或者没有从原点0开始,而是故意选择一个数字作为起点,或是纵坐标的单位不是等距的,省略了一些数据。这样比较的“长度”通常会夸大差异或数据波动,是不准确的。案例:华盛顿邮报可视化报道深度的难题 2014年3月,马航MH370失联是当年最为轰动的国际新闻之一。当各国都投入大量人力在相关海域展开搜救时,澳大利亚海军的海洋盾号舰船宣称截取了来自深海的飞机黑匣子信号,随即澳大利亚官方称希望能在数日内找到失踪的MH370航班。但是华盛顿邮报网站编辑对此不以为然,他们制作了名为深度的难题的报道,意在以可视化方式揭示定位黑匣子是一件挑战极大的工作。这张长图以相应的比例微缩展现了海下15 000英尺的世界,画面每

12、隔1 000英尺设计一道白线,并标注数据以示分隔,读者用手指不断点击观看的同时,既能感受到深海之深,也能从分隔线条和数据标识中了解所处的实际海下深度,而不至于迷失在画面中。画面中有一个颇具匠心的“长度”设计,即将海平面以上的最高建筑以相应的映射方式呈现在海下,从而反衬出海下之深。如作为美国华府的地标,华盛顿哥伦比亚地区最高的建筑华盛顿纪念碑如果倒立于海底,只不过到555英尺深,美国人熟知的纽约帝国大厦如果倒立于海底,也只有1 250英尺深,而当今世界最高的建筑迪拜的哈利法塔倒立于海底也不过2 717英尺深,这些与海盾号发现信号的15 000英尺深度海域相比,简直是微不足道的深度了。编辑通过找到

13、读者熟知的建筑物的长度来做参照,以展示海底的深度,相当于用读者熟悉的事物来做陌生话题的“引渡”,使该可视化效果更加便于理解。一、可视化编码的静态视觉变量(三)角度 角度是经常出现在饼图中的视觉变量,角度取值范围可以从0度到360度不等,能体现总体中不同组别数据所占的比例,从而呈现总体数据内部的具体结构。2013年11月25日,网易“数读”栏目推出了一则关于空气质量满意度的数据新闻,该新闻来自盖洛普公司针对空气质量在全球160个国家和地区调查的居民们的主观感受数据。调查发现中国内地居民对空气质量满意的比例为77%,不满的仅有21%,在受调查的160个国家和地区中排在第70位。而香港人则是全世界对

14、空气质量最不满的人群,因为满意空气质量的香港人仅占34%,不满的达到65%。在该报道中,编辑选用了饼图来做态度的可视化设计,将不同态度所占的比例以角度的差异呈现,并将不同年龄组的数据进行对比。从饼图中角度的差异和色彩的区别可以清晰地看到内地和香港民众对空气质量的态度差异。值得注意的是,因为调查中除了不满意和满意两种态度以外,还有一些其他的态度,因而编辑在制作饼图时还设计了以浅灰色的楔形来代表这部分态度,以使饼图更加客观地反映真实的数据。一、可视化编码的静态视觉变量(四)方向 一些可视化研究专家将“方向”这一视觉变量称为“斜度”,这两个概念是相同的。如果说角度是相交于一个点的两个向量,方向则指一

15、个向量的斜度。“方向”有助于读者把握斜率,从方向的变化中感知数据值的增长、下降和波动。“方向”的视觉效果是可以设计的,在数据值相同的情况下,通过标尺的变化可以控制斜率的缩放。当希望突出差异时,可以放大标尺的比例使斜率增加;当希望淡化差异时,可以缩小标尺的比例使斜率降低。案例:彭博社报道美国人是如何死去的 2014年4月17日,彭博社推出的报道美国人是如何死去的(How Americans Die)就利用了“方向”这一视觉变量来设计可视化效果。这个报道中主要运用了交互式的折线图和堆积图来呈现关于美国人自20世纪60年代以来死亡率和死因的变化的统计数据。“方向”作为体现变化的视觉变量成为构成该可视

16、化编码的最佳元素。以报道第一部分为例,这个部分记录了美国自1968年以来不同年份的死亡数据和男女性的死亡数据,其中位于中间的折线是全美的死亡数据,可以看到其自1968年以来总体上呈现下降中略有波动的趋势,而男性的死亡数据(蓝线)则总体呈现下降的趋势,折线的斜率是较为突出的,达到了30左右。唯有女性的死亡数据(红线)随着时序的变化,呈现总体上升的趋势,因而报道中指出“几乎所有的进步都在改善男性的生存前景”。一、可视化编码的静态视觉变量(五)形状 在图形设计中,形状是一种重要的视觉变量,它由点、线、面等不同元素构成。点是图形最基本的构成,是图形中面积最细小的成分。在坐标系中,点可以指示位置。点状符

17、号能通过面积和方向的变化,组成线状符号或面状符号。在视觉设计中,点状符号能够聚合和集中视觉,有一定的指示和引导视线的作用。线是由很多点沿着相同的方向紧密排列后形成的形状符号。线有明显的长度,但占有的宽度很小。线可以指示方向和位置,并形成面的边缘。线还可以通过连接形成形状。除了折线图,线状符号也经常出现在地图上,用以标识边界、等深线等。面是由很多线往相同方向不断重复紧贴后形成的形状符号,面有长度和宽度,能通过组合形成形状。在可视化设计中,点、线、面这些形状符号除了构成规则图形以外,还经常以非规则图形的方式呈现,被用来区分现实的对象,做现实世界中实际事物的直接映射。比如用一些简化的图标,如小人、汽

18、车、建筑物来指代实际事物,唤起人们的视觉关注。案例:财新“数字说”的报道全球十大高楼财新“数字说”栏目2014年8月8日推出的一则全球十大高楼的报道,在设计图表时用十座高楼的微缩绘图取代条状图,既让人看到了这些高楼的具体“身高”数据,也便于读者了解这些高楼的大致形态,极大地提升了这幅可视化图表的信息量。一、可视化编码的静态视觉变量(六)面积和体积 面积和体积也可用于表示数值的差异。面积通常用于二维空间,多采用圆形和矩形;体积则适用于三维空间,多采用立方体或球体。面积和体积在作为视觉变量进行事物之间的尺寸比较时,需要注意保持所有维度的比例,使之正确地反映面积和体积的变化,而不能出现失真的差异。如

19、设计两个不同面积的正方形时,要注意边长每增加一个单位,则新生成的正方形将是原正方形面积的4倍,而非2倍。同样,如果是一个立方体,则所有边长每增加1倍,放大后的新的立方体的体积将增加7倍。案例:埃博拉资助追踪 2014年10月28日,卫报报道埃博拉资助追踪时,主要以面积的视觉变量呈现不同的资助情况,编辑设计了大小不等、颜色各异的正方形来代表世界各国、不同跨国集团、NGO和私人机构对抗击埃博拉病毒所做的资助数据,这其中面积的大小反映资助数额的多寡。因为涉及的国家和组织较多,有些正方形面积很小,所以该可视化设计为交互式图表,当鼠标悬停在正方形上时,相应的正方形所代表的对象及其资助数额就在画面中弹出,

20、以便于读者进一步了解细节数据。一、可视化编码的静态视觉变量(七)色彩 色彩是所有视觉变量中最富于变化的一种。“曼塞尔色系”(Munsell)被认为是色彩学的基础,它将色彩分为“色相”、“纯度”和“明度”三种要素。“色相”即为对色调的称呼,在曼赛尔色系中,色相以红、黄、绿、蓝、紫等五色为主色,每两个主色间加入一中间色,成为十个基本色相。利用同一色相做明度、纯度变化的配色,容易让人产生统一的视觉观感;即使不完全使用同一色相,使用色环上尽可能靠近的色相,依然能产生一致感。“纯度”也被称为“彩度”、“饱和度”,指色彩的鲜明程度、纯净度。越鲜明的色彩纯度越高,让人感觉越刺激,能传递一种活跃的印象,但要注

21、意过度使用纯度高的色彩组合,会给人品位花哨和低俗之感;越暗沉的纯度越低,让人感觉越稳重,灰暗或安静。无论哪种色彩,其纯度越低就越接近灰色。“明度”也被称为“亮度”,表示色彩的明暗程度,越靠近白色,明度越高,越靠近黑色,明度越低。黄色明度较高,蓝紫色明度较低,红绿色居中。明度一致的色彩不容易产生强弱和对比,会给人带来均衡的印象,不适合用于要突出某个部分的设计。配色时,有时需要考虑形成统一一致的均衡感,有时则需要通过对比来形成视觉落差,从而突出设计中的某个主体部分。参考书籍一、可视化编码的动态视觉变量(一)发生时长这个变量指一个静态场景从出现展示到消失在画面上的时间长度,用于表现动态现象的延续过程

22、。设计动画时将发生时长的值设计得越大,说明动画生成的时间越长,也就是给一个事物更长的展示时间。(二)变化速率变化速率包括场景变化的幅度和速度两个层面。变化速率需借助位置、角度、方向、颜色、面积、体积之类的静态视觉变量的变化来呈现。(三)变化次序变化次序即场景出现的先后顺序,对于时间动画而言,时间就是内在的次序。在动态可视化设计时,未必都需要按照时间来设计变化次序,如在设计动态地图时,也可以通过颜色的变化来呈现某种现象在全球的兴起。(四)频率频率指场景出现的频繁程度,该变量与发生时长相关。在动态可视化设计中,可以采用闪烁频率,用让某些场景频繁出现在画面的方式来暗示其重要性。一、可视化编码的动态视

23、觉变量(五)时刻时刻指场景的显示时间,用以标识某一种变化的出现,这种变化可以指向某种行为或现象,也可以指向某个具有实际意义的时间。(六)同步同步指两个或多个时间序列之间的关系,同步可用于多个场景的时序校正中。同步与变化次序一同构成表达因果关系的重要视觉变量。(七)节奏节奏是描述符号周期性变化的特征,它是由发生时长、变化速率以及其他参量融合到一起而生成的复合参量。描述节奏的参量可以进一步细分为频率(周期)和振幅,节奏的频率对应着变化速度,振幅则对应着现象变化的峰值。符号的节奏参量可用于描述周期性变化现象的重复性特征,也可描述质量性质。数据可视化的标准 第三节可视化作为一种媒介,是设计者通过数据和

24、其他视觉元素的协作而生成的。设计可视化的过程相当于对这些视觉元素进行编码的过程,这个过程依赖于人类大脑对这些视觉元素长期存储的认知模式,即人们已经习惯于在日常生活中针对相应的视觉元素的相互组接和影响形成较为固定化的视觉暗示。可视化审美标准四要素 美国人诺阿伊林斯基在数据可视化之美中总结可视化审美的标准为新颖、充实、高效、美观四个要素:新颖新颖是指能以一种崭新的视角观察数据,或者以一种风格激发读者的激情从而使其达到新的理解和高度。虽然像条状图、散点图、地图这样常规的可视化设计能让读者迅速了解内容,但是如果媒体的可视化设计只是充斥这类模式化的作品,长此以往,必然会使读者逐步丧失阅读兴趣,所以如何设

25、计出新颖的作品,让读者感到眼前一亮的同时又体会解读数据的新鲜角度,这也是设计师面临的难题。充实充实是指可视化归根究底是一种媒介,媒体运用可视化来传播信息,而不是仅仅为了艺术设计。如果强调后者而忽视前者,那么可视化就失去了其驱动力。所以可视化除了考虑数据是否利于呈现,还需要考虑想要表达的信息是否有必要可视化,如何通过可视化设置应用场景,使信息对于读者而言更具价值。高效高效是指可视化应该有清晰的目标,传递一种信息或者提供一个视角来表达信息。通过可视化设计,简化了读者访问这些信息的难度,而不是增加了读者访问这些信息的复杂程度。这就要求设计师能聚焦信息,去除冗余数据的噪音,既要会做加法,也要会做减法。

26、美感美感则更易理解,各种可视化编码的视觉变量的应用要考虑其带来的视觉效果应该是充分的信息传达,有效的视觉引导,能揭示数据背后的关联和意义,给读者带来阅读时获知和审美的双重收获。这说明数据可视化设计始终应明确设计的初衷是为了信息的有效传播,而不是单纯为了设计而设计。艺术与科技的结合:24小时内美国上空的航迹谷歌数字艺术项目创意总监亚伦科布林所创作的飞行航迹(Flight Patterns)将美国联邦航空局在2008年8月12日这一天所检测到的超过两万架飞机飞过美国上空的航迹数据进行可视化,给读者提供了一种新的关注视角,不啻为艺术与科技相结合的可视化作品。飞行航迹的可视化包括静态信息图、依托谷歌的

27、可视化地图和动态视频三个部分,其最具特色的是动态视频部分。读者可以看到飞机航迹的记录开始于美国东部时间傍晚5点,整个黑色的背景地图上被代表航迹的发光线条点亮,线条开始互相交错穿行,在美国上空编织出一张巨大的彩色网络。零点临近,线条数量逐渐变少,从欧洲飞往美国东岸的飞机占据主要的航线。凌晨2点到3点,从东岸到西岸的红眼航班开始了它们的旅程。到早上6点,新英格兰、中大西洋以及美国东南部地区最早苏醒,伴随着日出,航班也缓慢地划出了从东至西的线路。飞行航迹提供的视频还包括美国东北部、西南部和亚特兰大地区的航线轨迹视频。本章小结关于可视化定义的争论在业内一直没有达成共识,有人将可视化等同于“信息图表”,

28、有人认为可视化的定义随着技术进步不断拓展。我们赞成后者的观念,将“数据可视化”定义为“探索、展示和表达数据含义的一种方法”。这种方法可以以静态的信息图的形式呈现,也可以以动态可视化的方式展现,可以是封闭式的叙事,也可以是交互式的设计。人类虽然很早就开始了可视化的实践,但是“数据可视化”概念真正兴起于20世纪60年代。统计学者和图形理论学者为这种思潮的兴起贡献了理论给养,而计算机工具的升级为之提供了技术支撑。当我们关注早期的经典可视化作品时,会发现与现在的作品相比,其虽然在呈现形式上略显单一陈旧,但在设计理念上有很多相通之处。视觉变量是数据可视化的构成要素,因为可视化主要是诉诸视觉的传播媒介,所

29、以我们着重探讨了视觉变量。可视化不仅仅是信息图表,因为如果将之限制为信息图表,则很多人仅仅会想到那些静态视觉变量,如今可视化的范畴已经拓展到动态可视化领域,所以我们还需关注那些动态视觉变量,在设计时将之与静态视觉变量相互结合使用。数据可视化设计师需始终明确自己的可视化目标是为了使信息更充实、高效地传播,在此基础上为信息赋予新鲜的观察视角和符合审美情趣的设计,融艺术与科学于一体。在这个过程中,对数据准确和清晰的刻画和传递始终是可视化的基本要求。本章学习与思考1.为什么说可视化不是信息图表?你认为两者的差异在哪里?2.Column Five对信息图的分类能给你区分可视化带来哪些启示?3.请对下列信息图中的静态视觉变量设计做出分析和评价。4.为什么说视觉变量是数据可视化的构成要素?你如何理解这个说法?5.设计动态的数据可视化时最需要关注的两个视觉变量是什么?请结合实例说明。6.请选择一个数据可视化作品,用本章提及的新颖、充实、高效、美观四个要素对其进行分析评价。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 金融行业 > 银行行业

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报