《数据新闻概论》课件第二章.pptx
《《数据新闻概论》课件第二章.pptx》由会员分享,可在线阅读,更多相关《《数据新闻概论》课件第二章.pptx(30页珍藏版)》请在文库网上搜索。
1、如何制作和传播数据新闻第二章数据新闻的类型 第一节一、“大数据新闻”与“小数据新闻”根据支撑报道的数据的性质来划分,数据新闻可以划分为“大数据新闻”和“小数据新闻”两种类型,而这两类数据新闻的差别就在于两类报道中所处理的数据对象是隶属于“大数据”的范畴还是“小数据”的样本。大部分专家赞同大数据(big data)有如下三个基本特征:(1)海量数据海量数据(volume):相比传统数据或小数据,大数据拥有庞大的数据量。到底多少数量级的数据才能被称为大数据呢?关于这一点业内尚无统一说法,一般认为10TB100TB是成为大数据的门槛。(2)类型多样类型多样(variety):相比传统数据多以文本数据
2、作为主要类型,大数据的类型更为多元化,其包含了网络日志、图像数据、文件数据和各种复杂的记录信息。(3)高速高速处理处理(velocity):数据量的增长速度很快,需要处理的速度和响应的时间越来越快。一、“大数据新闻”与“小数据新闻”小数据小数据大数据大数据目标解释特定的问题或是针对特定的目标考虑的是一个整体的目标,目标可能是灵活的,并非具体的存储位置存储于某一机构、某台电脑或某个单独的文件通常遍布于整个电子空间数据结构与内容高度结构化的数据,数据域被限制在一个单一的学科或分支学科内,以统一的格式记录包含各种非结构化数据,这些资源的主题可能跨越多个学科,或是与其他大数据资源存在相关关系数据准备数
3、据使用者为自己的使用目的所准备涵盖许多人的数据准备,准备数据的人未必是最终使用数据的人数据生命周期较短常被永久性地存储衡量可以通过标准的方法来解析和读取需要不同的协议来解读可重现性通常可以重现基本不可行成本成本和代价有限项目如果失败,代价高昂自省通过数据在电子表格和数据库中的行和列来定位可通过一种称之为“自省”的技术来实现分析一次性全部参与到分析通过分布式的方式进行分析小数据与大数据十个方面的区别大数据新闻作品典范:卫报如何报道英国骚乱?解读骚乱的报道历经了两个研究阶段。第一个阶段的成果发表于2011年12月,集中在探寻骚乱产生的原因上,报道团队先后采访了六大城市中270位骚乱参与者。值得一提
4、的是这一阶段中的另一项重要内容,报道团队对260万条与骚乱相关的Twitter数据进行了统计分析。详细报道见:https:/ 自我采集数据型的数据新闻是那些由报道者直接通过深度访谈、问卷调查、田野调查等社会科学研究方法获取第一手资料,并将这些资料量化为数据后进行处理,最后制作成的新闻报道。此类报道中的数据是报道者收集的原始数据,是真正意义上的第一手材料。在实践中,此类报道一般先由报道者设立清晰的报道目标,即一些需要通过调查了解的实际情况,分析原因或提出解决之道,然后报道者根据设定的目标确定调查范围和调查对象,再针对调查对象展开研究,收集数据。报道者对数据进行分析就是为了解决报道目标中设立的一些
5、具体问题。此类报道具有两个优点:一是媒体采用自己采集的数据报道可以增强报道的原创性和独家性,避免和其他媒体出现题材撞车现象;二是自我采集的数据相比已有的数据而言,其从最初的采集筹备到实施的过程都处于清晰的报道目标的指引之下,因而数据的纯度较高,可被利用的价值更大,这可以减少数据过滤的难度。卫报对英国骚乱的报道就属于自我采集数据型,媒体和科研机构合作耗时一年多,通过各种调查方法采集到关于骚乱的第一手材料,并将之进行分析解读后公之于众,其根据扎实的数据而提出的关于骚乱的观点打破了一些人的成见,引发了全社会的广泛关注,媒体也因此获得美誉。二、自我采集数据型和现有数据再利用型 现有数据再利用型的数据新
6、闻指报道者收集其他企业、科研机构、媒体或个人发表的与报道主题相关的数据分析报告或新闻报道,按照自我的报道意图对其中的数据进行新闻价值的再挖掘,将已有数据按照报道的叙事逻辑进行分析重组后制作成的数据新闻。这种数据新闻的优点是可以依据公开的丰富的数据资源,避免数据采集过程中可能遭遇的问题与麻烦,减少不必要的成本支出,它特别适合一些中小型媒体或是初步尝试数据新闻实践的媒体,可避免过度投入的风险。现有数据再利用型的数据新闻作品六十五年国人婚恋观变迁 2014年是中华人民共和国成立六十五周年,网易“数读”栏目于9月26日推出了六十五年国人婚恋观变迁史的报道。该报道选题从小处着眼,通过透视婚恋观念的变化,
7、以具体的数据展现人们从单一到多元、从压抑到自由的观念变化,从而折射出六十五年来中国社会的巨变。该报道以可视化信息图表的方式呈现,将信息图表设置为若干个色块,每一个色块代表着婚恋观的一个部分。具体包括择偶条件、最受欢迎、性行为态度、平均婚龄、离婚率、再婚占结婚总数比例等六个部分。(相关报道见网页:http:/ Search for Malaysia Airlines Flight 370),以强大的数据挖掘、分析和整合能力对该航班可能的飞行路线、搜寻范围做了解析和预测,并用可视化的方式将这次事件中大众普遍关心的技术问题以直观的形式呈现出来。失联搜救中的统计数据分析|统计之都(中国统计学门户网站,
8、免费统计学服务平台)http:/cos.name/2014/04/search.rescue.plane.statistical.data.analysis/三、以事件为选题的数据新闻与以话题为选题的数据新闻以话题为选题的数据新闻是指将报道选题聚焦于某类新闻话题,围绕此话题收集数据,并对之进行解读和呈现的数据报道。这类数据新闻的选题不与客观发生的新闻事件绑定,因而就有了更广阔的创意空间。编辑记者可以根据最新发生的事件做出选题的推理和联想,或是根据一些潜在的社会现象和问题做出思考,或是在已有的公开数据材料中找出具有新闻价值的部分,并以此为话题进行数据报道,甚至还可以是编辑记者自身或读者对某个话题
9、感兴趣而收集数据做报道。从这个角度看,以话题为选题的数据新闻没有很强的时效要求,其关键在于编辑记者寻找到的话题能吸引用户的关注,且用数据来解读该话题比其他报道方式更具有优势。这类新闻便于媒体用于一些具有个性化的选题报道中,媒体可据此来推出一些独家报道,从而与其他媒体之间形成差异化竞争,并逐步在用户心中产生数据新闻品牌效应。前面提及的傻瓜的艺术品拍卖市场就属于此类数据新闻,该报道选题并没有针对某一特定的新闻事件,而是从艺术品拍卖行业这一对普通用户而言略显神秘的领域入手,以一则小数据新闻对该领域进行条分缕析、细致入微的解读,令人深感选题之巧妙。案例:NPR如何报道美国和墨西哥的边境地带?2014年
10、4月,美国国家公共电台(NPR)网站推出了一则和调查报道中心(The Center for Investigative Reporting)合作完成的数据报道,工作人员用时两周,途经3 900多公里的美墨边境,不仅用镜头,也用数据向我们呈现了一个真实的边境。点击进入这个名为边境(borderland)的报道,你会看到页面上用显著的标题告诉读者:“边界线不仅仅是一条线,它是一个场所。”在关于报道的简短描述中,编者指出:“你在阅读报道,边境也处于忙碌中。”这段文字下方是五个处于变动中的数据,会伴随读者阅读时间的增加而不断增长。这五个数据与边境生活密切相关,分别是:有多少辆车合法通过边境,有多少行人
11、合法来往于边境,有所少人因为非法穿越边境而被拘,有多少磅大麻被警方搜获,有多少盎司的可卡因被警方搜获。只要停留几分钟,读者就会惊异地发现这些数据变动之快,让人不得不感叹边境之忙和边境之乱。http:/apps.npr.org/borderland/#_/introduction从制作到传播数据新闻的操作环节 第二节一则数据新闻的产生需要经历制作和传播这两个关键环节。在制作阶段,发现、收集、整理和分析数据是核心内容;而在传播阶段,则需要运用可视化,并整合大众媒体和社交媒体两种传播渠道。一、制作:以采集、整理和分析数据为核心业界知名的数据记者米尔科劳伦兹绘制了示意图展示数据新闻的制作过程(见图)。
12、在他看来,制作数据新闻首先应该对原始数据进行清理,过滤掉冗余的数据,留下具有新闻价值的数据;然后将之进行可视化处理,使抽象的数据更为浅显易懂;最后则是以新闻故事的方式报道,使公众能够阅读和接受。对于公众而言,原始数据是没有多少价值的,但是通过清理、可视化和新闻故事的包装,其价值逐步提升,并最终成为对公众有意义的数据报道。卫报制作数据新闻的步骤(1)发现和获取数据。卫报获取数据的来源多样:当数据团队察觉到重要的新闻事件时,记者编辑就会到互联网上搜索相关的数据;同时,记者编辑还经常关注包括Office for National Statistics和World Bank等政府数据库和公共数据源,以
13、从数据中找到潜在的待挖掘的故事。(2)整理和清洗数据。获取数据后记者编辑要对数据进行初步的分析,识别数据的用途,看其能否与其他数据源相互关联,能否展示在某个时段内的变化趋势。在分析的基础上将数据做出分类整理,通过谷歌 Refine和DataWrangler等工具对数据做初步处理,清除一些无用信息,将有用数据、参照数据和关联使用的其他数据录入电子数据表,为进一步分析数据做准备。(3)分析数据。分析数据是讲故事的主要部分,分析结果能帮助大众理解故事和数据。这个环节将运用运算方法找出数据中是否存在有价值的新闻,并对整个分析过程做细致完全的检查。(4)呈现数据。将数据报道用文字报道、发表原始数据、发布
14、信息图表、可视化等方式呈现出来。在实际运用中,数据团队经常采用Google Fusion Tables、Google Maps API、CartoDB、Google Spreadsheets、DataWrapper和Tableau等数据可视化工具。二、传播:整合多种媒体传播平台 对数据新闻传播环节描述较为全面和细致的是互联网专家保罗布拉德肖,在他绘制的数据新闻操作架构图中明确标示了“制作”和“传播”两个不同的环节。在这幅名为“数据新闻的倒金字塔结构”(The Inverted Pyramid of Data Journalism)的图中,左边的倒金字塔标注了类似劳伦兹所绘的制作流程,包含了“编
15、辑”、“清理”、“情境”、“综合”等步骤,通过这些环节逐步生产出一则数据新闻。与劳伦兹不同的是,布拉德肖的图形中特别强调了“传播”的环节,为此他专门写了一篇博文详细说明这一环节。二、传播:整合多种媒体传播平台布拉德肖认为数据新闻的传播有六种途径:(1)可视化传播(visualisation)。可视化是传播数据新闻最快、最高效的途径。它的缺陷是人们一般不愿花费时间细读信息图,因而虽然传播有效,但用户参与度差。运用可视化传播需要可视化作品提供消息来源的链接,并确保用户点击链接后能看到可视化图表所包含内容之外更为丰富的信息材料。(2)叙事传播(narration)。虽然传统的叙事方式在数据新闻传播领
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据新闻概论 数据新闻概论课件 第二章 数据 新闻 概论 课件 第二