收藏 分享(赏)

沪科教版普通高中教科书·信息技术必修1 数据与计算.pdf

上传人:九年教育 文档编号:6956607 上传时间:2022-08-23 格式:PDF 页数:154 大小:8.46MB
下载 相关 举报
沪科教版普通高中教科书·信息技术必修1 数据与计算.pdf_第1页
第1页 / 共154页
沪科教版普通高中教科书·信息技术必修1 数据与计算.pdf_第2页
第2页 / 共154页
沪科教版普通高中教科书·信息技术必修1 数据与计算.pdf_第3页
第3页 / 共154页
沪科教版普通高中教科书·信息技术必修1 数据与计算.pdf_第4页
第4页 / 共154页
沪科教版普通高中教科书·信息技术必修1 数据与计算.pdf_第5页
第5页 / 共154页
亲,该文档总共154页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、上海科技教育出版社数据与计算普通高中教科书必修1数据与计算必 修 1普通高中教科书信息技术上海科技教育出版社信息技术信息技术信息技术PUTONG GAOZHONG JIAOKESHUXINXIJISHU此书如有印、装质量问题,请向印厂调换印厂地址:长沙黄花印刷工业园三号 电话:0731-82755298普通高中教科书信息技术必修1数据与计算上海科技教育出版社有限公司出版发行(上海市柳州路218号邮政编码200235)湖南省新华书店经销湖南长沙鸿发印务实业有限公司印刷开本89012401/16印张9.52020年8月第1版2021年8月第2次印刷ISBN 978-7-5428-7320-0/G4

2、292定价: 11.75元批准文号: 湘发改价费 2017 343号举报电话: 12315ISBN 978-7-5428-7320-09 787542 873200此书如有印、 装质量问题, 请向印厂调换印厂地址: 长沙黄花印刷工业园三号电话: 0731-82755298ISBN 978-7-5428-7320-09 787542 873200普通高中教科书上海科技教育出版社数据与计算必 修 1信息技术编写人员名单主 编: 郑 骏 分册主编: 郑 骏主要编写人员(以姓氏笔画为序):卢 源 朱晴婷 陈 凯房爱莲 胡 杨 郭 骏曹红霞欢迎广大师生来电来函指出教材的差错和不足,提出宝贵意见。上海科技

3、教育出版社地址: 上海市闵行区号景路 159 弄 A 座 8 楼 邮政编码: 201101 联系电话: 021-64702058 邮件地址: 亲爱的同学:不知道你是否留意,我们几乎每天都能听到“数据”这个词。数据和每个人的生活都密切相关,它不仅是信息的载体,也是人们提取信息、 作出决策的重要依据, 并逐步成为社会发展的一项资源。人们合理选用技术工具处理数据,可以提高数据应用效能,发现其中隐含的信息,精准解决生活与学习中的问题。在数据与计算的学习中,我们将带领你理解数据、信息和知识的相互关系,体验利用数字化工具处理数据和发现信息的过程;利用一种程序设计语言编写程序,实现简单算法,经历计算机解决问

4、题的整个过程。你将在运用数字化工具的学习活动中,理解当今数字化世界的运转方式,提高利用信息技术解决问题的能力,发展信息意识和信息社会责任,养成数字化学习与创新的习惯。为了让你在学习数据与计算的过程中获得更大的成功,请浏览本书的栏目介绍。 写给学生的话 单元引言、学习目标和单元挑战从生活经验出发引入本单元将要学习的内容,提出本单元学习要达成的学习目标,预告学习完本单元后要接受的单元挑战。 项目引言和学习目标描述项目产生的背景和意义,介绍项目学习的主要内容,并提出一些具体问题,引导你带着问题探究。 项目学习指引 通过剖析真实的项目实施过程,帮助你了解学科思想方法,理解相关概念,掌握具体技能。解释一

5、些重要概念和术语,或提示相关知识和技术,帮助你抓住重点,扫除认知障碍。核心概念和小贴士提出若干问题引导你对技术背后的原理以及人、信息技术与社会的关系等进行思考和讨论。引导你利用网络、数字化工具和数字资源进行学习。提出活动任务,并引导你运用所学知识,使用信息技术工具进行探究、总结和展示。系统整理和归纳本项目的知识要点,方便你学习。补充更丰富的阅读材料,开阔你的视野。布置面向真实情境的项目任务,希望你综合运用本单元所学的知识与技能去解决问题。用思维导图可视化呈现本单元的知识脉络,提供基于学科核心素养的评价表,为你的学习表现进行自我评价。在学习过程中,希望你勤实践体验、多思考讨论,借助各种数字化工具

6、、资源进行学习与创新,不仅要理解和掌握具体的信息技术知识与技能,还要把握用信息技术解决问题的思想方法,并思考将信息技术应用于社会时所引发的各种挑战,以开放、包容的心态与信息技术、信息社会一起进步。 编 者单元挑战拓展阅读知识链接活 动数字化学习单元小结?思考与讨论?目 录第一单元 数据与信息.1项目一 探秘鸟类研究认识数据、信息与知识 . 21. 采集鸟类活动的数据 .32. 处理数据,获取信息 .53. 利用大数据获取信息 .7知识链接 .9项目二 探究计算机中的数据表示认识数据编码 .121. 从树牌号认识编码 .132. 了解数值数据和文本数据的编码 .143. 了解声音和图像的数字化

7、.16知识链接 .18单元挑战 认识并制作二维码 .25单元小结 .26第二单元 数据处理与应用. 27项目三 调查中学生移动学习现状经历数据处理的一般过程 .281. 明确数据需求 .292. 采集数据 .303. 加工、分析和可视化数据 .354. 撰写报告,提出数据应用建议 .37知识链接 .38项目四 认识智能停车场中的数据处理体验数据处理的方法和工具 .431. 探究停车引导中的数据处理 .442. 计算停车费 .483. 分析停车位使用数据 .51知识链接 .56单元挑战 采集与分析气象数据 . 64单元小结 . 65第三单元 算法和程序设计. 67项目五 描述洗衣机的洗衣流程了解

8、算法及其基本控制结构 .681. 从洗衣流程认识算法 .692. 描述“洗涤算法” .713. 分析洗衣流程的控制结构 .72知识链接 .74项目六 解决温标转换问题认识程序和程序设计语言 . 791. 体验程序设计的一般过程 .802. 了解程序的基本控制结构 .833. 优化程序,判断输入有效性 .84知识链接 .85项目七 用计算机计算圆周率设计简单数值数据算法 . 921. 设计算法实现用数学公式计算 .932. 设计算法实现用随机投点法计算 .95知识链接 .99项目八 分析历史气温数据设计批量数据算法 . 1061. 用列表表示和计算平均气温 .1072. 用模块化设计批量计算平均

9、气温 .110知识链接 .115单元挑战 探究密码安全问题 .124单元小结 .125第四单元 人工智能初步.127项目九 了解手写数字识别体验人工智能 .1281. 初识字符识别技术 .1292. 了解机器学习中的数据采集与预处理 .1303. 建立手写数字识别模型并进行验证 .1334. 评估手写数字识别模型并开展应用 .135知识链接 .137单元挑战 尝试用人工智能绘画 . 142单元小结 .143附录 部分名词术语中英文对照. 145第一单元 数据与信息在现实世界中, 每个人每天会产生大量数据, 如去过哪里、 买过什么商品、 走了多少路等。这些看似平凡的数据却蕴含了大量的信息, 如果

10、善加利用, 会给社会创造意想不到的价值。例如, 电商平台根据用户的浏览和购买记录, 有针对性地向用户推荐商品, 以提高商品销量; 智能手环告诉佩戴者每天走了多少步、 消耗了多少热量、 深度睡眠有多长时间等, 并提供保健建议, 甚至推荐相应的健身产品; 无人驾驶汽车使用摄像头、 车载雷达、 激光测距仪等设备采集数据, 识别周围的交通状况, 利用实时更新的地图进行自动导航, 实现无人驾驶。那么, 究竟什么是数据?什么是信息?数据在计算机中是如何表示和处理的?本单元将带领大家揭开数据与信息的神秘面纱。 通过具体实例, 感知数据与信息, 描述数据与信息的特征。 理解数据、 信息与知识的关系, 认识数据

11、对人们日常生活的影响。 知道数值、 文本、 声音、 图像等各类型数据的基本编码方式。学习目标认识并制作二维码单元挑战图 1-1 采集鸟类活动的数据项目一为了解决各种问题, 各行各业的人们都在做着采集数据、 获取信息甚至构建知识的工作。例如,商店采集顾客购买的商品等数据, 获取顾客购物喜好、 商品畅销程度等信息, 甚至构建以顾客为导向的市场营销战略知识, 以更好地开展商品营销活动。又如, 科学家长期在野外采集鸟类活动的数据 (图 1-1) , 获取鸟类分布、 鸟类对栖息地的选择等信息, 从而构建鸟类与植物关系的知识, 用于开展鸟类保护工作和生物多样性研究工作。项目学习目标在本项目中, 我们将探究

12、一群科学家的鸟类研究活动, 了解科学家是如何采集数据、 获取信息的。完成本项目学习, 须回答以下问题:1. 什么是数据?什么是信息?数据和信息的特征有哪些?2. 数据、 信息与知识的关系是什么?3. 什么是大数据?大数据的特征有哪些?探秘鸟类研究认识数据、信息与知识第一单元 数据与信息3核心概念数据 (data) 是对客观事物属性的描述, 是记录下来的某种可以识别的符号。在计算机科学中, 数据是指所有能输入计算机中并能被计算机程序处理的符号的总称。项目学习指引1. 采集鸟类活动的数据空中掠过几只鸟, 转瞬消失在树林里, 难觅踪迹。这些美丽的精灵栖息在哪里?它们喜欢怎样的林木环境?为回答这些问题

13、, 科学家在浙江某国家森林公园的一片实验林地里设立了一个国家野外科学观测研究站, 并长期在那里采集各种数据。通过观察、 测量等工作, 林地里的鸟类活动数据, 如鸟的种类、 数量、 行为等, 被定期记录了下来。这些描述鸟类活动的数据, 有数值、 文本、 图形、 图像等形式。为了更好地存储、 处理这些野外采集来的数据, 科学家将它们录入计算机中, 如表 1-1、 图 1-2 和图 1-3 所示。图 1-2 用数码相机拍摄的灰眶雀鹛表 1-1 林地鸟类活动调查记录表记录人: 记录时间: 年 月 日鸟的种类数量 (只)栖息取食基层行为树牌号灰眶雀鹛5灌丛鸣叫2130198灰眶雀鹛6灌丛鸣叫213012

14、3白头鹎5冠中上鸣叫4080059黄眉柳莺2冠中上觅食3080061黑鹎9冠上飞行5060137黄眉柳莺1冠中下跳跃1090013红头长尾山雀20整个冠层觅食, 啄树干2100030图 1-3 用 GIS(地理信息系统) 绘制的林地调查路线图(A、 B、 C 为林地调查线路)第一单元 数据与信息数据与计算4活 动1.1 近年来, 随着信息技术的普及, 国内外不少民间鸟类爱好者开始积极配合鸟类专业工作者, 参与多项鸟类科学调查活动。一些观鸟网站和鸟类 App 都具有采集、整理、 分享鸟类活动数据的功能, 如图 1-5 和图 1-6 所示。查找并选择一个观鸟网站或鸟类 App, 了解它向鸟类爱好者

15、采集哪些鸟类活动数据。图 1-4 用实时监控设备记录鸟类活动图 1-6 某鸟类 App图 1-5 某观鸟网站近年来, 人们利用各种信息技术工具, 实现了自动采集数据。例如, 在鸟类栖息地安装实时监控设备 (图 1-4) , 利用红外摄影机全天候拍摄视频数据, 利用录音设备录制声音数据, 这些数据可以直接保存到信息系统中, 供人们分析、研究。小贴士信息技术的发展使得人们采集和处理数据的手段不断加强,数据的内涵也逐渐丰富。在计算机发明前及发明初期, “数据”更多的是指数值型数据。随着计算机技术的发展,人们利用计算机处理的数据类型越来越丰富,涵盖了文本、 声音、 图形、 图像、 视频等非数值型数据。

16、第一单元 数据与信息52. 处理数据, 获取信息经过长年观测, 这个研究站的工作人员采集了大量鸟类活动的数据。这些数据被多名科学家共享, 他们对这些数据进行加工、 分析, 从而得出各种信息, 为各自的科研服务。现在人们越来越多地通过计算机来表示、 组织和处理数据, 从而可以获取并传播有价值的信息。例如, 科学家用计算机汇总 2010 年 10 月到 2012 年 10月的数据后得知, 在实验林地共观测到鸟类 44 种、4823 只次。其中, 留鸟有 23 种, 冬候鸟有 9 种, 旅鸟有 8 种, 夏候鸟有 4 种。进一步处理这些数据, 能得出以下鸟类居留型种数的柱状图 (图 1-7) 及居留

17、型比例的饼图 (图 1-8) 。核心概念信息(information)是数据中所包含的意义, 是对数据进行加工的结果。把数据有组织、 有规律地采集在一起就形成了信息。数据一方面承载着信息, 另一方面也产生着信息。这些数据包含着怎样的意义?从中能获取哪些信息?这些信息对人们有什么价值?信息是对数据的解释,具有主观性。对同样的客观数据, 不同的人会得到不同的信息。对于一般人而言, 或许能从以上数据中得到 “该林地鸟类众多” 的信息, 还可以得到“该林地的留鸟种数比候鸟多” 的信息。对于鸟类爱好者来说, 或许会得到 “该林地是适宜的观鸟地点” 这一信息。而科学家获得的信息或许是: 该地区鸟类物种多样

18、性高, 且繁殖鸟 (留鸟和夏候鸟) 占总种数约六成, 这表明 “该林地是鸟类繁衍生息的重要场所” 。图 1-7 2010 年 10 月到 2012 年 10 月林地内鸟类居留型种数柱状图参见 P9 知识链接 “数据和信息”图 1-8 2010 年 10 月到 2012 年 10 月林地内鸟类居留型比例饼图数据与计算6通过对大量数据、 信息的归纳整理和反复验证, 科学家完成了许多研究论文和学术著作, 构建出不少关于鸟类的知识, 如植物群落多样性与鸟类生存的关系等, 为鸟类栖息地保护和物种多样性保护提供了理论依据 (图 1-9) 。小贴士知识(knowledge)是人们在改造世界的实践活动中所获得

19、的可用于指导实践的认识、 规律和经验, 是归纳提炼出来的有价值的信息。图 1-9 鸟类知识的构建1. 该林地的野外数据采集工作是由多名工作人员共同完成的, 但数据大家都可以使用。这反映了数据的什么特征?2. 同一份鸟类研究数据, 鸟类学家可以从中获取鸟类的生存状况与栖息地环境改变之间联系的信息,从而指导人们开展环境保护工作; 卫生防疫部门可以从中获取候鸟迁徙路线的相关信息, 从而指导人们开展禽流感防护工作。这反映了数据的什么特征?这说明数据和信息之间有怎样的关系?你能列举出类似的例子吗??思考与讨论?数字化学习上网查找并梳理国内外学者对信息的各种认识。参见 P10 知识链接“数据、 信息与知识

20、的关系”在班级里介绍自己知道的鸟类知识, 说说自己是从哪里获取这些知识的。?思考与讨论?构建知识: 植物群落多样性直接关系到鸟类的生存质量, 保持植物群落多样性有利于鸟类生存提取信息: 鸟类分布与植物分布的对应关系采集数据: 鸟类种类、 数量、 位置、 食物类型、 行为、 栖息的树种等第一单元 数据与信息7活 动1.2 (1) 利用活动 1.1 中的观鸟网站或鸟类 App 的查询统计功能 (图 1-10 和图1-11) , 可以获取哪些数据?利用这些数据, 鸟类爱好者和鸟类专业工作者可能会获取哪些信息?这些数据和信息有着怎样的价值?时效性如何?(2) 利用思维导图, 整理这个网站或 App 提

21、供的数据和服务, 并向大家介绍。图 1-10 某观鸟网站的鸟种统计页面图 1-11 2016 年天津地区观测到的鸟种及次数3. 利用大数据获取信息当前, 随着信息技术的飞速发展、 数据采集规模的快速增长和数据处理速度的突飞猛进, 大数据已深深影响了科学家开展科学研究和发现新知识的方式。仍以鸟类研究为例, 如今, 摄像机、 雷达乃至卫星等各种设备每天不停歇地自动获取规模大得不可想象的数据, 经过计算机的高速处理, 产生信息或知识。例如, 利用从多个核心概念大数据 (big data) 是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。数据与计算8活 动1.3 地球夜间灯光

22、分布卫星图是根据卫星获得的数据制作的测绘地图, 它展示了地球上入夜区域的城市灯光分布情况。(1) 上网查找、 观看中国夜间灯光分布卫星图。结合地理知识, 分析我国各地夜间灯光分布情况, 找出图中灯光最集中的城市, 分析那里灯光强烈的原因。(2) 有一项跟踪研究指出, 夜间灯光与能源消耗、 人口增长、 GDP 增长紧密相关。你认同这一观点吗?试着发掘图中信息, 分析夜间灯光分布的规律及其原因。(3) 结合活动体会, 分析数据、 信息与知识的关系, 并利用恰当的工具绘制这三者的关系图。除了科学发现, 大数据对我们的日常生活也有着越来越深刻的影响。试着交流你所了解的大数据及其应用。?思考与讨论?图

23、1-12 某夜某地上空鸟的迁徙轨迹图监测天气的雷达基站下载的海量图像数据, 通过计算机的高速数据处理与分析, 科学家获得了鸟类对于山川地理的认知地图, 获得了它们感知地球磁场、 确定飞行方位的内在机理,以及关于鸟类迁徙的更多知识。图 1-12 所示的是 2010 年 9 月 10 日晚上某国东北部数百万只鸟的迁徙轨迹 (圆圈的大小表示鸟的密度, 颜色表示雷达的回波强度, 箭头所指的是鸟儿的迁徙方向, 箭头的长度表示鸟的飞行速度) 。参见 P10 知识链接“大数据”第一单元 数据与信息9知识链接数据和信息数据是对客观事物属性的描述, 是记录下来的某种可以识别的符号。信息是数据中所包含的意义, 是

24、对数据进行加工的结果。数据和信息之间有着固有的联系和区别, 它们具有许多共同特征, 同时又存在差异,具有一些不同的特征。1. 数据和信息的不同特征(1) 数据的载体性与信息的依附性数据是信息的符号表示, 是信息的载体; 信息是数据的含义, 是对数据的解释。两者密不可分。信息必须依附于某种载体, 通过某种数据形式才能存储、 表达和传播。相同的信息可以依附于不同的载体, 其内容不会因载体形式的不同而发生变化。例如, 2017 年 7 月, 我国多地降暴雨, 各地气象台发布了降雨量的数据, 电视台播放了暴雨来袭的视频, 广播台播放了语音报道, 报纸做了文字和图片报道这些文字、 图像、 声音、 视频等

25、都是数据, 它们承载着 “多地降暴雨” 的信息。同时, “多地降暴雨” 这一信息在存储和传播过程中依附于文字、 图像、 声音、 视频等多种载体。虽然信息传递的渠道不同, 所依附的载体形式不同, 但信息的内容是相同的。(2) 数据的孤立性与信息的联系性数据是最原始的记录, 与其他数据之间没有建立联系之前, 是分散和孤立的。只有通过对数据进行加工处理, 与其他数据之间建立联系, 才能形成针对某个特定问题的信息。例如, 1、3、5、7、9、11、13、15 是一组数值数据, 孤立地看每一个数, 无法知晓它代表什么。但如果将这组数据联系起来, 可以发现这是一个公差为 2 的等差数列的开头一段,据此可以

26、推断其后面的数应该是 17、19、21这样通过分析得出的结论便是信息。(3) 数据的客观性与信息的主观性数据是记录下来可以被识别的符号, 是原始事实, 具有客观性; 信息是对数据的解释,是数据处理的结果, 具有主观性。数据本身没有意义, 只有经过加工和解释, 才具有意义,从而转化为信息。例如, 用粉笔在黑板上画一个圆圈, 请被测试者回答这是什么, 会得到许多答案, 如 “数字 0” “英文字母 O” “句号” “月亮” 这里, 黑板上的圆圈是数据, 是客观存在的一个符号, 没有确定的含义, 而 “数字 0” “英文字母 O” 等是人们解读这一数据得到的信息。同一数据, 具有不同知识、 经验的人

27、从不同的角度解读, 会得到不同的信息。2. 数据和信息的共同特征(1) 普遍性数据是对客观事物属性的描述。事物是普遍存在的, 因此, 数据也无处不在, 无时不有。考试的成绩、 上课的铃声是数据, 人们阅读的文章、 观看的影片也是数据有了数据, 人们就会感知其中的意义, 自觉或不自觉地获取信息。因此, 信息也是普遍存在的。数据与计算10(2) 可处理性对数据可以进行加工处理, 生成新的数据。信息是数据加工的结果, 同一数据经过不同的加工可以得到不同的信息。同时, 对信息进行分析处理, 可以得到更多的信息。例如,从某个人的身份证号码中提取第 712 位, 得到数据 199006。根据身份证号码的编

28、码规则,从中可以解读出信息这个人的出生年月为 1990 年 6 月。作进一步加工处理, 还可以从中解读出更多信息, 如这个人的年龄、 属相等。(3) 传递性与共享性数据和信息是可以传递和共享的, 同一数据或信息可以通过复制、 传播, 被多人重复使用。在传递和共享的过程中, 数据和信息本身不会像物质和能源那样产生损耗。例如,同一新闻, 可以通过报纸、 电视、 网络等多种渠道传播。在这一过程中, 新闻通过各种渠道传递给多人, 而新闻本身不会因传递和共享而有任何损失。(4) 价值相对性与时效性数据和信息是有价值的, 但其价值只有当数据或信息被利用时才能体现出来。数据和信息的价值具有相对性, 是否有价

29、值及价值的大小取决于使用者的需求, 以及使用者对数据和信息的认知、 理解和应用能力。例如, 两家鞋厂分别派一名推销员到一个岛上推销鞋,他们上岛后共同感知的数据是 “岛上居民一年四季都光着脚” 。然而这两名推销员从中获取了不同的信息: 第一名推销员认为 “岛上无人穿鞋, 没有市场” ; 第二名推销员认为 “岛上无人穿鞋, 市场潜力很大” 。对数据和信息的不同理解, 使他们做出了不同的选择, 采取了不同的行动, 从而获得了不同的结果。第一名推销员失望而归, 第二名推销员请鞋厂速寄来 100 双鞋, 把鞋送给岛上的居民, 最终为鞋厂赢得了销售市场。数据和信息的价值也与个人需求有关。例如, “岛上居民

30、一年四季都光着脚” 这一数据及它承载的信息, 对于想到岛上推销鞋的推销员是有价值的, 但对于与此事不相关的人来说可能并没有什么价值。数据和信息的价值还与时间有关, 即具有时效性。例如, 某商场今年 10 月 1 日至 7 日举办店庆活动, 商品打折促销, 如果消费者恰好想去该商场购物, 并在 10 月 7 日之前获得了这个信息, 那么, 该信息对消费者是有价值的。但过了 10 月 7 日, 该信息就无效了, 其价值就降低了。数据、 信息与知识的关系从数据到信息, 再到知识, 是一个从低级到高级的认知过程。数据是信息和知识的来源。无论信息还是知识, 都来自数据, 都是以数据为载体而存在的。信息是

31、经过加工的数据, 知识是经过人类归纳整理和反复验证后沉淀下来而呈现的规律。同时, 相应的知识又是加工数据、 提炼信息的基础, 能帮助人们理解信息。由此可见, 数据、 信息与知识之间不存在绝对的界限, 三者有着千丝万缕的联系。大数据信息技术与经济社会的交汇融合引发了数据量的迅猛增长, 数据已成为国家基础性战略资源。大数据正日益对全球生产、 流通、 分配、 消费活动, 乃至经济运行机制、 社会生活方式和国家治理能力产生重要影响。第一单元 数据与信息11拓展阅读数据信息社会的重要资源随着人类跃进到大数据时代, 数据不仅是新知识的来源, 还是记录历史的最重要、 最可靠、最好的方式。从今以后, 人类所有

32、的历史记录, 无论是数字、 文档、 图片, 还是音频和视频, 都将以数据的形式存在, 数据就是静态的历史, 历史就是动态的数据。历史的碎片, 就是游离的数据; 历史的迷雾, 就是模糊的数据; 历史的盲点, 就是缺失的数据。用数据构建的历史, 因为精确的细节而永远鲜活, 数据越丰富, 后世的历史学家也就越能经由数据更好地再现当时的社会。除了发现知识、 记录历史, 人类使用数据的巅峰形式, 是通过数据训练机器, 让机器获得智能, 在不远的将来, 无处不在的计算设备和网络将像有智商的人一样, 为人类工作和服务。这意味着我们在向智能型社会迈进, 在这个新的社会形态下, 由于精准的计算和预测, 整个社会

33、的各个部分可以像无数个大大小小的轴承和齿轮一样, 环环相扣, 齿齿吻合。日常管理将通过数据得到优化, 各种任务、 合作可以无缝对接, 社会运行的成本可大幅度降低。更重要的是, 越来越多的工作将被计算机或者机器人代替。这既是进步, 又是挑战。回望农业时代和工业时代, 人类不断地开发我们赖以生存的自然环境, 从地表到地下, 物理性的资源终有耗尽的一天。而大数据将成为人类取之不尽、 用之不竭的新资源, 在这片资源之上, 再通过软件和算法, 人类将建设一个智能型世界。数据, 正在成为这个世界最重要的土壤和基础。摘自 数据之巅 大数据革命历史、 现实与未来大数据是指无法在可承受的时间范围内用常规软件工具

34、进行捕捉、 管理和处理的数据集合。大数据通常具有 4V 特征, 也就是 Volume(数据量) 、 Velocity(处理速度) 、 Variety(多样性) 、 Value(价值性) 。(1) 数据量: 大数据的体量很大, 且数据集合的规模还在不断扩大。随着信息技术的大规模普及和应用, 教育、 商业、 工业、 科学研究、 医疗等各行各业所产生的数据量都呈现出指数级增长的趋势。(2) 处理速度: 由于数据量增长速度快, 大数据处理速度也必须快, 且时效性要求高。大数据往往以数据流的形式动态地、 快速地产生, 需要在一定的时间限度内得到及时处理。(3) 多样性: 大数据来自多种数据源, 数据种类

35、和格式非常丰富。随着智能设备、 社交网络等的流行, 机器和传感器数据 (如设备日志、 地理位置数据) 、 社交数据 (如网站用户行为记录数据等) 等各种新类型数据越来越多。(4) 价值性: 大数据的价值性不仅指大数据能产生价值, 更是指数据价值密度相对较低。海量的数据中可能发挥价值的仅是其中非常小的一部分。在鸟类研究过程中, 科学家采集了各种各样、 丰富多彩的数据。为了有效存储和处理这些数据, 需要将它们数字化后存入计算机。计算机是由逻辑电路组成的, 逻辑电路通常只有高低两种电位状态, 正好可以表示 “0” 与 “1” , 所以计算机采用二进制来存储和表示数据 (生活中人们常用十进制数, 二进

36、制数和十进制数转换如图 1-13 所示) 。因此, 要想用计算机存储和处理现实中的数值、 文本、 图形、 图像、 声音和视频等数据, 必须对数据进行二进制编码,即将其转化为由 “0” 和 “1” 组成的代码。数据的类型不同, 编码的方法也不同。项目二探究计算机中的数据表示认识数据编码项目学习目标在本项目中 , 我们将通过探究一些鸟类活动数据的编码, 了解数值数据和文本数据的编码方法, 以及声音和图像的数字化过程。完成本项目学习, 须回答以下问题:1. 编码的意义和作用是什么?2. 数值数据编码的基本方法是怎样的? 3. 常用的文本数据编码方式是怎样的?4. 声音数字化的基本方法是怎样的?5.

37、图像数字化的基本方法是怎样的?二进制数01101110010111011110001001十进制数0123456789二进制数101010111100110111101111 10000 10001 10010 10011十进制数10111213141516171819二进制数10100 10101 10110 10111 11000 11001 11010 11011 11100 11101十进制数20212223242526272829图 1-13 二进制数和十进制数第一单元 数据与信息13项目学习指引1. 从树牌号认识编码在项目一的林地鸟类活动调查中, 科研人员以树为单位观察并记录每棵树

38、上鸟的活动数据。为了清楚无误地区分和表示每一棵树, 方便识别和交流, 科研人员为林地中的每一棵树都设置了一个编号树牌号, 如图 1-14 所示。核心概念编码(encoding)是指用预先规定的方法将文字、数字或其他对象转换成规定的符号组合,或将信息、数据转换为规定的脉冲电信号。在计算机中, 编码一般是指用预先规定的方法将数字、 文字、 图像、 声音、视频等对象编成二进制代码的过程。树牌号213019821301234080059如果 2 区 11 子区中有 10023 棵树, 以上的编码规则是否适用??思考与讨论?生活中编码无处不在, 如身份证号、 银行卡号、 邮政编码、 学籍号、 车牌号及条

39、形码、 二维码等, 都是按照一定的规则产生的编码。一级区域编码二级区域编码树木编码给树编号的过程其实是一个编码的过程。为了给林地里的每一棵树设置一个唯一的树牌号, 需要制定相应的编码规则。图 1-15 中的树牌号编码规则如下: 每个树牌号由 7 位数字组成, 第一位数字为一级区域编码 (09, 分别代表林地划分的一个一级区域) , 第二位和第三位数字为二级区域编码 (0120, 分别代表该一级区域中的一个子区) , 第四位至第七位数字为树木编码 (00019999, 分别代表每个子区中的一棵树) 。例如 , 树牌号 2130198, 就代表 2 区 13 子区的第198 棵树。图 1-15 某

40、树牌号的编码参见P18知识链接 “编码”第一单元 数据与信息图 1-14 树牌号示例数据与计算14小贴士十进制 (decimal system)是生活中常用的数制, 二进制 (binary system) 是计算技术中广泛采用的数制。活 动2.1 了解生活中的编码。(1) 了解身份证号的编码规则, 分析一代身份证号与二代身份证号的区别, 思考启用二代身份证号的原因。(2) 根据本校实际情况, 设计适用的学籍号编码规则, 保证每名学生拥有一个唯一的学籍号。(3) 在班级内分享自己的学籍号编码方案, 说明如何保证无重码, 以及在什么情况下需要修改编码规则、 如何修改。2. 了解数值数据和文本数据的

41、编码要想用计算机存储和处理数据,必须先对它们进行编码, 将它们转换成由 “0” 和 “1” 组成的二进制代码。对不同类型的数据, 应采用不同的编码方法。(1) 数值数据的编码数值数据是一类常见数据, 是可用于算术运算的具体数值。例如, 鸟的数量是 21 只, 这个数值数据在计算机中是如何表示的呢?计算机中的数值数据是以补码的方式表示的, 以十进制数 +21 和 -21 的 8 位编码为例, 它们的二进制数、 原码、 反码和补码分别如下。(+21)10=(+10101)2 (-21)10=(-10101)2+10101原 00010101 -10101原 10010101+10101反 0001

42、0101 -10101反 11101010+10101补 00010101 -10101补 11101011(2) 文本数据的编码记录鸟类活动时需要记录鸟的名称, 例如灰眶雀鹛的学名是 Alcippe Morrisonia。对这些由字母构成的数据, 计算机是如何存储和表示的呢?字母、 数字、 标点符号等, 称为西文字符。计算机在存储和处理这些西文字符时, 需要为每个字符规定一个由 0 和 1组成的代码。目前, 国际上普遍采用的西文字符编码标准是 ASCII 码 (American Standard Code for Information Interchange,美国标准信息交换代码) 。参见

43、 P19 知识链接“数值数据的编码”数字化学习支秉彝,汉字编码和汉字信息处理和系统研究的开拓者。20 世纪 60 年代, 支秉彝研究汉字信息字模,发明了 “见字识码” 编码方法。上网查找资料,了解并交流支秉彝等我国科学家为解决汉字进入计算机的难题而艰苦攻关、 不懈奋斗的事迹。第一单元 数据与信息15参见 P20 知识链接“文本数据的编码”小贴士标准 ASCII码用7个二进制位表示 1 个字符, 如, 字母A 的ASCII 码是1000001, 符号 # 的ASCII 码是 0100011。由于标准 ASCII 码只能表示 128 个字符,无法满足西文字符编码的需要, 后来又扩充了128 个字符

44、, 称为扩展ASCII 码。常用汉字有近 5000 个, 一个汉字的编码要用 2个字节表示, 而不是1个字节, 这是为什么??思考与讨论?活 动2.2 加密解密游戏。(1) 以标准 ASCII 码表作为密码本, 选出 4 名学生配合完成加密解密游戏。模拟保密电文的发送和接收过程, 角色分配及建议流程如下: 首长 1: 拟电文 (设计一段由字母、 数字或符号组成的明文) , 传递给发报员。 发报员: 对电文进行加密 (将字母、 数字或符号转换为 ASCII 码, 成为密文) ,传递给接报员。 接报员: 接收密文, 进行解密 (将 ASCII 码转换为字母、 数字或符号) , 解出明文,并传递给首

45、长 2。 首长 2: 向首长 1 核对解密后的电文与原电文是否一致。若不一致, 组织小组成员查找问题, 并改正。(2) 各小组自己设计编码方案和密码本, 再玩一次加密解密游戏。标准 ASCII 码表如图 1-16 所示。图 1-16 标准 ASCII 码表数据与计算163. 了解声音和图像的数字化把自然界的鸟鸣声录制下来并转换为音频文件, 经历了什么样的转换过程呢?自然界的鸟鸣声是一种连续的声波,为了用计算机存储和处理这些声音数据, 需要将它们数字化,并记录成为音频文件。将模拟声音信号转换成数字声音信号, 需要经历采样、 量化和编码三个步骤, 如图 1-17 所示。(1) 采样采样 (samp

46、ling) 即每隔一段时间在模拟声音信号的波形上采集一个幅度值。图 1-18(a) 是一段鸟鸣声的模拟声音信号, 对其采样时, 在波形信号上按时间维度等距离地选取若干个离散的点, 如图 1-18(b) 所示。这些采样得到的幅度值被记录下来, 如图 1-18(c) 所示。图 1-17 声音数字化的过程(a)(b)(c)图 1-18 声音数字化的采样过程参见 P21 知识链接“声音数字化”第一单元 数据与信息17小贴士量化位数:存储、记录声音幅度值所使用的二进制位数。(2) 量化采样之后,要用二进制数将采样得到的幅度值表示出来, 这就是量化 (quantization) 。例如, 取量化位数为 4

47、, 量化过程如下:首先, 确定量化位数为 4。然后, 将声音信号的幅度值范围划分为 24(16) 个量化级数。 第三,确定采样点的量化值。若采样得到的幅度值不在这些级数之内, 则按照一定的规则将它近似到某个级数值上。如图 1-19(a) 中, 第 3 个采样点的真实幅度值约为 5.4,将其四舍五入近似到级数值 5; 第 5 个采样点的真实幅度值约为 9.8, 将其四舍五入近似到级数值 10。同理可将第 6、 第10 个采样点的真实幅度值近似到相应的级数值。量化结果如图 1-19(b) 所示。 (a)(b)图 1-19 声音数字化的量化过程最后,用二进制数表示这些采样点的量化值。例如,用位二进制

48、数来表示,第 1 个采样点的量化值为 0101,第 2 个采样点的量化值为 0010, 第 3 个采样点的量化值为0101(3) 编码经过采样和量化, 模拟声音信号转化为一组二进制数序列, 再通过编码将其按照一定的规则记录下来。采用不同的编码方法, 会形成不同格式的音频文件, 如 WAV 格式、 MP3格式等。通过手机、 数码相机、 数码摄像机等数字设备, 可以拍摄鸟类的照片, 得到图像文件。图像数字化的过程和声音数字化类似, 都会经历采样、 量化和编码三个步骤。参见 P22 知识链接“图像数字化”数据与计算18知识链接编码编码是指用预先规定的方法将数字、 文字或其他对象转换成规定的符号组合,

49、 或将信息、 数据转换为规定的脉冲电信号。编码一般具备以下功能和意义。 鉴别: 编码是对象的唯一标识。通过辨识编码可以找到其唯一对应的对象。例如, 邮政编码对应的地区是唯一的, 身份证号码对应的人是唯一的, 包裹单上的条形码对应的包裹也是唯一的。 排序: 编码的符号都具有一定的顺序, 比较容易进行排序。 专用含义: 编码一般都会包含一定的含义, 例如, 本项目的树牌号中包含着所在区和子区的信息, 身份证号码中包含着出生日期的信息。在计算机中, 编码一般是指用预先规定的方法将数字、 文字、 图像、 声音、 视频等对象编成二进制代码的过程。活 动2.3 探究声音数字化参数对音频文件的影响。(1)

50、探究采样频率对音频文件大小与音质的影响。 选择一种音频编辑软件, 新建一个 WAV文件, 设置采样频率为 44.1kHz, 量化位数为 32 位, 声道数为 2(立体声) , 录制一段声音, 并将其保存为 “录音 1.WAV” 。 保持其他参数不变,修改采样频率为 11.025kHz,并将文件另存为“录音2.WAV” , 比较两个文件的大小及音质, 分析原因。(2) 模仿上述做法, 分别探究量化位数和声道数对音频文件大小及音质的影响。2.4 探究图像数字化。(1) 开展数字化学习, 了解图像数字化的知识, 对比声音数字化与图像数字化的过程。(2) 利用手机、 数码相机等工具采集鸟类活动图片,

展开阅读全文
相关资源
相关搜索
资源标签

当前位置:首页 > 教育专区 > 高中资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报