1、华东师范大学出版社总 主 编: 李晓明副总主编: 赵 健本册主编: 冯 忻编写人员( 按姓氏笔画排序) :毛黎莉 冯 忻 张逸中 欧阳元新 周永麒责任编辑: 程 滨美术设计: 储 平普通高中教科书 信息技术 必修1 数据与计算上海市中小学(幼儿园)课程改革委员会组织编写出版发行 华东师范大学出版社( 上海市中山北路3 6 6 3号)印 刷 上海昌鑫龙印务有限公司版 次 2 0 2 0年6月第1版印 次 2 0 2 0年6月第1次开 本 8 9 0毫米 1 2 4 0毫米 1/1 6印 张 9 . 2 5字 数 1 6 6千字书 号 I S B N 9 7 8 7 5 7 6 0 0 5 4 7
2、 9定 价 1 1 . 6 0元版权所有未经许可不得采用任何方式擅自复制或使用本产品任何部分违者必究如发现内容质量问题, 请拨打电话0 2 1 6 0 8 2 1 7 1 4如发现印、 装质量问题, 影响阅读, 请与华东师范大学出版社联系。电话: 0 2 1 6 0 8 2 1 7 1 1全国物价举报电话: 1 2 3 1 5声明 按照 中华人民共和国著作权法 第二十五条有关规定, 我们已尽量寻找著作权人支付报酬。著作权人如有关于支付报酬事宜可及时与出版社联系。本册教材图片提供信息: 本册教材中的部分图片由全景网、 视觉中国等图片网站提供。华东师范大学出版社致同学们致同学们亲爱的同学们: 当今
3、, 信息技术的发展日新月异, 物联网、 大数据、 人工智能等新技术、 新工具扑面而来, 显著地改变着人们的生活、 学习和工作模式。生存于信息社会中, 我们每一个人都不可避免地会接触信息技术、 应用信息技术, 甚至去创造新的信息技术。在具备了基本信息技术应用能力的基础上, 高中阶段我们要进一步学习信息技术的知识与技能,能够利用信息技术负责任地解决生活与学习中的问题, 全面提升信息素养, 迎接信息社会的挑战。“ 数据与计算” 作为高中信息技术学科的必修模块, 是学习高中信息技术学科其他模块的基础。本教科书采用“ 项目活动” 方式组织学习内容, 通过“ 信息技术伴我学” “ 编程应用助健康” “ 交
4、通数据利抉择”“ 智能工具好帮手” 项目, 将数据与大数据、 算法与编程实现、 数据处理与应用、 人工智能等基础知识与技能融入到学习活动中。教科书的每章围绕“ 信息意识” “ 计算思维” “ 数字化学习与创新” “ 信息社会责任”四个学科核心素养提出本章的学习目标, 利用“ 本章知识结构” 图示呈现本章知识脉络, 帮助同学们从总体上了解本章学习内容。在学习过程中, 同学们可以通过“ 体验思考” 栏目, 将现实问题、 个人经验与知识技能相关联, 带着问题开始学习; 通过“ 探究活动” 和“ 项目实践” 栏目, 将“ 做中学” 与“ 学中做” 的学习方法相互融合, 把知识技能应用于解决实际问题中;
5、 通过“ 技术支持” 栏目, 将新技术与新工具适时应用于作品制作中, 提高合理选用技术工具创造性完成作品制作的能力; 按照个人的学习需求, 学习“ 知识延伸” 栏目中的内容, 拓展个人学习视野。提升信息素养, 要求我们在掌握基本信息技术知识和常用信息技术工具的同时, 能够用计算思维来分析问题; 要求我们在体验信息技1 华东师范大学出版社数据与计算术给我们带来的更高效率的同时, 积极运用技术来创造性地解决问题和创作作品; 要求我们在享受信息技术提供的便利的同时, 关注信息安全, 参与和促进信息社会的伦理与道德建设。同学们可以通过本教科书与配套资源学习信息技术, 负责任地应用信息技术, 逐步成长为
6、新时代合格的社会主义建设者。编者2华东师范大学出版社目录目录第一章数据与大数据 . . . 1项目主题信息技术伴我学. . . 3第一节数据、信息与知识. . . 4第二节数字化与编码. . . 1 6第三节大数据及其作用与价值. . . 2 6第二章算法与程序实现 . . . 3 5项目主题编程应用助健康. . . 3 7第一节算法与算法描述. . . 3 8第二节程序设计语言基本知识. . . 5 0第三节常用算法及其程序实现. . . 7 11 华东师范大学出版社数据与计算第三章数据处理与应用 . . . 7 9项目主题交通数据利抉择. . . 8 1第一节数据采集、整理与安全. . .
7、 8 2第二节数据分析与可视化. . . 9 7第三节数据分析报告与应用. . . 1 1 4第四章走近人工智能 . . . 1 1 7项目主题智能工具好帮手. . . 1 1 9第一节体验计算机视觉应用. . . 1 2 0第二节人工智能的发展历程. . . 1 2 4第三节人工智能的作用及影响. . . 1 3 5后记 . . . 1 412华东师范大学出版社第 一 章数据与大数据本章学习目标在实际生活与学习中感知数据与信息, 知道数据与信息的特征, 理解数据、 信息与知识的区别和联系, 认识数据与信息对社会发展和个人成长的影响。掌握二进制数与十进制数、 二进制数与十六进制数相互转换的方法
8、, 了解数字化的过程与意义, 知道字符、 声音、 图像编码的基本方式。针对学习任务, 选择数字化学习工具和资源, 感受利用它们进行自主学习和知识分享的优势。华东师范大学出版社数据与计算信息技术的发展与普及改变着我们的生活与学习。我们的晨起, 可能始于查看手腕上带有睡眠监测功能的智能手环; 我们的休闲, 可能始于点击手机中具有歌曲智能推荐功能的音乐软件; 我们的出行, 可能始于扫描小区外停放的共享单车的二维码; 我们的学习, 也可能不再是从步入教室的一刻开始, 而是始于打开一款能够时时、 处处伴随着我们的在线学习软件。目前, 越来越多的高中生使用慕课学习平台、 数字图书馆、 数字实验系统开展学习
9、。登录慕课学习平台后, 可以实现跨校学习, 共享优质学习资源; 访问数字图书馆, 能够快速查阅信息, 自助完成电子图书的借阅和归还; 应用数字实验系统, 能够体验实验数据的生成过程, 以可视化方式感知实验规律。信息技术在改变着我们的学习环境, 也改变着我们的学习方式。掌握信息技术知识, 运用信息技术促进学习, 是新时代每位中学生都应具备的能力。本章知识结构4-*ED4-4+T-+2*+)D/+*.-+EEEED+D/04-M4-4-2华东师范大学出版社第一章数据与大数据项目主题信息技术伴我学项目情境随着技术的发展, 人们阅读的书籍已经从纸质图书拓展为既能看也能听的电子图书, 人们传统的阅读方式
10、也随之发生变化。一年一度的学校诗词大会即将举行, 学校图书馆收到了一些读者需求: 有的同学希望图书馆能够增购一些电子图书, 供同学们借阅; 有的同学希望图书馆能够将馆藏的纸质校刊制作成电子校刊, 方便查阅往年学校诗词大会的征文; 有的同学希望在面对浩瀚书海时, 学校图书馆能够根据同学们的阅读习惯, 提供个性化的图书推荐。小申是学校图书馆的志愿者, 他能为学校图书馆提供一些建议吗?项目任务任务 1任务 2任务 3 搜索电子图书网站, 记录电子图书选择过程中的参考数据, 了解这些数据所反映的信息, 描述数据在选择电子图书过程中所起到的作用。 将学校馆藏的纸质校刊制作成电子校刊, 感受 数字化的过程
11、, 小组合作完成电子校刊的制作。 分析电子图书网站向读者推送电子图书的方法与策略, 举例说明大数据在其中的作用, 为学校图书馆设计一份电子图书推荐方案。3 华东师范大学出版社数据与计算第一节数据、信息与知识人类对于数据的应用由来已久, 早在春秋战国时期, 齐国国相管仲就通过对农业生产数据的统计分析来制定相关的农业生产政策, 在 汉书地理志 史记平准书 等众多史籍中都留下了有关农业生产、 天文历法、 地理山川的大量数据, 这些数据的应用一定程度上提高了人类的生产效率。如今, 信息技术的发展赋予了人们采集和分析数据的新工具与新方法, 通过这些工具和方法, 人们可以更高效地处理数据, 解决问题。体验
12、思考随着学校诗词大会举办日期的临近, 图书馆老师希望小申能够根据同学们的需求, 列出与诗词相关的电子图书购买清单。小申访问了一些电子图书网站, 通过查找和比较, 列出了电子图书的购买清单。思考:1 . 如图1 . 1所示, 网站上提供了哪些数据来帮助人们选择要购买的图书?2 . 这些数据对人们选择图书有什么帮助?图 1 . 1 在电子图书网站上搜索电子图书4华东师范大学出版社第一章数据与大数据一、 感知数据数据无处不在。数字图书馆中, 人们输入的账号、 密码, 读者对于图书的评论等都是数据; 公交站台电子屏幕上显示的行车线路号、 预计到达时间等也是数据; 天气预报播报的气温、 湿度、 风级等同
13、样是数据。数据已广泛应用于我们的生活与学习。1 . 数据的概念数据是对事物描述的记录。例如, 描述一个学生的基本特征, 可以通过姓名、 性别、 年龄等方面的数据来记录; 确定某一地理位置, 可以通过经度和纬度的数据来记录; 表示城市空气质量检测中细颗粒物(P M2 . 5) 随时间变化的情况, 可以用一个时间序列数据来记录。数据可以帮助人们有效地描述事物。数据的表现形式多种多样, 可以有数字、 文字、 图形、 图像、 声音等形式。对同一事物的描述记录也可以有不同的数据表现形式, 例如,导航仪行车线路中表示车辆左转时, 可以用文字“ 左转” 来表示, 也可以用图形来表示, 还可以通过语音来播报。
14、同一数据也可能描述不同的事物。例如, 数字“6 0” 可以表示一个人的年龄、 一次考试的成绩、 一件物品的长度, 或者是某个路段的机动车的最高限速值等。因此, 脱离具体的情境和形式, 无法确定数据的意义。数据是可加工、 可处理的。从已知数据出发, 参照相关数据进行加工计算, 生成一些新的数据, 从中可以得到新的结论, 从而作为人们决策的依据。例如, 在线学习网站会记录学习者的访问数据, 通过学习者浏览某一页面的起始时间和结束时间, 计算得到这一页面的学习时长, 并将该学习时长和系统设定的有效学习时长进行比较, 从而判断学习者的该次学习是否有效。在人类文明的历史长河中, 人们发明了很多处理数据的
15、工具, 从古人发明的算盘到故宫馆藏的计算尺, 从十六世纪帕斯卡发明的加法器到今天功能强大的计算机, 人们处理数据的能力越来越强大, 数据的含义也越来越丰富。在计算机科学中, 数据是计算机识别、 存储和加工的对象。例如, 我们常用的演示文稿文件、 电子表格文件、 图像文件、 音频文件和视频文件等都是计算机处理的数据, 如图1 . 2所示。5 华东师范大学出版社数据与计算图 1 . 2 用计算机处理的数据2 . 数据的价值在信息社会, 随着数据处理技术的迅速发展, 数据被广泛地应用于社会的方方面面, 给人们的学习、 生活与工作带来了巨大的变化。图 1 . 3 数字化实验系统在数字图书馆中, 图书管
16、理人员利用采集到的借阅数据, 调整管理方式, 提供个性化服务; 读者借助网络平台中的图书数据, 足不出户就可以有针对性地选择和借阅图书, 享受读书的乐趣; 图书作者还可以根据读者对图书的阅读和评价数据, 进一步完善图书内容。在学校餐饮管理中, 通过食堂管理系统, 可以快速获取和分析学生的用餐数据, 根据不同菜品的销售数据, 食堂管理员可以适时地调整菜品种类,合理安排每种菜品的数量, 提高服务质量。图 1 . 4 道路检测车在教学实验中, 通过数字化实验系统, 可以采集需要测量的物理量, 如温度、 电压、 压强等, 将其转换成计算机可以处理的数据。计算机处理后, 能够直观地呈现实验结果, 提高学
17、生的探究能力, 如图1 . 3所示。在道路检修过程中, 道路检测车可以自动采集路面的损坏状况、 道路平稳度等各项数据, 如图1 . 4所示。通过数据分析, 车载计算机可以判断道路的安全情况, 甚至还可以估算出维修费用, 避免了由于人工目测而导致的误差, 为道路养护提供准确、有效的数据支撑。6华东师范大学出版社第一章数据与大数据随着信息技术与人们生产生活的交汇融合以及互联网的快速普及, 全球数据呈现出爆发式增长、 海量集聚的特点。数据对改善人民生活、 促进经济发展、 推动社会进步等, 起着越来越重要的作用, 它已成为像水、 电、 煤气一样重要的资源。数据作为一种资源, 同样需要通过各种各样的“
18、管道” 输送到社会的各个领域中去, 将数据转化为用户决策或行动的依据, 促进社会的发展。二、 认识信息自古以来, 人类的生存和发展就与信息有着不解之缘。我国古代利用烽火台传递示警信息, 通过活字印刷术促进知识和文化的广泛传播。今天, 移动通信设备和网络成为我们获取信息的重要途径。信息的获取与应用影响着我们分析问题与解决问题的方式。项目实践请尝试读取图 1. 5中的数据, 填写表 1. 1, 并回答问题。图 1 . 5 电子图书搜索页面7 华东师范大学出版社数据与计算表 1 . 1 电子图书信息分析表唐诗百话北山楼词话作者出版时间字数在读人数评分对于上述两本电子图书, 如果希望购买其中一本出版日
19、期较新的, 应该选择 , 选择的依据是 ; 如果希望购买其中一本较为热门的, 应该选择 , 选择的依据是 。 1 . 信息的概念生活中, 人们总是自觉或不自觉地获取和应用信息。在教室听到上课铃声, 学生保持安静, 开始上课。在交通路口, 行人根据交通信号灯的变化决定“ 行” 还是“ 停” 。在数字图书馆, 读者通过比较电子图书数据, 了解图书信息, 确定需要选择的图书。人们时时刻刻接触信息、 应用信息。对于什么是信息, 人们从不同的角度给出了不同的定义。唐代诗人岑参写道: “ 马上相逢无纸笔, 凭君传语报平安。 ” 南宋诗人杨万里则写下了“ 花落六回疏信息, 月明千里两相思” 。这些都表达出古
20、人对传送和得知信息的渴望。在通信并不发达的古代, 信息的意思更多地还是指消息。信息 学 奠 基 人 克 劳 德 艾 尔 伍 德 香 农 (C l a u d e E l w o o d S h a n n o n) 认为“ 信息是能够用来消除不确定性的东西” 。对某一不确定的情况, 当获得信息之后, 这种“ 不确定性” 就可以减少或消除。香农从信息的产生、 传播、 接收等通信系统角度来考虑信息的涵义, 这也推动了信息学的发展, 而这一定义也常被人们看作经典定义而加以引用。信息管理专家F. W.霍顿(F. W. H o r t o n) 将信息定义为: “ 信息是8华东师范大学出版社第一章数据与
21、大数据为了满足用户决策的需要而经过加工处理的数据。 ” 简单地说, 信息是经过加工的数据, 或者说, 信息是数据处理的结果。综合上述信息的定义可以看出, 信息表示的是事物之间的相互关系, 它可以通过数字、 字符、 图像、 声音和视频等载体进行传播。人们借助信息可以了解情况、 形成判断、 做出决策、 指导行动。在信息社会里, 有效获取和合理应用信息已成为人们需要具备的一项重要的信息素养。2 . 信息的特征信息在人际交流、 生产管理、 知识传播和科学研究等方面都发挥着巨大的作用。了解信息的特征有助于我们加深对信息的认识和理解。(1 ) 信息可以传播和存储信息的传播和存储需要依附于一定的载体。承载信
22、息的数字、 字符、 图像、 声音和视频等可称为信息的载体。在信息处理中, 如果存储信息的载体遭到破坏, 其承载的信息就会丢失。例如, 古书中文字的缺失导致了它所传达信息的丢失。通信信号受到强烈干扰, 也会破坏其所传递的信息。(2 ) 信息的价值是相对的同一条信息对于不同的持有者具有不同的价值, 例如, 有一条信息“ 我国发现了兵马俑” , 新闻记者需要将这条信息传播给更多的人,历史学家需要这条信息帮助其更好地进行历史研究等。同样, 信息的价值也取决于信息接收者对信息的理解、 认知和应用能力。人们在信息的应用过程中, 经过对原有信息的加工后可能会产生新的信息, 进而产生新的价值, 从而使原来的信
23、息增值。图 1 . 6 信息可以被共享(3 ) 信息可以被共享人们可以将一条信息传播出去, 让其他人也能接收并反复利用, 如图1 . 6所示。英国著名戏剧家萧伯纳曾经说过: “ 如果你有一个苹果, 我有一个苹果, 彼此交换,我们每个人仍然只有一个苹果; 如果你有一种思想, 我有一种思想, 彼此交换, 我们每个人就有了两种思想, 甚至多于两种思想。 ” 这在一定程度上体现了信息是可以被共享的。9 华东师范大学出版社数据与计算 (4) 信息具有时效性信息往往反映了事物在某个特定时间的状态, 信息的时效会随着时间的推移而变化。例如, 用户可以通过使用手机扫描二维码登录一些网站或邮箱, 提供给用户扫描
24、的二维码每隔一定时间便会刷新, 重新生成, 它所传递的信息只在一定时间内有效。在信息社会中, 信息的变化越来越快, 信息价值的实现取决于对其及时的把握和运用。如果不能及时利用最新信息, 信息的价值就可能会贬值甚至会变得毫无价值, 这就是信息的时效性。图 1 . 7 航班实时数据示例3 . 合理应用信息社会信息总量的快速增长为人们应用信息解决问题带来了便利条件。但是, 过于庞杂的信息量, 各种各样的干扰信息, 持续更新的技术工具, 都对人们感知与获取信息、 甄别信息的真伪和合理应用信息带来了挑战。(1 ) 敏锐感知周围世界,正确获取信息在信息社会中, 信息的变化日益频繁, 生存于其中的社会成员要
25、能敏锐地感知到变化的信息, 依据信息的变化做出相应决策。例如, 旅行社利用移动应用软件(A p p) 发布的实时航班数据, 了解航班运营时间等信息, 调整接送旅客的出车计划, 提高工作效率, 如图1 . 7所示。事实上, 缺少对信息变化的敏锐感知, 有可能造成不必要的损失。例如, 当城市地铁出现故障时,交通管理部门通过电台、 微信公众号等途径发布故障信息, 如果用户不能及时获取这些信息, 依然采用坐地铁的方式出行, 就会影响出行计划。信息技术为我们感知和获取信息提供了便利的条件。官方微信公众号、 官方微博实时推送和发布的信息可以帮助我们做出判断; 借助移动应用软件中的数据, 可以了解事物变化的
26、情况, 做出相应的行动调整。合理利用信息技术获取数据, 应用其中的信息指导所要采取的行动, 可以让我们自信、 从容地生活在信息社会中。(2 ) 具备信息辨别能力,有效甄别信息日常生活与学习中, 大家可能收到过一些虚假信息, 例如中奖短信、 诈骗电话、 虚假照片合成、 微信朋友圈和公众号中骇人听闻的假新闻等等。这些信息会影响我们的正常生活, 甚至会给我们带来不必要的损失。在纷繁复杂的信息环境下, 人们需要具备有效甄别信息、 判断信息真伪的能力。1 0华东师范大学出版社第一章数据与大数据图 1 . 8 移动应用安全软件生活中, 人们可以通过多种方式和渠道来辨别信息的真伪, 例如通过主流媒体对所获得
27、的信息进行核对, 与所获信息的相关人员进行实时沟通确认, 或者借助技术工具对所获信息进行分析辨别。人们在手机中安装移动应用安全软件来识别和标记诈骗电话等( 如图1 . 8所示) , 就是一种常见的辨别信息真伪的防护方式。(3 ) 遵守信息安全法规,负责任地使用信息信息技术拓展了人们的生存时空, 创造出人们新的生存环境。在新的环境中, 人们也要遵守其中的新秩序。为维护信息社会的秩序, 我国先后出台了一系列旨在推动信息化建设的法律法规, 这就要求每位社会成员都要担负起相应的责任。2 0 1 7年6月, 我国正式施行 中华人民共和国网络安全法 。其中, 第十二条要求“ 任何个人和组织不得利用网络从事
28、编造、 传播虚假信息扰乱经济秩序和社会秩序, 以及侵害他人名誉、 隐私、 知识产权和其他合法权益等活动” 。网络是继陆地、 海洋、 天空、 太空之外, 又一个人类活动空间。人们在网络空间中的各项活动要遵守信息社会的法律法规, 如有违反法律法规的行为, 必将会受到法律法规的惩罚。例如, 不法分子通过网络散布病毒程序, 用以盗取他人手机通信录、 短信、 银行卡账号等信息, 危害社会信息安全。经公安部门查实、 认定其违法行为后, 根据相应法律法规, 对其进行了相应处罚。三、 学习知识“ 知识就是力量” 这句名言一直流传至今, 知识可以推动社会的进步。在人类文明的历史长河中, 人们可以从种类繁多的资料
29、记录中获取知识, 也可以在生活实践中通过分析数据和信息来发现知识。如今, 信息技术的发展为我们学习知识创造了新的条件。结合具体问题情境, 应用这些知识可以帮助我们解决问题。1 1 华东师范大学出版社数据与计算探究活动图 1 . 9 唐诗百话 读者评论词频统计图在电子图书网站上, 小申发现许多位于热门榜单上的电子图书都拥有大量的读者评论。小申想通过这些评论, 了解某一电子图书的读者最突出的阅读感受。老师推荐他借助语义分析工具, 对电子图书的相关读者评论进行研究。使用语义分析工具分析 唐诗百话 的读者评论, 结果如图 1. 9所示。1. 根据图 1. 9, 分析读者对于 唐诗百话 最突出的阅读感受
30、是什么。2. 尝试利用语义分析工具, 分析某一电子图书的读者评论, 并思考在此过程中, 信息技术工具起到了怎样的作用。在前面的活动中, 我们尝试使用语义分析工具来辅助分析读者对电子图书的评论。在实际应用中, 数字图书馆可以对读者的图书评论加以分析, 并以此为依据向读者提供阅读推荐。信息技术为人们处理数据提供了强有力的工具, 人们可以利用信息技术对数据进行分析,找出其中的相互关系, 形成规律, 获得知识并加以运用。1 . 数据、信息与知识的关系数据是描述事物的记录, 它能够承载信息, 因此人们可以在处理数据的过程中获得信息。随着人类的进步以及处理数据和信息的能力不断提升, 人类从数据中获取有用信
31、息的能力越来越强。信息表示的是事物间的相互关系, 通过分析数据可以发现其中包含的关系。例如, 分析某电子图书借阅人数和读者评价, 可以发现该图书基本内容和写作特点, 为从同类图书中选择合适的图书提供依据。知识分为一般知识和科学知识。在日常生活和工作中, 人们所获得的认识和经验的总和, 通常称为一般知识。科学知识是人们对信息的科学组织, 它是经过严谨的验证, 获得学界一致认可的内容, 如物理学科中的牛顿三大定律、 化学学科中的元素周期律和生物学科中的遗传基本定律等。随着认知工具和方法的发展, 人们对世界的认识也会不断深入, 人类的知识也在不断地发展。今天, 人们运用各种信息技术工具来认识事物、
32、表达思想、 分享知识, 让学习和工作更加高效。例如, 通过数字实验设备, 可以便捷地采1 2华东师范大学出版社第一章数据与大数据集数据、 获取信息, 从而发现新知识; 借助网络平台加快信息的传播速度, 可以快速分享知识。合理地应用信息技术, 人们就能更好地认识世界、 发现知识, 推动人类文明的进步。2 . 体验数字化学习今天, 学习者处于全新的数字化学习环境中, 需要不断提升个人信息素养, 选择合适的学习资源和学习方式开展学习。网络的发展拓图 1 . 1 0 互联网环境下的远程学习展了学习时空, 学习者足不出户就可以获得优质的学习资源。例如, 不同地域的学校可以通过网络进行跨校研讨与交流, 推
33、动远程合作学习, 实现优质教育资源的效益最大化, 如图1 . 1 0所示。虚拟现实技术的应用可以模拟真实情境, 帮助学习者开展探究学习。例如, 在学习海洋生物的相关知识时, 学习者很难到深海中去体验深海生物的生存环境。但是, 在虚拟现实技术的支持下, 学习者可以身临其境地感受深海生物的生存环境, 更好地学习、 理解相关知识, 如图1 . 1 1所示。图 1 . 1 1 虚拟现实技术支持深海生物知识的学习大数据与人工智能技术在教育中的应用可以记录学习者的学习行为数据, 针对学习者的学习需求,依据数据分析结果提供精准学习支持。目前, 一些在线学习平台应用大数据和人工智能技术分析学生的学习过程, 实
34、时采集学生的学习数据, 依据数据发现学生学习的不足, 针对学习中存在的问题提供相应的学习资源与指导, 让学生感觉到“ 教师” 时时刻刻都在自己身边。技术支持语义分析工具借助语义分析工具, 我们可以用量化的方式分析文本内容, 获取文本所表达的深层次信息。例如, 通过语义分析工具, 可以快速分析读者对图书的评价, 了解读者对图书的关注要点等。如图 1. 12 所示, 在应用语义分析工具时, 将要分析的文本复制到分析工具中。通过计算, 系统可以完成文本内容的实体抽取, 识别文本中出现的人名、 地名等关键词; 实现词频统计, 对不同词性的词语进行分类呈现, 分析每类词语出现的频度; 绘制文本的词云,
35、突出文本中出现频率较高的关键词; 判断相关词语, 分析语义关联情况, 对文本内容进行精简提炼, 从长篇文章中提取关键句和关键段落, 编辑文本的摘要, 等等。1 3 华东师范大学出版社数据与计算图 1 . 1 2 应用语义分析工具分析文本作业练习图 1 . 1 3 “ 测定位移和速度” 的 DI S 环境与实验数据小申与学习同伴在数字化信息系统( DI S ) 实验室做“ 测定位移和速度”实验。实验过程中, 他们通过 DI S 中的位移传感器采集实验小车的位移数据, 然后将采集的数据传入计算机中, 利用实验软件系统描绘出s t图像。通过s t图像, 可以确定实验小车从起始时刻到任意时刻的位移和任
36、意一段时间内的平均速度。实验环 境 与 实 验 数 据 如 图1. 13所示。1 4华东师范大学出版社第一章数据与大数据1. 分析“ 测定位移和速度” 的实验环境与实验数据, 填写表 1. 2 。表 1 . 2 “ 测定位移和速度” 的实验环境与实验数据分析分析内容描 述运用 D I S 采集了哪些实验数据从实验数据中可以发现哪些信息通过实验可总结出哪些物理知识列举实验中所使用的数字化工具2. 列举你在日常学习中所使用的数字化学习工具, 描述它们的功能, 分析它们在学习中的优势和局限性。知识延伸香农与信息论1948 年, 香农在定义信息时, 借用了物理学中的“ 熵” 一词, 解决了对“ 信息”
37、 一词的量化和度量问题。从此, “ 信息” 一词就有了一次数学化的提炼, 信息就有了定量计算的单位, 这是一个划时代的进步, 推动了通信技术的发展, 也推动了整个信息技术的发展。信息论在信息与不确定性、 信息与信息熵之间架起了桥梁。香农认为“ 信息是能够用来消除不确定性的东西” , 他用概率分布来衡量信息的“ 不确定性” , 同时引入了“ 比特” 作为计量单位。“ 信息熵” 一词是从“ 热力熵” 而来, 即求整个系统事件中平均信息量的大小, 香农给出了信息熵的数学公式:H(H H x). p(xi)log2 p(xi) () (i=1, 2, , n)ni=1i i这些概念奠定了信息论的基础,
38、 并且为信息技术领域的进步开辟了新的道路。1 5 华东师范大学出版社数据与计算第二节数字化与编码信息技术的发展创造出一个全新的数字化环境, 生活在其中的每个人都能感受到数字化带来的变化。人们利用数字化设备可实时获取自己的心率、 血压等身体健康数据, 通过分析这些数据, 可以主动管理自己的健康; 乘客可以通过移动智能终端查询车辆到站的实时信息, 避免了以往久等公交车而不知车何时到达的尴尬。移动通信、 移动智能终端等新技术的广泛使用, 使全球正在成为一个互联互通的数字化世界。体验思考同学们希望查阅学校图书馆馆藏校刊上刊载的往年诗词大会征文。由于馆藏的校刊数量较少, 因此图书馆只能满足少数同学的借阅
39、需求。同时, 同学们在借阅校刊的过程中, 也令校刊产生了不同程度的污损, 影响了校刊的收藏。因此, 学校图书馆希望能够将历年的纸质校刊制作成电子校刊, 供同学们借阅。思考:1 . 纸质校刊的内容承载于墨迹和纸张之中, 那么电子校刊的内容是以怎样的形式存储在计算机中的?2 . 分析纸质校刊和电子校刊在借阅过程中各自的优势和不足。一、 进位计数制及其转换目前, 计算机的硬件组成通常可以呈现两种状态, 如电路的导通和断开。这样就决定了计算机内部采用二进制, 即以“0” 和“1” 的组合来表示信息, 用“1” 来表示一种状态( 如电路的导通) , 用“0” 来表示相反的另一种状态( 如电路的断开) 。
40、由于计算机采用二进制数进行运算和存储, 因此要使用计算机进行信息处理, 首先要把待处理的信息用二进制数来表示。1 . 进位计数制进位计数制, 是按进位方式实现计数的一种规则。进位计数制包含数码、 基数和位权三个要素。我们将用来表示某种进位计数制的一1 6华东师范大学出版社第一章数据与大数据组符号称为数码, 所使用的数码个数称为基数, 数码在不同数位上的倍率值称为位权。十进制是人们生活中常用的进位计数制, 它的基数为1 0, 由0, 1, 2, , 9共1 0个数码组成, 整数位的位权从右向左依次为1 00, 1 01, 1 02, 。例如, 十进制数4 6 3各个数位上的数字所代表的数值分别为
41、4 1 02、 6 1 01、 3 1 00。二进制是一种常用于计算机中的进位计数制, 它的基数为2, 只有0、 1两个数码, 整数位的位权从右向左依次为20, 21, 22, 。例如: 二进制数(1 1 0)2中, 各个数位上的数字所代表的数值分别为122、 1 21、 0 20。 在计算机科学中, 除了二进制之外, 为了便于使用, 常用的进位计数制还有十六进制。由于采用二进制数描述信息的位数较多, 不便于记忆、 交流和阅读, 因此为了方便书写和表达, 人们常常将二进制数转换为十六进制数。十六进制的基数是1 6, 包含0, 1, 2, 3, , 9, A, B, C, D, E, F, 共1
42、 6个数码。图 1 . 1 4 十进制数转换为二进制数不同的进位计数制用(S)R表示, 其中S是具体的数码, 下标R是该进位计数制的基数, 例如(1 0 2 A)1 6和(1 0 1 1)2。有时, 也用特定的字母标在末尾来标识进位计数制, 例如1 0 1 1 B, 这里的“B” 是二进制的特定字母, 十进制和十六进制则分别用“D” 和“H” 来表示。一般情况下, 十进制是默认进位计数制, 因此字母“D” 通常被省略。2 . 不同进位计数制的相互转换图 1 . 1 5 二进制数转换为十六进制数将十进制整数转换为二进制数的方法是除以2反向取余。例如,将十进制数3 7转换为二进制数, 即: (3
43、7)1 0=(1 0 0 1 0 1)2, 如图1 . 1 4所示。 二进制数转换为十进制数, 一般可以将每位二进制数和该位的位权相乘再求和, 这种方法称为按权展开。例如: (1 0 1 1)2= 123+022+121+120= 8+0+2+1=(1 1)1 0二进制数转换为十六进制数时, 把二进制数从低位到高位按4位一组划分, 每组用一位十六进制数表示, 不足4位二进制数, 高位用“0” 补齐。例如, (1 0 1 1 0 1 1)2=(5 B)1 6, 如图1 . 1 5所示。图 1 . 1 6 十六进制数转换为二进制数十六进制数转换为二进制数时, 将每一位十六进制数转换为4位二进制数,
44、 不足4位二进制数, 高位用“0” 补齐。例如, (A 3)1 6=(1 0 1 0 0 0 1 1)2, 如图1 . 1 6所示。1 7 华东师范大学出版社数据与计算3 . 数据的存储单位比特(b i t) 是计算机中最小的数据存储单位, 即一个二进制位, 一位的取值只能是0或1。字节(B y t e) 是计算机中信息组织和存储的基本数据存储单位,1字节就是8比特。字节常用B表示, 描述存储容量的常用单位还有K B、 M B、 G B、 T B、 P B、 E B等, 其换算规则如表1 . 3所示。表 1 . 3 常用存储单位换算表存储单位换算规则存储单位换算规则K B, 千字节1K B=
45、10 2 4B= 21 0BM B, 兆字节1M B= 10 2 4K B= 22 0BG B, 吉字节1G B= 10 2 4M B= 23 0BTB, 太字节1TB= 10 2 4G B= 240BPB, 拍字节1PB= 10 2 4TB= 250BEB, 艾字节1EB= 10 2 4PB= 26 0B图 1 . 1 7 模拟信号与数字信号二、 数字化今天, 数字技术向人类生活各个领域全面推进, 迅速改变着我们的学习和生活: 网上购物可以让消费者足不出户购买商品, 电子地图能及时规划出最优的出行路线, 在线政务让市民办事更高效,数字博物馆让人们跨时空浏览馆藏珍品。在丰富多彩的信息社会里,
46、数字化是计算机处理信息的基础, 将现实世界中各种各样的信息用二进制数来表示的过程就是信息的数字化。1 . 模拟信号和数字信号现实世界中, 我们将连续变化的物理量称为“ 模拟量” , 如温度、 速度等。数字化可将模拟量转换成数字量, 数字量的变化在时间或数值上都是离散的。模拟量和数字量都是对某一个物理量的反映或表达。两者的主要区别是: 模拟量是连续的, 数字量是离散的。例如, 水银温度计中的水银汞柱伸缩是连续变化的, 反映的是模拟量; 数字温度计显示的数字是离散的, 反映的是数字量。在电子设备中, 模拟量通常以模拟信号的形式进行传递, 数字量则以数字信号的形式进行传递。在一定条件下, 模拟信号和
47、数字信号可以相互转换, 如图1 . 1 7所示。以声音的数字化为例, 麦1 8华东师范大学出版社第一章数据与大数据克风能够将声波的振动转化为电信号, 这是一种模拟信号, 再经过模数转换设备( 如声卡等) 的处理后, 可以转换成计算机内部能够处理的数字信号。2 . 模拟信号的数字化过程在计算机领域, 数字化是指将复杂多样的信息表示为计算机可以图 1 . 1 8 采样处理的二进制代码的过程。通常, 使用电子设备( 如话筒等) 采集的信号是模拟信号, 为了能让数字设备进行存储和处理, 就需要将模拟信号转换为数字信号, 这种转换过程主要包括采样、 量化和编码。图 1 . 1 9 量化采样是在连续的模拟
48、信号中, 每隔一定时间( 或空间) 取一个值的过程, 如图1 . 1 8所示。对于同一模拟信号, 采样的时间间隔设置越小, 单位时间内采集的样本数量越多。每秒的采样次数称作采样频率, 单位用赫兹(H z) 表示。量化是把采样的值用二进制数值表示出来。其过程是按模拟信号变化的幅度将其划分为几个区段, 把落在某个区段的采样样本值归成一类, 并赋予相应的二进制数值来表示量化值, 如图1 . 1 9所示。对这些二进制数值进行编码, 就可以形成一系列二进制代码。这样, 计算机就可以对其进行识别、 存储和加工了。数字化的应用很广泛, 例如, 图像的数字化就是用离散的量来表示连续的空间, 视频的数字化就是用
49、离散的量来表示连续的时间和空间。项目实践电子校刊方便借阅和存放, 而且还可以提供多媒体形式的内容, 丰富了阅读资源。1. 选用数字化工具, 将纸质校刊中的文字制作成电子文本或音频文件。2. 选用数字化工具, 将纸质校刊中的插图制作成图像文件。3. 与同学合作, 尝试利用数字化工具制作电子校刊, 体验电子校刊的制作过程。1 9 华东师范大学出版社数据与计算三、 编码为了有效处理信息, 人们常常通过编码的方式来表示信息。例如, 公交车线路号就是一种编码, 人们通过线路号来选择和区分公交线路。学校里, 教学楼的楼号和教室号也是编码, 老师和同学们根据楼号和教室号就能确定上课和活动的地点。生活中, 身
50、份证号、 银行卡号、 学籍号、 车牌号等都是编码。编码是为了方便信息的存储、 检索和使用而规定的符号系统。编码的过程是将信息按照一定的规则进行变换。图书馆中, 管理员根据图书类目、 种次等信息对图书进行编码, 形成索书号, 然后按索书号将图书放在书架相应的位置上, 便于读者顺利地找到图书。要使用计算机处理各种各样的信息, 需要通过编码的方式将信息转换成用“0” 和“1” 表示的二进制代码。1 . 字符编码(1 ) A S C I I 码目前, 国际上广泛使用的英文字符编码是A S C I I码(Am e r i c a n s t a n d a r d c o d e f o r i n f