收藏 分享(赏)

人工智能PPT第1章人工智能概述.ppt

上传人:bubibi 文档编号:18831109 上传时间:2023-11-02 格式:PPT 页数:19 大小:1.03MB
下载 相关 举报
人工智能PPT第1章人工智能概述.ppt_第1页
第1页 / 共19页
人工智能PPT第1章人工智能概述.ppt_第2页
第2页 / 共19页
人工智能PPT第1章人工智能概述.ppt_第3页
第3页 / 共19页
人工智能PPT第1章人工智能概述.ppt_第4页
第4页 / 共19页
人工智能PPT第1章人工智能概述.ppt_第5页
第5页 / 共19页
亲,该文档总共19页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、Python机器学习导论-基于Sklearn周元哲清华大学出版社2第1章 人工智能概述第2章 Python数值计算第3章 数据清洗与特征预处理第4章 数据划分与特征提取第5章 特征降维与特征选择第6章 k近邻算法第7章 决策树第8章 线性回归模型第9章 朴素贝叶斯第10章 支持向量机第11章 K-Means算法第12章 模型调优与评估目目 录录31.1 相关概念1.2 机器学习三要素1.3 机器学习分类1.4 机器学习开发流程1.5 sklearn框架1.6 Anaconda1.7 Kaggle竞赛平台1.8 学习建议与步骤第一章第一章 目目 录录人工智能n人工智能(ArtificialInt

2、elligence,缩写AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,人工智能n第一阶段(1956-1974):人工智能研究最初20年的黄金时代。n第二阶段(1974-1980):人工智能的第一次寒冬。n第三阶段(1980-1987):人工智能繁荣期。n第四阶段(1987-1993):人工智能第二次寒冬。n第五阶段(1993-):人工智能的稳健时代。67机器学习机器学习(MachineLearning,缩写ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、算法复杂度理论等多门学科,研究计算机怎样模拟或实现人类的学习行为,获取新的知识。机器学

3、习通过使用算法解析数据、归纳规律、获得模型,对数据做出决策和预测。举个简单的例子,当浏览网上商城时,经常会出现商品推荐的信息。这是商城根据以往购物记录和收藏清单,识别出感兴趣并且愿意购买的产品,训练的决策模型。机器学习就是以仿生学为灵感、以数学为理论基础、以编程为实现工具,让机器像人一样学习。深度学习n深度学习(DeepLearning,缩写DL)相对于传统的神经网络,具有多个隐藏层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示,通过模仿人脑的的神经网络运行机制来解释数据(例如图像,声音和文本等)。8机器学习三要素n算

4、法是核心,数据与计算是基础。n数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。n算法通过在数据上进行运算产生模型。9机器学习分类n监督学习n无监督学习10监督学习n监督学习(supervisedlearning)是通过现有训练数据集进行建模,再用模型对新的数据样本进行分类或者回归分析的机器学习方法。利用输入数据及其对应标签来训练模型。这种学习方法类似学生通过研究问题和参考答案来学习,在掌握问题和答案之间的对应关系后,学生可自己给出相似新问题的答案。n监督学习分为分类学习和回归预测两个典型的问题。11n分类学习分类学习通常把分类(classification)视作监督学习的一个

5、离散形式,从有限的类别中,给每个样本贴上正确的标签。n回归预测回归任务(regression)预测目标数值是连续值。12无监督学习n无监督学习(unsupervisedlearning)又称为非监督学习,是在没有训练数据集的情况下,对没有标签的数据进行分析并建立合适的模型,以便给出问题解决方案的方法。由于无监督学习没有目标,因此无法从事预测任务,而适合对数据进行分析。13无监督学习分为数据聚类和特征降维。(1)数据聚类(Clustering)无监督学习里典型例子是聚类。对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小。(2)特征

6、降维(DimensionalityReduction)数据降维是对事物的特性进行压缩和筛选,就是对于许多特征表示的高维数据,而通过降维,使用较少的特征就可以概括该数据的重要特性。14机器学习开发流程n1问题分析问题分析 n2数据清洗数据清洗与与预处理预处理 n3数据划分与特征工程n4算法与模型n5模型优化和评估模型优化和评估15sklearn框架Sklearn(scikit-learn)是当前较为流行的机器学习框架,基于python语言的开源工具包,与NumPy,SciPy和Matplotlib等数值计算库紧密关联,具有众多的数据集以及简单高效的数据挖掘和数据分析工具。SKlearn官网地址:https:/scikit-learn.org/stable/16AnacondanAnaconda是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项,在数据可视化、机器学习、深度学习等多方面都有涉及。17Kaggle竞赛平台nKaggle作为目前全世界最为流行,同时也是认可度最高,参与人数最多的数据建模和数据分析线上竞赛平台,成立于2010年,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。nKaggle网址是:https:/

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 旅游攻略 > 广东广西

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报