ImageVerifierCode 换一换
格式:PPTX , 页数:32 ,大小:1.86MB ,
资源ID:20014189      下载积分:10 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wenkunet.com/d-20014189.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(人工智能导论PPT第三章机器学习.pptx)为本站会员(bubibi)主动上传,文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文库网(发送邮件至13560552955@163.com或直接QQ联系客服),我们立即给予删除!

人工智能导论PPT第三章机器学习.pptx

1、机器学习概述 n“A program can be said to learn from experience E with respect to some class of tasks T and performance measure P,if its performance at tasks in T,as measured bt P,improves with experience E.”n“如果一个程序在使用既有的经验(E)执行某类任务(T)的过程中被认定为是具备学习能力的,那么它一定需要展现出:利用现有的经验(E),不断改善其完成既定任务(T)的性能(P)的特质”n机器学习横跨计算

2、机科学,工程技术和统计学等多个学科,需要多学科的专业知识。,它可以作为实际工具应用于从政治到地质学的多个领域,解决其中的很多问题。甚至可以这么说,机器学习对于任何需要解释并操作数据的领域都有所裨益。机器学习工作流程无监督学习数据预处理与特征工程n数据清洗数据清洗n数据变换数据变换n数据过滤数据过滤n特征工程特征工程 sklearn库简介nScikit-learn库,由David Cournapeau在2007年首次开发。它包含一系列容易实现和调整的有用算法,可以用来实现分类和其他机器学习的任务。在官网下载时只有Scikit-learn,但是在Python调用该库时写法为sklearn,后面在代

3、码中调用该库也均为sklearn,这里可以将sklearn看作是Scikit-learn的缩写。nsklearn的基本功能主要分为六大部分,包括数据预处理、数据降维、模型选择、分类、回归、聚类。基本功能基本功能说明说明数据预处理数据预处理(preprocessingpreprocessing)数据特征提取、归一化。数据降维数据降维(dimensionality dimensionality reductionreduction)主成分分析(PCA)、非负矩阵分解(NMF)、特征选择(eature_selection)等模型选择模型选择(model selectionmodel selectio

4、n)pipeline(流水线)、grid_search(网格搜索)、cross_validation(交叉验证)、metrics(度量)、learning_curve(学习曲线)等分类分类(classificationclassification)逻辑回归、支持向量机(SVM)、K-近邻、随机森林、逻辑回归、神经网络等回归回归(regressionregression)线性回归、支持向量回归(SVR)、脊回归、弹性回归、贝叶斯回归、Lasso回归、最小角回归(LARS)等聚类聚类(clusteringclustering)K-Means(均值聚类)、spectral clustering(谱聚

5、类)、mean-shift(均值漂移)、分层聚类、DBSCAN聚类1.1.选择数据集数据集名称数据集名称调用方式调用方式数据描述数据描述鸢尾花数据集鸢尾花数据集load_iris()用于分类任务的数据集手写数字数据集手写数字数据集load_digits()用于分类任务或者降维任务的数据集乳腺癌数据集乳腺癌数据集load-barest-cancer()简单经典的用于二分类任务的数据集糖尿病数据集糖尿病数据集load-diabetes()经典的用于回归任务的数据集波士顿房价数据波士顿房价数据集集load-boston()经典的用于回归任务的数据集体能训练数据集体能训练数据集 load-linner

6、ud()经典的用于多变量回归任务的数据集2.2.调用数据集调用数据集1.from sklearn.datasets import load_iris2.iris=load_iris()3.3.划分数据集划分数据集n一般会把数据集划分成训练集、验证集和测试集,其中训练集用来估计模型,验证集用来确定网络结构或控制模型复杂程度的参数,而测试集则用于检验最终选择的最优模型的性能优劣。nScikit-learn中使用sklearn.model_selection模块对数据集进行划分,而该模块中的train_test_split()是交叉验证中常用的函数,其功能是从样本中随机按比例选取train_data

7、和test_data4.4.数据预处理数据预处理n归一化:将输入变量变换到某一范围,如01区间。在Scikit-learn库中,使用 MinMaxScaler 类实现;n标准化:通常适用于高斯分布的输入变量。在Scikit-learn库中,使用 StandardScaler 类实现;常用于假定输入变量高斯分布的线性回归、逻辑回归和线性判决分析。n正规化:将输入变量变换为具有单位范数长度的数据。常用的范数有L1、L2。在Scikit-learn库中,使用Normalizer类实现;代码分析 3.35 5数据降维数据降维n数据降维数据降维是指使用主成分分析、非负矩阵分解或特征选择等降维技术来减少要考虑的随机变量个数,其主要应用场景包括可视化处理和效率提升。n主成分分析PCA简介回归分析动机实例步骤n1.获取数据n2.预处理n3.特征工程n4.学习n5.模型评估模型训练n实例化逻辑回归n逻辑回归是一种分类模型。n应用场景:n广告点击率n是否为垃圾邮件n是否患病n金融诈骗n原理n输入值是什么n如何判断输出输入与激活函数n输入n激活函数如果三分,如何考虑?聚类算法nK-means算法nhttp:/

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报