人工智能导论PPT第三章机器学习.pptx-资源下载-文库网

人工智能导论PPT第三章机器学习.pptx

1、机器学习概述 n“A program can be said to learn from experience E with respect to some class of tasks T and performance measure P,if its performance at tasks in T,as measured bt P,improves with experience E.”n“如果一个程序在使用既有的经验（E）执行某类任务（T）的过程中被认定为是具备学习能力的，那么它一定需要展现出：利用现有的经验（E），不断改善其完成既定任务（T）的性能（P）的特质”n机器学习横跨计算

2、机科学，工程技术和统计学等多个学科，需要多学科的专业知识。，它可以作为实际工具应用于从政治到地质学的多个领域，解决其中的很多问题。甚至可以这么说，机器学习对于任何需要解释并操作数据的领域都有所裨益。机器学习工作流程无监督学习数据预处理与特征工程n数据清洗数据清洗n数据变换数据变换n数据过滤数据过滤n特征工程特征工程 sklearn库简介nScikit-learn库，由David Cournapeau在2007年首次开发。它包含一系列容易实现和调整的有用算法，可以用来实现分类和其他机器学习的任务。在官网下载时只有Scikit-learn，但是在Python调用该库时写法为sklearn，后面在代

3、码中调用该库也均为sklearn，这里可以将sklearn看作是Scikit-learn的缩写。nsklearn的基本功能主要分为六大部分，包括数据预处理、数据降维、模型选择、分类、回归、聚类。基本功能基本功能说明说明数据预处理数据预处理（preprocessingpreprocessing）数据特征提取、归一化。数据降维数据降维（dimensionality dimensionality reductionreduction）主成分分析(PCA)、非负矩阵分解（NMF）、特征选择(eature_selection)等模型选择模型选择（model selectionmodel selectio

4、n）pipeline(流水线)、grid_search（网格搜索）、cross_validation(交叉验证)、metrics（度量）、learning_curve（学习曲线）等分类分类（classificationclassification）逻辑回归、支持向量机（SVM）、K-近邻、随机森林、逻辑回归、神经网络等回归回归（regressionregression）线性回归、支持向量回归（SVR）、脊回归、弹性回归、贝叶斯回归、Lasso回归、最小角回归（LARS）等聚类聚类（clusteringclustering）K-Means（均值聚类）、spectral clustering(谱聚

5、类)、mean-shift（均值漂移）、分层聚类、DBSCAN聚类1.1.选择数据集数据集名称数据集名称调用方式调用方式数据描述数据描述鸢尾花数据集鸢尾花数据集load_iris()用于分类任务的数据集手写数字数据集手写数字数据集load_digits()用于分类任务或者降维任务的数据集乳腺癌数据集乳腺癌数据集load-barest-cancer()简单经典的用于二分类任务的数据集糖尿病数据集糖尿病数据集load-diabetes()经典的用于回归任务的数据集波士顿房价数据波士顿房价数据集集load-boston()经典的用于回归任务的数据集体能训练数据集体能训练数据集 load-linner

6、ud()经典的用于多变量回归任务的数据集2.2.调用数据集调用数据集1.from sklearn.datasets import load_iris2.iris=load_iris()3.3.划分数据集划分数据集n一般会把数据集划分成训练集、验证集和测试集，其中训练集用来估计模型，验证集用来确定网络结构或控制模型复杂程度的参数，而测试集则用于检验最终选择的最优模型的性能优劣。nScikit-learn中使用sklearn.model_selection模块对数据集进行划分，而该模块中的train_test_split()是交叉验证中常用的函数，其功能是从样本中随机按比例选取train_data

7、和test_data4.4.数据预处理数据预处理n归一化：将输入变量变换到某一范围，如01区间。在Scikit-learn库中，使用 MinMaxScaler 类实现；n标准化：通常适用于高斯分布的输入变量。在Scikit-learn库中，使用 StandardScaler 类实现；常用于假定输入变量高斯分布的线性回归、逻辑回归和线性判决分析。n正规化：将输入变量变换为具有单位范数长度的数据。常用的范数有L1、L2。在Scikit-learn库中，使用Normalizer类实现；代码分析 3.35 5数据降维数据降维n数据降维数据降维是指使用主成分分析、非负矩阵分解或特征选择等降维技术来减少要考虑的随机变量个数，其主要应用场景包括可视化处理和效率提升。n主成分分析PCA简介回归分析动机实例步骤n1.获取数据n2.预处理n3.特征工程n4.学习n5.模型评估模型训练n实例化逻辑回归n逻辑回归是一种分类模型。n应用场景：n广告点击率n是否为垃圾邮件n是否患病n金融诈骗n原理n输入值是什么n如何判断输出输入与激活函数n输入n激活函数如果三分，如何考虑？聚类算法nK-means算法nhttp:/

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？