收藏 分享(赏)

人工智能PPT第2章python数值计算-pandas.ppt

上传人:bubibi 文档编号:18831133 上传时间:2023-11-02 格式:PPT 页数:27 大小:438.50KB
下载 相关 举报
人工智能PPT第2章python数值计算-pandas.ppt_第1页
第1页 / 共27页
人工智能PPT第2章python数值计算-pandas.ppt_第2页
第2页 / 共27页
人工智能PPT第2章python数值计算-pandas.ppt_第3页
第3页 / 共27页
人工智能PPT第2章python数值计算-pandas.ppt_第4页
第4页 / 共27页
人工智能PPT第2章python数值计算-pandas.ppt_第5页
第5页 / 共27页
亲,该文档总共27页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、 python python科学计算科学计算 -pandas -pandaspandaspandas是基于是基于NumPy的数据分析工具,官的数据分析工具,官方网址是方网址是http:/pandas.org。pandas提供提供了快速,灵活和富有表现力的数据结构,目了快速,灵活和富有表现力的数据结构,目的是使的是使“关系关系”或或“标记标记”数据的工作既简数据的工作既简单又直观。单又直观。nPandas用于数据清洗,对噪音等数据进用于数据清洗,对噪音等数据进行处理,从而便于机器学习和数据分析。行处理,从而便于机器学习和数据分析。pandaspandas常用常用6个类个类nSeries:基本数据

2、结构,一维标签数组,能够保存任何:基本数据结构,一维标签数组,能够保存任何数据类型数据类型nDataFrame:基本数据结构,一般为二维数组,是一组:基本数据结构,一般为二维数组,是一组有序的列有序的列nIndex:索引对象,负责管理轴标签和其他元数据(比:索引对象,负责管理轴标签和其他元数据(比如轴名称)如轴名称)ngroupby:分组对象,通过传入需要分组的参数实现对:分组对象,通过传入需要分组的参数实现对数据分组数据分组nTimestamp:时间戳对象,表示时间轴上的一个时刻:时间戳对象,表示时间轴上的一个时刻nTimedelta:时间差对象,用来计算两个时间点的差值:时间差对象,用来计

3、算两个时间点的差值Pandas 2个重要个重要类类创建创建Series创建创建Series对象的函数是对象的函数是Series,它的主要参数是,它的主要参数是data和和index,其基本语法格式如下。,其基本语法格式如下。pandas.Series(data=None,index=None,name=None)参数说明如下:参数说明如下:ndata:接收:接收array或或dict。表示接收的数据。默认为。表示接收的数据。默认为None。nindex:接收:接收array或或list。表示索引,它必须与数据长度相同。表示索引,它必须与数据长度相同。默认为默认为None。nname:接收:接收

4、string或或list。表示。表示Series对象的名称。默认为对象的名称。默认为None。通过通过ndarray创建创建Seriesimportpandasaspdimportnumpyasnpprint(通过通过ndarray创建的创建的Series为:为:n,pd.Series(np.arange(5),index=a,b,c,d,e,name=ndarray)通过通过dict创建创建Seriesdict的键(的键(key)作为)作为Series的索引,的索引,dict的值的值(Value)作为)作为Series的值,因此无须传入的值,因此无须传入index参数。通过参数。通过dict

5、创建创建Series对象,代码如下所示:对象,代码如下所示:importpandasaspddict=a:0,b:1,c:5,d:3,e:4print(通过通过dict创建的创建的Series为:为:n,pd.Series(dict)通过通过list创建创建Seriesimportpandasaspdlist1=0,1,5,3,4print(通过通过list创建的创建的Series为:为:n,pd.Series(list1,index=a,b,c,d,e,name=list)Series属性属性Series拥有拥有8个常用属性,如下所示。个常用属性,如下所示。nvalues:以:以ndarra

6、y的格式返回的格式返回Series对象的所有元素对象的所有元素nindex:返回:返回Series对象的索引对象的索引ndtype:返回:返回Series对象的数据类型对象的数据类型nshape:返回:返回Series对象的形状对象的形状nnbytes:返回:返回Series对象的字节数对象的字节数nndim:返回:返回Series对象的维度对象的维度nsize:返回:返回Series对象的个数对象的个数nT:返回:返回Series对象的转置对象的转置访问访问Series的属性的属性importpandasaspdseries1=pd.Series(1,5,3,4)print(series1:

7、nn.format(series1)print(series1.values:n.format(series1.values)#数据数据print(series1.index:n.format(series1.index)#索引索引print(series1.shape:n.format(series1.shape)#形状形状print(series1.ndim:n.format(series1.ndim)#维度维度访问访问Series数据数据通过索引位置访问通过索引位置访问Series的数据与的数据与ndarray相同,相同,importpandasaspdseries5=pd.Series

8、(1,5,3,4,5,6,7,index=C,D,E,F,G,A,B)#通过索引位置访问通过索引位置访问Series数据子集数据子集print(series5位于第位于第1位置的数据为位置的数据为:,series50)#通过索引名称(标签)也可以访问通过索引名称(标签)也可以访问Series数据数据print(Eisn.format(series5E)更新更新Seriesimportpandasaspdseries1=pd.Series(list1,index=a,b,c,d,e,name=list)print(series1:nn.format(series1)#更新元素更新元素series

9、1a=3print(更新后的更新后的Series1为:为:n,series1)追加追加Series和插入单个值和插入单个值importpandasaspdseries1=pd.Series(list1,index=a,b,c,d,e,name=list)print(series1:nn.format(series1)series1=pd.Series(4,5,index=f,g)#追加追加Seriesprint(在在series插入插入series1后为:后为:n,series.append(series1)删除删除Series元素元素importpandasaspdseries=pd.Ser

10、ies(list1,index=a,b,c,d,e,name=list)print(series:nn.format(series)#删除数据删除数据series.drop(e,inplace=True)print(删除索引删除索引e对应数据后的对应数据后的series为:为:n,series)。DataFrameDataFrame是是pandas基本数据结基本数据结构,类似数据库中的表。构,类似数据库中的表。DataFrame既既有行索引,也有列索引,可以看作是有行索引,也有列索引,可以看作是Series组成的组成的dict,每个,每个Series是是DataFrame的一列。的一列。创建创

11、建DataFrameDataFrame函数用于创建函数用于创建DataFrame对象,其基本语法格式如下对象,其基本语法格式如下pandas.DataFrame(data=None,index=None,columns=None,dtype=None,copy=False)参数说明如下所示:参数说明如下所示:ndata:接收:接收ndarray、dict、list或或DataFrame。表示输入数据。表示输入数据。默认为默认为None。nindex:接收:接收Index,ndarray。表示索引。默认为。表示索引。默认为None。ncolumns:接收:接收Index,ndarray。表示列标

12、签(列名)。默认为。表示列标签(列名)。默认为None。通过通过dict创建创建DataFrameimportpandasaspddict1=col1:0,1,5,3,4,col5:5,6,7,8,9print(通过通过dict创建的创建的DataFrame为:为:n,pd.DataFrame(dict1,index=a,b,c,d,e)通过通过list创建创建DataFrameimportpandasaspdlist5=0,5,1,6,5,7,3,8,4,9print(通过通过list创建的创建的DataFrame为:为:n,pd.DataFrame(list5,index=a,b,c,d,

13、e,columns=col1,col5)通过通过Series创建创建DataFrameimportpandasaspdnoteSeries=pd.Series(C,D,E,F,G,A,B,index=1,5,3,4,5,6,7)weekdaySeries=pd.Series(Mon,Tue,Wed,Thu,Fri,Sat,Sun,index=1,5,3,4,5,6,7)df4=pd.DataFrame(noteSeries,weekdaySeries)print(df4:nn.format(df4)DataFrame属性属性nvalues:以:以ndarray的格式返回的格式返回DataFra

14、me对象的所有元素对象的所有元素nindex:返回:返回DataFrame对象的对象的Indexncolumns:返回:返回DataFrame对象的列标签对象的列标签ndtypes:返回:返回DataFrame对象的数据类型对象的数据类型naxes:返回:返回DataFrame对象的轴标签对象的轴标签nndim:返回:返回DataFrame对象的轴尺寸数对象的轴尺寸数nsize:返回:返回DataFrame对象的个数对象的个数nshape:返回:返回DataFrame对象的形状对象的形状访问访问DataFrame的属性的属性importpandasaspddf=pd.DataFrame(col

15、1:0,1,5,3,4,col5:5,6,7,8,9,index=a,b,c,d,e)print(DataFrame的的Index为:为:,df.index)print(DataFrame的列标签为:的列标签为:,df.columns)print(DataFrame的轴标签为:的轴标签为:,df.axes)print(DataFrame的维度为:的维度为:,df.ndim)print(DataFrame的形状为:的形状为:,df.shape)访问访问DataFrame首尾数据首尾数据print(默认返回前默认返回前5行数据为:行数据为:n,df.head()print(返回后返回后3行数据为:

16、行数据为:n,df.tail(3)更新更新DataFrameimportpandasaspddf=pd.DataFrame(col1:0,1,5,3,4,col5:5,6,7,8,9,index=a,b,c,d,e)print(DataFrame为:为:n,df)#更新列更新列dfcol1=10,11,15,13,14print(更新列后的更新列后的DataFrame为:为:n,df)插入和删除插入和删除DataFrameimportpandasaspddf3=pd.DataFrame(note:C,D,E,F,G,A,B,weekday:Mon,Tue,Wed,Thu,Fri,Sat,Sun

17、)print(df3:nn.format(df3)df3No.=pd.Series(1,5,3,4,5,6,7)#采用赋值的方法插入列采用赋值的方法插入列print(df3:nn.format(df3)deldf3weekday#删除列的方法有多种,如删除列的方法有多种,如del、pop、dropprint(df3:nn.format(df3)Index创建创建Series或或DataFrame等对象时,索引会被转换为等对象时,索引会被转换为Index对象。对象。Index对象可以通过对象可以通过pandas.Index()函数创建,也可以通过创建数函数创建,也可以通过创建数据对象据对象Ser

18、ies、DataFrame时接收时接收index(或(或column)参数创建,)参数创建,前者属于显式创建,后者属于隐式创建。隐式创建中,通过访问前者属于显式创建,后者属于隐式创建。隐式创建中,通过访问index(或(或DataFrame的的column)属性得到)属性得到Index,Index对象不对象不可修改,保证了可修改,保证了Index对象在各个数据结构之间的安全共享。对象在各个数据结构之间的安全共享。Index对象常用的属性及其说明如下所示。对象常用的属性及其说明如下所示。nis_monotonic:当各元素均大于前一个元素时,返回:当各元素均大于前一个元素时,返回Truenis_unique:当:当Index没有重复值时,返回没有重复值时,返回TrueplotMatplotlib绘制一张图表需要各个基础组件对象,工作量较绘制一张图表需要各个基础组件对象,工作量较大。而大。而pandas中使用行标签和列标签以及分组信息,较为简便的中使用行标签和列标签以及分组信息,较为简便的完成图表的制作。完成图表的制作。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 旅游攻略 > 广东广西

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报