收藏 分享(赏)

第三讲_数据分析工具Pandas.pdf

上传人:陈琪琪 文档编号:46932 上传时间:2018-08-01 格式:PDF 页数:54 大小:1.46MB
下载 相关 举报
第三讲_数据分析工具Pandas.pdf_第1页
第1页 / 共54页
第三讲_数据分析工具Pandas.pdf_第2页
第2页 / 共54页
第三讲_数据分析工具Pandas.pdf_第3页
第3页 / 共54页
第三讲_数据分析工具Pandas.pdf_第4页
第4页 / 共54页
第三讲_数据分析工具Pandas.pdf_第5页
第5页 / 共54页
点击查看更多>>
资源描述

1、互联网新技术在线教育领航者 ChinaHadoop互联网新技术在线教育领航者 LOGO Pandas -互联网新技术在线教育领航者 Pandas Pandas Pandas K-Means Open Food Facts互联网新技术在线教育领航者 Pandas Pandas NumPy 互联网新技术在线教育领航者 Pandas Pandas Pandas K-Means Open Food Facts互联网新技术在线教育领航者 Pandas Series list Series ser_obj = pd.Series(range(10) ser_obj.index, ser_obj.value

2、s ser_obj.head(n) 01_pandas_data_structures.ipynb互联网新技术在线教育领航者 Pandas Series ( ) ser_objidx dict Series name ser_obj.name, ser_obj.index.name 01_pandas_data_structures.ipynb互联网新技术在线教育领航者 Pandas DataFrame / ( excel, R data.frame) what about ndarray? 01_pandas_data_structures.ipynb互联网新技术在线教育领航者 Pandas

3、 DataFrame ndarray DataFrame dict DataFrame Series df_objcol_idx df_obj.col_idx dict key-value df_objnew_col_idx = data del df_objcol_idx 01_pandas_data_structures.ipynb互联网新技术在线教育领航者 Pandas Index Series DataFrame Index (immutable) Index Index Int64Index MultiIndex DatetimeIndex 01_pandas_data_struct

4、ures.ipynb互联网新技术在线教育领航者 Pandas Pandas Pandas K-Means Open Food Facts互联网新技术在线教育领航者 Pandas Series ser_obj ser_objpos ser_obj2:4, ser_obj label3 ser_obj ser_objpos1, pos2, pos3 02_pandas_data_process.ipynb互联网新技术在线教育领航者 Pandas 02_pandas_data_process.ipynb ( ) DataFrame互联网新技术在线教育领航者 Pandas ( ) DataFrame

5、df_obj df_obj 02_pandas_data_process.ipynb互联网新技术在线教育领航者 Pandas Pandas 3 .loc .iloc .ix DataFrame ndarray 02_pandas_data_process.ipynb互联网新技术在线教育领航者 Pandas NaN Series DataFrame add, sub, div, mul fill_value NaN fillna 02_pandas_data_process.ipynb互联网新技术在线教育领航者 Pandas NumPy ufunc abs apply axis=0 applym

6、ap 02_pandas_data_process.ipynb互联网新技术在线教育领航者 Pandas sort_index DataFrame sort_values 02_pandas_data_process.ipynb互联网新技术在线教育领航者 Pandas ser_obj.isnull(), df_obj.isnull() dropna fillna 02_pandas_data_process.ipynb互联网新技术在线教育领航者 Pandas Pandas Pandas K-Means Open Food Facts互联网新技术在线教育领航者 Pandas axis=0 axis

7、=1 skipna True idmax, idmin, cumsum describe 03_pandas_stats.ipynb互联网新技术在线教育领航者 Pandas互联网新技术在线教育领航者 Pandas互联网新技术在线教育领航者 Pandas Pandas Pandas K-Means Open Food Facts互联网新技术在线教育领航者 Pandas hierarchical indexing MultiIndex ser_obj outer_label ser_obj inner_label swaplevel() sortlevel() 04_pandas_multi_in

8、dex.ipynb互联网新技术在线教育领航者 Pandas 04_pandas_multi_index.ipynb互联网新技术在线教育领航者 Pandas (groupby) SQL pandas groupby split-apply-combine 互联网新技术在线教育领航者 Pandas ( ) split-apply-combine互联网新技术在线教育领航者 Pandas ( ) GroupBy DataFrameGroupBy SeriesGroupBy GroupBy GroupBy / mean() size() 05_pandas_groupby.ipynb互联网新技术在线教育

9、领航者 Pandas ( ) obj.groupby obj.groupby( - dataframe key obj.groupby(self_def_key) key unstack dataframe 05_pandas_groupby.ipynb互联网新技术在线教育领航者 Pandas ( ) GroupBy (group_name, group_data) GroupBy Pandas 05_pandas_groupby.ipynb互联网新技术在线教育领航者 Pandas (aggregation) mean() count() sum(), mean(), max(), min()

10、, count(), size(), describe() agg grouped.agg(func) func groupby 05_pandas_groupby.ipynb互联网新技术在线教育领航者 Pandas ( ) dict 05_pandas_groupby.ipynb互联网新技术在线教育领航者 Pandas ( ) 互联网新技术在线教育领航者 : shape shape? merge transform transform shape grouped.transform(np.mean) 06_pandas_grouped_apply_transform.ipynb互联网新技术在

11、线教育领航者 ( ) grouped.apply(func) func pd.concat df_obj , group_keys=False apply 06_pandas_grouped_apply_transform.ipynb互联网新技术在线教育领航者 Pandas Pandas Pandas K-Means Open Food Facts互联网新技术在线教育领航者 pd.fillna() pd.dropna()互联网新技术在线教育领航者 pd.merge DataFrame ( ) on left_on right_on (inner) 07_data_merge.ipynb互联网新

12、技术在线教育领航者 pd.merge ( ) how (outer) (left) (right) suffixes _x, _y left_index=True right_index=True 07_data_merge.ipynb互联网新技术在线教育领航者 pd.concat NumPy concat np.concatenate pd.concat axis=0 join outer Series DataFrame 08_data_concat.ipynb互联网新技术在线教育领航者 stack DataFrame-Series unstack Series-DataFrame lev

13、el=-1 09_data_reshape.ipynb互联网新技术在线教育领航者 stack DataFrame-Series unstack Series-DataFrame level=-1 09_data_reshape.ipynb互联网新技术在线教育领航者 duplicated() Series drop_duplicates() map Series map replace 10_data_transform.ipynb互联网新技术在线教育领航者 Pandas Pandas Pandas K-Means Open Food Facts互联网新技术在线教育领航者 K-Means clu

14、stering unsupervised learning demo http:/ K-Means k k k lect03_kmeans互联网新技术在线教育领航者 K-Means 1. k 2. n k 3. 4. k 2,3 k lect03_kmeans互联网新技术在线教育领航者 Pandas Pandas Pandas K-Means World Food Facts互联网新技术在线教育领航者 lect03_proj https:/ Pandas互联网新技术在线教育领航者 10 Pandas http:/pandas.pydata.org/pandas-docs/stable/10mi

15、n.html Pandas http:/pandas.pydata.org/pandas-docs/stable/indexing.html Pandas http:/pandas.pydata.org/pandas-docs/stable/missing_data.html Pandas http:/pandas.pydata.org/pandas- docs/version/0.18.1/visualization.html Pandas / http:/pandas.pydata.org/pandas-docs/stable/advanced.html互联网新技术在线教育领航者 Python for Data Analysis Pandas GroupBy http:/pandas.pydata.org/pandas-docs/stable/groupby.html Pandas http:/pandas.pydata.org/pandas-docs/stable/reshaping.html k-means https:/en.wikipedia.org/wiki/K-means_clustering k-means http:/ LOGO 疑问 Robin_TY互联网新技术在线教育领航者 LOGO 微信公众号:小象 新浪微博:ChinaHadoop 联系我 们

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 网络技术 > 热门技术

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报