1、互联网新技术在线教育领航者 ChinaHadoop互联网新技术在线教育领航者 LOGO scikit-learn -互联网新技术在线教育领航者 scikit-learn scikit-learn Twitter互联网新技术在线教育领航者 scikit-learn scikit-learn Twitter互联网新技术在线教育领航者 vs vs 互联网新技术在线教育领航者 Machine Learning is a type of Artificial Intelligence that provides computers with the ability to learn without be
2、ing explicitly programmed. Provides various techniques that can learn from and make predictions on DATA.互联网新技术在线教育领航者 f( ) = “ 你好吗?” f( ) = “ 猫” f( ) = “5-5” ( 下一步) Siri f( “ 你好!” ) = “ 您好!” ( 用户发问) ( 系统回应)互联网新技术在线教育领航者 f f 1 ( ) = “ ” f 1 ( ) = “ ” f 2 ( ) = “ ” f 2 ( ) = “ ”互联网新技术在线教育领航者 互联网新技术在线教
3、育领航者 Step 1. Step 2: Step3: 互联网新技术在线教育领航者 scikit-learn scikit-learn Twitter 互联网新技术在线教育领航者 scikit-learn?互联网新技术在线教育领航者 scikit-learn?互联网新技术在线教育领航者 scikit-learn? Python SVM k-means NumPy SciPy http:/scikit-learn.org/stable/testimonials/testimonials.html pip install scikit-learn conda install scikit-lear
4、n互联网新技术在线教育领航者 scikit-learn n 互联网新技术在线教育领航者 scikit-learn ( ) vs vs 互联网新技术在线教育领航者 scikit-learn scikit-learn iris digits svm .fit() .predict() pickle.dumps() 01_scikit_ml.ipynb互联网新技术在线教育领航者 scikit-learn scikit-learn Twitter 互联网新技术在线教育领航者 scikit-learn scikit-learn 互联网新技术在线教育领航者 scikit-learn (n_samples,
5、 n_features) np.reshape() (normalization) train_test_split() 02_scikit_tutorial.ipynb互联网新技术在线教育领航者 scikit-learn ( ) (normalization) preprocessing.scale() 02_scikit_tutorial.ipynb互联网新技术在线教育领航者 scikit-learn http:/scikit-learn.org/stable/tutorial/machine_learning_map/index.html互联网新技术在线教育领航者 scikit-lear
6、n Estimator fit Estimator Estimator get_params() score() Estimator Coefficient of Determination accuracy 02_scikit_tutorial.ipynb互联网新技术在线教育领航者 scikit-learn , (cross validation) cross_val_score() 02_scikit_tutorial.ipynb互联网新技术在线教育领航者 scikit-learn model.predict(X_test) model.score(X_test, y_test) 02_s
7、cikit_tutorial.ipynb互联网新技术在线教育领航者 scikit-learn scikit-learn Twitter 互联网新技术在线教育领航者 Principal components analysis (PCA) 互联网新技术在线教育领航者 d (x1, x2, , xd) (x1, x2), (x1, x3), , (x1, xd), (x2, x3), (x2, xd), (xd-1, xd) 互联网新技术在线教育领航者 ( ) , PCA , 互联网新技术在线教育领航者 PCA 1. mn R X (i) ( ) ( ) ( ) 2 , ,., i i i 1n x
8、 x x x ( ) ( ) ( ) 2 1 1 , ,., m i i i n 1n i R m x x x x (1) (2) (m) . xx xx Y xx互联网新技术在线教育领航者 PCA 2. 3. ( SVD) (eigenvalues) (eigenvectors) 4. : (1) (2) (1) (2) (m) (m) . . T xx xx Q Y Y x x x x x x xx 03_scikit_pca.ipynb互联网新技术在线教育领航者 scikit-learn scikit-learn Twitter 互联网新技术在线教育领航者 https:/ classif
9、ication twitter scikit-learn lecture08_proj互联网新技术在线教育领航者 1. 2. 3. ( ) 4. ( ) 5. ( ) 6. df_obj.info() df_obj.shape() df_obj.head() df_obj.dropna() df_obj.fillna() model.fit() model.predict() lecture08_proj互联网新技术在线教育领航者 http:/ scikit-learn http:/scikit-learn.org/stable/tutorial/ sklearn http:/ http:/scikit-learn.org/stable/tutorial/machine_learning_map/index.html http:/setosa.io/ev/principal-component-analysis/互联网新技术在线教育领航者 LOGO 疑问 Robin_TY互联网新技术在线教育领航者 LOGO 微信公众号:小象 新浪微博:ChinaHadoop 联系我 们