MOOC 机器学习-温州大学中国大学慕课答案.docx

资源描述

1、 MOOC 机器学习-温州大学中国大学慕课答案引言课后测试1、问题：哪一个是机器学习的合理定义？选项：A、机器学习从标记的数据中学习B、机器学习能使计算机能够在没有明确编程的情况下学习C、机器学习是计算机编程的科学D、机器学习是允许机器人智能行动的领域正确答案:【机器学习能使计算机能够在没有明确编程的情况下学习】2、问题：一个计算机程序从经验 E 中学习任务 T，并用 P 来衡量表现。并且，T的表现 P 随着经验 E 的增加而提高。假设我们给一个学习算法输入了很多历史天气的数据，让它学会预测天气。什么是 P 的合理选择？选项：A、计算大量历史气象数据的过程B、正确预测未来日期天气的概率C、天

2、气预报任务D、以上都不正确答案:【正确预测未来日期天气的概率】3、问题：回归问题和分类问题的区别是什么？选项：A、回归问题有标签，分类问题没有B、回归问题输出值是离散的，分类问题输出值是连续的C、回归问题输出值是连续的，分类问题输出值是离散的D、回归问题与分类问题在输入属性值上要求不同正确答案:【回归问题输出值是连续的，分类问题输出值是离散的】4、问题：以下关于特征选择的说法正确的是？选项：A、选择的特征越多越好B、选择的特征越少越好C、选择的特征需尽可能反映不同事物之间的差异D、以上说法均不对正确答案:【选择的特征需尽可能反映不同事物之间的差异】5、问题：一个包含 n 类的多分类问题，若采用

3、一对剩余的方法，需要拆分成多少次？选项：A、1 B、n-1C、nD、n+1正确答案:【n-1】6、问题：机器学习方法传统上可以分为( )类。选项：A、3B、4C、7D、2正确答案:【3】7、问题：哪些机器学习模型经过训练，能够根据其行为获得的奖励和反馈做出一系列决策？选项：A、监督学习B、无监督学习C、强化学习D、以上全部正确答案:【强化学习】8、问题：机器学习这个术语是由( )定义的？选项：A、James GoslingB、Arthur SamuelC、Guido van RossumD、以上都不是正确答案:【Arthur Samuel】9、问题：哪种开发语言最适合机器学习？( )选项：A、

4、CB、JavaC、PythonD、HTML正确答案:【Python】10、问题：( )是机器学习的一部分，与神经网络一起工作。选项：A、人工智能B、深度学习 C、A 和 BD、以上都不是正确答案:【深度学习】11、问题：( )是可用于标记数据的机器学习算法。选项：A、回归算法B、聚类算法C、关联规则算法D、以上都不是正确答案:【回归算法】12、问题：谷歌新闻每天收集非常多的新闻，并运用( )方法再将这些新闻分组，组成若干类有关联的新闻。于是，搜索时同一组新闻事件往往隶属同一主题的，所以显示到一起。选项：A、回归B、分类C、聚类D、关联规则正确答案:【聚类】13、问题：下列哪些学习问题不属于监督

5、学习？( )选项：A、聚类B、降维C、分类D、回归正确答案:【聚类#降维】14、问题：下列哪些学习问题不属于监督学习？( )选项：A、回归B、分类C、聚类D、关联规则正确答案:【聚类#关联规则】15、问题：机器学习的方法由( )等几个要素构成。选项：A、模型B、损失函数 C、优化算法D、模型评估指标正确答案:【模型#损失函数#优化算法#模型评估指标】16、问题：对于非概率模型而言，可按照判别函数线性与否分成线性模型与非线性模型。下面哪些模型属于线性模型？选项：A、K-meansB、k 近邻C、感知机D、AdaBoost正确答案:【K-means#k 近邻#感知机】17、问题：朴素贝叶斯属于概率

6、模型。选项：A、正确B、错误正确答案:【正确】18、问题：根据肿瘤的体积、患者的年龄来判断良性或恶性，这是一个回归问题。选项：A、正确B、错误正确答案:【错误】19、问题：大部分的机器学习工程中，数据搜集、数据清洗、特征工程这三个步骤绝大部分时间，而数据建模，占总时间比较少。选项：A、正确B、错误正确答案:【正确】20、问题：已知你朋友的信息，比如经常发 email 的联系人，或是你微博的好友、微信的朋友圈，我们可运用聚类方法自动地给朋友进行分组，做到让每组里的人们彼此都熟识。选项：A、正确B、错误正确答案:【正确】回归课后测试 1、问题：以下哪组变量之间存在线性回归关系？选项：A、学生的性别

7、与他的成绩B、儿子的身高与父亲的身高C、正方形的边长与面积D、正三角形的边长与周长正确答案:【正三角形的边长与周长】2、问题：回归问题和分类问题的区别是？选项：A、回归问题有标签，分类问题没有B、回归问题输出值是离散的，分类问题输出值是连续的C、回归问题输出值是连续的，分类问题输出值是离散的D、回归问题与分类问题在输入属性值上要求不同正确答案:【回归问题输出值是连续的，分类问题输出值是离散的】3、问题：以下说法错误的是？选项：A、残差是预测值与真实值之间的差值B、损失函数越小，模型训练得一定越好C、正则项的目的是为了避免模型过拟合D、最小二乘法不需要选择学习率正确答案:【损失函数越小，模型训练

8、得一定越好】4、问题：哪些算法不需要数据归一化？选项：A、kNNB、k-meansC、SVMD、决策树正确答案:【决策树】5、问题：以下哪些方法不能用于处理欠拟合？选项：A、增大正则化系数B、增加新的特征C、增加模型复杂度D、对特征进行变换，使用组合特征或高维特征正确答案:【增大正则化系数】6、问题：以下哪些方法不能用于处理过拟合？选项： A、对数据进行清洗B、增大训练数据的量C、利用正则化技术D、增加数据属性的复杂度正确答案:【增加数据属性的复杂度】7、问题：下列关于线性回归分析中的残差（Residuals）说法正确的是？选项：A、残差均值总是为零B、残差均值总是小于零C、残差均值总是大

9、于零D、以上说法都不对正确答案:【残差均值总是为零】8、问题：为了观察测试 Y 与 X 之间的线性关系，X 是连续变量，使用下列哪种图形比较适合？选项：A、散点图B、柱形图C、直方图D、以上都不对正确答案:【散点图】9、问题：假如你在训练一个线性回归模型，则：1. 如果数据量较少，容易发生过拟合。2. 如果假设空间较小，容易发生过拟合。关于这两句话，下列说法正确的是？选项：A、1 和 2 都错误B、1 正确，2 错误C、1 错误，2 正确D、1 和 2 都正确正确答案:【1 正确，2 错误】10、问题：关于特征选择，下列对 Ridge 回归和 Lasso 回归说法正确的是？选项：A、Ridge

10、回归适用于特征选择B、Lasso 回归适用于特征选择C、两个都适用于特征选择D、以上说法都不对正确答案:【Lasso 回归适用于特征选择】 11、问题：构建一个最简单的线性回归模型需要几个系数（只有一个特征）？选项：A、1 个B、2 个C、3 个D、4 个正确答案:【2 个】12、问题：向量 x=1,2,3,4,-9,0的 L1 范数是多少？选项：A、1B、19C、6D、正确答案:【19】13、问题：以下哪些是使用数据规范化(特征缩放)的原因？选项：A、它通过降低梯度下降的每次迭代的计算成本来加速梯度下降B、它通过减少迭代次数来获得一个好的解，从而加快了梯度下降的速度C、它不能防止梯度下降陷

11、入局部最优D、它防止矩阵不可逆(奇异/退化)正确答案:【它通过减少迭代次数来获得一个好的解，从而加快了梯度下降的速度#它不能防止梯度下降陷入局部最优】14、问题：线性回归中，我们可以使用最小二乘法来求解系数，下列关于最小二乘法说法正确的是?( )选项：A、只适用于线性模型，不适合逻辑回归模型等其他模型B、不需要选择学习率C、当特征数量很多的时候，运算速度会很慢D、不需要迭代训练正确答案:【只适用于线性模型，不适合逻辑回归模型等其他模型#不需要选择学习率#当特征数量很多的时候，运算速度会很慢#不需要迭代训练】15、问题：欠拟合的处理主要有哪些方式：()选项：A、增加模型复杂度B、减小正则化系数C

12、、增大正则化系数 D、添加新特征正确答案:【增加模型复杂度#减小正则化系数#添加新特征】16、问题：假如使用一个较复杂的回归模型来拟合样本数据，使用 Ridge 回归，调试正则化参数，来降低模型复杂度，若正则化系数较大时，关于偏差(bias)和方差(variance)，下列说法正确的是?( )选项：A、偏差减小B、偏差增大C、方差减小D、方差增大正确答案:【偏差增大#方差减小】17、问题：如果两个变量相关，那么它们一定是线性关系。选项：A、正确B、错误正确答案:【错误】18、问题：随机梯度下降，每次迭代时候，使用一个样本。选项：A、正确B、错误正确答案:【正确】19、问题：L2 正则化往往用于

13、防止过拟合，而 L1 正则化往往用于特征选择。选项：A、正确B、错误正确答案:【正确】20、问题：过拟合的处理可以通过减小正则化系数。选项：A、正确B、错误正确答案:【错误】逻辑回归课后测验1、问题：一监狱人脸识别准入系统用来识别待进入人员的身份，此系统一共包括识别 4 种不同的人员：狱警，小偷，送餐员，其他。下面哪种学习方法最适合此种应用需求：选项：A、二分类问题B、多分类问题C、回归问题D、聚类问题正确答案:【多分类问题】2、问题：以下关于分类问题的说法错误的是？选项：A、分类属于监督学习B、分类问题输入属性必须是离散的C、多分类问题可以被拆分为多个二分类问题D、回归问题在一定条件下可被

14、转化为多分类问题正确答案:【分类问题输入属性必须是离散的】3、问题：以下关于逻辑回归与线性回归问题的描述错误的是（）选项：A、逻辑回归用于处理分类问题，线性回归用于处理回归问题B、线性回归要求输入输出值呈线性关系，逻辑回归不要求C、逻辑回归一般要求变量服从正态分布，线性回归一般不要求D、线性回归计算方法一般是最小二乘法，逻辑回归的参数计算方法是似然估计法。正确答案:【逻辑回归一般要求变量服从正态分布，线性回归一般不要求】4、问题：以下关于 sigmoid 函数的优点说法错误的是？选项：A、函数处处连续，便于求导B、可以用于处理二分类问题C、在深层次神经网络反馈传输中，不易出现梯度消失D、可以压

15、缩数据值到0,1之间，便于后续处理正确答案:【在深层次神经网络反馈传输中，不易出现梯度消失】5、问题：逻辑回归的损失函数是哪个？选项：A、MSEB、交叉熵(Cross-Entropy)损失函数C、MAED、RMSE正确答案:【交叉熵(Cross-Entropy)损失函数】6、问题：下面哪一项不是 Sigmoid 的特点？选项： A、当 (z)大于等于 0.5 时，预测 y=1B、当 (z)小于 0.5 时，预测 y=0C、当 (z)小于 0.5 时，预测 y=-1D、(z)的范围为(0,1)正确答案:【当 (z)小于 0.5 时，预测 y=-1】7、问题：下列哪一项不是逻辑回归的优点？选项：A

16、、处理非线性数据较容易B、模型形式简单C、资源占用少D、可解释性好正确答案:【处理非线性数据较容易】8、问题：假设有三类数据，用 OVR 方法需要分类几次才能完成？选项：A、1B、2C、3D、4正确答案:【2】9、问题：以下哪些不是二分类问题？选项：A、根据肿瘤的体积、患者的年龄来判断良性或恶性？B、或者根据用户的年龄、职业、存款数量来判断信用卡是否会违约？C、身高 1.85m，体重 100kg 的男人穿什么尺码的 T 恤？D、根据一个人的身高和体重判断他(她)的性别。正确答案:【身高 1.85m，体重 100kg 的男人穿什么尺码的 T 恤？】10、问题：逻辑回归通常采用哪种正则化方式？选项

17、：A、Elastic NetB、L1 正则化C、L2 正则化D、Dropout 正则化正确答案:【L2 正则化】11、问题：假设使用逻辑回归进行多类别分类，使用 OVR 分类法。下列说法正确的是？选项：A、对于 n 类别，需要训练 n 个模型 B、对于 n 类别，需要训练 n-1 个模型C、对于 n 类别，只需要训练 1 个模型D、以上说法都不对正确答案:【对于 n 类别，需要训练 n 个模型】12、问题：你正在训练一个分类逻辑回归模型。以下哪项陈述是正确的？选出所有正确项选项：A、将正则化引入到模型中，总是能在训练集上获得相同或更好的性能B、在模型中添加许多新特性有助于防止训练集过度拟合C、

18、将正则化引入到模型中，对于训练集中没有的样本，总是可以获得相同或更好的性能D、向模型中添加新特征总是会在训练集上获得相同或更好的性能正确答案:【向模型中添加新特征总是会在训练集上获得相同或更好的性能】13、问题：以下哪项陈述是正确的？选出所有正确项（）选项：A、在构建学习算法的第一个版本之前，花大量时间收集大量数据是一个好主意。B、逻辑回归使用了 Sigmoid 激活函数C、使用一个非常大的训练集使得模型不太可能过拟合训练数据。D、如果您的模型拟合训练集，那么获取更多数据可能会有帮助。正确答案:【逻辑回归使用了 Sigmoid 激活函数#使用一个非常大的训练集使得模型不太可能过拟合训练数据。

19、】14、问题：下面哪些是分类算法？选项：A、根据肿瘤的体积、患者的年龄来判断良性或恶性？B、根据用户的年龄、职业、存款数量来判断信用卡是否会违约？C、身高 1.85m，体重 100kg 的男人穿什么尺码的 T 恤？D、根据房屋大小、卫生间数量等特征预估房价正确答案:【根据肿瘤的体积、患者的年龄来判断良性或恶性？#根据用户的年龄、职业、存款数量来判断信用卡是否会违约？#身高 1.85m，体重 100kg 的男人穿什么尺码的 T 恤？】15、问题：逻辑回归的激活函数是 Sigmoid。选项：A、正确B、错误正确答案:【正确】16、问题：逻辑回归分类的精度不够高，因此在业界很少用到这个算法选项： A

20、、正确B、错误正确答案:【错误】17、问题：Sigmoid 函数的范围是（-1，1）选项：A、正确B、错误正确答案:【错误】18、问题：逻辑回归的特征一定是离散的。选项：A、正确B、错误正确答案:【错误】19、问题：逻辑回归算法资源占用小，尤其是内存。选项：A、正确B、错误正确答案:【正确】20、问题：逻辑回归的损失函数是交叉熵损失选项：A、正确B、错误正确答案:【正确】朴素贝叶斯课后测验1、问题：假设会开车的本科生比例是 15%，会开车的研究生比例是 23%。若在某大学研究生占学生比例是 20%，则会开车的学生是研究生的概率是多少？选项：A、80%B、16.6%C、23%D、27.7%正确答

21、案:【27.7%】2、问题：下列关于朴素贝叶斯的特点说法错误的是（）选项：A、朴素贝叶斯模型发源于古典数学理论，数学基础坚实 B、朴素贝叶斯模型无需假设特征条件独立C、朴素贝叶斯处理过程简单，分类速度快D、朴素贝叶斯对小规模数据表现较好正确答案:【朴素贝叶斯模型无需假设特征条件独立】3、问题：以下算法不属于生成模型 ( )选项：A、朴素贝叶斯模型B、混合高斯模型C、隐马尔科夫模型D、支持向量机正确答案:【支持向量机】4、问题：关于拉普拉斯平滑说法正确的是（）选项：A、避免了出现概率为 0 的情况B、加上拉普拉斯平滑有助于提高学习性能C、会使得最终结果可能大于 1D、以上说法都不对正确答案:【避

22、免了出现概率为 0 的情况】5、问题：假设 X 和 Y 都服从正态分布，那么 P(X5,Y0)就是一个（），表示X5,Y0 两个条件同时成立的概率，即两个事件共同发生的概率。选项：A、先验概率B、后验概率C、联合概率D、以上说法都不对正确答案:【联合概率】6、问题：以下算法属于判别模型的是（）选项：A、朴素贝叶斯模型B、深度信念网络C、隐马尔科夫模型D、线性回归正确答案:【线性回归】7、问题：朴素贝叶斯的优点不包括（）选项：A、算法逻辑简单,易于实现B、分类过程中时空开销小 C、对缺失数据不太敏感，算法也比较简单，常用于文本分类D、朴素贝叶斯模型对输入数据的表达形式很敏感正确答案:【朴素

23、贝叶斯模型对输入数据的表达形式很敏感】8、问题：市场上某商品来自两个工厂，它们市场占有率分别为 60%和 40%，有两人各自买一件，则买到的来自不同工厂之概率为( )。选项：A、0.5B、0.24C、0.48D、0.3正确答案:【0.48】9、问题：以 A 表示事件甲种产品畅销，乙种产品滞销，则其对立事件 A 为（）选项：A、甲种产品滞销，乙种产品畅销B、甲，乙两种产品均畅销C、甲种产品滞销D、甲种产品滞销或乙种产品畅销正确答案:【甲种产品滞销或乙种产品畅销】10、问题：11. 关于朴素贝叶斯，下列说法错误的是：（）选项：A、它是一个分类算法B、朴素的意义在于它的一个天真的假设：所有特征之

24、间是相互独立的C、它实际上是将多条件下的条件概率转换成了单一条件下的条件概率，简化了计算D、朴素贝叶斯不需要使用联合概率正确答案:【朴素贝叶斯不需要使用联合概率】11、问题：掷二枚骰子，事件 A 为出现的点数之和等于 3 的概率为（）选项：A、1/11B、1/18C、1/6D、都不对正确答案:【1/18】12、问题：公司里有一个人穿了运动鞋，推测是男还是女？已知公司里男性 30 人，女性 70 人，男性穿运动鞋的有 25 人，穿拖鞋的有 5 人，女性穿运动鞋的有 40人，穿高跟鞋的有 30 人。则以下哪项计算错误（）？选项： A、p(男运动鞋)=0.25B、p(女运动鞋)=0.4C、p(运动

25、鞋男性)=25/30D、p（运动鞋女性)=0.4正确答案:【p（运动鞋女性)=0.4】13、问题：根据以往经验和分析得到的概率。在这里，我们用 P(Y)来代表在没有训练数据前假设 Y 拥有的初始概率，因此称其为 Y 的后验概率，它反映了我们所拥有的关于 Y 的背景知识。选项：A、正确B、错误正确答案:【错误】14、问题：朴素贝叶斯模型假设属性之间相互独立，这个假设在实际应用中往往是不成立的，在属性相关性较小时，朴素贝叶斯性能良好。而在属性个数比较多或者属性之间相关性较大时，分类效果不好。选项：A、正确B、错误正确答案:【正确】15、问题：朴素贝叶斯对缺失数据较敏感。选项：A、正确B、错误正确答

26、案:【正确】16、问题：判别模型所学内容是决策边界。选项：A、正确B、错误正确答案:【正确】17、问题：逻辑回归是生成模型，朴素贝叶斯是判别模型选项：A、正确B、错误正确答案:【错误】18、问题：逻辑回归和朴素贝叶斯都有对属性特征独立的要求选项：A、正确 B、错误正确答案:【错误】19、问题：朴素贝叶斯法的基本假设是条件独立性。选项：A、正确B、错误正确答案:【正确】20、问题：朴素贝叶斯适用于小规模数据集，逻辑回归适用于大规模数据集。选项：A、正确B、错误正确答案:【错误】机器学习实践课后测验1、问题：以下关于训练集、验证集和测试集说法不正确的是( )。选项：A、测试集是纯粹是用于测试模型泛

27、化能力B、训练集是用来训练以及评估模型性能C、验证集用于调整模型参数D、以上说法都不对正确答案:【训练集是用来训练以及评估模型性能】2、问题：当数据分布不平衡时，我们可采取的措施不包括( )。选项：A、对数据分布较少的类别过采样B、对数据分布较多的类别欠采样C、对数据分布较多的类别赋予更大的权重D、对数据分布较少的类别赋予更大的权重正确答案:【对数据分布较多的类别赋予更大的权重】3、问题：假设有 100 张照片，其中，猫的照片有 60 张，狗的照片是 40 张。识别结果：TP=40，FN=20，FP=10，TN=30，则可以得到：( )。选项：A、Accuracy=0.8B、Precision

28、=0.8C、Recall=0.8D、以上都不对正确答案:【Precision=0.8】 4、问题：关于数据规范化，下列说法中错误的是( )。选项：A、包含标准化和归一化B、标准化在任何场景下受异常值的影响都很小C、归一化利用了样本中的最大值和最小值D、标准化实际上是将数据在样本的标准差上做了等比例的缩放操作正确答案:【标准化在任何场景下受异常值的影响都很小】5、问题：下列哪种方法可以用来缓解过拟合的产生：( )。选项：A、增加更多的特征B、正则化C、增加模型的复杂度D、以上都是正确答案:【正则化】6、问题：以下关于 ROC 和 PR 曲线说法不正确的是 ( )。选项：A、ROC 曲线兼顾正例与

29、负例，PR 曲线完全聚焦于正例B、如果想测试不同类别分布下分类器性能的影响，ROC 曲线更为适合C、ROC 曲线不会随着类别分布的改变而改变D、类别不平衡问题中，ROC 曲线比 PR 曲线估计效果要差正确答案:【类别不平衡问题中，ROC 曲线比 PR 曲线估计效果要差】7、问题：以下关于偏差(Bias)和方差(Variance)说法正确的是 ( )。选项：A、方差描述的是预测值与真实值之间的差别B、偏差描述的是预测值的变化范围C、获取更多的训练数据可解决高方差的问题D、获取更多的特征能解决高方差的问题正确答案:【获取更多的训练数据可解决高方差的问题】8、问题：关于 L1 正则化和 L2 正则化

30、说法错误的是 ( )。选项：A、L1 正则化的功能是使权重稀疏B、L2 正则化的功能是防止过拟合C、L1 正则化比 L2 正则化使用更广泛D、L1 正则化无法有效减低数据存储量正确答案:【L1 正则化比 L2 正则化使用更广泛】9、问题：随着训练样本的数量越来越大，则该数据训练的模型将具有：( )。选项： A、低方差B、高方差C、相同方差D、无法判断正确答案:【低方差】10、问题：随着训练样本的数量越来越大，则该数据训练的模型将具有：( )。选项：A、低偏差B、高偏差C、相同偏差D、无法判断正确答案:【相同偏差】11、问题：关于特征选择，下列对 Ridge 回归和 Lasso 回归的说法正确的

31、是：( )。选项：A、Ridge 回归适用于特征选择B、Lasso 回归适用于特征选择C、两个都适用于特征选择D、以上说法都不对正确答案:【Lasso 回归适用于特征选择】12、问题：一个正负样本不平衡问题(正样本 99%，负样本 1%)。假如在这个非平衡的数据集上建立一个模型，得到训练样本的正确率是 99%，则下列说法正确的是？( )选项：A、模型正确率很高，不需要优化模型了B、模型正确率并不能反映模型的真实效果C、无法对模型做出好坏评价D、以上说法都不对正确答案:【模型正确率并不能反映模型的真实效果】13、问题：以下关于交叉验证说法正确的是 ( )。选项：A、交叉验证可利用模型选择避免过拟

32、合的情况B、交叉验证可对模型性能合理评估C、交叉验证大大增加了计算量D、以上说法都不对正确答案:【交叉验证可利用模型选择避免过拟合的情况#交叉验证可对模型性能合理评估#交叉验证大大增加了计算量】 14、问题：评价指标中，精确率(Precision)的计算需要哪些数值 ( )。选项：A、TPB、TNC、FPD、FN正确答案:【TP#FP】15、问题：评价指标中，召回率(Recall)的计算需要哪些数值 ( )。选项：A、TPB、TNC、FPD、FN正确答案:【TP#FN】16、问题：评估完模型之后，发现模型存在高偏差(high bias)，应该如何解决？( )选项：A、减少模型的特征数量B、增加

33、模型的特征数量C、增加样本数量D、尝试减少正则化系数正确答案:【增加模型的特征数量#尝试减少正则化系数】17、问题：特征空间越大，过拟合的可能性越大。选项：A、正确B、错误正确答案:【正确】18、问题：L2 正则化得到的解更加稀疏。选项：A、正确B、错误正确答案:【错误】19、问题：SMOTE 算法是用了上采样的方法。选项：A、正确B、错误正确答案:【正确】 20、问题：100 万条数据划分训练集、验证集、测试集，数据可以这样划分：98%，1%，1% 。选项：A、正确B、错误正确答案:【正确】KNN 算法课后测验1、问题：下列哪个距离度量不在 KNN 算法中体现：( )。选项：A、切比雪夫距离

34、B、欧氏距离C、余弦相似度D、曼哈顿距离正确答案:【余弦相似度】2、问题：下列选项中，关于 KNN 算法说法不正确是：( )。选项：A、能找出与待预测样本相近的 K 个样本B、默认使用欧氏距离度量C、实现过程相对简单，但是可解释性不强D、效率很高正确答案:【效率很高】3、问题：以下距离度量方法中，在城市道路里，要从一个十字路口开车到另外一个十字路口的距离是： ( )。选项：A、夹角余弦B、切比雪夫距离C、曼哈顿距离D、欧氏距离正确答案:【曼哈顿距离】4、问题：以下关于 KD 树的说法错误的是 ( )。选项：A、KD 树是一种对 k 维空间的数据进行存储以便于快速检索的树形数据结构B、KD 树主

35、要用于多维空间关键数据的检索C、KD 树节点与 k 维中垂直与超平面的那一维有关D、所有 x 值小于指定值的节点会出现在右子树正确答案:【所有 x 值小于指定值的节点会出现在右子树】 5、问题：利用 KD 树进行搜索时，正确的方式是 ( )。选项：A、查询数据从子节点开始B、若数据小于对应节点中 k 维度的值，则访问左节点C、回溯过程是为了找距离较远的点D、回溯的判断过程是从上往下进行的正确答案:【若数据小于对应节点中 k 维度的值，则访问左节点】6、问题：以下哪项是 KNN 算法的缺点？( )选项：A、低精度B、对异常值不敏感C、计算成本高D、需要的内存非常少正确答案:【计算成本高】7、问题

36、：关于余弦相似度，不正确的是( )。选项：A、余弦相似度的范围为-1,1B、余弦相似度的结果和向量的长度无关C、余弦相似度为-1 时候，两个向量完全不相关D、余弦相似度为 1 的时候，两个向量完全相关正确答案:【余弦相似度为-1 时候，两个向量完全不相关】8、问题：KD 树(K-Dimension Tree)的描述中，不正确的是( )。选项：A、KD 树是二叉树B、KD 树可以用更高的效率来对空间进行划分C、KD 树的结构非常适合寻找最近邻居和碰撞检测D、KD 树切分时，从方差小的维度开始切分正确答案:【KD 树切分时，从方差小的维度开始切分】9、问题：假设有 6 个二维数据点：D=(2,3)

37、,(5,7),(9,6),(4,5),(6,4),(7,2)，第一次切分时候，切分线为( )。选项：A、x=5B、x=6C、y=5D、y=6正确答案:【x=6】 10、问题：KNN 算法在什么情况下效果较好？( )选项：A、样本较多但典型性不好B、样本较少但典型性好C、样本呈团状分布D、样本呈链状分布正确答案:【样本较少但典型性好】11、问题：关于 KNN 算法的描述，不正确的是( )。选项：A、可以用于分类B、可以用于回归C、距离度量的方式通常用曼哈顿距离D、K 值的选择一般选择一个较小的值正确答案:【距离度量的方式通常用曼哈顿距离】12、问题：两个向量的长度分别为 1 和 2，两者之间的夹

38、角为 60 度，则以下选项错误的是( )。选项：A、余弦相似度为 0.5B、余弦相似度为正C、余弦相似度没法计算，因为没给出具体坐标值D、余弦相似度的值与向量的长度无关，只和向量之间的夹角有关正确答案:【余弦相似度没法计算，因为没给出具体坐标值】13、问题：影响 KNN 算法效果的主要因素包括( )。选项：A、K 的值B、距离度量方式C、决策规则D、最邻近数据的距离正确答案:【K 的值#距离度量方式#决策规则】14、问题：以下关于 KNN 说法正确的是 (多选)( )。选项：A、计算复杂度低B、对数据没有假设C、对异常值不敏感D、可解释性好正确答案:【计算复杂度低#对数据没有假设#对异常值不敏

39、感】 15、问题：闵可夫斯基距离中的 p 取 1 或 2 时的闵氏距离是最为常用的，以下哪项是正确的:( )。选项：A、p 取 1 时是曼哈顿距离B、p 取 2 时是欧氏距离C、p 取无穷时是切比雪夫距离D、闵可夫斯基空间不同于牛顿力学的平坦空间正确答案:【p 取 1 时是曼哈顿距离#p 取 2 时是欧氏距离#p 取无穷时是切比雪夫距离#闵可夫斯基空间不同于牛顿力学的平坦空间】16、问题：KNN 算法的缺点包括以下几点？( )选项：A、可解释性差，无法给出决策树那样的规则B、对训练数据依赖度特别大，当样本不平衡的时候，对少数类的预测准确率低C、对异常值敏感D、计算复杂性高；空间复杂性高，尤其是

40、特征数非常多的时候正确答案:【可解释性差，无法给出决策树那样的规则#对训练数据依赖度特别大，当样本不平衡的时候，对少数类的预测准确率低#计算复杂性高；空间复杂性高，尤其是特征数非常多的时候】17、问题：两个向量的余弦相似度越接近 1，说明两者越相似。选项：A、正确B、错误正确答案:【正确】18、问题：k 近邻法(k-Nearest Neighbor,kNN)是一种比较成熟也是最简单的机器学习算法，可以用于分类，但不能用于回归方法。选项：A、正确B、错误正确答案:【错误】19、问题：KNN 没有显示的训练过程，它在训练阶段只是把数据保存下来，训练时间开销为 0，等收到测试样本后进行处理。选项：A

41、、正确B、错误正确答案:【正确】20、问题：KNN 分类的时候，对新的样本，根据其 k 个最近邻的训练样本的类别，通过多数表决等方式进行预测。选项：A、正确B、错误正确答案:【正确】决策树课后测验1、问题：以下关于决策树特点分析的说法错误的有 ( )。选项：A、推理过程容易理解，计算简单B、算法考虑了数据属性之间的相关性C、算法自动忽略了对模型没有贡献的属性变量D、算法容易造成过拟合正确答案:【算法考虑了数据属性之间的相关性】2、问题：以下关于决策树原理介绍错误的有 ( )。选项：A、决策树算法属于无监督学习B、决策树算法本质上是贪心算法C、决策树生成过程中需要用到分割法D、决策树决策过程从

42、根节点开始正确答案:【决策树算法属于无监督学习】3、问题：我们想要在大数据集上训练决策树模型，为了使用较少的时间，可以：()。选项：A、增加树的深度B、增大学习率C、减少树的深度D、减少树的数量正确答案:【减少树的深度】4、问题：以下关于决策树算法说法错误的是 ( )。选项：A、ID3 算法选择信息增益最大的特征作为当前决策节点B、C4.5 算法选择信息增益率来选择属性C、C4.5 算法不能用于处理不完整数据D、CART 算法选择基尼系数来选择属性正确答案:【C4.5 算法不能用于处理不完整数据】5、问题：以下关于剪枝操作说法正确的是 ( )。选项： A、CART 采用的是悲观策略的预剪枝B、

43、ID3 没有剪枝策略C、C4.5 采用的是基于代价函数的后剪枝D、以上说法都不对正确答案:【ID3 没有剪枝策略】6、问题：C4.5 选择属性用的是( )。选项：A、信息增益B、信息增益率C、交叉熵D、信息熵正确答案:【信息增益率】7、问题：7.哪种决策树没有剪枝操作( )。选项：A、C4.5B、CARTC、ID3D、以上都不对正确答案:【ID3】8、问题：以下那种说法是错误的( )。选项：A、信息增益 = 信息熵 - 条件熵B、一个系统越是混乱，随机变量的不确定性就越大，信息熵就越高C、一个系统越是有序，信息熵就越低D、中国足球队战胜巴西足球队的信息熵要小于中国乒乓球队战胜巴西乒乓球队的信息熵正确答案:【中国足球队战胜巴西足球队的信息熵要小于中国乒乓球队战胜巴西乒乓球队的信息熵】9、问题：ID3 算法的缺点不包括( )。选项：A、ID3 没有剪枝策略，容易过拟合B、信息增益准则对可取值数目较多的特征有所偏

展开阅读全文

MOOC 机器学习-温州大学 中国大学慕课答案.docx

MOOC 机器学习-温州大学中国大学慕课答案.docx