问道深山去,听禅紫气来。

东财《数据挖掘概论》单元作业三

阅读:13 更新时间:2022-04-15 21:48:03

东财《数据挖掘概论》单元作业三


------------------------
1.线性回归通常通过( )方法进行参数估计。
A.最小二乘法
B.牛顿法
C.聚类
D.拉格朗日法
答案请点我要此答案,或联系QQ

2.简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作( )。
A.层次聚类
B.划分聚类
C.非互斥聚类
D.模糊聚类
答案请点我要此答案,或联系QQ

3.ID3、C4.5和CART都采用的是( )方法。
A.贪心
B.回溯
C.动态规划
D.递归
答案请点我要此答案,或联系QQ

4.表示簇内距离与簇间距离之比的指标为( )。
A.DBI指数
B.Jaccard系数
C.rand指数
D.轮廓系数
答案请点我要此答案,或联系QQ

5.存在噪声和离群点时,( )是更鲁棒的划分聚类方法。
A.k-中心点方法
B.AGNES
C.k-均值方法
D.BIRCH
答案请点我要此答案,或联系QQ

6.在决策树中,树的最顶层结点是( )。
A.内部结点
B.树叶结点
C.分支
D.根结点
答案请点我要此答案,或联系QQ

7.垃圾邮件检测通常通过( )方法实现。
A.线性回归
B.岭回归
C.Lasso
D.逻辑回归
答案请点我要此答案,或联系QQ

8.对于有n个数据点的数据集,经验上通常设置簇数为( )。
A.√(2n)
B.√n
C.√2
D.√(n/2)
答案请点我要此答案,或联系QQ

9.在基本k-均值算法里,当邻近度函数采用( )的时候,合适的质心是簇中各点的中位数。
A.曼哈顿距离
B.平方欧几里德距离
C.余弦距离
D.Bregman散度
答案请点我要此答案,或联系QQ

10.事件的优势比(odds)的取值范围是( )。
A.(0,+∞)
B.(0,1)
C.(-∞,+∞)
D.(-1,1)
答案请点我要此答案,或联系QQ

------------------------
1.( )可能成为k-均值的终止条件。
A.对固定数量的迭代
B.在局部最小值不是特别差的情况下,在迭代中对簇观测值的分配不发生变化
C.在连续迭代中质心不发生变化
D.RRS下降到阈值以下
答案请点我要此答案,或联系QQ,B,C,D

2.以下属于分类器评价或比较尺度的有( )。
A.预测准确度
B.召回率
C.模型描述的简洁度
D.计算复杂度
答案请点我要此答案,或联系QQ,C,D

3.k-均值聚类分析在( )情况下无法得出好的结果。
A.具有异常值的数据点
B.具有不同密度的数据点
C.具有非凹形的数据点
D.具有非环形的数据点
答案请点我要此答案,或联系QQ,B,C

4.具有相同的时间复杂度的聚类算法有( )。
A.BIRCH
B.k-均值
C.DBSCAN
D.OPTICS
答案请点我要此答案,或联系QQ,D

5.回归方法主要分为( )。
A.线性回归
B.非线性回归
C.岭回归
D.Lasso
答案请点我要此答案,或联系QQ,B

------------------------
1.分类是无监督学习,即每个训练样本的类编号是未知的,要学习的类集合或数量也可能是事先未知的。( )
T.对
F.错
答案请点我要此答案,或联系QQ

2.精准率是分类器正确分类的检验元组所占的百分比。( )
T.对
F.错
答案请点我要此答案,或联系QQ

3.给定由两次运行K均值产生的两个不同的簇集,误差的平方和最大的那个应该被视为较优。( )
T.对
F.错
答案请点我要此答案,或联系QQ

4.在基于密度的聚类方法中,当“领域”中密度超过某一阈值会继续增长给定的簇。( )
T.对
F.错
答案请点我要此答案,或联系QQ

5.轮廓系数的数值越小说明模型的聚类效果越好。( )
T.对
F.错
答案请点我要此答案,或联系QQ

推荐信息