问道深山去,听禅紫气来。

《大数据计算机技术Ⅱ》课程在线作业1

阅读:7 更新时间:2022-11-01 02:02:07

《大数据计算机技术Ⅱ》课程在线作业1


------------------------
1.下列哪一个大数据衡量单位最大:
A.EB
B.ZB
C.PB
D.TB
正确答案:false

2.下列哪一个大数据属性是用来衡量价值的:
A.volume
B.Variety
C.Velocity
D.Value
正确答案:false

3.下列不属于大数据计算体系三个基本层次的:
A.数据存储系统
B.数据处理系统
C.数据应用系统
D.数据传输系统
正确答案:false

4.下列不属于NOSQL数据库的是:
A.SQL数据库
B.列存储数据库
C.文档数据库
D.图形数据库
正确答案:false

------------------------
1.下列属于数据处理算法的
A.回归分析
B.聚类算法
C.关联规则算法
D.排序算法
正确答案:false

2.下列属于缺失值处理方法的是:
A.忽略该记录
B.使用默认值
C.使用同类样本平均值
D.随机产生缺失值的补充
正确答案:false

------------------------
1.ICDM会议评选的十大经典算法包括C4.5算法、k-均值算法、支持向量机、Apriori算法、EM算法、PageRank算法、AdaBoost算法、k-临近算法、朴素贝叶斯算法和回归树算法。
T.对
F.错
正确答案:false

2.读取CSV文件不可以采用读取txt文件的函数
T.对
F.错
正确答案:false

3.ndarray对象的属性包括数组轴的个数
T.对
F.错
正确答案:false

4.DataFrame每一列必须都是类型相同的值
T.对
F.错
正确答案:false

5.Hadoop基于HDFS/HBase的数据存储系统
T.对
F.错
正确答案:false

6.一个HDFS文件可以按Split形式进行物理存储
T.对
F.错
正确答案:false

------------------------
1.网络爬虫的技术框架包括几个部分?请描述每个部分的功能。
正确答案:false

2.请简述决策树模型中有哪些常用的剪枝方法?
正确答案:false

3.k-means方法存在的主要缺点是什么?如何解决?
正确答案:false

4.请简述线性可分SVM的基本思想。
正确答案:false

5.什么是频繁项集?频繁项集有哪些主要的定理?
正确答案:false

6.请简述PageRank算法的基本设计思想。
正确答案:false

7.请分别简述数据去重过程中,duplicated 和drop_duplicates两种方法的作用。
正确答案:false

8.请分别阐述下列两个操作的含义:(1)A*B;(2)dot(A,B)。当A = array( [[1,1], [0,2]] )且B = array( [[2,0], [3,4]] )时,分别计算上述两个操作的结果。
正确答案:false

推荐信息