问道深山去,听禅紫气来。

《大数据计算机技术Ⅱ》课程在线作业2

阅读:9 更新时间:2022-11-01 02:00:30

《大数据计算机技术Ⅱ》课程在线作业2


------------------------
1.美国政府在哪一年推出“大数据的研究和发展计划”:
A.2010
B.2011
C.2012
D.2013
正确答案:false

2.下列哪一个大数据属性是用来衡量价值的:
A.volume
B.Variety
C.Velocity
D.Value
正确答案:false

3.下列不属于列存储格式特征的:
A.基于主键存储
B.基于键值对存储
C.采用非关系型模型
D.查询效率优于按行存储
正确答案:false

4.下列不属于NOSQL数据库的是:
A.SQL数据库
B.列存储数据库
C.文档数据库
D.图形数据库
正确答案:false

------------------------
1.下列属于数据噪声处理方法的是:
A.分箱算法
B.平滑算法
C.聚类算法
D.回归算法
正确答案:false

2.下列属于缺失值处理方法的是:
A.忽略该记录
B.使用默认值
C.使用同类样本平均值
D.随机产生缺失值的补充
正确答案:false

------------------------
1.merge默认对数据表进行内连接
T.对
F.错
正确答案:false

2.读取CSV文件不可以采用读取txt文件的函数
T.对
F.错
正确答案:false

3.replace方法不支持一次性替换多个值
T.对
F.错
正确答案:false

4.DataFrame每一列必须都是类型相同的值
T.对
F.错
正确答案:false

5.scikit-learn 是机器学习领域的一个商用库
T.对
F.错
正确答案:false

6.HDFS提供了HBase的底层数据存储结构
T.对
F.错
正确答案:false

------------------------
1.网络爬虫的技术框架包括几个部分?请描述每个部分的功能。
正确答案:false

2.请简述决策树模型中有哪些常用的剪枝方法?
正确答案:false

3.什么是分箱?分箱有几种方法?
正确答案:false

4.什么是规范化?规范化有几类方法?
正确答案:false

5.什么是频繁项集?频繁项集有哪些主要的定理?
正确答案:false

6.数据建模包括几个层次模型?请简述每个层次模型的功能。
正确答案:false

7.请分别简述数据去重过程中,duplicated 和drop_duplicates两种方法的作用。
正确答案:false

8.请阐述复制和视图的三种主要操作。
正确答案:false

推荐信息