问道深山去,听禅紫气来。

《大数据计算机技术Ⅱ》课程在线作业3

阅读:8 更新时间:2022-11-01 02:02:32

《大数据计算机技术Ⅱ》课程在线作业3


------------------------
1.下列不属于ODBC接口特征的:
A.用户直接将SQL语句传送给ODBC
B.对数据库的操作不依赖任何DBMS
C.不直接与DBMS打交道
D.由Java 语言编写的类和接口组成
正确答案:false

2.下列哪一个大数据属性是用来衡量价值的:
A.volume
B.Variety
C.Velocity
D.Value
正确答案:false

3.下列不属于大数据开源技术解决方案的
A.HDFS
B.Hbase
C.MapReduce
D.Colossus
正确答案:false

4.下列不属于NOSQL数据库的是:
A.SQL数据库
B.列存储数据库
C.文档数据库
D.图形数据库
正确答案:false

------------------------
1.下列关于监督学习的描述,不正确的是
A.在监督学习中,输入变量与输出变量可以是连续的,也可以是离散的
B.在监督学习中,输入变量与输出变量只能是连续的
C.在监督学习中,输入变量与输出变量只能是离散的
D.若输入变量与输出变量均为连续变量,则称为分类
正确答案:false

2.下列属于缺失值处理方法的是:
A.忽略该记录
B.使用默认值
C.使用同类样本平均值
D.随机产生缺失值的补充
正确答案:false

------------------------
1.ICDM会议评选的十大经典算法包括C4.5算法、k-均值算法、支持向量机、Apriori算法、EM算法、PageRank算法、AdaBoost算法、k-临近算法、朴素贝叶斯算法和回归树算法。
T.对
F.错
正确答案:false

2.Mayavi不但是一个方便实用的可视化软件,而且可以方便地用Python编写扩展
T.对
F.错
正确答案:false

3.二次索引表机制的关键是建立主表列到RowKey的逆向映射关系
T.对
F.错
正确答案:false

4.集群由多个独立的计算机通过高速局域网连接在一起
T.对
F.错
正确答案:false

5.Hadoop基于HDFS/HBase的数据存储系统
T.对
F.错
正确答案:false

6.Mapper执行map task,将输出结果写入中间文件
T.对
F.错
正确答案:false

------------------------
1.请阐述Pandas工具包中的两种主要的数据结构
正确答案:false

2.大数据计算技术标准有哪些?
正确答案:false

3.k-means方法存在的主要缺点是什么?如何解决?
正确答案:false

4.请描述分布式文件系统的结构和特点。
正确答案:false

5.什么是频繁项集?频繁项集有哪些主要的定理?
正确答案:false

6.请简述HBase系统架构的主要组成,并描述各组成部分的作用。
正确答案:false

7.请分别简述数据去重过程中,duplicated 和drop_duplicates两种方法的作用。
正确答案:false

8.有哪些归属于多指令流多数据流(MIMD)模型的计算机架构?
正确答案:false

推荐信息