问道深山去,听禅紫气来。

21秋学期(1709、1803、1809、1903、1909、2003、2009、2103、2109)《大数据开发技术(一)》在线作业

阅读:12 更新时间:2022-04-15 21:47:08

21秋学期(1709、1803、1809、1903、1909、2003、2009、2103、2109)《大数据开发技术(一)》在线作业


------------------------
1.SQL Azure体系结构层中哪层相当于网关,相当于普通Web系统的逻辑层
A.Client Layer
B.Services Layer
C.Platform Layer
D.Infrastructure Layer
答案请点我要此答案,或联系QQ

2.以下哪种属于列族数据库()
A.MongoDB
B.Redis
C.Hbase
D.Neo4j
答案请点我要此答案,或联系QQ

3.MongoDB将数据存储为一个()
A.关系
B.属性
C.字段
D.文档
答案请点我要此答案,或联系QQ

4.关于Strom中Bolt说法错误的是()。
A.Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作
B.Bolt是一个被动的角色,Spout是一个主动的角色
C.Bolt不仅可以处理Tuple还可以创建新的Tuple
D.Bolt是Streams的状态转换过程的抽象含义
答案请点我要此答案,或联系QQ

5.关于Reduce端Shuffle过程,说法正确的是()。
A.Reduce领取数据先放入缓存,来自不同Map机器,先合并,再归并,写入磁盘
B.多个溢写文件归并最后只能形成一个大文件
C.当数据很少时,也要溢写到磁盘
D.Reduce任务通过RPC向JobTracker询问Map任务是否已经完成
答案请点我要此答案,或联系QQ

6.MapReduce中()会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给JobTracker,同时接收JobTracker 发送过来的命令并执行相应的操作。
A.Client
B.Job Tracker
C.Task
D.Task Tracker
答案请点我要此答案,或联系QQ

7.以下哪种数据库适合于批量数据处理和即席查询()
A.MySQL
B.Oracle
C.Hbase
D.NosSQL
答案请点我要此答案,或联系QQ

8.Amazon DynamoDB属于()
A.关系数据库
B.键值数据库
C.NoSQL数据库
D.数据仓库
答案请点我要此答案,或联系QQ

9.名称节点和数据节点之间则使用()协议进行交互
A.名称节点
B.第二名称节点
C.数据节点
D.TCP
答案请点我要此答案,或联系QQ

10.UMP系统中面对中等规模用户如何进行资源调度()
A.可以共享同一个MySQL实例
B.每个用户独占一个MySQL实例
C.会占用多个独立的MySQL实例
D.随机分配MySQL实例
正确答案:false

11.词频计算就是典型的()运算。
A.关系连接
B.分组聚合
C.关系代数
D.矩阵
答案请点我要此答案,或联系QQ

12.以下亚马逊的产品中哪个是分布式内存缓存
A.ElastiCache
B.RDS
C.DynamoDB
D.Redshift
答案请点我要此答案,或联系QQ

13.Google Cloud SQL是谷歌公司推出的基于()的云数据库
A.MySQL
B.SQL Server
C.Hbase
D.Oracle
答案请点我要此答案,或联系QQ

14.HDFS中当一些数据节点不可用时,会导致一些数据块的副本数量()冗余因子
A.大于
B.小于
C.等于
D.大于等于
答案请点我要此答案,或联系QQ

15.大数据摩尔定律体现了大数据的哪个体征()。
A.数据体量大
B.数据产生速度快
C.数据种类多
D.数据计算快
E.数据价值高
答案请点我要此答案,或联系QQ

16.在Storm的工作流程中,对于Supervisor说法错误的是()。
A.Supervisor会去Zookeeper集群上认领自己的Task
B.Supervisor节点首先将提交的Topology进行分片,分成一个个Task,分配给相应的Nimbus
C.Supervisor会将Task和相关的信息提交到Zookeeper集群上
D.Supervisor会通知自己的Worker进程进行Task的处理
答案请点我要此答案,或联系QQ

17.关于Storm中Topology说法错误的是()。
A.Topology可视为流转换图
B.Topology可以被提交到Storm集群执行
C.在Topology里面可以指定每个组件的并行度, Storm会在集群里面分配那么多的线程来同时计算
D.Topology里面的每一个组件都是串行运行的
答案请点我要此答案,或联系QQ

18.HBase的目标是处理非常庞大的表,可以通过()方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表
A.垂直扩展
B.水平扩展
C.拓扑扩展
D.叠加
答案请点我要此答案,或联系QQ

19.以下说法不正确的是()。
A.MapReduce的核心思想就是“分面治之”
B.HDFS是对GFS的开源实现
C.MapReduce是一种分布式计算模型
D.HDFS采用HBase作为其底层数据存储
答案请点我要此答案,或联系QQ

20.UMP系统借助于()来实现高效和可靠的协同工作
A.Mnesia
B.LVS
C.RabbitMQ
D.Zookeeper
答案请点我要此答案,或联系QQ

21.MapReduce处理关系的()运算时,Map过程需要记录元组的信息及该元组来源。
A.投影
B.差
C.交
D.并
答案请点我要此答案,或联系QQ

22.Hbase中客户端包含访问HBase的接口,同时在缓存中维护着已经访问过的()位置信息,用来加快后续数据访问过程
A.Master
B.Slaver
C.Region
D.客户端
正确答案:false

23.UMP系统中面对分库分表用户如何进行资源调度()
A.可以共享同一个MySQL实例
B.每个用户独占一个MySQL实例
C.会占用多个独立的MySQL实例
D.随机分配MySQL实例
答案请点我要此答案,或联系QQ

24.Storm中如果要让所有的Tuple都发送到同一个Task中,应该采用哪种Stream Groupings()。
A.ShuffleGrouping
B.AllGrouping
C.GlobalGrouping
D.FiedlsGrouping
答案请点我要此答案,或联系QQ

25.Hbase在寻址过程客户端只需询问Zookeeper服务器,不需要链接()
A.Master
B.Region
C.Zookeeper
D.Chubby
答案请点我要此答案,或联系QQ

26.以下不属于物联网关键技术的是()。
A.RFID
B.传感器
C.交换机
D.矩阵式二维码
答案请点我要此答案,或联系QQ

27.以下哪种属于键值数据库()
A.MongoDB
B.Redis
C.Hbase
D.Neo4j
答案请点我要此答案,或联系QQ

28.UMP系统中面对多个小规模用户如何进行资源调度()
A.可以共享同一个MySQL实例
B.每个用户独占一个MySQL实例
C.会占用多个独立的MySQL实例
D.随机分配MySQL实例
答案请点我要此答案,或联系QQ

29.Gephi是哪种可视化工具()
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
答案请点我要此答案,或联系QQ

30.MapReduce设计的一个理念就是(),因为移动数据需要大量的网络传输开销。
A.数据向计算靠拢
B.计算向数据靠拢
C.计算向网络靠拢
D.计算与数据并行
答案请点我要此答案,或联系QQ

------------------------
1.以下哪些应用场景属于大规模图或者网络的呈现形式?()
A.社交网络
B.传染病传播途径
C.交通事故对路网的影响
D.广告推荐
正确答案:false

2.Pregel中顶点之间的通讯的每条消息都包含了()
A.消息值
B.需要到达的目标顶点ID
C.起始点ID
D.时间
正确答案:false

3.以下哪个是HDFS的局限性()。
A.延迟高
B.只允许对文件执行追加操作,不能执行随机写操作
C.用MapReduce处理大量小文件时,会产生过多的Map任务,线程管理开销会大大增加
D.拥有复杂的数据模型
答案请点我要此答案,或联系QQ,B,C

4.以下哪些是数据可视化时间线工具()
A.Echarts
B.Timetoast
C.Xtimeline
D.R
答案请点我要此答案,或联系QQ,C

5.以下哪些是云计算关键技术()。
A.虚拟化
B.分布式计算
C.分布式存储
D.物联网
E.单租户
答案请点我要此答案,或联系QQ,B,C

6.以下哪个不是云数据库的特点
A.高可扩展性
B.高可用性
C.支持资源有效分发
D.本地存储
答案请点我要此答案,或联系QQ

7.下列哪些属于大数据计算模式()。
A.分布式计算
B.图计算
C.流计算
D.并行计算
E.批处理计算
答案请点我要此答案,或联系QQ

8.关于MapReduce,说法正确的是()。
A.MapReduce框架采用了Master/Slave架构,包括一个Master和若干个Slave
B.Hadoop框架是用Java实现的,因此MapReduce应用程序要用Java来写
C.MapReduce模型的核心是Map函数和Reduce函数
D.MapReduce将一个存储在分布式文件系统中的大规模数据集,切分成许多独立的分片
答案请点我要此答案,或联系QQ,C,D

9.关于Map端Shuffle过程中的合并与归并,说法正确的是()。
A.两个键值对<“a”,1>和<“a”,1>,如果合并,会得到<“a”,2>
B.合并不会改变最终结果
C.两个键值对<“a”,1>和<“a”,1>,如果归并,会得到<“a”,2>
D.两个键值对<“a”,1>和<“a”,1>,如果归并,会得到<“a”,<1,1>>
答案请点我要此答案,或联系QQ,B,D

10.流计算处理流程三个主要阶段是()。
A.实时采集
B.实时存储
C.实时计算
D.实时查询
答案请点我要此答案,或联系QQ,C,D

------------------------
1.Hbase中缓存刷新,每次刷写都生成一个新的StoreFile文件,因此,每个Store包含多个StoreFile文件
T.对
F.错
答案请点我要此答案,或联系QQ

2.HBase中包含一个Region服务器和许多个Master服务器
T.对
F.错
答案请点我要此答案,或联系QQ

3.传统的数据处理流程,需要先采集数据并存储在关系数据库等数据管理系统中,之后由用户通过查询操作和数据管理系统进行交互
T.对
F.错
答案请点我要此答案,或联系QQ

4.Storm框架是实时计算系统,所以不能使用数据库。
T.对
F.错
答案请点我要此答案,或联系QQ

5.大数据决策逐渐成为一种新的决策方式,大数据应用有力促进了信息技术与各行业的深度融合,大数据开发大大推动了新技术和新应用的不断涌现。
T.对
F.错
答案请点我要此答案,或联系QQ

6.HDFS中的NameNode的操作日志文件EditLog中记录了所有针对文件的创建、删除、重命名等操作
T.对
F.错
答案请点我要此答案,或联系QQ

7.Pregel将PageRank处理对象看成是连通图,而MapReduce则将其看成是键值对
T.对
F.错
正确答案:false

8.Pregel中无论在哪台机器上,都可以简单根据顶点ID判断出该顶点属于哪个分区,即使该顶点可能已经不存在了
T.对
F.错
答案请点我要此答案,或联系QQ

9.UMP系统中的Mnesia不错支持事务
T.对
F.错
正确答案:false

10.数据仓库、专家系统产生于大数据发展的成熟期
T.对
F.错
答案请点我要此答案,或联系QQ

推荐信息