问道深山去,听禅紫气来。

20秋学期(1709、1803、1809、1903、1909、2003、2009 )《大数据开发技术(一)》在线作业

阅读:10 更新时间:2020-10-18 16:55:35

20秋学期(1709、1803、1809、1903、1909、2003、2009 )《大数据开发技术(一)》在线作业


------------------------
1.Storm框架在处理()上比MapReduce更有优势。
A.静态数据
B.流数据
C.批量数据
D.网络数据
答案请点我要此答案,或联系QQ

2.以下亚马逊的产品中哪个是分布式内存缓存
A.ElastiCache
B.RDS
C.DynamoDB
D.Redshift
答案请点我要此答案,或联系QQ

3.Timetoast是哪种可视化工具()
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
答案请点我要此答案,或联系QQ

4.HDFS中()记录了每个文件中各个块所在的数据节点的位置信息
A.NameNode
B.SecondaryNameNode
C.DataNode
D.Block
答案请点我要此答案,或联系QQ

5.Modest Maps是哪种可视化工具()
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
答案请点我要此答案,或联系QQ

6.应用于涉及频繁读写、拥有简单数据模型的应用,内容缓存,比如会话的数据库是哪种()
A.列族数据库
B.键值数据库
C.图数据库
D.文档数据库
答案请点我要此答案,或联系QQ

7.Storm中如果要随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量大致一致,应该采用哪种Stream Groupings()。
A.ShuffleGrouping
B.AllGrouping
C.GlobalGrouping
D.FiedlsGrouping
答案请点我要此答案,或联系QQ

8.以下哪个命令是Ubuntu中创建系统用户的命令()。
A.adduser
B.useradd
C.sudo
D.sudo user
答案请点我要此答案,或联系QQ

9.以下说法不正确的是()。
A.MapReduce的核心思想就是“分面治之”
B.HDFS是对GFS的开源实现
C.MapReduce是一种分布式计算模型
D.HDFS采用HBase作为其底层数据存储
答案请点我要此答案,或联系QQ

10.hadoop fs -() 命令可以将指定的文件的内容输出到标准输出
A.cat
B.append
C.add
D.write
答案请点我要此答案,或联系QQ

11.MapReduce处理关系的()运算时,Map过程需要记录元组的信息及该元组来源。
A.投影
B.差
C.交
D.并
答案请点我要此答案,或联系QQ

12.关于Hadoop集群,以下说法错误的是()。
A.SecondaryNameNode可以和NameNode共用一台机器
B.JobTracker指派的任务由TaskTracker执行
C.SecondaryNameNode可以和DataNode共用一台机器
D.NameNode可以和JobTracker共用一台机器
答案请点我要此答案,或联系QQ

13.在做人口调查时,采用对一个总样本为1亿人口的数据随机抽取1000人进行抽样调查体现了大数据的哪种思维方式()。
A.相关而非因果
B.全样而非抽样
C.效率而非精确
D.全面而非特别
答案请点我要此答案,或联系QQ

14.以下哪种不属于为大数据时代提供关键技术支撑的信息科技变化()。
A.网络宽带不断增加
B.存储设备容量不断增加
C.CPU处理能大幅提升
D.存储设备尺寸不断减小
答案请点我要此答案,或联系QQ

15.Amazon DynamoDB属于()
A.关系数据库
B.键值数据库
C.NoSQL数据库
D.数据仓库
答案请点我要此答案,或联系QQ

16.信息技术发展史上的第三次信息化浪潮解决的问题是什么()。
A.信息处理
B.信息增长
C.信息爆炸
D.信息传输
答案请点我要此答案,或联系QQ

17.以下哪个是HDFS的局限性()。
A.吞吐率
B.数据集
C.兼容性
D.延迟
答案请点我要此答案,或联系QQ

18.Echarts是哪种可视化工具()
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
答案请点我要此答案,或联系QQ

19.关于MapReduce中Shuffle过程,说法错误的是()。
A.Shuffle过程中为每个Map任务分配一个缓存
B.Shuffle过程中分区默认采用哈希函数
C.Shulle过程的合并会改变最终结果
D.Shuffle过程在Reduce端首先从Map端领取结果,然后执行归并操作,最后输送给Reduce任务进行处理。
答案请点我要此答案,或联系QQ

20.大数据摩尔定律体现了大数据的哪个体征()。
A.数据体量大
B.数据产生速度快
C.数据种类多
D.数据计算快
E.数据价值高
答案请点我要此答案,或联系QQ

21.Amazon RDS属于()
A.关系数据库
B.键值数据库
C.NoSQL数据库
D.数据仓库
答案请点我要此答案,或联系QQ

22.以下说法不正确的是()。
A.Zookeeper提供分布式锁之类的基本服务
B.Mahout提供了分布式存储服务
C.Flume提供了日志管理服务
D.Sqoop主要被用于数据交互操作
答案请点我要此答案,或联系QQ

23.Hbase中Zookeeper文件记录了()的位置
A..META.表
B.-ROOT-表
C.Region
D.Master
答案请点我要此答案,或联系QQ

24.Hadoop启动所有进程的命令为()。
A.all-start.sh
B.all-start.exe
C.start-all.sh
D.start-all.exe
答案请点我要此答案,或联系QQ

25.UMP系统借助于()来实现各个节点之间的通信
A.Mnesia
B.LVS
C.RabbitMQ
D.Zookeeper
答案请点我要此答案,或联系QQ

26.Amazon SimpleDB属于()
A.关系数据库
B.键值数据库
C.NoSQL数据库
D.数据仓库
答案请点我要此答案,或联系QQ

27.Gephi是哪种可视化工具()
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
答案请点我要此答案,或联系QQ

28.关于MapReduce工作流程,说法错误的是()。
A.不同的Map任务之间不会进行通信
B.不同的Reduce任务之间不会发生任何信息交换
C.用户可以显式地从一台机器向另一台机器发送消息
D.所有的数据交换都是通过MapReduce框架自身去实现的
答案请点我要此答案,或联系QQ

29.应用于存储、索引并管理面向文档的数据或者类似的半结构化数据,比如,用于后台具有大量读写操作的网站的数据库是哪种()
A.列族数据库
B.键值数据库
C.图数据库
D.文档数据库
答案请点我要此答案,或联系QQ

30.HDFS中FSDataInputStream封装了()
A.HDFSInputStream
B.DFSInputStream
C.DataInputStream
D.FSInputStream
正确答案:

------------------------
1.以下属于流计算框架的是()。
A.Twitter Storm
B.Spark
C.MapReduce
D.Pregel
E.Yahoo! S4
答案请点我要此答案,或联系QQ

2.关于MapReduce,说法正确的是()。
A.MapReduce框架采用了Master/Slave架构,包括一个Master和若干个Slave
B.Hadoop框架是用Java实现的,因此MapReduce应用程序要用Java来写
C.MapReduce模型的核心是Map函数和Reduce函数
D.MapReduce将一个存储在分布式文件系统中的大规模数据集,切分成许多独立的分片
答案请点我要此答案,或联系QQ

3.以下哪种数据库属于NoSQL数据库()
A.关系数据库
B.键值数据库
C.文档数据库
D.分布式数据库
答案请点我要此答案,或联系QQ

4.以下图计算软件哪种属于以图顶点为中心的、基于消息传递批处理的并行引擎
A.Giraph
B.Pregel
C.Hama
D.DEX
答案请点我要此答案,或联系QQ

5.以下哪个是HDFS的局限性()。
A.延迟高
B.只允许对文件执行追加操作,不能执行随机写操作
C.用MapReduce处理大量小文件时,会产生过多的Map任务,线程管理开销会大大增加
D.拥有复杂的数据模型
答案请点我要此答案,或联系QQ

6.Hbase的Region服务器中用户数据首先被写入到()
A.MemStore
B.Hlog
C.StoreFile
D.客户端
答案请点我要此答案,或联系QQ

7.以下哪些是云计算关键技术()。
A.虚拟化
B.分布式计算
C.分布式存储
D.物联网
E.单租户
答案请点我要此答案,或联系QQ

8.以下哪些可以提供计算服务()。
A.Spark
B.Tez
C.Mahout
D.MapReduce
E.YARN
答案请点我要此答案,或联系QQ

9.以下哪些是数据可视化分析工具()
A.R
B.Weka
C.Gephi
D.Tableau
答案请点我要此答案,或联系QQ

10.Hbase提供了哪些访问接口?
A.Pig
B.Hive
C.Zookeeper
D.Java API
答案请点我要此答案,或联系QQ

------------------------
1.Hbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中,清空缓存,并在Hlog里面写入一个标记
T.对
F.错
答案请点我要此答案,或联系QQ

2.Ambari通过Web进行Hadoop集群的管理配置。
T.对
F.错
答案请点我要此答案,或联系QQ

3.Hbase和传统数据库一样都是列式数据库
T.对
F.错
答案请点我要此答案,或联系QQ

4.关系数据库的关键特性包括完善的事务机制和高效的查询机制
T.对
F.错
答案请点我要此答案,或联系QQ

5.早期对于流计算的研究多数是基于对传统数据库处理的流式化,即实时数据库,很少研究流计算框架
T.对
F.错
答案请点我要此答案,或联系QQ

6.HDFS读数据过程中读取请求获得的输入流是FSInputStream
T.对
F.错
答案请点我要此答案,或联系QQ

7.Pregel将计算细化到顶点,同时在顶点内控制循环迭代次数,而MapReduce则将计算批量化处理,按任务进行循环迭代控制
T.对
F.错
答案请点我要此答案,或联系QQ

8.HDFS中的NameNode的操作日志文件EditLog中记录了所有针对文件的创建、删除、重命名等操作
T.对
F.错
答案请点我要此答案,或联系QQ

9.CAP理论告诉我们,一个分布式系统可以同时满足一致性、可用性和分区容忍性这三个需求
T.对
F.错
答案请点我要此答案,或联系QQ

10.在概念视图层面, HBase 中的每个表是采用了基于列的存储方式
T.对
F.错
答案请点我要此答案,或联系QQ

尝试在线代写作业

推荐信息