问道深山去,听禅紫气来。

21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据开发技术(二)》在线作业

阅读:41 更新时间:2021-08-21 02:28:16

21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据开发技术(二)》在线作业


------------------------
1.Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是()
A.filter
B.foreach
C.map
D.mkString
答案请点我要此答案,或联系QQ

2.Mllib中线性会馆算法中的参数reParam表示()
A.要运行的迭代次数
B.梯度下降的步长
C.是否给数据加干扰特征或者偏差特征
D.Lasso 和ridge 的正规化参数
答案请点我要此答案,或联系QQ

3.Scala列表方法中输出符号指定条件的所有元素的方法是()
A.drop
B.head
C.filter
D.init
答案请点我要此答案,或联系QQ

4.Spark GraphX中类Graph的mask方法可以()
A.反转图中所有边的方向
B.按照设定条件取出子图
C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性
D.合并边相同的属性
答案请点我要此答案,或联系QQ

5.Spark中DataFrame的()方法是进行分组查询
A.order by
B.group by
C.select by
D.sort by
答案请点我要此答案,或联系QQ

6.图结构中如果无重复的边或者顶点到自身的边,那么称之为()
A.完全图
B.有向完全图
C.无向图
D.简单图
答案请点我要此答案,或联系QQ

7.PairRDD中()函数可以合并具有相同键的值
A.mapValues
B.groupBy
C.groupByKey
D.reduceByKey
答案请点我要此答案,或联系QQ

8.Dstream窗口操作中()方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的Dstream
A.window
B.countByWindow
C.reduceByWindow
D.reduceByKeyAndWindow
答案请点我要此答案,或联系QQ

9.Scala类通过子类化和基于灵活的混合类来进行扩展,作为##的一个可靠性解决方案
A.多态
B.虚函数
C.派生
D.多重继承
答案请点我要此答案,或联系QQ

10.以下哪个函数可以对RDD进行去重()
A.sortBy
B.filter
C.distinct
D.intersection
答案请点我要此答案,或联系QQ

11.PairRDD的()方法,可以把两个RDD中键相同的元素组合在一起,合并为一个RDD。
A.join
B.union
C.substract
D.intersection
答案请点我要此答案,或联系QQ

12.Mllib中metrics.recallByThreshold 表示()指标
A.准确度
B.召回率
C.F值
D.ROC曲线
答案请点我要此答案,或联系QQ

13.Spark GraphX中类Graph的reverse方法可以()
A.反转图中所有边的方向
B.按照设定条件取出子图
C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性
D.合并边相同的属性
答案请点我要此答案,或联系QQ

14.GraphX中()方法可以释放顶点缓存
A.cache
B.presist
C.unpersistVertices
D.edges.unpersist
答案请点我要此答案,或联系QQ

15.图的结构通常表示为:G(V,E),其中,E是图G中()
A.顶点
B.顶点的集合
C.边
D.边的集合
答案请点我要此答案,或联系QQ

16.Scala中重写一个非抽象方法必须使用()修饰符。
A.extends
B.override
C.extend
D.overrides
答案请点我要此答案,或联系QQ

17.GraphX中()方法可以查询度数
A.degrees
B.degree
C.vertices
D.edges
答案请点我要此答案,或联系QQ

18.Mllib中线性会馆算法中的参数intercept表示()
A.要运行的迭代次数
B.梯度下降的步长
C.是否给数据加干扰特征或者偏差特征
D.Lasso 和ridge 的正规化参数
答案请点我要此答案,或联系QQ

19.Scala函数组合器可以对集合中的元素进行分组操作,结果得到的是一个Map的方法是()
A.filter
B.flatten
C.grouby
D.flatmap
答案请点我要此答案,或联系QQ

20.Spark Streming中()函数可以使用func将源DStream中的每个元素进行聚合操作,返回一个内部所包含的RDD只有一个元素的新DStream
A.union
B.reduce
C.join
D.cogroup
答案请点我要此答案,或联系QQ

21.以下哪个不是Scala的数据类型()
A.Int
B.Short Int
C.Long
D.Any
答案请点我要此答案,或联系QQ

22.Spark Streming中()函数可以对源DStream的每个元素通过函数func返回一个新的DStream
A.map
B.flatMap
C.filter
D.union
答案请点我要此答案,或联系QQ

23.图是一种数据元素间为()关系的数据结构
A.多对多
B.一对一
C.一对多
D.多对一
答案请点我要此答案,或联系QQ

24.如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是()
A.[0,numPartitions]
B.[0,numPartitions-1]
C.[1,numPartitions-1]
D.[1,numPartitions]
答案请点我要此答案,或联系QQ

25.Graph类中如果要根据边数据创建图,边数据需要加载为二元组,可以选择是否对边分区,应该用()方法
A.Graph(vertices,edges, defaultVertexAttr)
B.Graph.fromEdges(RDD[Edge[ED]], defaultValue)
C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
D.GraphLoader.edgeListFile(sc,filename)
答案请点我要此答案,或联系QQ

------------------------
1.Scala函数支持()
A.递归函数
B.高阶函数
C.柯里化
D.匿名函数
答案请点我要此答案,或联系QQ

2.以下哪个是Scala的数据类型()
A.Any
B.NULL
C.Nothing
D.AnyRef
答案请点我要此答案,或联系QQ

3.Scala中可以用()方法来连接两个或多个列表
A.::
B.#:::
C.List.:::()
D.List.concat()
答案请点我要此答案,或联系QQ

4.Spark可以通过哪些外部存储创建RDD()
A.文本文件
B.目录
C.压缩文件
D.通配符匹配的文件
答案请点我要此答案,或联系QQ

5.Spark中的RDD的说法正确的是()
A.弹性分布式数据集
B.是Spark中最基本的数据抽象
C.代表一个可变的集合
D.代表的集合里面的元素可并行计算
答案请点我要此答案,或联系QQ

6.Spark中DataFrame的()方法是查询指定字段的数据信息
A.select
B.selectExpr
C.col
D.apply
答案请点我要此答案,或联系QQ

7.以下哪个方法可以从集合中创建RDD()
A.parallelize
B.makeRDD
C.textFile
D.loadFile
答案请点我要此答案,或联系QQ

8.TF-IDF中TF指的是()
A.词频
B.词在文档中出现的次数
C.逆文档概率
D.词在文档集中出现的概率
E.词在文档集中出现的概率
答案请点我要此答案,或联系QQ

9.Mllib实现了一些常见的机器学习算法和应用程序,包括()
A.分类
B.聚类
C.降维
D.回归
答案请点我要此答案,或联系QQ

10.Spark SQL 可以通过()方法加载json文件为DataFrame
A.format
B.json
C.get
D.read
答案请点我要此答案,或联系QQ

------------------------
1.RDD的mapPartitions操作会导致Partitions数量的变化
T.对
F.错
答案请点我要此答案,或联系QQ

2.Scala函数组合器中filter过滤移除使得传入的函数的返回值为true的元素
T.对
F.错
答案请点我要此答案,或联系QQ

3.Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。
T.对
F.错
答案请点我要此答案,或联系QQ

4.Scala函数组合器中foreach和map类似,有返回值
T.对
F.错
答案请点我要此答案,或联系QQ

5.Spark中DataFrame 的查询操作也是一个懒操作, 仅仅生成一个查询计划, 只有触发Action 操作才会进行计算并返回查询结果。
T.对
F.错
答案请点我要此答案,或联系QQ

6.PairRDD中groupBy(func)func返回key,传入的RDD的各个元素根据这个key进行分组。
T.对
F.错
答案请点我要此答案,或联系QQ

7.键值对RDD由一组组的键值对组成,这些RDD被称为PairRDD。
T.对
F.错
答案请点我要此答案,或联系QQ

8.RDD的union函数会将两个RDD元素合并成一个并且去处重复元素
T.对
F.错
答案请点我要此答案,或联系QQ

9.RDD中combineByKey不允许返回类型与输入数据类型不同的返回值
T.对
F.错
答案请点我要此答案,或联系QQ

10.RDD的行动操作通过某种函数将一个RDD 转换为一个新的RDD , 但是转换操作是懒操作,不会立刻执行计算。
T.对
F.错
答案请点我要此答案,或联系QQ

11.Scala函数组合器中groupBy是对集合中的元素进行分组操作,结果得到的是一个Map
T.对
F.错
答案请点我要此答案,或联系QQ

12.Scala中元组是是一种可迭代的键值对(key/value)结构。
T.对
F.错
答案请点我要此答案,或联系QQ

13.RDD是一个可读写的数据结构
T.对
F.错
答案请点我要此答案,或联系QQ

14.RDD的map操作不会改变RDD的分区数目
T.对
F.错
答案请点我要此答案,或联系QQ

15.Spark只有键值对类型的RDD才能设置分区方式
T.对
F.错
答案请点我要此答案,或联系QQ

尝试在线代写作业

推荐信息