问道深山去,听禅紫气来。

22春学期(高起本1709-1803、全层次1809-2103)《并行程序设计》在线作业-00003

阅读:20 更新时间:2022-05-31 19:45:59

22春学期(高起本1709-1803、全层次1809-2103)《并行程序设计》在线作业-00003


------------------------
1.SIMD并行架构的优点不包括____。
A.辅助提供更大并发度
B.设计简单
C.编程简单
D.更小的芯片尺寸
答案请点我要此答案,或联系QQ

2.链表数据结构的查找、插入、删除等操作,既有对链表的读也有对链表的写,对此,采用互斥量加解锁整个链表的同步机制相比加解锁每个节点的方式的缺点是____。
A.粒度太粗,节点读写一致性不能保证
B.粒度太粗,线程不必要的等待
C.粒度太细,加解锁开销大
D.粒度太细,总体读写一致性不能保证
答案请点我要此答案,或联系QQ

3.对于搜索分解,下面哪个说法是错误的_____。
A.所有子树搜索任务都必须全部完成
B.工作量可能大于串行计算
C.工作量可能小于串行计算
D.可能产生超线性加速比
答案请点我要此答案,或联系QQ

4.AVX是____平台的SIMD架构。
A.x86
B.POWER
C.SPARC
D.ARM
答案请点我要此答案,或联系QQ

5.OpenMP并行模型是一种____模式。
A.静态线程
B.对等式多线程
C.加锁-解锁
D.Fork-join
答案请点我要此答案,或联系QQ

6.一个Neon寄存器最多存放____个短整型数。
A.2
B.4
C.8
D.16
答案请点我要此答案,或联系QQ

7.全球500强超算在CPU、网络等硬件上越来越体现出采用____的趋势。
A.特殊硬件
B.通用硬件
C.非公开硬件
D.廉价硬件
答案请点我要此答案,或联系QQ

8.并行计算的新兴应用领域不包括____。
A.制药
B.数字媒体
C.国防
D.游戏
答案请点我要此答案,或联系QQ

9.任务依赖图的平均并发度的定义是____。
A.顶点权重之和
B.顶点数
C.各层平均顶点数
D.顶点权重之和/关键路径长度
答案请点我要此答案,或联系QQ

10.对于效率E,下面描述错误的是____。
A.理想并行E=1
B.总是在0~1之间
C.可能>1
D.可能随着处理器数量增大趋向于0
答案请点我要此答案,或联系QQ

11.并行算法加速比的定义是____。
A.并行时间/串行时间
B.串行时间/并行时间
C.串行时间-并行时间
D.(串行时间-并行时间)/并行时间
答案请点我要此答案,或联系QQ

12.除了用于解决竞争条件外,互斥量还可用于____。
A.解决共享资源竞争的问题
B.解决并发度低的问题
C.解决通信开销大的问题
D.解决负载不均的问题
答案请点我要此答案,或联系QQ

13.每个AVX寄存器宽度为____位。
A.64
B.128
C.256
D.512
答案请点我要此答案,或联系QQ

14.对于障碍同步机制,以下说法错误的是____。
A.SIMD架构无需障碍机制
B.是一种群体同步机制
C.可用信号量实现
D.无法用其他同步机制实现
答案请点我要此答案,或联系QQ

15.MPI程序中发送和接收消息的两个进程必须____。
A.在同一个网段中
B.连接在同一个路由器上
C.在同一个通信域中
D.以上皆错
答案请点我要此答案,或联系QQ

16.对于向线程函数传递参数,下列说法错误的是____。
A.线程函数并非用户程序调用,因此无法直接传递
B.线程函数必须接受void *参数,因此只能传递大小不超过指针的数据对象
C.线程通常通过此途径获取线程号
D.不同线程间的参数传递相互无关,即使它们具有相同的线程函数
答案请点我要此答案,或联系QQ

17.pthread_create函数中线程函数指针的正确类型是____。
A.void (void *)
B.void * (void *)
C.int (void)
D.void * (*)(void *)
答案请点我要此答案,或联系QQ

18.OpenMP主要是通过____来更高层抽象的多线程编程。
A.设计实现新的语言
B.为现有语言提供大量库函数
C.为现有语言扩展编译指示
D.新编译器实现自动并行化
答案请点我要此答案,或联系QQ

19.对MPI通信中发送方和接受方的类型匹配,下面错误的说法是____。
A.均使用相同数据类型
B.均使用MPI_BYTE
C.均使用MPI_PACKED
D.使用相容类型
答案请点我要此答案,或联系QQ

20.实现任何时刻都只有一个线程进行共享变量更新的OpenMP指令是____。
A.omp parallel
B.omp barrier
C.omp critical
D.omp reduce
答案请点我要此答案,或联系QQ

21.动态线程编程模式的缺点是____。
A.线程管理开销高
B.系统资源利用率低
C.线程任务分配困难
D.线程通信效率低
答案请点我要此答案,或联系QQ

22.CUDA线程层次中不包括____。
A.Kernel
B.Grid
C.Block
D.Thread
答案请点我要此答案,或联系QQ

23.对于MPI中的点对点通信,下面错误的说法是____。
A.发送方的目的地址必须是接受方的进程编号
B.接受方的源地址可以不是发送方的进程编号
C.发送方和接受方的消息标签必须一致
D.接受方的消息标签可以是MPI_ANY_TAG
答案请点我要此答案,或联系QQ

24.关于OpenMP循环并行程序的编写,下列说法中正确的是____。
A.程序员需要编写线程创建和管理代码
B.程序员需要编写循环划分代码
C.程序员需要编写调度策略代码
D.程序员只需指出对哪个循环进行并行,循环划分和调度策略是什么
答案请点我要此答案,或联系QQ

25.SSE intrinsics _mm_add_ps命令的功能是____。
A.寄存器间单精度浮点数向量加法
B.寄存器间双精度浮点数向量加法
C.寄存器内单精度浮点数加法
D.寄存器内双精度浮点数加法
答案请点我要此答案,或联系QQ

26.OpenMP并行模型是一种____模式。
A.SISD
B.SIMD
C.MISD
D.SPMD
答案请点我要此答案,或联系QQ

27.OpenMP是___架构下的一种编程工具。
A.SIMD
B.MISD
C.共享内存
D.分布式内存
答案请点我要此答案,或联系QQ

28.OpenMP的优点不包括____。
A.从头编写并行程序很自然
B.串行程序并行化简单
C.不必关心低层细节
D.可移植、可扩展
答案请点我要此答案,或联系QQ

29.采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的优点是____。
A.更有利于负载均衡
B.减少了通信开销
C.降低了计算次数
D.减少了从进程空闲
答案请点我要此答案,或联系QQ

30.互斥量是一种____同步机制。
A.一元状态
B.二元状态
C.多元状态
D.以上皆错
答案请点我要此答案,或联系QQ

31.对于并行程序设计,下面说法错误的是____。
A.天然具有复杂性
B.算法移植困难
C.软件开发标准环境发展相对之后
D.不应发展这个方向
答案请点我要此答案,或联系QQ

32.我国最早夺得全球超级计算机计算能力冠军的是____。
A.天河1号
B.天河1A
C.天河2号
D.神威.太湖之光
答案请点我要此答案,或联系QQ

33.以下____是MPI基本原语。
A.MPI_barrier
B.MPI_Comm_numprocs
C.MPI_Comm_rank
D.MPI_Comm_Send
答案请点我要此答案,或联系QQ

34.1) R=XR*1.3;G=XG*1.8;B=XB*1.1; 2) R=X[0]*1.3;G=X[1]*1.8;B=X[2]*1.1; 这两个程序片段哪个进行向量化效率更高?
A.1)
B.2)
C.不确定
D.以上皆错
答案请点我要此答案,或联系QQ

35.n个节点的超立方构造成本为____。
A.O(logn)
B.O(sqrt(n))
C.O(n)
D.O(nlogn)
答案请点我要此答案,或联系QQ

36.为了解决CPU内流水线深度限制,主要的技术手段是____。
A.降低指令复杂度
B.去掉分支预测功能
C.增大核心数
D.超标量技术
答案请点我要此答案,或联系QQ

37.OpenMP是___的一个常见替代。
A.SSE
B.MPI
C.Pthread
D.CUDA
答案请点我要此答案,或联系QQ

38.SSE intrinsics _mm_load_ps命令的功能是____。
A.对齐向量读取单精度浮点数
B.未对齐向量读取单精度浮点数
C.对齐向量读取双精度浮点数
D.未对齐向量读取双精度浮点数
答案请点我要此答案,或联系QQ

39.采用划分子矩阵方法实现矩阵乘法,在进行SSE并行化时,是对(由外至内数)第____层循环进行循环展开然后向量化。
A.3
B.4
C.5
D.6
答案请点我要此答案,或联系QQ

40.四位助教帮助教授批改300份试卷,试卷共16道题,每位助教负责批改75份试卷,这是一种____任务划分方法。
A.数据并行
B.任务并行
C.搜索并行
D.预测并行
答案请点我要此答案,或联系QQ

41.对奇偶转置排序进行OpenMP并行化,第一种策略是直接对内层循环使用omp parallel for指令,第二种策略是对外层循环使用omp parallel指令,对内层循环使用omp for指令,后者相对于前者的优点是____。
A.保持了数据依赖
B.消除了大量线程创建、销毁开销
C.有利于负载均衡
D.减少了线程间交互
答案请点我要此答案,或联系QQ

42.编写矩阵乘法的AVX程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
A.2
B.4
C.8
D.16
答案请点我要此答案,或联系QQ

43.在下列应用中,SIMD最不适合____。
A.图像处理
B.音频处理
C.科学计算
D.数据库查询
答案请点我要此答案,或联系QQ

44.MPI是用于____系统的并行编程模型。
A.SIMD
B.MISD
C.共享内存
D.分布式内存
答案请点我要此答案,或联系QQ

45.SSE intrinsics _mm_load_sd命令的功能是____。
A.对齐标量读取单精度浮点数
B.未对齐标量读取单精度浮点数
C.对齐标量读取双精度浮点数
D.未对齐标量读取双精度浮点数
答案请点我要此答案,或联系QQ

46.关于MPI是什么,以下说法错误的是____。
A.一种消息传递编程模型标准
B.一种共享内存编程模型标准
C.编程角度看是C++/Fortran等的库
D.基于SPMD模型
答案请点我要此答案,或联系QQ

47.MPI_Send和MPI_recv是通过____区分消息。
A.端口号
B.消息名
C.消息标签
D.消息哈希
答案请点我要此答案,或联系QQ

48.经典冯诺依曼架构执行一条指令的过程中不包括哪个操作?
A.取指令
B.解码
C.安全性检查
D.执行指令
答案请点我要此答案,或联系QQ

49.执行pthread_rwlock_wrlock时,____的情况下加锁成功。
A.没有线程已为线程上锁
B.已有一个线程上了读锁
C.已有一个线程上了写锁
D.已有多个线程上了读锁
答案请点我要此答案,或联系QQ

50.SSE指令移动单精度浮点数,不能实现____。
A.将64位数据移动到SSE寄存器高位
B.将64位数据移动到SSE寄存器低位
C.将32位数据移动到SSE寄存器指定位置
D.在两个SSE寄存器高/低64位间移动
答案请点我要此答案,或联系QQ

推荐信息