减少流水线处理分支指令时的暂停时钟周期数的技术途径是什么?其流水线数据通路应如何改进?

题目

减少流水线处理分支指令时的暂停时钟周期数的技术途径是什么?其流水线数据通路应如何改进?

参考答案和解析
正确答案: 在流水线中尽早判断分支转移是否成功;转移成功时,尽早计算出转移目标地址。两者应同时采用,缺一不可。
(1)把“=0?”测试移至ID段;
(2)在ID段增设一个加法器,这样可以把分支开销减少一拍。
如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

●设每条指令由取指、分析、执行3个子部件完成,并且每个子部件的执行时间均为△t。若采用常规标量单流水线处理机(即该处理机的度为1),连续执行16条指令,则共耗时(14)△t。若采用度为4的超标量流水线处理机,连续执行上述16条指令,则共耗时(15)△t。

(14)A.16

B.18

C.32

D.48

(15) A.4

B.5

C.6

D.8


正确答案:B,C

第2题:

设指令由取指、分析、执行3个子部件完成,并且每个子部件的时间均为△t。若采用常规标量单流水线处理机(即该处理机的度为1),连续执行12条指令,共需(请作答此空)△t。若采用度为4的超标量流水线处理机,连续执行上述12条指令,只需( )△t。

A.12
B.14
C.16
D.18

答案:B
解析:
指令由取指、分析和执行3个子部件完成,n=3,且每个子部件的时间均为Δt。若采用常规标量单流水线处理机(即该处理机的度m=1),连续执行12条(k=12)指令的时空图如图所示。执行这12条指令所需的总时间为:Tk=(k+3-1)*Δt=(12+3)*Δt=14Δt。



若采用度为4(m=4)的超标量流水线处理机,连续执行上述12条(k=12)指令的时空图如图所示。



由图可知,执行这12条指令所需的总时间只需要5Δt。

第3题:

下列关于阵列处理机与流水线处理机特点的描述,不正确的是()

A.阵列处理机利用并行性中的同时性,而流水线处理机利用的是时间重叠

B.阵列处理机提高速度主要靠缩短时钟周期,流水线处理机主要靠增大处理单元数

C.阵列处理机使用互连网络来确定处理单元间的连接,而流水线处理机则不是

D.与流水线处理机不同,阵列处理机的结构是和所采用的并行算法紧密联系的


参考答案:B

第4题:

减少流水线处理分支指令时的暂停时钟周期数有哪两种途径?


正确答案: (1)在流水线中尽早判断出分支转移是否成功;
(2)尽早计算出分支转移成功时的PC值(即分支的目标地址)。

第5题:

为了改进由于条件转移指令引起的流水线断续现象、减少条件转移指令造成的执行部件停顿时间,一般有哪几种措施?


正确答案:A.猜测法。指令部件发现条件转移指令后,在等待执行部件执行完指令队列中的指令并产生条件码后的这一段时间里,指令部件仍按固定的方向继续预取指令,或者按转移成功的方向预取,或者按转移不成功的方向预取。等到产生条件码后,如果同猜测的转移方向一致,指令缓冲寄存器组中预先取出的指令可以用,流水线停顿的时间可以缩短。如果未猜对,则指令缓冲寄存器组中的指令和已做的工作全部作废,重新按另一个方向读取指令,然后开始分析。这时流水线损失的时间仍较长。
B.预取转移目标。在发现条件转移指令后,同时向两个分支方向预取指令。即除了继续按原来方向预取指令外,还按转移成功方向预取指令,最后根据真正的方向取其中一个分支的指令继续运行,有的还可以对于原来分支内指令进行带条件执行(即译码、取数、运算,但不送结果)进一步提高转移指令效率
C.加快和提前形成条件码,有的指令的条件码并不一定要等执行完毕得到运算结果后才能形成。
D.推迟转移。在编译一个程序时,编译程序自动地调整条件转移指令的位置,把条件转移指令从原来的位置向后移一条或若干条,而把无关指令先运行,这样作可以改进流水线的效率,不影响结果。一般可采用以下三种调度方法:A.将转移指令前的那条指令调度到延迟槽中;B.将转移目标处的那条指令调度到延迟槽中;C.将转移不发生时该执行的那条指令调度到延迟槽中。
E.加快短循环程序的处理。循环是一种特殊的条件转移,它通常是按循环计数器内内容是否为0来判断是否已达到应有的循环次数,决定是否需要“向后”转移。短循环程序是指循环段的指令数目少于(或等于)指令缓冲寄存器组中可存放的指令数时的循环程序段。如果在执行这种短循环时,能把整个短循环程序段放在指令缓冲寄存器组中,让指令部件停止预取新的指令,重复使用这段短循环程序,就可减少访问主存次序,提高机器的效率。

第6题:

指令流水线中出现数据相关时流水线将受阻,()可解决数据相关问题。

A.增加硬件资源
B.采用旁路技术
C.采用分支预测技术
D.以上都可以

答案:B
解析:
旁路技术指不必等待某条指令的执行结果写回到寄存器后,再从寄存器取出结果,而是直接将执行结果通过专用通路送至需要该结果的地方,可用来解决流水线的数据相关问题。

第7题:

ILLIACIV是一种()

  • A、流水线处理机
  • B、指令重叠处理机
  • C、阵列处理机
  • D、多处理机

正确答案:C

第8题:

下面关于Pentium引入的超标量流水线技术描述正确的是__。

A.在内部有可以并行执行的5条整数处理流水线

B.可以达到每个时钟周期执行2条指令

C.可以达到每个时钟周期执行5条指令

D.有两个缓冲区


正确答案:D

第9题:

减少流水线处理分支指令时的暂停时钟周期数有两种途径,一种是(),另一种是()。


正确答案:尽早判断出分支转移是否成功;尽早计算出分支转移的目标地址

第10题:

假定某计算机工程师想设计一个新CPU,一个典型程序的核心模块有一百万条指令,每条指令执行时间为100ps。若新CPU是一个20级流水线处理器,执行上述同样的程序,理想情况下,它比非流水线处理器快多少?


正确答案:若在一个20级流水线的处理器上执行,理想情况下,每个时钟周期为:100/20=5ps,所以,程序执行时间约为5×106=5μs. 快100/5=20倍。

更多相关问题