1、第一题 选取题1 SIMD是指(B)A、单指令流单数据流 B、单指令流多数据流C、多指令流单数据流 D、多指令流多数据流2下列那种存储设备不需要编址?DA. 通用寄存器B. 主存储器C. 输入输出设备D. 堆栈3按照计算机系统层次构造,算术运算、逻辑运算和移位等指令应属于(A)级机器语言。A、老式机器语言机器 B、操作系统机器C、汇编语言机器 D、高档语言机器4 初期计算机系统只有定点数据表达,因而硬件构造可以很简朴。但是这样系统有明显缺陷,下面哪一种不是它缺陷:BA数据表达范畴小B单个需要计算时钟周期多C编程困难D存储单元运用率很低7下面哪个页面替代算法事实上是不可以实现?DA)随机页面替代
2、算法B)先进先出替代算法C)最久没有使用算法D)最优替代算法9指令优化编码办法,就编码效率来讲,那种办法最佳?CA. 固定长度编码B. 扩展编码法C. huffman编码法D. 以上编码都不是10在初期冯诺依曼计算机特性中,机器以(C)为中心。A、存储器 B、输入输出设备C、运算器 D、控制器1.RISC 计算机指令系统集类型是 ( C ) 。A. 堆栈型 B. 累加器型C. 寄存器寄存器型 D. 寄存器 - 存储器型2、相联存储器访问方式是( D )。A先进先出顺序访问B按地址访问C无地址访问D按内容访问3、假设条指令执行过程可以分为“取指令”、“分析”和“执行”三段,每段分别只有个部件可供
3、使用,并且执行时间分别为t、2t和3t,持续执行n条指令所需要耗费最短时间约为( C )。(假设“取指令”、“分析”和“执行”可重叠,并假设n足够大)A6 nt B2 nt C3 nt Dnt6、下列计算机不属于RISC计算机是( C )。ASUN:Ultra SPARCBIBM:Power PC620CIBM:PC/XTDDEC:ALPHA211647、哪一点不是RISC特点?( D )A. 减少指令平均执行周期数B. 注重编译优化技术C. 减少指令和寻址方式种类D. 增长指令功能8、哪种兼容方式对系列机来说是必要规定做到?( B )A. 向前兼容 B. 向后兼容 C. 向上兼容 D. 向下
4、兼容9、在计算机系统中,表征系统运营状态部件是( D )。A程序计数器B累加计数器C中断计数器D程序状态字(PSW)10、存储器读写速率越高,每位成本也越高,存储容量也小。解决这一问题重要办法是采用( C )。ACacheB并行存储器C多级存储体系构造D缓冲技术1计算机系统构造层次构造按照由高到低顺序是(A )。A、高档语言机器级、汇编语言机器级,老式机器语言机器级、微程序机器级B、高档语言机器级,应用语言机器级、汇编语言机器级、微程序机器级C、应用语言机器级、老式语言机器级,汇编语言机器级,操作系统机器级D、应用语言机器级,操作语言机器级,微程序机器级、老式机器语言机器级2机器内浮点数都包括
5、阶码和尾数两某些,其中尾数位数重要影响(A )。A、能表达数精度 B、能表达数范畴C、能表达数范畴和精度 D、能表达数在数轴上分布离散程序3RISC含义是(C )。A、 Reduced Instruction System ComputerB、 Reproduced Instruction Set ComputerC、 Reduced Instruction Set ComputerD、Reproduced Instruction System Computer4推出系列机新机器,不能更改是(A )。 A、原有指令寻址方式和操作码 B、系统总线构成 C、数据通路宽度 D、存储芯片集成度8与全相
6、联映象相比,组相联映象长处是( A )、目录表小 、比较对法、命中率高 、主存运用率高10 对于线性流水,在每段通过时间相等状况下,流水线效率与( C )成正比。A、 任务数 B、流水线段数 C、吞吐率 D、排空时间1. 相应用程序员不透明是(D )。A先行进位链 B乘法器C指令缓冲器 D条件码寄存器2. 如下说法中,不对的是(B )。软、硬件功能是等效,提高硬件功能比例会 A提高解题速度 B提高硬件运用率 C提高硬件成本 D减少所需存储器用量4. 数据表达含义是( D )。A表达数据所采用数制和码制 B数据类型C浮点数表达方式 D硬件能直接辨认数据类型6.在不同类中断事件优先级中,( D )
7、不受中断屏蔽控制。A中断按键 B外部中断CI/O中断 D访管中断7.与虚拟存储器等效访问速度无关是(D )。A访存页地址流 B页面替代算法C主存容量 D辅存容量8. 页是( )单位,由( )划分,它长度( )。DA逻辑,系统,定长 B逻辑,顾客,不定长C物理,顾客,不定长 D物理,系统,定长1.某个时期投入市场机器上编制软件,不用修改就可运营在比它之后投入市场机器上,这被称为(D)。A向上兼容 B向下兼容 C向前兼容 D向后兼容2.信息按整数边界存储重要长处是(A )。A访存速度快 B节约主存单元C指令字规整化 D指令优化 4.按Cache地址映像块冲突概率从高到低顺序是(C )。 A.全相联
8、映像、直接映像、组相联映像 B.组相联映像、直接映像、全相联映像 C.直接映像、组相联映像、全相联映像 D.全相联映像、组相联映像、直接映像5.衡量流水线重要性能指标是(D )。A.流水线容量 B.流水线长短C.流水线规模 D.流水线吞吐率和效率2并行解决发展通过( D )途径形成了分布解决系统。A提高主频 B时间重叠 C资源重复 D资源共享3.系列机软件必要保证( D ),普通应做到软件向上兼容性。A、向上兼容 B、向下兼容 C、向前兼容 D、向后兼容1对机器语言程序员透明是( B )。A中断字 B主存地址寄存器 C通用寄存器 D条件码按照Flynn分类,PMMX指令采用是(31)模型,而当
9、前高性能服务器与超级计算机则大多属于(32)类。(31)、(32)ASISD BSIMD CMISD DMIMD例题1分析按照Flynn分类,计算机可分为SISD、SIMD、MISD和MIMD共4类。P中开始采用MMX技术,引进了某些新通用指令,虽然使用了单指令多数据思想,但从整体上说P仍属于SISD类。当前高性能服务器与超级计算机大多具备各种解决器,多任务解决并行解决,基本上都属于MIMD。例题1答案(31)A (32)D第二题 填空题1、进行仿真工作机器称为宿主机,而被仿真机器称为_目的机_。3、Cache存储器写保护时,只写入Cache,仅当需块替代时,才将其写回主存,称这种修改办法为_
10、写回法_法。4、普通中断是在_每条指令尾部_时解决,而页失效是及时解决。1提高计算机系统并行性重要技术途径有时间重叠、 资源重复 和 资源共享 。4在Cache存贮器中,CPU每次写Cache同步,也写入主存,称这种更新主存块内容办法为 写直达 法。2计算机构成是计算机体系构造 逻辑 实现。计算机实现是计算机构成 物理 实现。3“主存-辅存”层次目是为了弥补主存 容量 局限性;“Cache-主存”层次目是为了弥补主存 速度 局限性。4从计算机体系构造发展来看,初期计算机是以 运算器 为中心系统构造,而近代是以 存储器 为中心系统构造。6计算机体系构造设计和分析中最经常使用三条基本原则是 大概率
11、原则、阿摩达尔定律 和 局部性原理 。7Amdahl定律表白系统加速比依赖于 部件可改进比例 和加速比 两个因素。9一条DLX指令最多需要5个时钟周期,它们分别是 取指周期、指令译码 周期、执行/有效地址计算周期、存储器 周期和写回 周期。10吞吐率是流水线在 单位时间内 所完毕任务数或输出成果数量。11流水线在持续流动达到稳定状态后所得到吞吐率叫做 最大吞吐率 。12按照同一时间内各段之间连接方式来分,流水线可分为 动态流水线和 静态流水线 。13.流水线中有关有 构造有关、数据有关 和 控制有关 。1.并行性涉及同步性和 并发 性二重含义。5. 解决通用寄存器数有关办法有 推后法 和 设立
12、有关专用通路 。2. 计算机系统3T性能目的是 1TFLOPS计算能力 , 1TBYTE主存客量和 1TBYTES I/O带宽 。4. 浮点数阶码位数影响数可表达 范畴 大小,尾数位数影响数可表达精度 大小。5.在满足系统性能和总线流量前提下,可以采用总线功能组合、 并/串-串/并转换 、 信息编码 等方式来减少总线线数。8. 段页式虚拟存贮器内部地址映象表机构有 段 表和 页 表两某些。9.在m段构成流水线中,设各段通过时间不同,则在持续完毕n个任务时流水线效率为 。10.全局有关指已进入流水线 转移指令 和其后续指令之间有关。1中断响应时间是指_从发出中断祈求到进入中断解决程序这段时间_
13、_。3对于计算机体系构造,计算机构成和计算机实现三个概念来说,_计算机构成_着眼于机器级内各事件排序方式_计算机系统构造_着眼于对老式机器级界面拟定,_计算机实现_着眼于 微程序设计。5中断系统软硬件功能分派事实上就是在 中断响应硬件 和 中断解决程序软件之间功能分派。6数据宽度是指在 期间所传送数据总量。7评价存贮器性能基本规定是大容量、 高速度 和低价格。8程序局部性涉及 时间 上局部性和 空间 上局部性9在“一次重叠”解释时,第K+1条指令需要等第K条指令执行后才干形成,称此时发生了 指令有关 。10中断屏蔽不能变化中断响应优先顺序,但是可以动态变化中断 解决程序 顺序。一、判断题1可以
14、说向后兼容是系列机主线特性。 ( )3在数据描述符中,描述符与数据分开存储,重要用于描述单个数据特性。 ( )6为了动态调节中断解决程序实际执行完顺序,需要在中断级祈求源和中断响应排队器入口端之间加设中断屏蔽字寄存器和相应控制门电路。( )7页面失效祈求可以在每条指令执行到末尾时检测,以便在此时看与否调页。 ( )8Cache存贮器等效访问速度达不到接近于第一级Cache,可以增长Cache容量来解决。 ( )9对于通用寄存器变址有关状况,有也许会浮现“一次有关”,而不会浮现“二次有关”。( )1( )器件发展是推动计算机系统向前发展最直接动力。3( )由于RISC简化了指令系统,因而,RIS
15、C上目的程序比CISC上目的程序要短某些,程序运营时间就会少某些。5. ( )专用总线总线数多,系统流量大,I/O系统不适当用专用总线。8( )存储器采用单体单字,还是多体交叉并行存取,对系统构造设计应是透明。10. ( )从软硬功能分派看,静态流水线把功能承担较多地加到硬件上,而动态流水线则较多地加到软件上,以提高流水效能。3( )在集中式定期查询方式中,共享总线部件均有各自一对总线祈求和总线准许线。4( )页面失效祈求可以在每条指令执行到末尾时检测,以便在此时看与否调页。 3、若Cache未命中,应将程序挂起,同步调块。( )5、只要将子过程进一步细分,就可以使流水吞吐率进一步提高。( )
16、1系统与否设浮点运算指令,对计算机系统构造是透明。( 错 )2基址寻址支持程序动态再定位,变址寻址支持程序循环。( 对 )存储转发寻径:在存储转发网络中包是信息流基本单位,每个结点有一种包缓冲区。包从源结点通过一系列中间结点到达目结点。当一种包到达一种中间结点时,它一方面被存入缓冲区,当所规定输出通道和接受结点包缓冲区可使用时,然后再将它传送给下一种结点。1系列机所谓系列机是指在一种厂家内生产具备相似系统构造,但具备不同构成和实现一系列不同型号机器。系列机办法可以在具备相似系统构造各种机器之间实现软件移植。5MIPSMIPS= =6MFLOPSMFLOPS=7命中率存储器替代方略命中率是为存储
17、器层次构造中任意两个相邻层次而定义一种概念,当在Mi中找到一种信息项时,称之为命中,反之称之为缺失。在Mi层命中率就是信息项可在Mi中找到概率。11存储转发寻径在存储转发网络中包是信息流基本单位,每个结点有一种包缓冲区。包从源结点通过一系列中间结点到达目结点。当一种包到达一种中间结点时,它一方面被存入缓冲区,当所规定输出通道和接受结点包缓冲区可使用时,然后再将它传送给下一种结点。13 静态流水线在同一时间内,多功能流水线中各个功能段只能按照一种固定方式连接,实现一种固定功能。只有当按照这种连接方式工作所有任务都流出流水线之后,多功能流水线才干重新连接,以实现其她功能。14存储器带宽存储器带宽为
18、存储器在持续访问时数据吞吐速率。带宽单位普通是每秒钟传送位数或字节数。15Amdahl定律:系统中对某一部件或某种执行方式取采了改进后,整个系统性能提高与两种因素关于(1)改进某些使用频率或占总执行时间比例关于;(2)与改进某些在采用改进办法后比较有改进办法前性能提高倍数关于。:加速比:改进某些使用频率或占总执行时间比例:改进某些在改进前性能与改进后性能之比,(也就是改进某些性能提高倍数)1. 构造有关当指令在流水线中重叠执行时,流水线有也许变化指令读/写操作顺序(2分),使得读/写操作顺序不同于它们非流水实现时顺序(2分),将导致数据有关2. 程序局部性原理程序在执行时所访问地址不是随机,而
19、是相对簇聚(3分);这种簇聚涉及指令和数据两某些(1分)。3. CPI指令时钟数(Cycles per Instruction)(4分)。4. 并行性:包括同步性和并发性.是指在同一时刻或同一时间间隔内完毕两种以上性质相似或不同工作。5. 组相联映象:主存中每一块只能映象到Cache中唯一一种特定块位置,即第i块映象到Cache中物理地址应为i mod 2ncb块位置上。6. 模仿:用一种机器语言解释另一种机器语言方式.仿真:用微机解释机器语言方式。 (4分)17、Flynn分类法:计算机系统构造一种分类办法按照同步执行指令流与数据流在系统中数目,将系统构造分为:SISD单指令单数据流,SIM
20、D多指令流多数据流,MISD多指令流单数据流,MIMD多指令流多数据流。18、物理地址cache存储系统:物理地址cache存储系统是指cache、主存、磁盘这三个存储器分别构成cache-主存和主存-磁盘两个存储系统19、非阻塞网络:非阻塞网络:逻辑上交叉开关网络,除非存在不同输入端口向同一输出端口发送消息,否则消息通信将不会阻塞。请描述存储器访问时间局部性和空间局部性,并讲述其因素。时间上局部性指是近来将来要用到信息很也许是当前正在使用信息,这重要是由程序循环和堆栈等导致。 空间上局部性指是近来将来要用到信息很也许与当前正在使用信息在空间上是相邻或相近,这重要是由于指令普通是顺序执行和数据
21、是集簇存储所导致。15、简述流水线技术特点流水过程由各种相联系子过程构成,每个过程称为流水线级或段。流水技术适合于大量重复时序过程。13、简述SIMD计算机分布式存储器与共享存储器异同。SIMD计算机分布式存储器与共享存储器相似点都存在互联网络。不同点式在共享内存方案中,共享多体并行存储器通过对准网络与各解决单元相连。在分布内存方案中,每个解决单元有自己本地存储器,解决单元有自己本地存储器,解决单元之间数据通过数据寻径网络完毕。15、程序中有哪两类有关,分别可以采用什么办法来解决?(1) 数据有关数据有关指在执行本条指令过程中,如果用到指令、操作数、变址偏移量等是前面指令执行成果,则必要等待前
22、面指令执行完毕,并把成果写到主存或通用寄存器中之后,本条指令才干开始执行。可以采用设立专用数据通路、延迟执行等办法来解决数据有关。(2) 控制有关控制有关指由条件分支指令、转子程序指令、中断等引起有关。可以采用静态分支预测技术、动态分支预测技术、提前形成条件码等来解决控制有关。14、简述超标量解决机特点超标量解决机普通具备多于一条流水线,一台m度超标量解决机可同步发射m条指令,指令发射等待时间为1个时钟,指令并行度为m。12、数据类型、数据表达和数据构造之间关系是什么?在设计一种计算机系统时,拟定数据表达原则重要有哪几种?数据类型有各种各样,如文献、图、表、树、阵列、队列、链表、栈、向量、串、
23、实数、整数、布尔数、字符等。数据表达研究是计算机硬件可以直接辨认,可以被指令系统直接调用那些数据类型。数据构造研究是面向系统软件,面向应用领域所需要解决各种数据类型,研究这些数据类型逻辑构造和物理构造之间关系,并给出相应算法。拟定哪些数据类型用数据表达来实现原则重要有三个,一是缩短程序运营时间,二是减少CPU与主存储器之间通信量,三是这种数据表达通用性和运用率。16、实现软件移植重要途径有哪些?它们存在什么问题?合用于什么场合?(1) 采用系列机办法,只能在具备相似系统构造各种机器之间实现软件移植,普通是一种厂家生产机器(2) 采用模仿与仿真办法,可在不同系统构造机器之间互相移植软件,对于使用
24、频率较高指令,尽量用仿真办法以提高运算速度,而对于使用频率低且难于用仿真实现指令则用模仿办法来实现。(3) 采用统一高档语言办法,可以解决构造相似或完全不同各种机器上软件移植,但是,要统一高档语言,语言原则化很重要,但难以在短期内解决。1设计RISC机器可采用基本技术有哪些?设计RISC机器基本技术:按设计RISC机器普通原则来精选和优化设计指令系统;逻辑上采用硬联组合电路为主,恰当辅以微程序控制;在CPU内设立大量寄存器,采用重叠寄存器组窗口;指令采用重叠和流水方式解释,采用延迟转移;优化设计高质量编译程序。19简述计算机系统设计中软硬件取舍3原则。1) 在既有器件条件下,系统要有较高性能价
25、格比;2) 不要不合理地限制各种构成、实现技术采用;3) 硬件设计要考虑如何为软件提供更好支持。2. 简述RISC构造设计原则。(1) 选用使用频率最高指令,并补充某些最有用指令;(2) 每条指令功能应尽量简朴,并在一种机器周期内完毕;(3) 所有指令长度均相似;(4) 只有Load和Store操作指令才访问存储器,其他指令操作均在寄存器之间进行(5) 以简朴有效方式支持高档语言。3. 解决流水线构造有关办法有哪些?(1) 流水化功能单元(2) 资源重复(3) 暂停流水线4.组相联Cache比相似容量之直接映象Cache失效率低。由此与否可以得出结论:采用组相联Cache一定能带来性能上提高?
26、为什么?答:不一定。由于组相联命中率提高是以增长命中时间为代价,组相联需要增长多路选取开关。11、一条流水线连接图如下所示,画出100条指令持续通过该流水线时空图,并计算该流水线加速比。(其中 )参照答案:顺序执行时间为T06100600ns采用流水方式执行时间为T1399+6=303加速比ST0/T1600/303=1.9812、13、双输入端加、乘双功能静态流水线有1、2、3、4四个子部件,延时分别为t,t,2t,t,“加”由124构成,“乘”由134构成,输出可直接返回输入或锁存。现执行(1) 画出流水时空图,标出流水线入端数据变化状况。(2) 求运算所有完毕所需时间和流水线效率。(3)
27、 找出瓶颈子过程并将其细分,重新画出时空图并计算流水时间和效率。部件 成果输入a1 a2 a3 a4 a1+b1 a2+b2 a3+b3 a4+b4 b1 b2 b3 b4 c1 c2 c3 c4 t4321(1)(2)由上图可知,所有运算完时间是23t。 (3)43-23-121输入a1 a2 a3 a4 a1+b1 a2+b2 a3+b3 a4+b4 b1 b2 b3 b4 c1 c2 c3 c4 成果t部件 由上图可知,流水时间为20t。 2在下列不同类型解决机上做向量运算:D=(A+B)*C,向量长度均为4,每个周期时间为10ns。分别计算所需最短时间,写出简要计算过程。(15分)1)
28、.SISD单解决机,有一种通用运算部件,每3个周期做完一次加法,或每4个周期做完一次乘法。(5分)2).流水线解决机,有一条两功能静态流水线,加法通过其中3段,乘法通过其中4段,每段延迟时间均为一种周期。(5分)3).向量解决机,有独立加法器和乘法器,加法器采用3段流水线,乘法器采用4段流水线,每段延迟时间均为一种周期,采用向量链接方式工作。(5分)解:1)10ns4(34) 280ns,4次加法和4次乘法串行执行2)10ns(67) 130ns,流水线执行4次加法需要6个周期,流水线执行4次乘法需要7个周期3)10ns(73) 100ns,得到第1个成果需要7个周期,此外3个成果需要3个周期
29、9、在一种Cache存储系统中,主存储器访问周期、存储容量和单位价格分别为60ns、64MB和10元NB,Cache访问周期、存储容量和单位价格分别为10ns、512KB和100元MB,Cache命中率为098。计算这个Cache存储系统等效访问周期、存储容量和单位价格。这个Cache存储系统等效访问周期: T=TcH+Tm(1-H)=10ns0.98+60ns(1-0.98)=11ns 等效存储容量: S=64MB 等效单位价格: C=(CcSc+CmSm)/(Sc+Sm)=(1000.5+1064)/(0.5+64)=10.7(元/MB)8、1台向量计算机1次只能如下述两种执行方式中一种运营:一种是向量方式,执行速度Rv为10MFLOPS;另一种是标量方式,执行速度Rs为1MFLOPS。设是该计算机典型程序代码中可向量化某些比例。(a)推导出该计算机平均执行速度R公式(b)要使R达到7.5MFLOPS,问向量化比例应多大?(c)假设Rs=1MFLOPS,=0.7,要使R达到2MFLOPS,问Rv应为多大?参照答案:(a)(b)R=7.5,则 ,=0.963(c) ,则 MFLOPS