计算机体系结构复习教学提纲.doc

资源描述

计算机体系结构复习精品资料名词解释填空选择简答计算 1. 计算机系统的多级层次结构： 2. 系统结构的概念：计算机系统结构指的是计算机系统的软、硬件的界面，即机器语言程序员或编译程序设计者所能看到的传统机器级所具有的属性。 3. 在计算机技术中，对本来存在的事物或属性，但从某种角度看又好象不存在的概念称为透明性。 4. 对于通用寄存器型机器，这些属性主要是指：（选择题） 1) 指令系统（包括机器指令的操作类型和格式、指令间的排序和控制机构等） 2) 数据表示（硬件能直接辩认和处理的数据类型） 3) 寻址规则（包括最小寻址单元、寻址方式及其表示） 4) 寄存器定义（包括各种寄存器的定义、数量和使用方式） 5) 中断系统（中断的类型和中断响应硬件的功能等） 6) 机器工作状态的定义和切换（如管态和目态等） 7) 存储系统（主存容量、程序员可用的最大存储容量等） 8) 信息保护（包括信息保护方式和硬件对信息保护的支持） 9) I/O结构（包括I/O连接方式、处理机/存储器与I/O设备间数据传送的方式和格式以及I/O操作的状态等） 5. 计算机组成指的是计算机系统结构的逻辑实现，包含物理机器级中的数据流和控制流的组成以及逻辑设计。 6. 计算机实现指的是计算机组成的物理实现。 7. 数据表示是指计算机硬件能够直接识别、指令集可以直接调用的数据类型。 8. 数据类型、数据结构、数据表示之间的关系数据类型数据表示数据结构 9. 系列机指由同一厂商生产的具有相同体系结构、但具有不同组成和实现的一系列不同型号的机器。 10. 常见的计算机系统结构分类法有两种：Flynn分类法和冯氏分类法。冯氏分类法是用系统的最大并行度对计算机进行分类；Flynn分类法是指按照指令流和数据流的多倍性进行分类。 11. 定量分析技术（简答题）： 1) 以经常性事件为重点：在计算机系统设计中，经常需要在多种不同的方法之间进行折中，这时应按照对经常发生的情况采用优化方法的原则进行选择。 2) Amdahl定律：加速某部件执行速度所能获得的系统性能加速比，受限于该部件的执行时间占系统中总执行时间的百分比。 3) CPU性能公式：执行一个程序所需的CPU时间=执行程序所需的时钟周期数*时钟周期时间 4) 程序的局部性原理：指程序执行时所访问的存储器地址分布不是随机的，而是相对簇聚的。分为时间局部性和空间局部性。 12. 冯诺依曼结构的特点：以运算器为中心；在存储器中，指令和数据同等对待；存储器是按地址访问、按顺序线性编址的一维结构，每个存储单元的位数是固定的；指令是按顺序执行的；指令由操作码和地址码组成；指令和数据均以二进制编码表示，采用二进制运算。 13. 实现可移植性的常用方法有三种：采用系列机、模拟与仿真、统一高级语言。 14. 系列机在兼容方面，向后兼容一定要保证，尽量保证向上兼容 15. 模拟是指用软件的方法在一台现有的计算机上实现另一台计算机的指令集。（软件方法） 16. 仿真是指用一台现有计算机上的微程序去解释实现另一台计算机的指令集。（硬件方法） 17. 并行性包括同时性和并发性。 18. 从执行程序的角度来看，并行性等级从低到高可分为：（简答） 1) 指令内部并行：单条指令中各微操作之间的并行 2) 指令级并行：并行执行两条或两条以上的指令 3) 线程级并行：并行执行两个或两个以上的线程，通常是以一个进程内派生的多个线程为调度单位。 4) 任务级或过程级并行：并行执行两个或两个以上的过程或任务，以子程序或进程为调度单位。 5) 作业或程序级并行：并行执行两个或两个以上的作业或程序。 19. 提高并行性的技术路径（12字）：时间重叠、资源重复、资源共享 20. 能够对紧密耦合系统和松散耦合系统进行区分：紧密耦合系统共享主存，松散耦合系统共享外设 21. CISC指令集结构存在的问题： 1) 各种指令的使用频度相差悬殊 2) 指令集庞大，指令条数很多，许多指令的功能又很复杂， 3) 许多指令由于操作繁杂，其CPI值比较大，执行速度慢。 4) 由于指令功能复杂，规整性不好，不利于采用流水技术来提高性能。 22. 设计RISC机器遵循的原则 1) 指令条数少而简单。只选取使用频度很高的指令，在此基础上补充一些最有用的指令。 2) 采用简单而又统一的指令格式，并减少寻址方式；指令字长都为32位或64位。 3) 指令的执行在单个机器周期内完成。 (采用流水线机制) 4) 只有load和store指令才能访问存储器，其他指令的操作都是在寄存器之间进行。（即采用load-store结构） 5) 大多数指令都采用硬连逻辑来实现。 6) 强调优化编译器的作用，为高级语言程序生成优化的代码。 7) 充分利用流水技术来提高性能。 23. 指令动态调度是在程序的执行过程中，依靠专门硬件对代码进行调度。静态调度的流水线依靠编译器对代码进行静态调度，以减少相关和冲突。 24. 数据结构指由软件进行处理和实现的各种数据类型。 25. MIPS的数据寻址方式只有立即数寻址和偏移量寻址。 26. 流水技术是指：将一个重复的时序过程分解成为若干个子过程，而每个子过程都可有效地在其专用功能段上与其他子过程同时执行。流水线的段数称为流水线的深度。 27. 流水技术的特点 1) 流水线把一个处理过程分解为若干个子过程（段），每个子过程由一个专门的功能部件来实现。 2) 流水线中各段的时间应尽可能相等，否则将引起流水线堵塞、断流。时间长的段将成为流水线的瓶颈。 3) 流水线每一个功能部件的后面都要有一个缓冲寄存器（锁存器），称为流水寄存器。 4) 流水技术适合于大量重复的时序过程，只有在输入端不断地提供任务，才能充分发挥流水线的效率。 5) 流水线需要有通过时间和排空时间。 28. 流水线分类： 1) 按流水线所完成的功能分：单功能流水线和多功能流水线 2) 按照同一时间段内各段之间的连接方式分：静态流水线和动态流水线 3) 按照流水的级别分：部件级流水线、处理机级流水线和处理机间流水线 4) 按照流水线中是否有反馈回路分：线性流水线和非线性流水线 5) 按照任务流入和流出的顺序分：顺序流水线和乱序流水线 29. 解决流水线瓶颈问题的常用方法：细分瓶颈段、重复设置瓶颈段 30. 程序中的相关有三种类型：数据相关、名相关（反相关、输出相关）、控制相关流水线中的相关有：数据相关、结构相关、控制相关处理机找中的相关：数据相关、控制相关 31. 控制相关带来了两个限制： 1) 与一条分支指令控制相关的指令不能被移到该分支之前，否则这些指令就不受该分支控制 2) 如果一条指令与某分支指令不存在控制相关，就不能把该指令移到该分支之后。 32. 流水线冲突三种类型：结构冲突、数据冲突和控制冲突 33. 数据冲突：写后读冲突、写后写冲突、读后写冲突 34. 在Tomasulo算法中，Vj，Vk：源操作数的值。对于每一个操作数来说，V或Q字段只有一个有效。 35. 基于硬件的前瞻执行时，执行的结果不是写回到寄存器或存储器，而是放到ROB缓冲器中。通过保留站重新命名寄存器。 36. 多流出处理机有两种基本风格：超标量和超长指令字 37. 循环展开技术：多次复制循环体并相应调整展开后的指令和循环结束条件，增加有效操作时间与控制操作时间比率，也给编译器进行指令调度带来了更大的空间。 38. 循环展开和指令调度时要注意以下几个方面（简答题） 1) 保证正确性。注意两个地方的正确性：循环控制，操作数偏移量的修改。 2) 注意有效性。只有找到不同寻呼台之间的无关性，才能够有效地使用循环展开。 3) 使用不同的寄存器。如果使用相同，或较少数量的寄存器，可能导致新的冲突。 4) 尽可能减少循环控制中的测试指令和分支指令。 5) 注意对存储器数据的相关性分析 6) 注意新的相关性。由于原循环不同次的迭代在展开后都到了同一次循环体中，因此可能带来新的相关性。 39. 从用户角度看，存储器的三个主要指标：容量、速度和价格。 40. 存储层次的性能参数。P155 1) 存储层次的平均每位价格C 2) 命中率H 3) 平均访存时间Ta 41. 映像规则：全相联映像、直接相联映像、组相联映像 42. 可以从三个方面改进Cache的性能：（简答题） 1) 降低失效率：增加块大小、增加Cache容量、提供相联度、Victim Cache、伪相联映像Cache、硬件预取指令和数据、编译器控制的预取、用编译技术减少Cache失效次数。 2) 减少失效开销：Victim Cache、硬件预取指令和数据、编译器控制的预取、使读失效优于写、写缓存归并、尽早重启动和关键字优先、非阻塞Cache、两级Cache 3) 减少命中时间：容量小且结构简单的Cache、对Cache进行索引时不必进行地址变换、流水化Cache访问、Trace Cache 43. 按照产生失效的原因不同，可以把失效分为：强制性失效、容量失效和冲突失效 44. 2：1的Cache经验规则，即大小为N的直接映像Cache的失效率约等于大小为N/2的2路组相联Cache的失效率。 45. 请求字优先：调块时，从请求字所在的位置读起。这样，第一个读出的字便是请求字，将之立即发送给CPU。 46. 有关虚拟存储器问题： 1) 映像规则：全相联映像 2) 查找算法：页表、段表、TLB 3) 替换算法：LRU 4) 写策略：写回法 47. 中断响应次序由硬件决定，不可改变，中断处理次序通过中断屏蔽码的设置来改变。 48. 反映存储外设可靠性性能参数有：可靠性、可用性和可信性。 49. 通道的种类：字节多路通道、选择通道和数组多路通道。 50. 在字节多路通道中，实际流量是连接在这个通道上所有设备的数据传输率之和。 51. 对于选择通道和数组多路通道，在一段时间内，一个通道只能为一台设备传送数据。此时通道的实际流量就等于该设备的数据传输率。因此这两种通道的实际流量就是连接在这个通道上所有设备中数据流量最大的那一个。 52. 互联网络是一种由开关元件按照一定的拓扑结构和控制方式构成的网络，用来实现计算机系统中结点之间的互相连接。 53. 交换函数（P254 图7.2） 54. 互联网络的主要特性参数： 1) 网络规模：网络中结点的个数。 2) 结点度：与结点相连接的边数（通道数），包括入度和出度。 3) 距离：对于网络中的任意两个结点，从一个结点出发到另一个结点终止所需要跨越的边数的最小值。 4) 网络直径：网络中任意两个结点之间距离的最大值。 5) 结点之间的线长：两个结点之间连线的长度，用米、千米等表示。 6) 等分宽度：当某一网络被切成相等的两半时，沿切口的边数（通道数）的最小值称为通道等分宽度，用b表示。 7) 对称性：从任何结点看到的拓扑结构都是相同的网络称为对称网络。 55. 线性阵列 1) 端结点的度：1 2) 其余结点的度：2 3) 直径：N－1 4) 等分宽度b=1 56. 环和带弦环 1) 对称 2) 结点的度：2 3) 双向环的直径：N/2 4) 单向环的直径：N 57. 静态网络有：线性阵列、环、度为3的带弦环、度为4的带弦环。循环移数网络和全网络 58. 动态网络有：总线网络、多级互联网络和交叉开关网络等 59. 分布式处理机分为：分布式共享存储器和对称式共享存储器 60. 共享存储器通信主要优点（简答题） 1) 与常用的对称式多处理机使用的通信机制兼容。 2) 易于编程，同时在简化编译器设计方面也占有优势。 3) 当通信数据量较小时，通信开销较低，带宽利用较好。 4) 通过硬件控制的Cache减少了远程通信的频度，减少了通信延迟以及对共享数据的访问冲突。 5) 消息传递通信机制的主要优点：硬件较简单；通信是显式的，因此更容易搞清楚何时发生通信以及通信开销是多少，以便编程者和编译程序设法减少通信开销。 1. 透明性：在计算机技术中，对本来存在的事物或属性，但从某种角度看又好象不存在的概念称为透明性。 2. 系列机在一个厂家内生产的具有相同的体系结构，但具有不同组成和实现的一系列不同型号的机器。 3. CPU性能公式： CPU时间 = 执行程序所需的时钟周期数×时钟周期时间= IC ×CPI ×时钟周期时间其中，时钟周期时间是系统时钟频率的倒数。每条指令执行的平均时钟周期数CPI CPI = 执行程序所需的时钟周期数／IC IC：所执行的指令条数 4. 程序的局部性原理（构成存储层次的理论依据）包括程序的时间局部性，程序的空间局部性 5. 冯·诺依曼结构的主要特点 Ø 以运算器为中心。 Ø 在存储器中，指令和数据同等对待。 Ø 存储器是按地址访问、按顺序线性编址的一维结构，每个单元的位数是固定的。 Ø 指令的执行是顺序的。 Ø 指令由操作码和地址码组成。 Ø 指令和数据均以二进制编码表示，采用二进制运算。 6. 实现可移植性的常用方法采用系列机，模拟与仿真，统一高级语言。 7. 软件兼容方式：向前（后）兼容,向上（下）兼容四种。向后兼容一定要保证，他是系列机的根本特征（填空） 8. 模拟：用软件的方法在一台现有的机器（称为宿主机）上实现另一台机器（称为虚拟机）的指令集。 9. 仿真：用一台现有机器（宿主机）上的微程序去解释实现另一台机器（目标机）的指令集。 10. 并行性：计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。同时性和并发性（填空） 11. 从执行程序的角度来看，并行性等级从低到高可分为： Ø 指令内部并行 Ø 指令级并行 Ø 线程级并行 Ø 任务级或过程级并行 Ø 作业或程序级并行 12. 耦合度分为：（了解区别）紧密耦合系统（直接耦合系统）：在这种系统中，计算机之间的物理连接的频带较高，一般是通过总线或高速开关互连，可以共享主存。松散耦合系统（间接耦合系统）：一般是通过通道或通信线路实现计算机之间的互连，可以共享外存设备（磁盘、磁带等）。机器之间的相互作用是在文件或数据集一级上进行的。 13. 数据表示：计算机硬件能够直接识别、指令集可以直接调用的数据类型。 14. 数据结构：由软件进行处理和实现的各种数据类型。 15. MIPS的寄存器： 32个64位通用寄存器（GPRs）也被称为整数寄存器，R0的值永远是0 32个64位浮点数寄存器（FPRs） 16. MIPS的数据寻址方式立即数寻址与偏移量寻址 17. DLX的数据寻址方式寄存器寻址，寄存器间接寻址，立即数寻址与偏移量寻址 18. 流水线技术 Ø 把一个重复的过程分解为若干个子过程，每个子过程由专门的功能部件来实现。 Ø 把多个处理过程在时间上错开，依次通过各功能段，这样，每个子过程就可以与其他的子过程并行进行。 19. 流水技术的特点 Ø 流水线把一个处理过程分解为若干个子过程（段），每个子过程由一个专门的功能部件来实现。 Ø 流水线中各段的时间应尽可能相等，否则将引起流水线堵塞、断流。时间长的段将成为流水线的瓶颈。 Ø 流水线每一个功能部件的后面都要有一个缓冲寄存器（锁存器），称为流水寄存器。 Ø 流水技术适合于大量重复的时序过程，只有在输入端不断地提供任务，才能充分发挥流水线的效率。 Ø 流水线需要有通过时间和排空时间。 20. 从不同的角度和观点，把流水线分成多种不同的种类。 Ø 单功能流水线：只能完成一种固定功能的流水线。 Ø 多功能流水线：流水线的各段可以进行不同的连接，以实现不同的功能 21. 按照同一时间内各段之间的连接方式对多功能流水线做进一步的分类 Ø 静态流水线：在同一时间内，多功能流水线中的各段只能按同一种功能的连接方式工作 Ø 动态流水线：在同一时间内，多功能流水线中的各段可以按照不同的方式连接，同时执行多种功能。 22. 按照流水的级别来进行分类 Ø 部件级流水线（运算操作流水线）：把处理机的算术逻辑运算部件 Ø 处理机级流水线（指令流水线）：把指令的解释执行过程按照流水方式处理。 Ø 处理机间流水线（宏流水线）：它是由两个或者两个以上的处理机串行连接起来，对同一数据流进行处理，每个处理机完成整个任务中的一部分。 23. 按照流水线中是否有反馈回路来进行分类 Ø 线性流水线：流水线的各段串行连接，没有反馈回路。 Ø 非线性流水线：流水线中除了有串行的连接外，还有反馈回路。 24. 根据任务流入和流出的顺序是否相同来进行分类 Ø 顺序流水线：流水线输出端任务流出的顺序与输入端任务流入的顺序完全相同。 Ø 乱序流水线：流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同，允许后进入流水线的任务先完成（从输出端流出）。 25. 流水线的性能指标p61 吞吐率：在单位时间内流水线所完成的任务数量或输出结果的数量。 26. 解决流水线瓶颈问题的常用方法 Ø 细分瓶颈段 Ø 重复设置瓶颈段 27. 相关有3种类型（填空） Ø 数据相关（也称真数据相关） Ø 名相关（有读后写，写后写两种相关） Ø 控制相关 28. 流水线冲突有3种类型：（填空）结构冲突，数据冲突，控制冲突 29. 3.12 有一指令流水线如下所示（1）求连续输入10条指令，该流水线的实际吞吐率和效率；（2）该流水线的“瓶颈”在哪一段？请采取两种不同的措施消除此“瓶颈”。对于你所给出的两种新的流水线，连续输入10条指令时，其实际吞吐率和效率各是多少？解：（1）（2）瓶颈在3、4段。 n 变成八级流水线（细分） 1 2 3-1 3-2 4-1 4-2 4-3 4-4 n 重复设置 30. 静态调度技术依靠编译器对代码进行静态调度，以减少相关和冲突。它不是在程序执行的过程中、而是在编译期间进行代码调度和优化。静态调度通过把相关的指令拉开距离来减少可能产生的停顿。 31. 动态调度方法在流水线中出现相关时，通过硬件重新安排指令的执行顺序，来调整相关指令实际执行时的关系，减少处理器空转。 32. 记分牌算法和Tomasulo算法是两种比较典型的动态调度算法。 33. 动态分支预测技术: 是根据本条指令之前的行为判断本次行为 34. 前瞻执行（speculation）的基本思想：对分支指令的结果进行猜测，并假设这个猜测总是对的，然后按这个猜测结果继续取、流出和执行后续的指令。只是执行指令的结果不是写回到寄存器或存储器，而是放到一个称为ROB（ReOrder Buffer）的缓冲器中。等到相应的指令得到“确认”（commit）（即确实是应该执行的）之后，才将结果写入寄存器或存储器。通过保留栈。关键思想：允许指令乱序执行，但必须顺序确认 35. 多指令流出技术基本风格：超标量；超长指令字；超流水处理机 36. 循环展开和指令调度时要注意以下几个方面 Ø 保证正确性。 Ø 注意有效性。 Ø 使用不同的寄存器。 Ø 删除多余的测试指令和分支指令，并对循环结束代码和新的循环体代码进行相应的修正 Ø 注意对存储器数据的相关性分析 Ø 注意新的相关性 37. 存储层次的性能参数P155 1. 每位价格C 2. 命中率H 和失效率F 3. 平均访问时间TA 38. 映像规则：直接映象：主存中的每一块只能被放置到Cache中唯一的一个位置。（空间利用率最低，冲突概率最高，实现最简单）全相联：主存中的任一块可以被放置到Cache中的任意一个位置。（空间利用率最高，冲突概率最低，实现最复杂，命中时间最长）是组相连的特例，所以的都是一组组相联：主存中的每一块可以被放置到Cache中唯一的一个组中的任何一个位置。组相联是直接映象和全相联的一种折中 39. 替换算法P163 40. 改进Cache的性能平均访存时间＝命中时间＋失效率×失效开销 41. 可以从三个方面改进Cache的性能：（与p201结合） Ø 降低失效率 Ø 减少失效开销 Ø 减少Cache命中时间 42. 子块放置技术：把cache块进一步划分为更小的块（子块），并给每个子块赋予一位有效位，用于指明该子块中的数据是否有效。 43. 请求字从下一级存储器调入Cache的块中，只有一个字是立即需要的。这个字称为请求字。 44. 请求字优先：调块时，从请求字所在的位置读起。这样，第一个读出的字便是请求字。将之立即发送给CPU。 45. 映象规则：全相联（填空）替换算法：LRU 写策略：写回法 46. 反映外设可靠性能的参数有： 1. 可靠性（Reliability） 2. 可用性（Availability） 3. 可信性（Dependability） 47. 根据信息传送方式的不同，将通道分为三种类型 1. 字节多路通道 2. 选择通道 3. 数组多路通道 48. 实际流量是连接在这个通道上的所有设备的数据传输率之和。 fi：第i台设备的实际数据传输率 49. 互连网络是一种由开关元件按照一定的拓扑结构和控制方式构成的网络，用来实现计算机系统中结点之间的相互连接。 50. 交换函数：实现二进制地址编码中第k位互反的输入端与输出端之间的连接。写出端口对应（入à出） 51. 均匀洗牌函数写出几号端口对应几号端口 52. 互连网络的主要特性参数有： Ø 网络规模：网络中结点的个数。 Ø 结点度：与结点相连接的边数（通道数），包括入度和出度。 Ø 距离：对于网络中的任意两个结点，从一个结点出发到另一个结点终止所需要跨越的边数的最小值。 Ø 网络直径：网络中任意两个结点之间距离的最大值。 Ø 结点之间的线长：两个结点之间连线的长度，用米、千米等表示。 Ø 等分宽度：当某一网络被切成相等的两半时，沿切口的边数（通道数）的最小值称为通道等分宽度，用b表示。 Ø 对称性：从任何结点看到的拓扑结构都是相同的网络称为对称网络。 53. 线性阵列一种一维的线性网络，其中N个结点用N-1个链路连成一行。 q 端结点的度：1 q 其余结点的度：2 q 直径：N－1 q 等分宽度b=1 54. 环和带弦环 q 对称 q 结点的度：2 q 双向环的直径：N/2 q 单向环的直径：N 55. 根据系统中处理器个数的多少，可把现有的MIMD计算机分为两类：集中式共享存储器结构分布式存储器结构，具有分布的物理存储器，支持规模较大的多处理机系统 56. 共享存储器通信的主要优点（简答题） Ø 与常用的对称式多处理机使用的通信机制兼容。 Ø 易于编程，同时在简化编译器设计方面也占有优势。 Ø 当通信数据量较小时，通信开销较低，带宽利用较好。 Ø 通过硬件控制的Cache减少了远程通信的频度，减少了通信延迟以及对共享数据的访问冲突。 57. 消息传递通信机制的主要优点 Ø 硬件较简单。 Ø 通信是显式的，因此更容易搞清楚何时发生通信以及通信开销是多少，以便编程者和编译程序设法减少通信开销。仅供学习与交流，如有侵权请联系网站删除谢谢13

展开阅读全文