1、.1. 多级层次结构从计算机语言的角度,把计算机系统按功能划分成多级层次结构。2. 透明性:在计算机技术中,对本来存在的事物或属性,但从某种角度看又好象不存在的概念称为透明性。3. 对于通用寄存器型机器,这些属性主要是指:(选择题)(1) 数据表示 (硬件能直接辩认和处理的数据类型) (2) 寻址规则 (包括最小寻址单元、寻址方式及其表示) (3) 寄存器定义 (包括各种寄存器的定义、数量和使用方式)(4) 指令集 (包括机器指令的操作类型和格式、指令间的排序和控制机构等)(5) 中断系统 (中断的类型和中断响应硬件的功能等)(6) 机器工作状态的定义和切换 (如管态和目态等)(7) 存储系统
2、 (主存容量、程序员可用的最大存储容量等)(8) 信息保护 (包括信息保护方式和硬件对信息保护的支持) (9) I/O结构(包括I/O连接方式、处理机/存储器与I/O设备间数据传送的方式和格式以及I/O操作的状态等)4. 计算机组成计算机系统的逻辑实现。5. 计算机实现计算机系统的物理实现。 (两者的区别 第5页)6. 系列机 在一个厂家内生产的具有相同的体系结构,但具有不同组成和实现的一系列不同型号的机器。7. 冯氏分类法 用系统的最大并行度对计算机进行分类。 最大并行度:计算机系统在单位时间内能够处理8. Flynn分类法 按照指令流和数据流的多倍性进行分类。9. 4个定量原理:(有理解,
3、有简答)以经常性事件为重点=大概率事件优先规则10. CPU性能公式:CPU时间 = 执行程序所需的时钟周期数时钟周期时间= IC CPI 时钟周期时间其中,时钟周期时间是系统时钟频率的倒数。每条指令执行的平均时钟周期数CPI CPI = 执行程序所需的时钟周期数IC IC:所执行的指令条数11. 程序的局部性原理(构成存储层次的理论依据) 包括程序的时间局部性,程序的空间局部性12. 冯诺依曼结构的主要特点 以运算器为中心。 在存储器中,指令和数据同等对待。 存储器是按地址访问、按顺序线性编址的一维结构,每个单元的位数是固定的。 指令的执行是顺序的。 指令由操作码和地址码组成。 指令和数据均
4、以二进制编码表示,采用二进制运算。13. 实现可移植性的常用方法 采用系列机,模拟与仿真,统一高级语言 。14. 软件兼容方式:向前(后)兼容,向上(下)兼容四种。向后兼容一定要保证,他是系列机的根本特征(填空)15. 模拟:用软件的方法在一台现有的机器(称为宿主机)上实现另一台机器(称为虚拟机)的指令集。16. 仿真:用一台现有机器(宿主机)上的微程序去解释实现另一台机器(目标机)的指令集。17. 并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。同时性和并发性(填空)18. 从执行程序的角度来看,并行性等级从低到高可分为: 指令内部并行 指令级并行 线程级并行 任务级或过程
5、级并行 作业或程序级并行19. 提高并行性的技术途径:时间重叠,资源重复,资源共享20. 耦合度分为:(了解区别)紧密耦合系统(直接耦合系统):在这种系统中,计算机之间的物理连接的频带较高,一般是通过总线或高速开关互连,可以共享主存。松散耦合系统(间接耦合系统):一般是通过通道或通信线路实现计算机之间的互连,可以共享外存设备(磁盘、磁带等)。机器之间的相互作用是在文件或数据集一级上进行的。21. CISC指令集结构存在的问题 : 各种指令的使用频度相差悬殊 指令集庞大,指令条数很多,许多指令的功能又很复杂, 许多指令由于操作繁杂,其CPI值比较大,执行速度慢。 由于指令功能复杂,规整性不好,不
6、利于采用流水技术来提高性能。 22. 设计RISC机器遵循的原则 指令条数少而简单。只选取使用频度很高的指令,在此基础上补充一些最有用的指令。 采用简单而又统一的指令格式,并减少寻址方式;指令字长都为32位或64位。 指令的执行在单个机器周期内完成。 (采用流水线机制) 只有load和store指令才能访问存储器,其他指令的操作都是在寄存器之间进行。(即采用load-store结构) 大多数指令都采用硬连逻辑来实现。 强调优化编译器的作用,为高级语言程序生成优化的代码。 充分利用流水技术来提高性能。23. 数据表示:计算机硬件能够直接识别、指令集可以直接调用的数据类型。24. 数据结构:由软件
7、进行处理和实现的各种数据类型。25. MIPS的寄存器:32个64位通用寄存器(GPRs)也被称为整数寄存器,R0的值永远是032个64位浮点数寄存器(FPRs)26. MIPS的数据寻址方式立即数寻址与偏移量寻址27. DLX的数据寻址方式寄存器寻址,寄存器间接寻址,立即数寻址与偏移量寻址28. 流水线技术 把一个重复的过程分解为若干个子过程,每个子过程由专门的功能部件来实现。 把多个处理过程在时间上错开,依次通过各功能段,这样,每个子过程就可以与其他的子过程并行进行。29. 流水技术的特点 流水线把一个处理过程分解为若干个子过程(段),每个子过程由一个专门的功能部件来实现。 流水线中各段的
8、时间应尽可能相等,否则将引起流水线堵塞、断流。 时间长的段将成为流水线的瓶颈。 流水线每一个功能部件的后面都要有一个缓冲寄存器(锁存器),称为流水寄存器。 流水技术适合于大量重复的时序过程,只有在输入端不断地提供任务,才能充分发挥流水线的效率。 流水线需要有通过时间和排空时间。30. 从不同的角度和观点,把流水线分成多种不同的种类。 单功能流水线:只能完成一种固定功能的流水线。 多功能流水线:流水线的各段可以进行不同的连接,以实现不同的功能31. 按照同一时间内各段之间的连接方式对多功能流水线做进一步的分类 静态流水线:在同一时间内,多功能流水线中的各段只能按同一种功能的连接方式工作 动态流水
9、线:在同一时间内,多功能流水线中的各段可以按照不同的方式连接,同时执行多种功能。 32. 按照流水的级别来进行分类 部件级流水线(运算操作流水线):把处理机的算术逻辑运算部件 处理机级流水线(指令流水线):把指令的解释执行过程按照流水方式处理。 处理机间流水线(宏流水线):它是由两个或者两个以上的处理机串行连接起来,对同一数据流进行处理,每个处理机完成整个任务中的一部分。 33. 按照流水线中是否有反馈回路来进行分类 线性流水线:流水线的各段串行连接,没有反馈回路。 非线性流水线:流水线中除了有串行的连接外,还有反馈回路。 34. 根据任务流入和流出的顺序是否相同来进行分类 顺序流水线:流水线
10、输出端任务流出的顺序与输入端任务流入的顺序完全相同。 乱序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同,允许后进入流水线的任务先完成(从输出端流出)。35. 流水线的性能指标p61吞吐率:在单位时间内流水线所完成的任务数量或输出结果的数量。36. 解决流水线瓶颈问题的常用方法 细分瓶颈段 重复设置瓶颈段37. 相关有3种类型(填空) 数据相关(也称真数据相关) 名相关(有读后写,写后写两种相关) 控制相关38. 流水线冲突有3种类型:(填空)结构冲突,数据冲突,控制冲突39. 3.12 有一指令流水线如下所示(1) 求连续输入10条指令,该流水线的实际吞吐率和效率;(2)
11、该流水线的“瓶颈”在哪一段?请采取两种不同的措施消除此“瓶颈”。对于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少?解:(1)(2)瓶颈在3、4段。n 变成八级流水线(细分)123-13-24-14-24-34-4n 重复设置40. 静态调度技术依靠编译器对代码进行静态调度,以减少相关和冲突。它不是在程序执行的过程中、而是在编译期间进行代码调度和优化。静态调度通过把相关的指令拉开距离来减少可能产生的停顿。41. 动态调度方法在流水线中出现相关时,通过硬件重新安排指令的执行顺序,来调整相关指令实际执行时的关系,减少处理器空转。42. 记分牌算法和Tomasulo算法是
12、两种比较典型的动态调度算法。43. 动态分支预测技术:是根据本条指令之前的行为判断本次行为44. 前瞻执行(speculation)的基本思想: 对分支指令的结果进行猜测,并假设这个猜测总是对的,然后按这个猜测结果继续取、流出和执行后续的指令。只是执行指令的结果不是写回到寄存器或存储器,而是放到一个称为ROB(ReOrder Buffer)的缓冲器中。等到相应的指令得到“确认”(commit)(即确实是应该执行的)之后,才将结果写入寄存器或存储器。 通过保留栈。关键思想:允许指令乱序执行,但必须顺序确认45. 多指令流出技术基本风格: 超标量;超长指令字;超流水处理机46. 循环展开和指令调度
13、时要注意以下几个方面 保证正确性。 注意有效性。 使用不同的寄存器。 删除多余的测试指令和分支指令,并对循环结束代码和新的循环体代码进行相应的修正 注意对存储器数据的相关性分析 注意新的相关性47. 存储层次的性能参数P1551. 每位价格C2. 命中率H 和失效率F3. 平均访问时间TA48. 映像规则:直接映象:主存中的每一块只能被放置到Cache中唯一的一个位置。(空间利用率最低,冲突概率最高,实现最简单)全相联:主存中的任一块可以被放置到Cache中的任意一个位置。(空间利用率最高,冲突概率最低,实现最复杂,命中时间最长)是组相连的特例,所以的都是一组组相联:主存中的每一块可以被放置到
14、Cache中唯一的一个组中的任何一个位置。组相联是直接映象和全相联的一种折中 49. 替换算法P16350. 改进Cache的性能平均访存时间命中时间失效率失效开销51. 可以从三个方面改进Cache的性能:(与p201结合) 降低失效率 减少失效开销 减少Cache命中时间52. 子块放置技术:把cache块进一步划分为更小的块(子块),并给每个子块赋予一位有效位,用于指明该子块中的数据是否有效。53. 请求字 从下一级存储器调入Cache的块中,只有一个字是立即需要的。这个字称为请求字。 54. 请求字优先:调块时,从请求字所在的位置读起。这样,第一个读出的字便是请求字。将之立即发送给CP
15、U。55. 映象规则:全相联(填空)替换算法:LRU写策略:写回法56. 反映外设可靠性能的参数有:1. 可靠性(Reliability)2. 可用性(Availability)3. 可信性(Dependability)57. 根据信息传送方式的不同,将通道分为三种类型1. 字节多路通道2. 选择通道3. 数组多路通道58. 实际流量是连接在这个通道上的所有设备的数据传输率之和。fi:第i台设备的实际数据传输率 59. 互连网络是一种由开关元件按照一定的拓扑结构和控制方式构成的网络,用来实现计算机系统中结点之间的相互连接。60. 交换函数:实现二进制地址编码中第k位互反的输入端与输出端之间的连
16、接。 写出端口对应(入出) 61. 均匀洗牌函数 写出几号端口对应几号端口62. 互连网络的主要特性参数有: 网络规模:网络中结点的个数。 结点度:与结点相连接的边数(通道数),包括入度和出度。 距离:对于网络中的任意两个结点,从一个结点出发到另一个结点终止所需要跨越的边数的最小值。 网络直径:网络中任意两个结点之间距离的最大值。 结点之间的线长:两个结点之间连线的长度,用米、千米等表示。 等分宽度:当某一网络被切成相等的两半时,沿切口的边数(通道数)的最小值称为通道等分宽度,用b表示。 对称性:从任何结点看到的拓扑结构都是相同的网络称为对称网络。63. 线性阵列 一种一维的线性网络,其中N个
17、结点用N-1个链路连成一行。q 端结点的度:1q 其余结点的度:2q 直径:N1q 等分宽度b=1 64. 环和带弦环 q 对称q 结点的度:2q 双向环的直径:N/2q 单向环的直径:N 65. 根据系统中处理器个数的多少,可把现有的MIMD计算机分为两类:集中式共享存储器结构 分布式存储器结构,具有分布的物理存储器,支持规模较大的多处理机系统 66. 共享存储器通信的主要优点 (简答题) 与常用的对称式多处理机使用的通信机制兼容。 易于编程,同时在简化编译器设计方面也占有优势。 当通信数据量较小时,通信开销较低,带宽利用较好。 通过硬件控制的Cache减少了远程通信的频度,减少了通信延迟以及对共享数据的访问冲突。67. 消息传递通信机制的主要优点 硬件较简单。 通信是显式的,因此更容易搞清楚何时发生通信以及通信开销是多少,以便编程者和编译程序设法减少通信开销。 .