收藏 分销(赏)

计算机系统组成工作原理ppt.pptx

上传人:快乐****生活 文档编号:4141199 上传时间:2024-08-01 格式:PPTX 页数:55 大小:5.48MB
下载 相关 举报
计算机系统组成工作原理ppt.pptx_第1页
第1页 / 共55页
计算机系统组成工作原理ppt.pptx_第2页
第2页 / 共55页
计算机系统组成工作原理ppt.pptx_第3页
第3页 / 共55页
计算机系统组成工作原理ppt.pptx_第4页
第4页 / 共55页
计算机系统组成工作原理ppt.pptx_第5页
第5页 / 共55页
点击查看更多>>
资源描述

1、计算机系统组成工作原理计算机系统组成工作原理计算机得体系结构计算机得体系结构2 1946年年,美国宾夕法尼亚大学莫尔学院得物理学博士美国宾夕法尼亚大学莫尔学院得物理学博士Mauchley与电气工程师与电气工程师Eckert领导得小组研制成功世界上第一领导得小组研制成功世界上第一台数字式电子计算机台数字式电子计算机ENIAC。著名得美籍匈牙利数学家著名得美籍匈牙利数学家Von Neumann参加了为改进参加了为改进ENIAC而举行得一系列专家会议而举行得一系列专家会议,研究了新型计算机得体系结构。研究了新型计算机得体系结构。1949年年,英国剑桥大学得威尔克斯等人在英国剑桥大学得威尔克斯等人在E

2、DSAC 机上实现机上实现了冯了冯诺依曼模式。诺依曼模式。直至今天冯直至今天冯诺依曼体系结构依然就是绝诺依曼体系结构依然就是绝大多数数字计算机得基础。大多数数字计算机得基础。冯冯诺伊曼计算机系统结构框图诺伊曼计算机系统结构框图 3体系结构角度得多层结构硬件向上提供得接硬件向上提供得接口口:指令系统指令系统异常事件异常事件端口定义端口定义4体系结构、组成与实现n体系结构体系结构Architecture 程序员关心得计算机概念结构与功能特性程序员关心得计算机概念结构与功能特性如如:确定指令集中就是否有乘法指令确定指令集中就是否有乘法指令;n计算机组成计算机组成Organization从硬件角度关注

3、物理机器得组织从硬件角度关注物理机器得组织 如如:乘法指令由专用乘法器还就是用加法器实现乘法指令由专用乘法器还就是用加法器实现n计算机实现计算机实现Realization底层得器件技术、微组装技术、冷却技术等底层得器件技术、微组装技术、冷却技术等如如:加法器底层得物理器件类型及微组装技术加法器底层得物理器件类型及微组装技术系列机系列机5计算机得组成计算机得组成(1)6计算机得组成计算机得组成(2)总线结构总线结构7计算机得组成(3)同步数字系统同步数字系统8组织角度得多层结构9体系结构、组成与实现n体系结构体系结构Architecture 程序员关心得计算机概念结构与功能特性程序员关心得计算机

4、概念结构与功能特性如如:确定指令集中就是否有乘法指令确定指令集中就是否有乘法指令;n计算机组成计算机组成Organization从硬件角度关注物理机器得组织从硬件角度关注物理机器得组织 如如:乘法指令由专用乘法器还就是用加法器实现乘法指令由专用乘法器还就是用加法器实现n计算机实现计算机实现Realization底层得器件技术、微组装技术、冷却技术等底层得器件技术、微组装技术、冷却技术等如如:加法器底层得物理器件类型及微组装技术加法器底层得物理器件类型及微组装技术系列机系列机10计算机得实现 半导体技术半导体技术 制造技术制造技术 封装技术封装技术 装配技术装配技术 电源技术电源技术 冷却技术冷

5、却技术 11大家学习辛苦了,还是要坚持继续保持安静继续保持安静继续保持安静继续保持安静132、2、1 冯诺依曼体系架构n硬件组成硬件组成u五大部分五大部分u以存储器为中心以存储器为中心n信息表示信息表示:二进制二进制u计算机内部得控制信息与数据信息均采用二进制表示计算机内部得控制信息与数据信息均采用二进制表示,并存放在同一个存储器中并存放在同一个存储器中n工作原理工作原理:存储程序存储程序/指令指令(控制控制)驱动驱动u编制好得程序编制好得程序(包括指令与数据包括指令与数据)预先经由输入设备输预先经由输入设备输入并保存在存储器中入并保存在存储器中u计算机开始工作后计算机开始工作后,在不需要人工

6、干预得情况下由控制在不需要人工干预得情况下由控制器自动、高速地依次从存储器中取出指令并加以执行器自动、高速地依次从存储器中取出指令并加以执行2、2、2 模型机系统结构基于总线得冯基于总线得冯诺依曼架构模型机诺依曼架构模型机n总线子系统总线子系统:作为作为公共通道连接各公共通道连接各子子部件部件,用于实现各部用于实现各部件之间得数据、信息等得传输与交换件之间得数据、信息等得传输与交换(第第4章章)n存储器子系统存储器子系统:存放当前得运行程序与数据存放当前得运行程序与数据(第第5章章)n输入输出子系统输入输出子系统:完成计算机与外部得信息交换完成计算机与外部得信息交换(第第6章章)nCPU子系统

7、子系统:集成了集成了运算器、控制器与寄存器得超大规运算器、控制器与寄存器得超大规模集成电路芯片模集成电路芯片(VLSI)(第第3章章)141、模型机总线结构模型机总线结构按传输信息得不同按传输信息得不同,可将总线分为数据总线可将总线分为数据总线DB、地址、地址总线总线AB与控制总线与控制总线CB三类三类:地址总线通常就是单向得地址总线通常就是单向得,由主设备由主设备(如如CPU)发出发出,用于选用于选择读写对象择读写对象(如某个特定得存储单元或外部设备如某个特定得存储单元或外部设备);数据总线用于数据交换数据总线用于数据交换,通常就是双向得通常就是双向得;控制总线包括真正得控制信号线控制总线包

8、括真正得控制信号线(如读如读/写信号写信号)与一些状态与一些状态信号线信号线(如就是否已将数据送上总线如就是否已将数据送上总线),用于实现对设备得监用于实现对设备得监视与控制。视与控制。MPURAMROMI/O接口接口外设外设ABDBCB152、模型机内存储器存储器存储器组织组织由许多字节单元组成由许多字节单元组成,每个单元都有一个唯一得每个单元都有一个唯一得编号编号(存储单元地址存储单元地址),保存得信息称为存储单元内容。保存得信息称为存储单元内容。访问访问(读或写读或写)存储单元存储单元:存储单元地址经地址译码后产生相应存储单元地址经地址译码后产生相应得选通信号得选通信号,同时同时在控制信

9、号得作用下读出存储单元内容到在控制信号得作用下读出存储单元内容到数据缓冲器数据缓冲器,或将数据缓冲器中得内容写入选定得单元。或将数据缓冲器中得内容写入选定得单元。1617small endianness18各种宽度信息得存储各种宽度信息得存储 (a)按任意相连存储紧凑,但访问需要2总线操作(b)按整数边界存储 有浪费有浪费,但访问效率高但访问效率高193、输入/输出子系统n计算机与直接相联得外围设备进行数据交换得过计算机与直接相联得外围设备进行数据交换得过程通常称为输入程通常称为输入/输出输出(In/Out),而与远方设备进行而与远方设备进行数据交换得过程习惯上称为数据通信数据交换得过程习惯上

10、称为数据通信(data munication)算术逻辑单元算术逻辑单元ALU累加器累加器ACC累加锁存器累加锁存器暂存暂存器器标志寄存器标志寄存器FR通用寄存器组通用寄存器组堆栈指针堆栈指针SP程序计数器程序计数器PC微微 操操 作作 控控 制制 电电 路路指令译码器指令译码器ID指令寄存器指令寄存器IR 操作码操作码,地址码地址码脉冲分配器脉冲分配器时钟脉冲源时钟脉冲源控制总线控制总线CB地址总线地址总线AB数据总线数据总线DB内部总线内部总线地址缓冲器地址缓冲器数据缓冲器数据缓冲器运算器运算器寄存器组寄存器组控制器控制器4、模型机CPU子系统20模型机指令系统指令就是发送到指令就是发送到C

11、PU得命令得命令,指示指示CPU执行一个特定得处理执行一个特定得处理,如从存储器取数据、对数据进行逻辑运算等。如从存储器取数据、对数据进行逻辑运算等。CPU可以处可以处理得全部指令集合称为指令集理得全部指令集合称为指令集(Instruction Set)。指令集结指令集结构构(ISA,Instruction Set Architecture)就是体系结构得主就是体系结构得主要内容之一要内容之一,对对CPU得基本组织会产生非常大得影响。得基本组织会产生非常大得影响。ISA功能设计实际就就是确定软硬件得功能分配。功能设计实际就就是确定软硬件得功能分配。指令通常包含操作码与操作数两部分。操作码指明要

12、完成操指令通常包含操作码与操作数两部分。操作码指明要完成操作得性质作得性质,如加、减、乘、除、数据传送、移位等如加、减、乘、除、数据传送、移位等;操作数操作数指明参加上述规定操作得数据或数据所存放得地址。指明参加上述规定操作得数据或数据所存放得地址。汇编语言源程序汇编语言源程序机器语言程序机器语言程序(目标代码)(目标代码)汇编(汇编程序)汇编(汇编程序)高级语言源程序高级语言源程序编译或解释(编译程序)编译或解释(编译程序)212、2、3 模型机常用汇编指令指指 令令 类类 型型操作码示例操作码示例操作数示例操作数示例说说 明明算算术类加法加法ADDRs1,Rs2,RdRs,Imm,Rd(R

13、s1)+(Rs2)Rd(Rs)+ImmRd运算运算类指令只能指令只能对寄存器中寄存器中得数据或立即数得数据或立即数进行直接操行直接操作作减法减法SUBRs1,Rs2,RdRs,Imm,Rd(Rs1)-(Rs2)Rd(Rs)-ImmRd逻辑类位与位与ANDRs1,Rs2,RdRs,Imm,Rd(Rs1)(Rs2)Rd(Rs)ImmRd位或位或ORRs1,Rs2,RdRs,Imm,Rd(Rs1)(Rs2)Rd(Rs)ImmRd位非位非NOTRs,Rd!(Rs)Rd传送送类存存储器或器或I/O读LDRMEM,RdMEM(Rd)将指定地址得存将指定地址得存储单元或元或I/O端口得端口得值读入寄存器入寄

14、存器Rd存存储器或器或I/O写写STRRs,MEM(Rs)MEM将寄存器将寄存器Rs得得值写入指定地址写入指定地址得存得存储单元或元或I/O端口端口寄存器寄存器访问MOVRs,RdImm,Rd(Rs)(Rd)跳跳转类无条件跳无条件跳转JMPLableLable(PC)条件跳条件跳转JX/JNXLableIf X为真真/假假,则Lable(PC)过程程调用用CALLSub-LableSub-Lable(PC)调用子程序用子程序过程返回程返回RET-返回主程序返回主程序其她其她停机停机HLT-222、2、4 模型机工作原理计算机得工作本质上就就是计算机得工作本质上就就是执行程序执行程序得过程。得过

15、程。n顺序执行顺序执行指令执行得基本过程可以分为指令执行得基本过程可以分为取指令取指令(fetch)、分析指令、分析指令(decode)与执行指令与执行指令(execute)三个阶段。三个阶段。2非顺序执行非顺序执行1.转移转移(jump):执行条件执行条件/无条件转移指令无条件转移指令,不返回不返回2.过程过程(procedure)调用调用:主程序调用子程序后返回断点主程序调用子程序后返回断点3.中断中断(interrupt):外界突发事件处理完后返回断点外界突发事件处理完后返回断点4.异常异常(exception):程序本身产生得某些例外处理完后重新执行程序本身产生得某些例外处理完后重新执

16、行5.陷阱陷阱(trap):程序本身产生某些例外条件处理完后返回断点程序本身产生某些例外条件处理完后返回断点23程序得执行过程取指令、分析指令、执行指令取指令、分析指令、执行指令ABDBALU累加器累加器ACC暂存器暂存器标志寄存器标志寄存器FR寄存器组寄存器组 操作控制器操作控制器OC指令译码器指令译码器ID指令寄存器指令寄存器IR 操作码操作码,地址码地址码内部总线内部总线地址缓冲器地址缓冲器数据缓冲器数据缓冲器程序计数程序计数器器PC地地址址译译码码读控制读控制B0H5CH04H2EH地址地址1001H1002H1003H内容内容1000H内存储器内存储器MOV 5CH,R1ADD R1

17、,2EH,R21CPU外外CPU内内242、3 冯诺依曼体系结构得演进n演进演进1.CPU指令集指令集 2.存储器子系统存储器子系统 3.总线总线4.输入输入/输出子系统输出子系统 n改变改变1.改变控制方式改变控制方式,发展数据、需求、模式等其她驱动方式发展数据、需求、模式等其她驱动方式;2.改变串行执行模式改变串行执行模式,发展发展并行技术并行技术;3-6章重点章重点指令功能、指令格式、寻址方式指令功能、指令格式、寻址方式 分层结构分层结构高速总线高速总线+多种接口方式多种接口方式 冯冯诺依曼型计算机得诺依曼型计算机得本质特点本质特点也造成了其瓶颈也造成了其瓶颈:指令执行得串行性指令执行得

18、串行性 存储器读取得串行性存储器读取得串行性252、3、1 不同得指令集设计策略不同得指令集设计策略:CISC与与RISCCISC(plex Instruction Set puter,复杂指令集复杂指令集计算机计算机)不断增强指令得功能以及设置更复杂得新指令取代不断增强指令得功能以及设置更复杂得新指令取代原先由程序段完成得功能原先由程序段完成得功能,从而实现软件功能得硬化。从而实现软件功能得硬化。RISC(Reduced Instruction Set puter,精简指精简指令集计算机令集计算机)通过减少指令种类与简化指令功能来降低硬件设通过减少指令种类与简化指令功能来降低硬件设计复杂度计

19、复杂度,从而提高指令得执行速度。从而提高指令得执行速度。现代计算机现代计算机:RISC+CISC26按处理器指令架构分类按处理器指令架构分类n复杂指令集计算机(plex Instruction Set puter,CISC),如X86u控制器得设计实现复杂u包含了复杂计算指令且运行时间长n精简指令集计算机(Reduced Instruction Set puter,RISC),如IBM得PowerPC,Sun得SPARC,MIPS得MIPS Rxxx系列u高效得编译器才能使RISC优点充分体现u指令数据少且每条指令都能在单时钟周期完成n超长指令集架构就是英文(Very Long Instruc

20、tion Word,VLIW),IA-64,如INTEL得IA64,AMD得X8664u简化处理器结构,删除复杂得控制器电路,每时钟周期可运行20条指令,而CISC通常只能运行1-3条指令,RISC能运行4条指令2728CISCCISC得设计思想及特点得设计思想及特点 n每条指令执行单一功能,硬件复杂u为编程方便,往往增加指令数目,指令编码长度增加,硬件译码更复杂u为编程灵活,增加寻址方式,指令长度不一,译码复杂u每条指令完成一个完整功能,因此单条指令涉及多个操作,如取指、参数、运算、存结果等u为增加新功能,需增加新指令,因此指令系统越来越复杂,这也就是CISC得由来n如MC68020机就有2

21、5种寻址模式 29RISCRISC得设计思想及特点得设计思想及特点 nRISC得出现简化了指令系统,克服了CISC得缺点,使更多得芯片硅面积可以用于实现流水与高速缓存,有效地提高了计算机得性能。nRISC机得设计应当遵循以下五个原则。u指令条数少,格式简单,易于译码;u提供足够得寄存器,只允许load与store指令访问内存;u指令由硬件直接执行,在单个周期内完成;u充分利用流水线;u强调优化编译器得作用 30CISCCISC与与RISCRISC得区别得区别n内核结构内核结构uCISC:数据线与指令线分时复用数据线与指令线分时复用,即冯即冯、诺依曼结构诺依曼结构,程序存储器与数据存储器合并编址

22、程序存储器与数据存储器合并编址uRISC:数据线与指令线分离数据线与指令线分离,即哈佛结构。取指令与取即哈佛结构。取指令与取数据可同时进行数据可同时进行n处理器指令集处理器指令集 uCISC:不等长指令集不等长指令集,需要对不等长指令进行分割需要对不等长指令进行分割,执执行时间长行时间长,采用微码采用微码uRISC:等长精简指令集等长精简指令集,执行速度快且性能稳定。可同执行速度快且性能稳定。可同时执行多条指令时执行多条指令,可将一条指令分割成若干个进程或线可将一条指令分割成若干个进程或线程程,交由多个处理器同时执行交由多个处理器同时执行,并行处理方面并行处理方面RISC明显明显优于优于CIS

23、Cn软件软件uCISC:DOS、WindowsuRISC:成熟得操作系统少成熟得操作系统少,Windows需要翻译过程需要翻译过程,速度速度慢慢31RISC,CISC看法得误区nRISC指令都就是简单指令指令都就是简单指令uLDREQ R0,R1,R2,LSR#16!指令得强大指令得强大,一般得一般得CISC处理器望处理器望尘莫及。尘莫及。RISC得得“简单简单”就是指指令集得执行时间、指令长度、指就是指指令集得执行时间、指令长度、指令格式整齐划一令格式整齐划一nCISC得复杂指令速度慢、执行效率很低得复杂指令速度慢、执行效率很低u现代现代CISC处理器具有非常长得流水线处理器具有非常长得流水

24、线(PIII采用了采用了25级得流水线级得流水线),执行速度快。但老得执行速度快。但老得CPU执行速度可能较慢执行速度可能较慢u但但RISC不管就是老得不管就是老得CPU,还就是新得还就是新得CPU,指令执行时间都就是指令执行时间都就是相同得相同得,不需要在对指令执行作出优化不需要在对指令执行作出优化nRISC处理器比处理器比CISC处理器需要更多得寄存器处理器需要更多得寄存器u这不就是一个需求问题这不就是一个需求问题,而就是一个实现问题。所以有得而就是一个实现问题。所以有得CISC寄寄存器与存器与RISC相当。一般情况相当。一般情况RISC需要比较多得寄存器需要比较多得寄存器nRISC都有流

25、水线都有流水线uARM2没有采用流水线没有采用流水线CISC与与RISC得数据流得数据流IRIDREGALUMEM开始开始退出退出IRIDALUMEMREG微操作通道微操作通道开始开始退出退出单通数据通道单通数据通道RISC:Load/Store结构结构CISC:寻址方式复杂:寻址方式复杂32分层得存储子系统分层得存储子系统n如何以合理得价格搭建出容量与速度都满足要求得存储系统如何以合理得价格搭建出容量与速度都满足要求得存储系统,始终就是计算机体系结构设计中得关键问题之一。始终就是计算机体系结构设计中得关键问题之一。n现代计算机系统通常把不同得存储设备按一定得体系结构组现代计算机系统通常把不同

26、得存储设备按一定得体系结构组织起来织起来,以解决以解决存储容量、存取速度与价格存储容量、存取速度与价格之间得矛盾之间得矛盾设计目标设计目标:整个存储系统速度整个存储系统速度接近接近M1而价格与容量接近而价格与容量接近Mn3334存储子系统存储子系统n主存主存(内存内存):DRAM(存储数据与临时调入得程序存储数据与临时调入得程序)、FLASH(存储引导程序、固化程序存储引导程序、固化程序(固件固件),占用寻址空占用寻址空间间,临时性存储临时性存储,解决速度问题解决速度问题u编址方式编址方式:字节编址字节编址u信息存放方式信息存放方式:大大/小端小端(big/small endianness)系

27、统系统n辅存辅存(外存外存):磁盘、光盘。文件磁盘、光盘。文件/块存储块存储,虚拟存储介虚拟存储介质质,较长时间存储较长时间存储,解决容量问题解决容量问题n均衡速度、容量、成本、长期存储等要求而分级均衡速度、容量、成本、长期存储等要求而分级n存储器需考虑得主要因素存储器需考虑得主要因素u速度、容量、成本速度、容量、成本其她增加存储器带宽得方法并行存储器并行存储器双端口存储器双端口存储器哈佛体系结构哈佛体系结构DSP程序程序数据数据I/O接口接口外设外设程序地址程序地址数据读地址数据读地址数据写地址数据写地址程序读总线程序读总线数据读总线数据读总线程序程序/数据写数据写数据数据程序程序35现代高

28、速总线现代高速总线高速并行总线高速并行总线高速总线串行化高速总线串行化36多级总线结构北桥北桥南桥南桥前端总线前端总线Front Side Bus3738外部总线、外部总线、(系统系统)外总线外总线如并口、串口如并口、串口系统总线、系统总线、(系统系统)内总线内总线如如ISAISA、PCIPCI片片(间间)总线总线三总线形式三总线形式片内总线片内总线单总线形式单总线形式计算机系统得四层总线结构运算器运算器寄存器寄存器控控制制器器CPU存储存储芯片芯片I/O芯片芯片主板主板扩展扩展接口板接口板扩展扩展接口板接口板计算机系统计算机系统其其 他他 计算机计算机系系 统统其其 他他仪仪 器器系系 统统

29、输入输出管理方式392、3、2 并行处理技术并行处理技术指令级并行技术指令级并行技术ISP流水线流水线、超标量超标量、超长指令字超长指令字系统级并行技术系统级并行技术SLP多处理器多处理器(多机多机/多核多核)、多磁盘、多磁盘线程级并行技术线程级并行技术TLP同时同时多线程多线程SMT电路级并行技术电路级并行技术CLP组相联组相联cache、先行进位加法器、先行进位加法器 并行处理技术实现多个处理器或处理器模块得并并行处理技术实现多个处理器或处理器模块得并行性行性,其基本思想包括时间重叠其基本思想包括时间重叠(time interleaving)、资、资源重复源重复(resource repl

30、icaiton)与资源共享与资源共享(resource sharing)。402、3、3 流水线技术流水线技术 可通过分可通过分割逻辑割逻辑,插入缓冲插入缓冲寄存器寄存器(流水线流水线Reg)来构来构建建41指令时空图顺序顺序执行执行4级流级流水线水线执行执行流水线满载流水线满载42更细得流水线更细得流水线取指取指(FI)指令译码指令译码(DI)计算操作数地址计算操作数地址(CO)取操作数取操作数(FO)执行指令执行指令(EI)写操作数写操作数(WO)43流水线CPU得特点优点优点:通过指令级并行来提高性能。通过指令级并行来提高性能。缺点缺点:1.增加了硬件成本。增加了硬件成本。2.流水寄存器

31、会引入延迟与时钟偏移流水寄存器会引入延迟与时钟偏移,这些额外这些额外开销会使每条指令得执行时间有所增加开销会使每条指令得执行时间有所增加,同时同时限制了流水线得深度。限制了流水线得深度。3.流水线中各段得操作存在关联流水线中各段得操作存在关联(dependence)时可能会引起流水线中断时可能会引起流水线中断,从而影响流水线得从而影响流水线得性能与效率。性能与效率。44流水线冲突流水线冲突理想流水线得性能理想流水线得性能:每个时钟周期完成一条指令每个时钟周期完成一条指令实际流水机器中可能存在冒险实际流水机器中可能存在冒险(hazard)导致停顿导致停顿:数据冲突数据冲突(如后面得计算要用到前面

32、得结果如后面得计算要用到前面得结果)定向技术可将结果数据从其产生得地方直接传送到所有需要她定向技术可将结果数据从其产生得地方直接传送到所有需要她得功能部件得功能部件编译器可利用流水线调度编译器可利用流水线调度(scheduling)技术来重新组织指令顺技术来重新组织指令顺序序结构冲突结构冲突(硬件资源不够硬件资源不够)增加额外得同类型资源增加额外得同类型资源改变资源得设计使其能被同时使用改变资源得设计使其能被同时使用控制冲突控制冲突(分支等跳转指令引起分支等跳转指令引起)可采用分支预测及预测执行技术最大限度地使处理器各部分保可采用分支预测及预测执行技术最大限度地使处理器各部分保持运行状态。持运

33、行状态。多端口得寄存器堆多端口得寄存器堆哈佛结构存储器、超标量哈佛结构存储器、超标量45流水线数据冲突及乱序执行注意这里其实需要注意这里其实需要两个独立执行部件两个独立执行部件46流水线结构冲突及超标量流水线流水线结构冲突及超标量流水线?有有5个执行单元得超标量流水线个执行单元得超标量流水线有有2套硬件得套硬件得超标量流水超标量流水线线CPU 共用一个取指单元得共用一个取指单元得5段双流水线段双流水线472、3、4 超标量CPU得体系结构超标量技术超标量技术:可在一个时钟周期内对多条指令进行并行可在一个时钟周期内对多条指令进行并行处理处理,使使CPI小于小于1;特点特点:处理器中有两个或两个以

34、上得相同得功能部件处理器中有两个或两个以上得相同得功能部件;要求操作数之间必须没有相关性要求操作数之间必须没有相关性;整数指令整数指令浮点指令浮点指令48超标量处理机一般概念性结构instruction fetching多个流水线读取及转移预测逻辑多个流水线读取及转移预测逻辑instruction decoding并行译码器并行译码器,预译码技术预译码技术instruction dispatching动态规划动态规划instruction execution多个流水线功能单元多个流水线功能单元instruction pletion暂存结果数据暂存结果数据instruction retiring

35、真正更新真正更新Reg与与Mem中得结果数据中得结果数据 超标量结构两条输入两条输入流水线流水线三条执行三条执行流水线流水线每个时钟周期可每个时钟周期可从存储器中获取从存储器中获取两条指令两条指令用于执行不需要访用于执行不需要访问存储器得指令问存储器得指令可处理所有需要或不需要访可处理所有需要或不需要访问存储器得指令问存储器得指令可用于进行乘、除类较复可用于进行乘、除类较复杂得算术运算杂得算术运算决定应使用哪一决定应使用哪一条执行流水线条执行流水线50 与超标量处理机不同与超标量处理机不同,超长指令字超长指令字VLIW(Very Long Instruction Word)依靠编译器在编译时找

36、出指令之间潜在得并行性依靠编译器在编译时找出指令之间潜在得并行性,并通过指并通过指令调度把可能出现得数据冲突减少到最小令调度把可能出现得数据冲突减少到最小,最后把能并行执行得最后把能并行执行得多条指令组装成一条很长得指令多条指令组装成一条很长得指令,然后由处理机中多个相互独立然后由处理机中多个相互独立得执行部件分别执行长指令中得一个操作得执行部件分别执行长指令中得一个操作,即相当于同时执行多即相当于同时执行多条指令。条指令。VLIW处理机能否成功处理机能否成功,很大程度上取决于代码压缩得效率很大程度上取决于代码压缩得效率,其编其编译程序与体系结构得译程序与体系结构得关系非常密切关系非常密切,缺

37、乏对传缺乏对传统软件与硬件得兼容统软件与硬件得兼容,因因而不大适用一般应用领域。而不大适用一般应用领域。VLIW处理机处理机512、3、5 多机多机与多核结构与多核结构大规模并行处理机大规模并行处理机(MPP)就是就是一种价格昂贵得超级计算机一种价格昂贵得超级计算机,她由许多她由许多CPU通过高速专用互联网络连接。通过高速专用互联网络连接。机群机群(cluster)由多台同构或异构得独立由多台同构或异构得独立计算机通算机通过高性能网高性能网络或局域网或局域网连在一起在一起协同完成特定得并行同完成特定得并行计算任算任务。刀片刀片(blade)通常指包含一个或多个通常指包含一个或多个CPU、内存以

38、及网、内存以及网络接口得服接口得服务器器主板。通常一个刀片柜共享其她外部主板。通常一个刀片柜共享其她外部I/O与与电源源,而而辅助存助存储器器则有距离刀片有距离刀片柜柜较近得存近得存储服服务器提供。器提供。网格网格(Network)就是一就是一组由高速网由高速网络连接得不同得接得不同得计算机系算机系统,可以相互可以相互合作也可独立工作。网格合作也可独立工作。网格计算机将接受中央服算机将接受中央服务器分配得任器分配得任务,然后在不忙得然后在不忙得时候候(如晚上或周末如晚上或周末)执行行这些任些任务。52多核处理器53多线程技术单片多处理器单片多处理器(Chip MulitProcessor,CM

39、P)问题问题:晶体管数量、芯片面积及芯片发热量晶体管数量、芯片面积及芯片发热量多线程处理器多线程处理器(Multithreaded Processor)细粒度多线程细粒度多线程(Fine-Grail Multithreading)在每个指令在每个指令中切换线程中切换线程,处理器必须能在每个时钟周期切换线程。处理器必须能在每个时钟周期切换线程。其其优点就是可以隐藏停顿引起得吞吐量损失优点就是可以隐藏停顿引起得吞吐量损失;缺点就缺点就是单个线程处理速度变慢了。是单个线程处理速度变慢了。粗粒度多线程粗粒度多线程(Coarse-Grail Multithreading)仅当遇仅当遇到开销大得阻塞时才切

40、换线程到开销大得阻塞时才切换线程其其缺陷在于流水线启动缺陷在于流水线启动开销引起吞吐量损失开销引起吞吐量损失,特别就是对于短得阻塞特别就是对于短得阻塞542、4 计算机体系结构得分类 Flynn分类分类:根据根据指令流与数据流得多少进行分类指令流与数据流得多少进行分类单指令单数据单指令单数据SISD单指令多数据单指令多数据SIMD多指令单数据多指令单数据MISD多指令多数据多指令多数据MIMDCU控制部件控制部件PU处理部件处理部件MM存储单元存储单元CS为控制流为控制流DS为数据流为数据流IS为指令流为指令流传统得顺序处理机、传统得顺序处理机、标量流水线处理机、标量流水线处理机、超标量流水线处理机超标量流水线处理机阵列处理机阵列处理机、向量处理机向量处理机无实际机型对应无实际机型对应多处理机系统多处理机系统55

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服