资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,Company Logo,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二层,第三层,第四层,第五层,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二层,第三层,第四层,第五层,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二层,第三层,第四层,第五层,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,Company Logo,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,Company Logo,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,Company Logo,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,Company Logo,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二层,第三层,第四层,第五层,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二层,第三层,第四层,第五层,*,计算机硬件技术基础,第,1,章 微型计算机系统概述,1.1,微型计算机的发展历程,1.2,微型计算机的基础知识,1.3,机内数据和指令的表示,1.4,微型计算机性能,1.5,计算机性能测试程序,1.1,微型计算机的发展历程,1.1.1,发展历史,1946,年世界第,1,台计算机诞生,计算机硬件的发展历史(共,4,代),第,1,代,第,2,代,第,3,代,第,4,代,1.1,微型计算机的发展历程,1.1.2,微型计算机,定义,微型机即个人计算机(,PC,机),按体积划分的计算机。,微型计算机的发展历史(共,6,代),第,1,代(,4,位),第,2,代(,8,位),第,3,代(,16,位),第,4,代(,32,位),第,5,代(,64,位),第,6,代(高性能微处理器),1.1,微型计算机的发展历程,1.1.2,微型计算机,硬件发展规律,(1)Moore,定律,(2)Bell,定律,(3)Gilder,定律,(4)Metcalfe,定律,(,5,),半导体存储器发展,规律,(,6,),硬盘存储技术发展规律,1.1,微型计算机的发展历程,1.1.3,微型计算机的应用和,特点,应用领域,(,1,),科学,计算,(,2,),过程检测与,控制,(3,)信息管理,(4,),计算机辅助,系统,(,5,),半导体存储器发展,规律,(,6,),硬盘存储技术发展,规律,1.1,微型计算机的发展历程,1.1.3,微型计算机的应用和,特点,2.,特点,(,1,),高性能,、低价格,(,2,),体积,小、功耗,低,(,3,),可靠性高,(,4,),应用,面广泛,1.1,微型计算机的发展历程,1.1.4,微型机的,分类,1,按制造,工艺,2按机器,组成,3按机器字长,1.1,微型计算机的发展历程,1.1.5,一体机与平板,电脑,1,一体机,一体机又称一体台式机,是指将传统分体台式机的主机集成到显示器中,从而形成一体台式机,。,1.1,微型计算机的发展历程,1.1.5,一体机与平板,电脑,1,平板电脑,计算机所有的部件集成到了一块平板上,以显示屏(触摸屏)作为基本的输入设备。触摸屏允许用户通过触控笔或数字笔来进行输入而不是传统的键盘或鼠标,。,1.2,微型计算机基础知识,1.2.1,冯,诺依曼计算机的基本,结构,计算机应包括运算器、存储器、控制器、输入设备、输出设备五大基本部件,。,1.2,微型计算机基础知识,1.2.2,微型计算机的工作流程,(1)取出指令,(2)分析指令,(3)执行指令,(,4,),形成下一条指令的地址,1.2,微型计算机基础知识,1.2.3,微型计算机系统的组成,1.2,微型计算机基础知识,1.2.4,微型计算机系统的组成,1.2,微型计算机基础知识,1.2.4,微型计算机系统的,组成,存储系统的容量,1KB=210B=1024B,1,MB=210KB=1024KB,1GB=210MB=1024MB,1TB=210GB=1024GB,1.3,计算机内数据和指令的表示,1.3.1,计算机中的,数制,二进制、八进制、十进制与十六进制,数制之间的转换,计算机为何采用二进制,1.3,计算机内数据和指令的表示,1.3.2,计算机中的数的表示,1.符号位数字化,2.符号位如何运算,3.小数点的表示,1,),定点表示法,2,),浮点表示法,1.3,计算机内数据和指令的表示,1.3.3,西文字符与汉字的编码,1字符的编码,ASC,编码,2汉字的编码,1,)机内码,2,)国标码,3,)输入码,4,)字形码,5,)地址码,1.4,微型计算机性能,1.4.1,微型计算机性能的主要标准,1CPU的字长,2运算速度,3内存容量,4存取周期,5.输入输出数据传输速率,6.可靠性,7.兼容性,1.4,微型计算机性能,1.4.2CPU,性能,1主频,2多核,3工作电压,4协处理器,5流水线技术与超标量,6乱序执行和分支预测,7高速缓存,8制造工艺,1.4,微型计算机性能,1.4.2,CPU,性能,9,执行指令的时间,MIPS,(,Million Instruction Per Second,),MFLOPS,(,Million Floating Point Operations Per Second,),1.4,微型计算机性能,1.4.3,总线的性能,1总线宽度,2总线时钟,3最大数据传输速率,(带宽),4信号线数,5负载能力,1.4,微型计算机性能,1.4.4,外设的性能,1,.,硬盘,的,性能,2,.,光盘驱动器,的性能,3.USB,外设的性能,4.1394,总线外设的性能,5.,打印机的性能,6.,键盘和鼠标的性能,1.4,微型计算机性能,1.4.5,计算机性能测试,程序,SiSoft Sandra、HWiNFO、WinBench99、PCMark,2002,等测试程序,以,EVEREST,为例进行说明,1.5,微型机性能测试程序,1.4.5,计算机性能测试程序,第,2,章 微处理器及其管理,中央处理器即通常所谓的,CPU,(,Central Processing Unit,),是计算机的运算和控制核心。作为计算机中最核心的部件,,CPU,负责读取指令,对指令译码并执行指令。,CPU,通过执行指令,实现运算和控制过程。,在日常生活中人们通常以,CPU,的类型来判断计算机的档次,例如,装有,Pentium 4 CPU,的是,P4,计算机、装有,Pentium III CPU,的是,P3,计算机等。虽然这种方法不太准确,但也说明了在计算机的性能指标中,CPU,起着决定性的作用。,本章要点,2.1,微处理器的基本知识,2.2,微处理器技术,2.3,典型的微处理器,2.4,微处理器的性能测试程序,习题,2,本章逻辑结构,2.1微处理器的基本知识,2.1.1 微处理器的发展历程,2.1.2 微处理器的组成,2.1.3 微处理器的内部结构,2.1.4 微处理器的工作模式,2.1.5 微处理器的指令系统,2.1.5微处理器的接口类型,2.2,微处理器技术,2.2.1,流水线技术,2.2.2,动态执行技术,2.2.3,多内核技术,2.2.4,RISC,技术,2.2.5,多媒体和超线程技术,本章逻辑结构,2.3,精简,典型的微处理器,2.3.1 Intel,微处理器,2.3.1 AMD,微处理器,2.4,微处理器的性能测试程序,2.4.1 MMX,技术,2.4.2 CPU,的编号,2.4.3,微处理器性能测试,2.1,微处理器的基本知识,2.1.1,微处理器的发展历程,1974,年,著名的美国,Intel,公司发明了世界上第一片微处理器,Intel 4004,1989,年,,Intel,公司推出了,80486,芯片,这种芯片实破了,100,万个晶体管的的界限,集成了,120,万个晶体管。,1999,年,,Intel,公司发布了,PentiumIII,处理器。,2000,年,,Intel,公司发布了,Pentium4CPU,。,随后的,10,年里,,Intel,公司在,X86,的体系架构上,发展了双核,CPU,、多核,CPU,,更快前端总线的,CPU,,低功耗高性能的移动处理平台,CPU,等等。,2.1,微处理器的基本知识,2.1.2,微处理器的组成,1,控制器,控制器是整个微机系统的指挥中心,对协调整个微机系统有序工作极为重要。其主要作用是控制程序的执行。包括对指令进行译码、寄存,并按指令要求完成规定的操作,即指令控制、时序控制和操作控制。,控制器主要由以下几个基本部分组成。,程序计数器(,PC,),又称指令计数器,用来确定下一条指令的地址。,指令寄存器(,IR,),用于暂存从内存中取出的将要进行译码处理的指令。,指令译码器(,ID,),用于解析获知指令的功能,并按规定格式将信息存储于寄存器。,时序和逻辑控制器,根据来自译码单元的指令,它会生成控制信号,告诉运算逻辑单元(,ALU,)和寄存器如何运算、对什么进行运算以及对结果进行怎样的处理。,控制器的主要功能有:,从内存中取一条指令,并指出下一条指令在内存中的位置;,对指令进行译码,产生相应的操作控制信号,以便启动规定的动作。,指挥并控制,CPU,、内存和输入,/,输出设备之间的数据流动方向。,2.1,微处理器的基本知识,2.1.2,微处理器的组成,2,运算器,控制器是运算器即算术逻辑单元(,ALU,,,Arithmetic Logic Unit,),是,CPU,芯片的运算部件。,ALU,主要由加法器组成,辅之以移位寄存器及相应控制逻辑组合而成的电路,它在控制信号的作用下可以对操作数进行算术或逻辑运算,输出运算结果。,运算器有两个主要功能:,执行各种算术运算;,执行各种逻辑运算,如两个值的比较等。,2.1,微处理器的基本知识,2.1.2,微处理器的组成,3,寄存器,寄存器是,CPU,内部的高速存储单元,用于存放程序运行过程中所使用的各种数据和,指令,除此外,它还负责存储指针跳转信息以及循环操作命令,是运算逻辑单元,(,ALU,)直接接口的存储区域。,在应用方面,“可编程”寄存器又可分为下面几种:,(,1,)通用寄存器,通用寄存器在,CPU,中数量多,使用频率高,是数据调度的主要部件,其中既可以存放数据,也可存放数据的地址。,(,2,)地址寄存器,地址寄存器用于存放数据的地址,用于存储器的寻址操作,或程序执行跳转地址,也称为地址指针寄存器。,(,3,)标志寄存器,标志寄存器(,Flags Register,,,FR,)是一个存放条件标志、控制标志寄存器,主要用于反映处理器的状态和运算结果的某些特征及控制指令的执行。标志寄存器中存储的信息称为程序状态字,(Program Status Word,,,PSW),,所以标志寄存器也称为,PSW,寄存器。,2.1,微处理器的基本知识,2.1.3,微处理器的内部结构,当前通用的微型计算机皆为,x86,体系结构,因此以,Intel,公司最早推出的,8086/8088 CPU,为例,描述微处理器的内部结构。,8086/8088 CPU,从功能上划分成两个独立部件:总线接口单元,BIU,(,Bus Interface Unit,)和执行单元,EU,(,Execution Unit,)。,执行单元,EU,是程序中各条指令执行的核心,完成指令译码、运算及其他操作的执行。执行单元,EU,从总线接口单元,BIU,的指令队列缓冲器中取出指令,由,EU,控制器的指令译码器译码产生响应的操作控制信号送给各部件。执行单元,EU,对操作数进行算术运算和逻辑运算,并将运算结果的状态特征保存到标志(状态)寄存器,FR,(,Flags Register,)中。,EU,并不直接与,CPU,外部系统相连,如果在指令执行过程中需要访问外部的主存储器或,I/O,设备取操作数,那么,EU,将访问地址送给,BIU,后,将要等待操作数据到来后才能继续操作。,EU,执行单元由算术逻辑单元(,ALU,)、标志寄存器、通用寄存器组和操作控制器电路等部件组成。,算术逻辑单元(,ALU,)主要完成算术运算、逻辑运算及数据传送等操作。,2.1,微处理器的基本知识,2.1.3,微处理器的内部结构,图,2.1 Intel 8086 CPU,的内部结构,SP,AL,AH,BP,BL,BH,SI,CL,CH,DI,DL,DH,通用寄存器,AX,BX,CX,DX,CS,DS,SS,ES,IP,内部寄存器,2,1,指令队列缓冲器,4,3,6,5,数,据,寄,存,器,地,址,寄,存,器,ALU,?,暂存寄存器,标志寄存器,EU,控制电路,总线,控制电路,ALU,数据总线,(,16,位,),8086,总线,DB,(,16,位,),DB,(,16,位,),AB,(,20,位,),地址,加法器,8,位,执行单元,EU,总线执行单元,BIU,2.1,微处理器的基本知识,2.1.4,微处理器的工作模式,微机中常用的,Intel,系列微处理器的主要发展历程是:,8080,,,8086/8088,,,80186,,,80286,,,80386,,,80486,,,Pentium,Pentium II,Pentium III,Pentium 4,等。除了,8080,、,8086/8088,具有两种工作模式外,其它都具有三种工作模式。,1,8080,、,8086/8088,微处理器,8086/8088,微处理器有两种工作模式:最大模式和最小模式。,最小模式系统中只有,8086,(或,8088,)一个微处理器。最小模式是单处理器系统。系统中所需要的控制信号全部由,8086,(或,8088,),CPU,本身直接生成。,最大模式系统中有两个或两个以上的微处理器,即除了主处理器,8086,(或,8088,)以外,还有协处理器(,8087,算术协处理器或,8089,输入,/,输出协处理器)。最大模式可构成多处理器系统,系统中所需要的控制信号由总线控制器,8288,提供。,2.1,微处理器的基本知识,2.1.4,微处理器的工作模式,。,2,80X86,、,Pentium,处理器,实模式和虚拟,86,模式是为了兼容,8086,处理器而设置的。在实模式下,,80X86,、,Pentium,处理器就相当于一个运行频率更高,速度更快、功能更强的,8086,处理器。,保护模式是,80X86,、,Pentium,处理器的主要工作模式。在此方式下,可以寻址,4 GB,的地址空间,同时,保护模式提供了多任务、内存分页管理和优先级保护等机制。,为了在保护模式下继续提供和,8086,处理器的兼容,,80X86,、,Pentium,又设计了一种虚拟,86,模式,以便可以在保护模式的多任务条件下,有的任务运行,32,位保护模式虚拟地址程序,有的任务运行,16,位的实地址程序。在虚拟,86,模式下,同样支持任务切换、内存分页管理和优先级,但内存的寻址方式和,8086,相同,也是可以寻址,1 MB,的空间。,2.1,微处理器的基本知识,2.1.5,微处理器的指令系统,。,指令是微处理器执行某种操作的命令,微处理器全部指令的集合称为指令系统。例如,Intel CPU,的,SSE,、,SSE2,指令集,,AMD CPU,的,3D Now!,指令集,不同的,CPU,系列,有着不同的指令系统。,8086,指令系统是所有,X86,系列,CPU,的指令系统的基础,,80286,、,80386,乃至,Pentium,等新型,CPU,的指令系统仅仅是在这个基础上做了一些扩充。,8086,的指令为,1-6,个字节,一般用指令的第一个或前两个字节表示指令的操作码和寻址方式,通常称为操作码域。操作码指出执行该指令时,CPU,要做什么,寻址方式则表示执行指令时所用的操作数的来源。,1,数据传送指令,数据传送指令是最基本、最重要、最常使用的一类指令,其基本功能是将数据从一个位置移动到另一个位置,完成寄存器与寄存器之间、寄存器与存储器之间以及寄存器与,I/O,端口之间的字节或字传送。它们所具有的共同特点是不影响标志寄存器的内容。数据传送指令又可细分为通用数据传送指令、输入输出传送指令、目标地址传送指令和标志传送指令等,4,类,。,2.1,微处理器的基本知识,2,算术运算指令,算术运算指令用于执行二进制的算术运算,即二进制数据的加、减、乘、除。表,2.2,给出了算术运算指令。,3,逻辑运算和移位指令,逻辑运算和移位指令用于对数据字节或字的二进制位进行操作。表,2.3,给出了逻辑运算和移位指令。,4,字符串操作指令,字符串可以是存储在存储器中的一组数据块或字节数据(例如,字母、数字),字符串操作指令用于字符串或数据块的处理。,5,控制转移指令,程序中的指令通常是顺序执行的,在,8086/8088,中,指令的执行顺序由代码寄存器,CS,和指令寄存器,IP,决定,当执行一条指令时,,IP,的内容就自动进行调整。如果需要改变程序指令的执行顺序,必须改变,IP,的值(或同时改变,CS,与,IP,的值),控制转移指令就是通过改变,CS,和,IP,的值来进行程序的转移。,2.1,微处理器的基本知识,6,处理器控制指令,处理器控制指令用于控制,CPU,的状态,使,CPU,暂停、等待或执行空操作等。表,2.6,给出了处理器控制指令。,2.1,微处理器的基本知识,2.1.3,微处理器的接口类型,在计算机中,主板是各个硬件设备的容器,,CPU,要进行工作也需要通过某个接口与主板连接。,从第一颗,8086,诞生到,386,问世,,CPU,都是被直接焊接在主板上,用户要升级电脑就必须同时更换主板与,CPU,。到了,386,末期,部分,CPU,被压固在主板上,借助工具可以插拔。,采用焊接方式连接在主板上的,CPU,不便于产品更换,而且随着,CPU,的发展,引脚增多,焊接方式也很难适应。,1989,年,英特尔发布了第一块,Socket 1,接口的,486DX,,采用了,ZIF,(,Zero Insertion Force,,零插拔力)设计,使得用户可以很方便的拆装处理器。,Socket,接口是由很多插针构成,主板上带有相同数目的插孔,,CPU,与主板连接时只需将插针对准插孔插入即可。需要注意的是一款,CPU,并不是在所有主板上都能连接,必须具有相匹配的插孔才行。,伴随着微处理器的发展,,CPU,的接口方式也不断变化,大致有引脚式、卡式、触点式、针脚式等。下面介绍几种比较常用的,CPU,接口。,2.1,微处理器的基本知识,1,Socket 7,Socket 7,接口最早应用在,Pentium MMX,系列,CPU,上,这种类型的,CPU,共有,321,个插针,,CPU,工作电压为,2.5V3.5V,。,Socket 7,是方形多针脚,ZIF,(零插拔力)插座,插座上有一根拉杆,在安装和更换,CPU,时只要将拉杆向上拉出,就可以轻易地插进或取出,CPU,芯片。,2,Slot 1,SLOT 1,接口的出现取代了,Socket 7,,它是英特尔公司为,Pentium II,系列,CPU,设计的插槽,其将,Pentium II CPU,及其相关控制电路、二级缓存都封装在一块子卡上,多数,Slot 1,主板使用,100MHz,外频。,SLOT 1,的技术结构比较先进,能提供更大的内部传输带宽和,CPU,性能。,3,Slot A,Slot A,和,Slot 1,差不多,只是,Slot A,使用,EV6,总线协议,而,Slot 1,使用,P6 GTL+,总线协议,但二者不能混用。支持,SLOT A,接口结构的主板芯片组主要有两种,一种是,AMD,的,AMD 750,芯片组,另一种是,VIA,的,Apollo KX133,芯片组。此类接口已被,Socket A,接口全面取代。,2.1,微处理器的基本知识,4,Socket 370,Intel,推出,Socket 370,接口取代了,Slot,接口,从外形上看,,Socket 370,和更早的,Socket 7,差不多,两者都采用零插拔力插槽。,Socket 370,接口对应的,CPU,是,370,针脚,工作电压为,2V1.475V,。,Socket 370,接口早期使用在,Mendocino,核心(,PPEG,封装)的,Celeron 333,和,Celeron 366,微处理器上,著名的,Coppermine,(铜矿)核心和,Tualatin,(图拉丁)核心系列,CPU,就是采用,Socket 370,接口的代表产品。,5,Socket A,Socket A,接口也称为,Socket 462,,原因是该接口具有,462,个插孔,可以支持,133MHz,外频。,AMD,公司推出了多款,Socket A,接口,CPU,产品,比如,Thunderbird,(雷鸟)、,Duron,(毒龙)、,Athlon XP,(速龙,XP,)等。目前,SocketA,接口已经被淘汰。,6,Socket 423,Socket 423,接口最早使用在,Intel Pentium 4,处理器中,从外观看,,Socket 423,前几种,Socket,类的接口近似。采用该接口的,CPU,具有,423,根针脚数,工作电压为,1.75V,。随着,DDR,内存的流行,英特尔开发了支持,SDRAM,及,DDR,内存的,i845,芯片组,,Socket 423,接口也被,Socket 478,接口彻底取代。,2.1,微处理器的基本知识,7,Socket 478,Socket 478,接口针脚数为,478,针,虽然在针脚数目上增加了不少,但是其封装面积却比,Socket 423,接口处理器的封装面积小了不少,针脚排列非常紧密。这主要是在,PGA-ZIF,封装工艺上进行了改进,集成度更高。,8,Socket 754,Socket 754,是,2003,年,9,月,AMD,针对,64,位桌面平台最初发布时的接口,具有,754,个,CPU,针脚插孔,支持,200MHz,外频和,800MHz,的,HyperTransport,总线频率,但不支持双通道内存技术。,9,Socket 940/939,Socket 940,和,Socket 939,都是,AMD64,位,CPU,的接口标准,,Socket 939,是,AMD,公司于,2004,年,6,月推出。它们分别具有,940,根和,939,根,CPU,针脚,都支持双通道,DDR,内存,但不能混插。,采用,Socket 940,接口的有服务器,/,工作站所使用的,Opteron,以及最初的,Athlon 64 FX,。随着,AMD,从,2006,年开始全面转向支持,DDR2,内存,,Socket 940,也会逐渐被,Socket F,所取代。,2.1,微处理器的基本知识,10.,LGA775,LGA775,,又称为,Socket 775,或,Socket T,,是目前应用于,Intel LGA775,封装的,CPU,所对应的接口,目前采用此种接口的有,LGA775,封装的,Pentium 4,、,Pentium 4 EE,、,Celeron D,等,CPU,。与以前的,Socket 478,接口,CPU,不同,,Socket 775,接口,CPU,的底部没有传统的针脚,取而代之以,775,个触点(其实是非常纤细的弯曲的弹性金属丝),即并非针脚式而是触点式。通过与对应的,Socket 775,插槽内的,775,根触针接触,来传输信号。,Socket 775,接口,不仅能够有效提升处理器的信号强度、提升处理器频率,同时也可以提高处理器生产的良品率,降低生产成本。,11,LGA 1156,LGA 1156,又叫做,Socket H,,是,Intel,在,LGA775,与,LGA 1366,之后的,CPU,接口。它是当前主流产品,Intel Core i3/i5/i7,处理器(,Nehalem,系列)的标准接口,读取速度比,LGA 775,高。图,2.12,所示是采用,LGA 1156,接口的,intel core i5-750 CPU,及主板插座。,2.2,微处理器技术,2.2.1,流水线技术,微处理器的流水线(,pipeline,)技术是指在程序执行时多条指令重叠进行操作的一种准并行处理实现技术。这种技术借鉴了工业流水线制造的思想。在工业制造中采用流水线可以提高单位时间的生产量;同样在,CPU,中采用流水线设计也有助于提高,CPU,的工作效率。,CPU,的工作和汽车装配类似,大致可分为取指、译码、执行、访存、回写五个步骤,在,CPU,中由几个不同功能的电路单元组成一条指令处理流水线,然后将一条指令分别由这些电路单元流水线执行,这样就能实现在一个,CPU,时钟周期完成一条指令,因此提高,CPU,的运算速度。,2.2,微处理器技术,2.2.2,指令流水线结构,CPU,完成一条指令操作可分为取指、译码、执行、访存、回写五个步骤,即一个,k=,5,级的流水线,假设,CPU,的时钟周期为,T,,那么完成,n=,4,条指令操作需要,8,T,,而如果不采用流水线技术则需要,20,T,。完成过程如图,2.13,所示。,图,2.13,指令流水线,2.2,微处理器技术,2.2.2,多内核技术,多内核是指在一枚处理器中集成两个或多个完整的计算引擎(内核),外表看起来好像是一个,CPU,,但实际上是由多个,CPU,核心组成的,理论上其性能会变成原来的数倍,但须搭配支持多,CPU,的操作系统和应用程序才能发挥其性能。操作系统将每个执行内核视作具有所有相关执行资源的独立处理器。利用多内核技术可以在较低频率、较小缓存的条件下大幅提高性能。,2.2,微处理器技术,2.2.3,动态执行技术,为了提高处理器的并行处理能力和执行效率,微处理器设计中都会采用一系列动态执行技术。动态执行技术是一个总称,具体包括乱序执行、分支预测和推测执行等相关技术。,1.,乱序执行技术,乱序执行(,out-of-orderexecution,,也可称为错序执行),是指,CPU,允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理的技术。,这好比让四个人一起抄写一首古诗,每人抄一句,如果这时在一张大纸上按顺序由第一个人写好第一句后再交给第二个人写,以此类推,那么可以知道,在某一个人写的时候,其他的人必须等待。但如果让四个人分别用四张纸同时写,那么就可以同时各写各的,不用等待,甚至第二句比第一句先写好也没关系(就象乱序执行)。等大家都写完之后再按顺序贴在一起(就象,CPU,中乱序执行后的重新排列单元)。,采用乱序执行技术的目的是为了使,CPU,内部电路满负荷运转并相应提高了,CPU,的运行程序的速度。,CPU,根据各个电路单元的状态和各指令能否提前执行的具体情况分析后,将能提前执行的指令立即发送给相应电路单元执行,在这期间不按规定顺序执行指令,然后由重新排列单元将各执行单元结果按指令顺序重新排列。,2.2,微处理器技术,2,分支预测和推测执行技术,分支预测(,Branch Prediction,)是指在指令结果出来之前,能够预测到指令是否产生分支转移;推测执行(,Speculation Execution,)建立在分支预测的基础上,在分支预测后进行推测执行。,2.2,微处理器技术,2.2.4 RISC,技术,RISC,的技术要点主要有以下几方面:,1.,采用精简指令集,RISC,结构采用精简的指令集,总共大约,100,条左右。这些指令都是操作频率比较高的,比如选取运算指令、加载、存储指令和转移指令作主指令集。大部分复杂指令都被去掉,要实现复杂指令,则使用成熟的编译技术,由简单指令合成。精简的指令集大大改善了处理器的性能,并推动了,R1SC,的设计。,2.,规范指令格式,RISC,对指令做了规范,将所有的指令设计成等长,绝大多数指令都能在一个时钟周期内执行完成。这些指令在长度、格式和执行时间上都是规整的。这样在流水线结构中不会产生取指令时间和译码时间不统一。因此,,RISC,指令和流水线配合使用,可以提高流水线的使用效率和指令执行的吞吐量。,3.,简化寻址方式,采用寄存器操作,尽量减少访存操作,RISC,的寻址方式很少,一般不超过,4,种,因为复杂的寻址方式需要对有效地址进行计算,降低了处理器的运算能力,。,CPU,内有一个较大的通用寄存器组(通用寄存器数量至少为,32,个),,RISC,规定,CPU,内的所有操作,除了访问存储器的取数(,Load,)和存数(,Store,)两条指令外,其余指令的操作都在寄存器之间进行。,2.2,微处理器技术,2.2.4 RISC,技术,4.,优化指令流水线技术,指令流水线的工作方式是将每条指令的执行分为几个部分,然后同时执行多条指令。理想情况是任何指令的取指和执行阶段占据相同时间,都是一个单周期。由于,RISC,指令系统简单,长度固定,寻址方式简单,规范了指令格式,使得流水线技术的优化成为可能,也使,RISC,指令得以在一个时钟周期内执行完成,提高了指令执行技术。所有从内存到,CPU,执行的指令,都遵循一种恒定的流的形式。每条指令都以同样的步调执行,无等待的指令,,CPU,始终处于忙碌状态。,5.,优化编译程序来支持高级程序设计语言,RISC,的精简指令集简化了编译工作。因为指令长度固定,寻址方式少,指令格式和执行时间都很规整,编译时避免了在具有相似功能的许多指令中进行选择,也不用选择寻址方式,所以更容易实现编译器优化,生成执行效率高的机器代码。,2.2,微处理器技术,2.2.5,多媒体和超线程技术,随着微型计算机在各行各业的广泛应用,计算机处理的数据在数量及复杂性方面都在迅速加大,比如多媒体、游戏、三维图形图像、虚拟现实等功能,这些都对微处理器的性能提出了更高的要求。,1.,MMX,技术,MMX,(,Multi Media eXtension,,多媒体扩展)技术是在,1996,年,Intel,公司推出代号为,P55C,的,Pentium,处理器时首次采用的,之后就成为所有,Intel,处理器的一个基本标准和必备技术。,增的,57,条,MMX,指令包括,9,条数学运算指令、,2,条数据比较指令、,4,条压缩数据还原指令、,4,条逻辑运算指令、,3,条移位指令、,1,条数据转换指令、,1,条,FP/MMX,状态转换指令和若干分支指令。此外,还将,CPU,芯片内的,L1,缓存由原来的,16KB,增加到,32KB,,因此,MMX CPU,比普通,CPU,在运行含有,MMX,指令的程序时,处理多媒体的能力上提高了,60,左右。即使不使用,MMX,指令的程序,也能获得,15,左右的性能提升。,2.2,微处理器技术,2.2.5,多媒体和超线程技术,SSE,技术,SSE(Streaming SIMD Extensions,,单指令多数据扩展,),技术是,英特尔,在,Pentium III,处理器中首次引入的指令集,是继,MMX,指令集的扩充。,MMX,技术对性能提高主要针对整型数据,但实际应用中只采用整型数据并不可行,比如只用整型数据就不能精确地绘制,3D,图像等,处理器更多的是处理浮点型数据,所以,SSE,技术目的是提高处理器的浮点运算性能。,SSE,指令集提供了,70,条新指令,其中包含单指令多数据浮点计算、以及额外的,SIMD,整数和高速缓存控制指令。其优势包括:更高分辨率的图像浏览和处理、高质量,音频,、,MPEG2视频,、同时,MPEG2,加解密;语音识别占用更少,CPU,资源;更高精度和更快响应速度。,AMD,后来在,Athlon XP,中加入了对这个新指令集的支持。,第二代,SSE,指令集,SSE2,是,Intel,在,P4,的最初版本中引入的,它新增了,144,条指令,还增加了对,CPU,的缓存的控制指令。,AMD,后来在,Opteron,和,Athlon 64,中也加入了对它的支持。,2.2,微处理器技术,2.2.5,多媒体和超线程技术,3.,超线程技术,超线程技术,(Hyper-Threading Technology),是,Intel,在,2002,年发布的一项新技术,是一种利用特殊的硬件指令,把多线程处理器内部的两个逻辑内核模拟成两个物理芯片,从而使单个处理器就能“享用”线程级的并行计算的处理器技术。多线程技术可以在支持多线程的操作系统和软件上,有效的增强处理器在多任务、多线程处理上的处理能力。,Intel,率先在,Xeron,处理器上得到应用。由于使用了该技术,,Intel,是世界上首枚集成了双逻辑处理器单元的物理处理器(其实就是在一个处理器上整合了两个逻辑处理器单元)的提供者。,1,)进程与线程,程是程序在计算机上的一次执行活动。当运行一个程序,就启动了一个进程。进程是动态的,而程序是一组有序的指令集合,是一个静态的概念。进程是程序及其数据在计算机上的一次执行。离开了程序,进程就失去了存在的意义,但同一程序在计算机上的每次运行将构成不同的进程。,2,)超线程(,Hyper-Threading,),超线程技术是利用特殊的硬件指令,把两个逻辑内核模拟成两个物理芯片,让单个处理器都能使用线程级并行计算,进而兼容,多线程,操作系统和软件,减少了,CPU,的闲置时间,提高的,CPU,的运行效率。,2.3,典型的微处理器,2.3.1,Intel,微处理器,1.,4,位处理器:,4004,2,8,位处理器:,8008/8080,3,16,位处理器:,8086/8088/80286,4,32,位处理器:,80386/80486/Pentium,系列,/Celeron,(赛扬)系列,5,32/64,位兼容处理器:,Intel Core,系列,6,64,位处理器,:Itanium系列,2.3,典型的微处理器,2.3.2,AMD,微处理器,AMD,(超微半导体)成立于,1969,年,总部位于,加尼福利亚州,桑尼维尔,目前,AMD,是唯一能与,Intel,抗衡的,CPU,厂商,AMD,的,Am286,是授权制造的,Intel 80286,兼容品,虽然与,Intel,产品一模一样,但工作频率比,Intel 80286,高。,AMD,于,1991,推出,386,处理器。,1993,年,,AMD,推出,AMD 486,微处理器,最高工作频率为,120MHz,。,1996,年,,AMD,发布,K5,微处理器,因为研发问题,其上市时间比竞争对手,Intel,的,Pentium,处理器延迟很多,再加上性能并不十分出色,这个不成功的产品一度使得,AMD,的市场份额大量丧失。,1997,年,,AMD,发布了,K6,处理器,,K6,是与,Intel PentiumMMX,同档次的产品。,1998,年,,AMD,在,K6,的基础上做了大幅度的改进后推出,K6-2,系列微处理器,其中最主要的是加入了对“,3DNow!,”指令的支持。,1999,年,,AMD,推出了代号为“,Sharptooth,”(利齿)的,K6-3,系列微处理器,它是,AMD,推出的最后一款支持,Super,架构和,CPGA,封装形式的,CPU,。,目前的,AMD,处理器从低端到高端的产品线有,Sempron,(闪龙)、,Athlon,(速龙)、,Athlon FX,(速龙,FX,)、,Phenom,(羿龙)、,Opteron,(皓龙)、,Turion,(炫龙)。,2.4,微处理器的性能测试程序,2.4.1 CPU,的编号,CPU,编号具有不可替代的意义,类似人的身份证,每款,CPU,出厂时都标有一些编号,这些编号几乎包含了该,CPU,的所有信息。当我们接触散装,CPU,时,完全可以通过编号来了解,CPU,的真正身份,但是,CPU,的编号通常并不直观,不是专业人士很难直接从中得出,CPU,的性能参数。,1,Intel CPU,我们以,Intel Core 2
展开阅读全文