资源描述
【AMD处理器的微架构简介】
一、K5微架构:
K5是AMD公司第一个独立生产的x86级CPU,发布时间在1996年3月。由于K5在开发上遇到了问题,其上市时间比英特尔的Pentium晚了许多,再加上性能不好,这个不成功的产品一度使得AMD的市场份额大量丧失。K5的性能非常一般,整数运算能力不如Cyrix的6x86,但是仍比Pentium略强,浮点运算能力远远比不上Pentium,但稍强于Cyrix。综合来看,K5属于实力比较平均的那一种产品。K5低廉的价格是最大的卖点。基本参数:
时钟频率:
116MHz
前端总线:
60MHz
缓存
L1 24KB,L2 集成于主板 无L3
插槽:
Socket5
指令集:
x86
制作工艺:
0.5微米
晶体管数量:
430万
核心/线程
1/1
二、K6微架构:
AMD 自然不甘心Pentium在CPU市场上呼风唤雨,因此它们在1997年又推出了K6。k6是一款32位的处理器,这款CPU的设计指标是相当高的,它拥有全新的MMX指令以及64KB L1 Cache(比奔腾MMX多了一倍),整体性能要优于奔腾MMX,接近同主频PⅡ的水平。AMD在整数运算方面做得非常成功,K6稍微落后的地方是在运行需要使用到MMX或浮点运算的应用程序方面,比起同样频率的Pentium 要差许多。
K6逐渐衍生出K6-2和K6-3处理器。为了打败竞争对手Intel,AMD K6-2系列微处理器在K6的基础上做了大幅度的改进,其中最主要的是加入了对"3DNow!"指令的支持。"3DNow!"指令是对X86体系的重大突破,此项技术带给我们的好处是大大加强了计算机的3D处理能力,带给我们真正优秀的3D表现。而且大多数K6-2并没有锁频,加上0.25微米制造工艺带给我们的低发热量,能很轻松的超频使用,同时,K6-2也继承了AMD一贯的传统,同频型号比Intel 产品价格要低25% 左右。 K6-2系列上市之初使用的是"K6 3D"这个名字("3D"即"3DNow!"),待到正式上市才正名为"K6-2",它的最低频率为200MHz,最高达到550MHz。K6-2处理器凭借架构上的优势令英特尔感到了巨大的压力。
时钟频率:
300MHz
前端总线:
66MHz
缓存
L1 24KB,无L2 及L3
插槽:
Socket 7
指令集:
MMX、x86、3DNow!
制作工艺:
0.35微米
晶体管数量:
880万 单核心单线程
三、K7微架构:
K7 CPU采用200MHz的外频,并放弃了Socket 7和Slot A结构,转而采用Socket A。K7第一个版本采用的是0.25微米的制造技术,而后采用0.18微米铜互连技术。K7继续采用3D NOW!指令集,加强了整数、浮点运算和多媒体运算的能力。K7并没有采用INTEL的GTL+系统总线协议,它使用的是Digital公司的Alpha系统总线协议EV6。优点:首先它有许多比GTL+更为优秀的构造,例如点对点布局。其次它可以支持200MHz的外频,可支持512KB—8MB的二级缓存。
K7系列CPU是AMD公司推出的高性价比CPU,又可以细分为:采用Pluto(布鲁托)核心、Thunderbird(雷鸟)核心的Athlon系列CPU;采用Spitfire(烈火)核心、Morgan(野马)核心的Duron系列CPU,还有采用Palomino(帕洛米诺马)核心、Thoroughbred(撒拉布列特马)核心的Athlon XP系列。
“更小、更快”是AMD最新一代“Thunderbird”(雷鸟)核心Athlon处理器的座右铭。AMD的Thunderbird处理器配有256KB On-Die存储器与全速的二级缓存,这大大地增强了新款Athlon的整体效能。与雷鸟同时推出的烈火核心,标志AMD在高端低端全面和Intel对抗了。毒龙,它基于雷鸟核心,但把二级缓存减少到了64KB,性能当然有下降,不过对抗”铜矿”赛扬是毫无问题。成为当时最具有性价比的处理器。2001年10月,Palomino发布,显然它的目标是P4处理器,因为这个时候AMD开始实行PR标识,而且起了一个多少有点俗的名字:Athlon XP,不过这个名字也一直延续到K7核心的终止。谈论Athlon XP我们就不能不单独谈它的完结篇产品——Barton核心。Barton则更是经典中的经典,它采用Athlon处理器的第七代核心(K7),集成5430万晶体管(与Thoroughbred相比提高1680万),另外还增加了256KB二级缓存,使二级缓存的总存量达到了512KB。Barton---历时33年锤炼出来的经典,绝对是AMD的一座里程碑。
四、K8微架构:-----AMD的经典之作,细数5处技术。
2003年9月25日凌晨,Athlon 64系列处理器正式发布,标志着桌面处理器正式吹响了进军64位的号角,而引领这一时代变化的是有斗士之称的AMD。无数的评测已经证明Athlon 64系列是设计成熟、性能优良的处理器。
K8是首个兼容64位Windows的微处理器,它的的CPU基于K7,添加了一个整合内存控制器(integrated memory controller,IMC),采用超线程通讯结构(HyperTransport communication fabric),二级缓存增加到了1MB,增加了 SSE 指令集,后期的K8增加了SSE3。在K9被宣布取消后,双核心的Athlon 64X2被错误地称为K9。
AMD在推出Athlon 64系列处理器之初,主要包含3个分支:面向服务器市场的Opteron,面向极高端及发烧级用户的Athlon 64 FX,以及面向中高端用户的Athlon 64处理器。Opteron和Athlon 64 FX处理器共享Sledge Hammer(大锤)核心,同样为Socket 940接口,二级缓存为1MB,处理器集成双通道内存控制器,但必须搭配具有ECC Registered功能的内存,不能使用普通的内存。Athlon 64处理器则采用Clawhammer(羊角锤)核心,Socket 754接口,二级缓存同为1MB,处理器只集成单通道内存控制器,但搭配普通内存即可。
在早期由于价格因素,Athlon 64与普通用户的距离总是很远,但随着AMD推出了集成双通道内存控制器的socket 939针Athlon 64和面向低端的754针Sempron处理器,以及Duron和Athlon XP处理器的退位,AMD新一代产品开始主导市场并进入主流价位。
Athlon 64则通过内建内存控制器(IMC)可以让处理器直接调配内存,原先在北桥中内存控制器已经不复存在,优点是:首先可以减少处理器调用内存数据时的延迟,其次,也可以避免因主板芯片组参差不齐导致系统性能降低的问题。据之前的测试数据来看,K8架构在内存带宽利用率上达到了80-85%,而这几乎是同时代奔腾4处理器的两倍。
高速(HyperTransport)总线技术是Athlon 64设计的亮点之一,不过该技术并不是AMD所独创的技术。用于连接处理器和芯片组或芯片组之间来完成数据交换工作,用于高端的市场SledgeHammer核心Athlon 64 FX和Opteron处理器集成三个HyperTransport控制器,而面向主流市场的ClawHammer核心Athlon 64处理器则精简为一个。
相对与AMD的3DNow!来说,Intel的SSE2指令集得到了更多软件开发者的支持,因此,Athlon 64处理器还增加了SSE2指令集,并且SSE2指令寄存器的数量比Pentium 4更多。Athlon 64对于SSE、SSE2、3D Now!、3D Now!+都可以提供完好的支持。K8架构拥有更强大的3组复杂解码单元,几乎所有的浮点指令和SSE指令都可以使用直接路径解码了,这便增强了游戏以及多媒体应用下的处理性能。
我们看到:在AMD的多款Socket 939和Socket 754型号的新Athlon 64处理器中,AMD将都会使用一种名为Cool‘n’Quiet的技术。那么究竟该技术到底是一项什么技术,它能起到什么作用呢?总的来说,Cool‘n’Quiet是一项能让处理器在闲置状态下自动降低电压与频率的节能技术,目前的移动处理器都支持这项技术,不过在桌面处理器上,AMD还是首先将此技术广为应用的厂商。AMD在日本的分公司于2002年1月18日在东京宣布在新型处理器Athlon XP使用了一种低耗电技术,该项技术被命名为“清凉安静技术(Cool‘n’Quiet Technology)”(以下简称CnQ)。这项技术使处理器可以根据所执行的运算工作来改变自己的频率,降低处理器的发热量,有效地节约了资源,延长了处理器的寿命。
EVP防病毒技术(Enhanced Virus Protection):是AMD公司应用在Athlon64芯片中的一项技术。它可以防止病毒的缓冲区溢出攻击。缓冲区溢出攻击是指病毒使CPU因缓冲区溢出而执行恶意代码的攻击技术。应用这项新技术后,缓冲区的数据将会只读,而不能执行,这就有效防止了那些恶意代码被执行。
不过,与Athlon XP平台不同的是,AMD 64根据处理器的功能性、市场定位同衍生了三种互不兼容的型号:Socket 745、Socket 939、Socket 940三大系列,每个系列都有低、中高之分,我们在这里就对各系列的产品进行详细介绍,希望可以对大家有所帮助。
Socket 754处理器:
Socket 754针 系列处理器是AMD针对主流市场推出的产品,共拥有两大系列,一个是针对中高端市场的Athlon 64系列,另一个是最新上市的Socket 754 Sempron系列处理器。Athlon 64只拥有一个单通道内存控制器,而且Hyper-Transport总线频率也只有800MHz。最早的Athlon 64处理器是基于Claw hammer核心,拥有1MB L2缓存,后来Athlon 64已经改用Newcastle核心,L2缓存也减到了512KB,目的显然是为了降低Athlon 64的生产成本。 同时针对低端市场,AMD推出了同样采用Socket 754接口的Sempron。与Socket A版本的Sempron相比,Socket 754 Sempron最大的特点是真正改用采用Athlon64内核,90nm SOI制程。但与Athlon 64相比,Socket 754 Sempron并不支持64bit运算、Cool'n'Quiet及EVP硬件防毒功能,而且L2缓存也减为了128K/256KB,核心代号也因此改为Paris。Sempron由于整合了内存控制器及Athlon64的大多数特性,所以整体性能比Socket A要好。
Socket 939处理器:
分为Athlon 64、Athlon 64 FX、Sempron三个系列。其中Socket 939 Athlon 64处理器多数采用Newcastle核心,(采用90nm制程的Socket 939 Athlon 64是采用Winchester核心),拥有512KB L2缓存,整合的内存控制器支持双通道DDR技术。它还采用了更快的Hyper-Transport总线—--频率达1GHz,带宽增幅达到25%,而且也增加了对SSE3指令集的支持。Socket 939 Athlon 64 FX除了频率较高,采用Claw Hammer核心,拥有1MB L2缓存外,与Socket 939 Athlon 64无太大的区别了。Socket 939 Sempron也是采用Athlon 64架构,一样整合双通道内存控制器,但仍不支持64位内存、Cool'n' Quite、EVP,而且Hyper-Transport总线频率仍维持在800MHz的水平、仅拥有128KB/256KB L2缓存。
Socket 940处理器:有Opteron和Athlon 64 FX两个系列。其中Opteron是AMD针对服务器市场推出的64位处理器。它基于Sledge Hammer核心,拥有1MB的L2及128KB的L1,后来采用Troy(特洛伊)核心支持Hyper-Transport频率1GHz及整合双通道DDR内存控制器,增强了对SSE3指令集的支持。至于Socket 940 Athlon 64 FX,它除了不支持多路运算模式之处,其它之功能几乎与Opteron处理器一样。
五、K10、K10.5微架构:(因为K9被取消)
从2003年AMD发布第一款桌面级64位处理器Athlon 64和Athlon 64 FX开始,AMD就带领我们步入了K8时代, AMD完成了从一个追随者到一位领导者的角色转换,而且凭借K8架构高性能低功耗的优良性能,更是一举击败了Intel的Netburst架构产品P4,成为一时的性能之王,但是,Intel在2006年9月,Intel终于推出了蕴酿已久的新架构产品---Core架构,一下子夺回被AMD K8抢去的市场。面对Intel在高端市场上争夺,AMD的K8双核由此而显得黯然失色,只能频频降价应对,用性价比保护住中低端市场的份额。但是Intel随即发动了价格战,对AMD传统较为强势的中低端市场虎视眈眈,Conroe-L,奔腾E系列等产品更是令AMD苦不堪言。AMD深深明白,单靠价格上的优势,很难去抵挡Intel的攻势,想解决目前的困境,AMD唯有靠发布新品来取代K8架构处理器,而K10正是AMD今年的一根救命稻草。
K10也就是通常俗称的K8L,是AMD此前K8架构产品的继任者(没有K9),在架构上有所进步, AMD声称其K10架构具备一系列“革命性设计”,有五大要素:1.真四核设计,并不是将两个双核封装在一起,而是真正的单芯片四核心。2.采用Cool’n’Quiet2.0技术,可以做到让每个核心配有独立的电源控制,独立的运作,大大降低能耗,节省成本。3.完整的DDR2双通道内存控制器,支持DDR2-1066。4.支持 HT3.0技术:为1080P高清视频播放和极高分辨率游戏提供带宽。HT 1.0仅为1.6 GHz ,而HT 2.0也不过2.0 GHz。HT 1.0 和2.0的原始带宽仅为6.4和8.0 GB/s。而AMD 羿龙处理器的传输速度为3.6 GHz。HT 3.0 原始带宽,提升至 14.4-16.0 GB/s,AMD 羿龙处理器是向下兼容的;5.共享的L3缓存。进入K10架构之后,Athlon(速龙)被废弃,取而代之的是新的“Phenom(羿龙)”,AMD还全面放弃型号中的“64”字样,因此原来的Athlon 64 X2改名Athlon X2并进入低端市场。
K10.5微架构 CPU:HT总线和K10相同都是3.0规范,内存升级支持双通道DDR3。接口为AM3(Socket938),AM2+接口的主板在BIOS支持的前提下,可以使用AM3接口的CPU。
六、Bulldozer微架构:
Bulldozer(推土机)是AMD继K10微架构之后所推出的微处理器架构。主要应用于桌面平台、服务器平台乃至超级计算机的微处理器核心上。基于AMD Bulldozer微架构,32纳米SOI HKMG制程的处理器产品于2011年9月率先于桌面平台上发布,是为核心代号“Zambezi(赞比西河)”(Socket AM3+,4至8线程)之AMD FX系列;紧接着的是10月12日发布服务器平台,核心代号“Interlagos(英特拉格斯)”(Socket G34,16线程)、“Valencia(瓦伦西亚)”(Socket C32,4至8线程)之AMD Opteron系列。
Intel Nehalem架构支持单核心双线程,而AMD推土机架构则颇有点儿反其道而行之的意思,将每两个核心捆绑在一块儿,称之为一个“推土机模块” (Bulldozer Module),让其中的两个核心既有各自独立的执行管线、整数调度器和一级缓存,也有共享的预取和解码单元、浮点调度器(和两个128-bit FMAC乘法累加单元)、二级缓存;一个模块共计2.13亿个晶体管,这个数据包含了2MB的L2快取。所有的模块共用L3缓存。
上图为“推土机”模块示意图。独立L1,共享L2,L3。
上图为双模块四核心推土机处理器示意图(所有核心共享三级缓存和北桥)
上图为:四模块八核心示意图
微架构特性:支持Intel的AVX指令集(Advanced Vector Extensions,进阶矢量扩展),使处理器支持256位元的浮点运算作业。除此之外还支持Intel授权的SSE4.1、SSE4.2、AES、CLMUL、Multiply-Add/Accumulat等,以及AMD自有的SSE5(拆分为XOP、FMA4、CVT16)、SSE4a等。11层金属、32纳米SOI HKMG制程;Turbo Core 2.0和上代Turbo Core一样可以根据处理器的负载状态调整各处理器核心的时钟频率,在处理器核心闲置时可以降低其时钟频率乃至关闭核心;处理器核心满载时可以提升其时钟频率。核心电压在0.775V--1.425V;TDP为25—140W。桌面平台的处理器,内建双通道DDR3内存控制器,支持DDR3-1866、DDR3-2000、DDR3-2133以及更高规格的内存;Hyper-Transport总线升格为3.1版本,默认运作时钟频率3.20GHz,传送速率6.4GT/s,带宽25.6GB/s。引入增强的AM3+接口,并向下兼容现有AM3接口处理器。配套芯片组为900系列芯片组,可向下相容于800系列芯片组、使用Socket AM3插座的主板,但需要主板厂商提供BIOS/EFI固件更新,2012年后期推出的1000系列芯片组可以相容桌面级Bulldozer微架构的处理器。
展开阅读全文