资源描述
2006年2月秦杰 郑丽萍 张庆辉q Origin 2000分布共享存储器结构的大规模并行 多处理机系统,采用超结点的模块结构,可以从 1个处理器扩展到128个处理器。q Origin 2000采用超标量MIPS R10000处理器,运 行Unix的64位IRIX操作系统。7.7 多处理机实例第章 多处理机2006年2月秦杰 郑丽萍 张庆辉q Origin基于NUMA体系结构的 每个结点可安装每个结点可安装1 1个或个或2 2个个MIPS R10000MIPS R10000微微 处理器、第二级高速缓存(处理器、第二级高速缓存(L2 CacheL2 Cache)、主存)、主存 储器、目录存储器及储器、目录存储器及HubHub等,等,HubHub用于连接微处用于连接微处 理器、存储器、理器、存储器、I IO O和路由器等。和路由器等。q Origin存储器系统每个结点的主存储器容量:4GBq 结点的Hub内含4个接口和交叉开关7.7 多处理机实例OriginOrigin体系结构体系结构2006年2月秦杰 郑丽萍 张庆辉q 存储器最大传输率为780Mbsq IO和路由器接口最大传输率:2780Mbs(1.56Gb/s)q Origin的路由器有6个端口,用于连接结点或其它路由 器。Origin的路由器和互连网络是ASIC芯片,通过芯 片内部的交叉开关选择数据传送路径。q 为了减少数据在路由器之间的传送延迟,加快传送速 度,可将处于对角位置的路由器进行连接。7.7 多处理机实例4 4处理器系统处理器系统1616处理器系统处理器系统128128处理器系统处理器系统2006年2月秦杰 郑丽萍 张庆辉THANK YOUSUCCESS2024/3/1 周五8可编辑2006年2月秦杰 郑丽萍 张庆辉 128处理器构成的Origin 2000系统由4个立方体组成,在立方体之间传送数据多经过了一级路由器。在结点内部实现的是SMP(对称多处理器)结构,由于只有两个处理器,所以不存在SMP结构的总线瓶颈问题。在结点之间实现的是大规模并行处理结构,但又解决了共享存储器问题。因此在Origin系统中,无论是访问存储器的时间还是结点间传送数据的频带宽度都很理想。7.7 多处理机实例2006年2月秦杰 郑丽萍 张庆辉 访问存储器的延迟时间:访问存储器的延迟时间:系统系统CPUCPU数数 最小延迟时间最小延迟时间最大延迟时间最大延迟时间 平均延迟时间平均延迟时间 2 2 318ns 318ns 343ns 343ns 343ns 343ns 4 4 318ns 318ns 554ns 554ns 441ns 441ns 8 8 318ns 318ns 759ns 759ns 623ns 623ns 16 16 318ns 318ns 759ns 759ns 691ns 691ns 32 32 318ns 318ns 836ns 836ns 764ns 764ns 64 64 318ns 318ns 1067ns 1067ns 851ns 851ns 128 128 318ns 1169ns 318ns 1169ns 959ns 959ns7.7 多处理机实例2006年2月秦杰 郑丽萍 张庆辉 系统频带宽度:系统频带宽度:处理器数处理器数 频宽(无快速连线)频宽(无快速连线)*频宽(有快速连线)频宽(有快速连线)*8 8 1.56Gb/s 1.56Gb/s 3.12Gb/s 3.12Gb/s 16 16 3.12Gb/s 3.12Gb/s 6.24Gb/s 6.24Gb/s 32 32 6.24Gb/s 6.24Gb/s 12.5Gb/s 12.5Gb/s 64 64 12.5Gb/s 12.5Gb/s -128 128 25Gb/s -25Gb/s -*相当于虚线情况相当于虚线情况7.7 多处理机实例2006年2月秦杰 郑丽萍 张庆辉 Origin系统的存储器层次结构可分为寄存器、L1 Cache、L2 Cache和主存储器,其中寄存器和L1 Cache在R10000微处理器中。寄存器的存取时间最短,L1 Cache又分成指令Cache和数据Cache两部分,这是为了避免取指令和存取数据发生冲突。L2 Cache安装在结点卡中,统一存放指令和数据,由SRAM组成。7.7 多处理机实例2006年2月秦杰 郑丽萍 张庆辉 Origin的主存储器地址是统一编址的,每个处理器通过互连网络可访问系统中任一存储单元。当一个处理器初次读取某一存储单元数据时,该数据在提供给CPU的同时也拷贝到本结点的Cache中。同一数据在各个Cache中将保持一致。Origin系统的Cache采用写作废协议。7.7 多处理机实例2006年2月秦杰 郑丽萍 张庆辉 Origin采用基于目录的协议。在Origin的结点中,有一个存储器和一个目录存储器。存储器被划分为存储器块(每个存储器块对应于一个Cache行)。每块对应一个目录项,每个目录项包含其对应存储器块的状态信息和系统中各Cache共享存储情况的位向量,根据位向量可以知道本存储器块在哪些Cache中有拷贝。当执行写存储器操作时,根据目录项的位向量可将有关结点中的Cache数据作废,从而实现了Cache的一致性。7.7 多处理机实例2006年2月秦杰 郑丽萍 张庆辉THANK YOUSUCCESS2024/3/1 周五15可编辑
展开阅读全文