单周期CPU设计实验报告.doc

资源描述

计算机组成原理与接口技术实验《计算机组成原理与接口技术实验》实验报告学院名称：学生姓名：学号：专业（班级）：合作者：时间： 2016 年 4 月 25 日成绩 : 实验二：一. 实验目的 1. 掌握单周期CPU数据通路图的构成、原理及其设计方法； 2. 掌握单周期CPU的实现方法，代码实现方法； 3. 认识和掌握指令与CPU的关系； 4. 掌握测试单周期CPU的方法。二. 实验内容设计一个单周期CPU，该CPU至少能实现以下指令功能操作。需设计的指令与格式如下： ==> 算术运算指令（1）add rd , rs, rt （说明：以助记符表示，是汇编指令；以代码表示，是机器指令） 000000 rs(5位) rt(5位) rd(5位) reserved 功能：rd←rs + rt。reserved为预留部分，即未用，一般填“0”。（2）addi rt , rs ,immediate 000001 rs(5位) rt(5位) immediate(16位) 功能：rt←rs + (sign-extend)immediate；immediate符号扩展再参加“加”运算。（3）sub rd , rs , rt 000010 rs(5位) rt(5位) rd(5位) reserved 完成功能：rd←rs - rt ==> 逻辑运算指令（4）ori rt , rs ,immediate 010000 rs(5位) rt(5位) immediate(16位) 功能：rt←rs | (zero-extend)immediate；immediate做“0”扩展再参加“或”运算。（5）and rd , rs , rt 010001 rs(5位) rt(5位) rd(5位) reserved 功能：rd←rs & rt；逻辑与运算。（6）or rd , rs , rt 010010 rs(5位) rt(5位) rd(5位) reserved 功能：rd←rs | rt；逻辑或运算。 ==> 传送指令（7）move rd , rs 100000 rs(5位) 00000 rd(5位) reserved 功能：rd←rs + $0 ；$0=$zero=0。 ==> 存储器读/写指令（8）sw rt ,immediate(rs) 写存储器 100110 rs(5位) rt(5位) immediate(16位) 功能：memory[rs+ (sign-extend)immediate]←rt；immediate符号扩展再相加。（9) lw rt , immediate(rs) 读存储器 100111 rs(5位) rt(5位) immediate(16位) 功能：rt ← memory[rs + (sign-extend)immediate]；immediate符号扩展再相加。 ==> 分支指令（10）beq rs,rt,immediate 110000 rs(5位) rt(5位) immediate(位移量，16位) 功能：if(rs=rt) pc←pc + 4 + (sign-extend)immediate <<2；特别说明：immediate是从PC+4地址开始和转移到的指令之间指令条数。immediate符号扩展之后左移2位再相加。为什么要左移2位？由于跳转到的指令地址肯定是4的倍数（每条指令占4个字节），最低两位是“00”，因此将immediate放进指令码中的时候，是右移了2位的，也就是以上说的“指令之间指令条数”。 ==> 停机指令（11）halt 111111 00000000000000000000000000(26位) 功能：停机；不改变PC的值，PC保持不变。三. 实验原理单周期CPU指的是一条指令的执行在一个时钟周期内完成，然后开始下一条指令的执行，即一条指令用一个时钟周期完成。电平从低到高变化的瞬间称为时钟上升沿，两个相邻时钟上升沿之间的时间间隔称为一个时钟周期。时钟周期一般也称振荡周期（如果晶振的输出没有经过分频就直接作为CPU的工作时钟，则时钟周期就等于振荡周期。若振荡周期经二分频后形成时钟脉冲信号作为CPU的工作时钟，这样，时钟周期就是振荡周期的两倍。） CPU在处理指令时，一般需要经过以下几个步骤： (1) 取指令(IF)：根据程序计数器PC中的指令地址，从存储器中取出一条指令，同时，PC根据指令字长度自动递增产生下一条指令所需要的指令地址，但遇到“地址转移”指令时，则控制器把“转移地址”送入PC，当然得到的“地址”需要做些变换才送入PC。 (2) 指令译码(ID)：对取指令操作中得到的指令进行分析并译码，确定这条指令需要完成的操作，从而产生相应的操作控制信号，用于驱动执行状态中的各种操作。 (3) 指令执行(EXE)：根据指令译码得到的操作控制信号，具体地执行指令动作，然后转移到结果写回状态。 (4) 存储器访问(MEM)：所有需要访问存储器的操作都将在这个步骤中执行，该步骤给出存储器的数据地址，把数据写入到存储器中数据地址所指定的存储单元或者从存储器中得到数据地址单元中的数据。 (5) 结果写回(WB)：指令执行的结果或者访问存储器中得到的数据写回相应的目的寄存器中。单周期CPU，是在一个时钟周期内完成这五个阶段的处理。取指令 IF 指令译码 ID 指令执行 EXE 存储器访问 MEM 结果写回 WB 图1 单周期CPU指令处理过程 MIPS32的指令的三种格式： R类型： 31 26 25 21 20 16 15 11 10 6 5 0 op rs rt rd sa func 6位 5位 5位 5位 5位 6位 I类型： 31 26 25 21 20 16 15 0 op rs rt immediate 6位 5位 5位 16位 J类型： 31 26 25 0 op address 6位 26位其中， op：为操作码； rs：为第1个源操作数寄存器，寄存器地址（编号）是00000~11111，00~1F； rt：为第2个源操作数寄存器，或目的操作数寄存器，寄存器地址（同上）； rd：为目的操作数寄存器，寄存器地址（同上）； sa：为位移量（shift amt），移位指令用于指定移多少位； func：为功能码，在寄存器类型指令中（R类型）用来指定指令的功能； immediate：为16位立即数，用作无符号的逻辑操作数、有符号的算术操作数、数据加载（Laod）/数据保存（Store）指令的数据地址字节偏移量和分支指令中相对程序计数器（PC）的有符号偏移量； address：为地址。图2 单周期CPU数据通路和控制线路图图2是一个简单的基本上能够在单周期上完成所要求设计的指令功能的数据通路和必要的控制线路图。其中指令和数据各存储在不同存储器中，即有指令存储器和数据存储器。访问存储器时，先给出地址，然后由读/写信号控制（1-写，0-读。当然，也可以由时钟信号控制，但必须在图上标出）。对于寄存器组，读操作时，先给出地址，输出端就直接输出相应数据；而在写操作时，在 WE使能信号为1时，在时钟边沿触发写入。图中控制信号作用如表1所示，表2是ALU运算功能表。表1 控制信号的作用控制信号名状态“0” 状态“1” PCWre PC不更改，相关指令：halt PC更改，相关指令：除指令halt外 ALUSrcB 来自寄存器堆data2输出，相关指令：add、sub、or、and、move、beq 来自sign或zero扩展的立即数，相关指令：ori、sw、lw ALUM2Reg 来自ALU运算结果的输出，相关指令：add、sub、ori、or、and、move 来自数据存储器（Data MEM）的输出，相关指令：lw RegWre 无写寄存器组寄存器，相关指令： sw、halt 寄存器组写使能，相关指令：add、sub、ori、or、and、move、lw InsMemRW 读指令存储器(Ins. Data)，初始化为0 写指令存储器 DataMemRW 读数据存储器，相关指令：lw 写数据存储器，相关指令：sw ExtSel 相关指令：ori，(zero-extend)immediate（0扩展）相关指令：sw、lw、beq， (sign-extend)immediate（符号扩展） PCSrc PC←PC+4，相关指令：add、sub、ori、or、and、move、sw、lw、beq(zero=0) PC←PC+4+(sign-extend)immediate，同时zero=1，相关指令：beq RegOut 写寄存器组寄存器的地址，来自rt字段，相关指令：ori、lw 写寄存器组寄存器的地址，来自rd字段，相关指令：add、sub、and、or、move ALUOp[2..0] ALU 8种运算功能选择(000-111)，看功能表相关部件及引脚说明： Instruction Memory：指令存储器， Iaddr，指令存储器地址输入端口 IDataIn，指令存储器数据输入端口（指令代码输入端口） IDataOut，指令存储器数据输出端口（指令代码输出端口） RW，指令存储器读写控制信号，为1写，为0读 Data Memory：数据存储器， Daddr，数据存储器地址输入端口 DataIn，数据存储器数据输入端口 DataOut，数据存储器数据输出端口 RW，数据存储器读写控制信号，为1写，为0读 Register File：（寄存器组） Read Reg1，rs寄存器地址输入端口 Read Reg2，rt寄存器地址输入端口 Write Reg，将数据写入的寄存器端口，其地址来源rt或rd字段 Write Data，写入寄存器的数据输入端口 Read Data1，rs寄存器数据输出端口 Read Data2，rt寄存器数据输出端口 WE，写使能信号，为1时，在时钟上升沿写入 ALU： result，ALU运算结果 zero，运算结果标志，结果为0输出1，否则输出0 表2 ALU运算功能表 ALUOp[2..0] 功能描述 000 A + B 加 001 A – B 减 010 B – A 减 011 A ∨ B 或 100 A ∧ B 与 101 /A ∧ B A非与B 110 A Å B 异或 111 A ⊙ B 同或需要说明的是根据要实现的指令功能要求画出以上数据通路图，和确定ALU的运算功能(当然，以上指令没有完全用到提供的ALU所有功能，但至少必须能实现以上指令功能操作)。从数据通路图上可以看出控制单元部分需要产生各种控制信号，当然，也有些信号必须要传送给控制单元。从指令功能要求和数据通路图的关系得出以上表1，这样，从表1可以看出各控制信号与相应指令之间的相互关系，根据这种关系就可以得出控制信号与指令之间的关系表（留给学生完成），再根据关系表可以写出各控制信号的逻辑表达式，这样控制单元部分就可实现了。指令执行的结果总是在下个时钟到来前开始保存到寄存器、或存储器中，PC的改变也是在这个时候进行。另外，值得注意的问题，设计时，用模块化的思想方法设计，关于ALU设计、存储器设计、寄存器组设计等等，也是必须认真考虑的问题。可以参考其他资料文档，里面有相应的设计方法介绍. 四. 实验器材电脑一台、Xilinx ISE 软件一套。五. 实验分析与设计模块分析：根据单周期CPU数据通路和控制线路图，大致可以将CPU分为右图七个模块，每个模块负责一个部分的功能：（代码存于code文件夹） (图的下方为各个模块的变量，在后图会出现，故省略) CPU：负责各模块之间的数据的传输，如同C语言中的头文件，将其他的子模块连接在一起，其中clk信号在此声明。 CU：CU负责指令的解析，即将由ROM读取的指令转化为操作发送给其他子模块进行操作。 PC：负责指令的计数，已经指令的向前或向后跳动，每个时钟周期计数加一。 ROM：即存储器，发送信息，CPU的指令文件即由ROM读取，只读，在电脑中表现为BIOS的数据文件。 RAM：内存，可读可写，用来保存临时数据，汇编语言中的$s的储存地点。 RF：寄存器，可读可写，数据由寄存器发送向ALU计算，汇编语言中的$t的储存地点。 SE：产生立即数，将发送过来的半数零拓展或符号拓展。 ALU：算术单元，加减乘除逻辑运算等等，都在这里计算。测试数据输入00000000000000000000000000000000（不操作）可得到如上图，CPU正确运行实验测试：（根据实验内容指令表格） 0,1,2,3 算术运算指令 4,5,6 逻辑运算指令 7 传送指令 8,9 存储器读/写指令 10,11 分支指令 14 停机指令指令序号 op rs rt rd reserved 0 000000 00001 00010 00011 0000 0000 000 add $1 $2 $3 $3 = $1 + $2 =0 1 000001 00011 00100 0000 0000 0000 0011 addi $3 $4 $4 = $3 + 3 = 3 2 000001 00100 00010 0000 0000 0000 1000 addi $4 $2 $2 = $4 + 8 = 11 3 000010 00010 00100 00001 0000 0000 000 sub $2 $4 $1 $1 = $2 - $4 = 8 4 010000 00010 00101 0000 0000 0000 1000 ori $2 $5 $5 = $2 | （上式）= 11 5 010001 00001 00010 00110 0000 0000 000 and $1 $2 $6 $6 = $1 & $2 = 8 6 010010 00001 00010 00111 0000 0000 000 or $1 $2 $7 $7 = $1 | $2 = 11 7 100000 00111 00000 01000 0000 0000 000 move $7 $zero $8 $8 = $7 8 100110 01000 00001 0000 0000 0000 0100 sw $8 $1 RAM[$8 + 4] = $1 9 100111 00001 01000 0000 0000 0000 0100 lw $1 $8 $8 = 0 10 110000 00001 00010 0000 0000 0000 0000 beq $1 $2 $1 != $2, pc = pc + 1 11 110000 00010 00101 0000 0000 0000 0001 beq $2 $5 $2 == $5, pc = pc + 2 12 000001 00001 00010 0000 0000 0000 0001 addi $1 $2 此指令被跳过 13 111111 0000 0000 0000 0000 0000 0000 00 halt 停机 0.add 因为都为0，没有变化 1.addi 如上表，$4为3 2.addi $2 = $4 + 8 = 11 3.sub $1 = $2 - $4 = 8 4.ori $5 = $2 | 0000 0000 0000 1000 = 11 5.and $6 = $1 & $2 = 8 6.or $7 = $1 | $2 = 11 7. move $8 = $7 8. sw register RAM $s15 = $1 9.lw 10. beq 不相等情况由于这里两个寄存器不相等，立即数为0，即跳转到下1 + 0/4条指令，故这里进入下一条指令。 11.beq 相等情况，跳过指令12 跳转到13，$1没有变化 13．halt 停机，如图，下一条指令被锁测试完成六. 实验心得本次实验的难度较第一次实验要高很多，很多问题都是半知半解的状态，尤其是CU部分，CU是按照实验资料中的页5中的表格生搬硬套的，有许多不理解，同学也帮助了很多。实验有很多和图上是有区别的，主要表现在CPU的位数，基本没有算法，都是理解和想象的问题，有些模块要自己构想，不能通过看图就知道，但是图中给了很多的提示，每个部件的输入和输出基本上在图中都有显示。 CPU的难度也很大，主要是变量十分得多，很容易就造成错误，在写模块的时候很容易就造成错误。最后就是运行的问题，一开始不知道如何导入指令，做出来全部显示的都是X，检查了几遍代码后才发现问题，从ROM中读取指令。单纯的课本内容，并不能满足学生的需要，通过补充，达到内容的完善教育之通病是教用脑的人不用手，不教用手的人用脑，所以一无所能。教育革命的对策是手脑联盟，结果是手与脑的力量都可以大到不可思议。 16 / 16

展开阅读全文