哈夫曼编译码器-实习报告.doc

资源描述

实习报告哈夫曼编译码器班级：11052414 姓名：沈晓斌（11054417）盛豪杰（11054418）一．需求分析 1.问题描述用huffman编码进行通信可以大大提高信道利用率，缩短信息传输时间，降低传输成本。但是，这要求在发送端通过一个编码系统对待传输数据预先编码，在接收端将传来的数据进行译码（复原）。对于双工信道（即可以双向传输信息的信道），每端都需要一个完整的编/译码系统。是为着这样的信息收发站写一个huffman编/译码系统。 2.基本要求该系统应具有以下功能：（1） I：初始化（Initialization）。从终端读入字符集大小n,以及n个字符和n个权值，建立哈夫曼树，并将它存进文件hfmTree中。（2） E：编码（Encoding）。利用建好的哈夫曼树（如不在内存中，则从文件hfmTree中读入），对文件ToBeTran中的正文进行编码，然后将结果存入文件CodeFile中。（3） D：译码(Decoding)。(利用已经建好的哈夫曼树将文件CodeFile中的代码进行译码，结果存入文件TextFile中。（4） P：印代码文件(Print)。将文件CodeFile以紧凑格式显示在终端上，每行50个代码。同时将此字符形式的编码文件写入文件CodePrin中。（5） T：印哈夫曼树(Tree printing)。将已在内存中的哈夫曼树以直观的方式（凹入表形式）显示在终端上，同时将此字符形式的哈夫曼树写入文件TreePrin中。 3.测试数据（1）利用下面这道题中的数据调试程序。某系统在通信联络中只可能出现八种字符，其概率分别为0.25，0.29，0.07，0.08，0.14，0.23，0.03，0.11，试设计哈夫曼编码。（2）用下表给出的字符集和频度的实际统计数据建立哈夫曼树，并实现以下报文的编码和译码：“THIS PROMGRAM IS MY FAVORITE”。字符 A B C D E F G H I J K L M 频度 186 64 13 22 32 103 21 15 47 57 1 5 32 20 字符 N O P Q R S T U V W X Y Z 频度 57 63 15 1 48 51 80 23 8 18 1 16 1 二.概要设计 typedef struct { unsigned int weight; unsigned int parent, lchild, rchild; }HTNode, *HuffmanTree; //动态分配数组存储哈夫曼树 HTNode HT[30]; //全局变量HT，二维数组HC储存哈夫曼编码 int s1, s2; //定义全局变量 char HC[10000][10000]; void Select(int i) //从HT中选择权值最小的两个作为一个新的结点 void HuffmanCoding(int *w)//w存放n个字符的权值(均>0),构造哈夫曼树HT,并求出n个字符的哈夫曼编码HC. void OpenCode(char a[]) //对输入的字符进行编码 void OpenDecode(char a[])//对输入的编码进行译码主函数主函数主要设计的是一个分支语句，让用户挑选所实现的功能。如图所示： intHuffmanTree();初始化哈夫曼树 HuffmanCoding()构造哈夫曼树编码调用Opencod() 译码调用Opendecode（） Select（）供HuffmanCoding()调用三.详细设计 #include<stdio.h> #include<stdlib.h> #include<string.h> typedef struct { unsigned int weight; unsigned int parent, lchild, rchild; }HTNode, *HuffmanTree; //动态分配数组存储哈夫曼树 HTNode HT[30]; //全局变量HT，二维数组HC储存哈夫曼编码 int s1, s2; char HC[10000][10000]; void Select(int i) //从HT中选择权值最小的两个作为一个新的结点 { int j; for(j = 1; j <= i - 1; j++)//随便选择一个双亲不为的结点 { if(HT[j].parent == 0) { s1 = j; break; } } for(j = s1 + 1; j <= i; j++) //找出第一个权值最小的结点 { if(HT[j].parent == 0) { if(HT[s1].weight > HT[j].weight) s1 = j; } } HT[s1].parent = 1; for(j = 1; j <= i; j++) //用相同的方法找出第二个权值最小的结点 { if(HT[j].parent == 0) { s2 = j; break; } } for(j = s2 + 1; j <= i; j++) { if(HT[j].parent == 0) { if(HT[s2].weight > HT[j].weight) s2 = j; } } } void HuffmanCoding(int *w) { //w存放n个字符的权值(均>0),构造哈夫曼树HT,并求出n个字符的哈夫曼编码HC. int i, j, c; unsigned int t1, t; char mer[100]; for(i = 1; i <= 27; i++) { HT[i].parent = 0; HT[i].rchild = 0; HT[i].rchild = 0; HT[i].weight = w[i]; } for(i=28;i<=53;++i) //建哈夫曼树 {//在HT[1..i-1]选择parent为且weight最小的两个结点，其序号为s1和s2． Select(i-1); HT[s1].parent = i; HT[s2].parent = i; HT[i].lchild = s1; HT[i].rchild = s2; HT[i].weight = HT[s1].weight + HT[s2].weight; } //－－－从叶子到根逆向求每个字符的哈夫曼编码－－－ for(i = 1; i <= 27; i++) { t1 = i; j = 0; memset(mer, 0, sizeof(mer)); //每次用完mer[]都清空 while(HT[t1].parent != 0) { t = HT[t1].parent; if(HT[t].lchild == t1) mer[j++] = '0'; if(HT[t].rchild == t1) mer[j++] = '1'; t1 = t; } j--; for(c = 0; j >= 0; j--, c++) //逆向输出mer[]存入HC中 HC[i][c] = mer[j]; } } void OpenCode(char a[]) //对输入的字符进行编码 { int i; FILE *fp3=fopen("d:\\CodeFile.txt","w"); for(i = 0; a[i] != '\0'; i++) { if(a[i] == ' ') { fprintf(fp3,"%s", HC[1]); printf("%s", HC[1]); } else { fprintf(fp3,"%s", HC[a[i] - 'A' + 2]); printf("%s", HC[a[i] - 'A' + 2]); } } fprintf(fp3,"\n"); printf("\n"); fclose(fp3); } void OpenDecode(char a[]) //对输入的编码进行译码 { FILE *fp4=fopen("d:\\TextFile.txt","w"); int i, j, m; char b[100]; j = 0; m = 53; for(i = 0; a[i] != '\0'; i++) { if(a[i] == '1') { if(HT[m].rchild != 0) //循环知道找出没有孩子的结点，转化为个字母和空格 { m = HT[m].rchild; if(m >= 1 && m <= 27) { if(m == 1) b[j++] = ' '; else b[j++] = 'A' + m - 2; m = 53; } } } if(a[i] == '0') { if(HT[m].lchild != 0) { m = HT[m].lchild; if(m >= 1 && m <= 27) { if(m == 1) b[j++] = ' '; else b[j++] = 'A' + m - 2; m = 53; } } } } b[j] = '\0'; fprintf(fp4,"%s\n",b); puts(b); fclose(fp4); } int main() { int num, Fre[100], i; char Character[100], word[100], word1[1000000], num1; FILE *fp1=fopen("d:\\hfmTree.txt","w"); FILE *fp2=fopen("d:\\ToBeTran.txt","r"); printf("字符:"); for(num = 1; num <= 14; num++) //输入权值表 { scanf("%c", &num1); if(num1 != ' ') Character[num] = num1; else num--; } printf("频度:"); for(num = 1; num <= 14; num++) scanf("%d", &Fre[num]); getchar(); printf("字符:"); for(num = 15; num <= 27; num++) { scanf("%c", &num1); if(num1 != ' ') Character[num] = num1; else num--; } printf("频度:"); for(num = 15; num <= 27; num++) scanf("%d", &Fre[num]); Character[28] = '\0'; HuffmanCoding(Fre); printf("----------------------------------------------\n"); fprintf(fp1,"*: %s\n", HC[1]); printf("*: %s\n", HC[1]); for(i = 2; i <= 27; i++) { fprintf(fp1,"%c: %s\n", 'A' + i - 2, HC[i]); printf("%c: %s\n", 'A' + i - 2, HC[i]); } fclose(fp1); getchar(); getchar(); getchar(); fgets(word, 28, fp2); printf("编码后的结果为："); OpenCode(word); FILE *fp3=fopen("d:\\CodeFile.txt","r"); fscanf(fp3,"%s",word1); printf("译码后的结果为："); OpenDecode(word1); return 0; } 四、调试分析：在写程序与调试的过程中，发现自己对于函数的调用与参数的传递的方面还是存在很多问题，从参数的类型等等方面都出现了很多问题。关于这个程序的要求比较复杂，刚开始做的时候没有任何思路，最后分模块一点一点的进行。在调试过程中，出现了很多次明明建立了文件却发现未存入数据的情况，为此我多次进行调试，发现是打开文件的操作放在了循环体内部导致数据无法写入。整体而言，整个程序主要使用了HuffmanCoding()的方式进行哈夫曼编码，在Openencod（）里面用了字符串的匹配进行译码，在Opendecode（）里进行了重新遍历树的过程，在算法的效率以及如何更为节省空间的存储数据上都要进一步改进。五．测试数据权值列表（*为空格）各字符编码显示需要编码的文件编码结果译码结果并写入TextFile文件六.附录文件：哈夫曼编.cpp Code.file hfmTree ToBeTran TextFile

展开阅读全文