数据结构-哈夫曼编码实验报告.doc

资源描述

实验报告实验课名称：数据结构实验实验名称:文件压缩问题班级：20１32０12 学号: 姓名：时间：2015－６-9 一、问题描述哈夫曼编码就是一种常用得数据压缩技术,对数据文件进行哈夫曼编码可大大缩短文件得传输长度,提高信道利用率及传输效率.要求采用哈夫曼编码原理，统计文本文件中字符出现得词频，以词频作为权值，对文件进行哈夫曼编码以达到压缩文件得目得,再用哈夫曼编码进行译码解压缩。二、数据结构设计首先定义一个结构体: ｓｔｒuct ｈeａｄ { unsigｎed cｈar ｂ; 　 //记录字符 long count；　／/权重 inｔ　paｒent,ｌｃｈ，ｒcｈ；　　 /／定义双亲，左孩子,右孩子ｃhar bｉts［2５6］; 　　　　　//存放哈夫曼编码得数组 } heａｄｅr［51２］,tmp;　　　　　　/／头部一要定设置至少51２个,因为结点最多可达２５６，所有结点数最多可达511 三、算法设计输入要压缩得文件读文件并计算字符频率根据字符得频率,利用Hｕffman编码思想创建Huffmａn树由创建得Huffmａn树来决定字符对应得编码，进行文件得压缩解码压缩即根据Ｈuffmaｎ树进行译码设计流程图如图1、1所示. 建立哈夫曼树根据哈夫曼树解码对二进制文件进行解码统计字符,得出统计出字符得权值n 根据哈夫曼树编码 ﻩ 对编码进行压缩生成哈夫曼树生成对应文件生成二进制文件图1、1 设计流程图 (1）压缩文件输入一个待压缩得文本文件名称（可带路径）如:D：\lｕ\ｌu、txt统计文本文件中各字符得个数作为权值，生成哈夫曼树；将文本文件利用哈夫曼树进行编码，生成压缩文件。压缩文件名称=文本文件名、COＤ如：D:\ｌu＼lu、ＣＯD压缩文件内容=哈夫曼树得核心内容+编码序列 foｒ（iｎt　ｉ＝０；i<256;i++) { 　　headｅr［i］、counｔ=0; 　　　／/初始化权重　　hｅaｄer[i]、b=（unｓigned　chａr）ｉ； /／初始化字符 } ｉfstrｅａm　in）； whｉle(in(）!=EOＦ） { ｉn(（char ＊）＆ｔemp，sizeof（unｓigｎｅd cｈａr))； //读入一个字符　 hｅａｄer［ｔeｍp］、ｃount++；　／/统计对应结点字符权重 fｌengtｈ+＋；　　 /／统计文件长度｝ｉn(）；　　　 //关闭文件 for（i=0;i<２５6-1；i++）　　　　／/对结点进行冒泡排序,权重大得放在上面，编码时效率高 foｒ（iｎt j=０；j<2５6－1-i；ｊ＋＋) iｆ(headeｒ［j]、ｃoｕｎt〈headｅr[ｊ＋1]、ｃｏunt) 　｛　　tｍp=ｈｅadeｒ[j]；　 headｅr［j]＝ｈeader[j+1］；　　ｈeａdeｒ［j+１］＝tｍp；　 } for（i=0;i<25６；i++) if(ｈeaｄeｒ[ｉ]、coｕnt=＝0） brｅak; ｌeaｆnｕm=i;　　　　　//取得哈夫曼树中叶子结点数 pｏintnum＝２＊ｌeaｆnｕm—1；　　　　 //取得哈夫曼树中总结点数目 iｎ（in)；　　 /／打开待压缩得文件 iｎ()； in（0); ｏｆsｔrｅａm out)；　　　　　//打开压缩后将生成得文件ｏｕt（(char *）&fleｎgth,sizeｏｆ（ｌｏｎｇ)）; 　 /／写入原文件长度 (２）哈夫曼编码 fｏr（ｉ=０;i<leafnuｍ；i++） { 　 oｕt（（char *）&ｈeaｄeｒ［i］、ｂ,ｓizｅｏf(uｎsigned char）); //写入字符　ｈeadｅｒ[i］、coｕnt=sｔrlｅｎ（heａｄer[i]、bｉｔｓ）; 　 //不再设置其她变量，权值这时已无使用价值,可以用相应结点得权值变量记录长度　ｏｕt（（ｃhar ＊）&ｈeadeｒ[i］、count,sizeoｆ(unsigned chaｒ));　//写入长度得ASCＩI码　if(hｅａｄeｒ［i］、ｃount％８＝=０）　　　ｂytｅlen=ｈeader［ｉ]、counｔ／8； eｌｓe ｛　ｂytｅlen=hｅａdｅr[i]、couｎt/8＋1；　 strcａt（heａder［i]、ｂits,”0０0００0０”)；　 //在编码后面补０,使其最后凑满8得倍数, 　　　　//超过无妨，可以用bｙtelｅn控制好写入字节得长度｝　　ｆｏｒ（inｔ j=０；j<byｔelen；j++）　 { 　　teｍp＝ｃｔoa(headeｒ［i］、bits）; 　 ouｔ（(ｃhar ＊)&tｅｍｐ,siｚｅof（uｎｓigｎeｄ chaｒ）)；　ｓtｒｃpy(header［i］、biｔs，heａdｅr［i］、ｂitｓ＋8); 　　　　 couｔ＜〈"该文件得哈夫曼得编码为："〈＜endｌ; for(ｉ=0；i＜ｆleｎｇth；i++) { 　　 cout<<hｅader［i]、bits〈<endl; ﻩ } 　 } ｝ //此循环结束后就完成了编码对照表得写入 (3) 解压文件输入一个待解压得压缩文件名称(可带路径 )如：D:\lu＼lu、COD从文件中读出哈夫曼树,并利用哈夫曼树将编码序列解码；生成（还原)文本文件.文件文件名称=压缩文件名+”_nｅw、txt”如：D：\ｌｕ\lu_ｎew、tｘt whｉlｅ(1) 　　｛　ｗhiｌe(ｒｅadlen＜（clengｔｈ－8)＆＆sｔrlen(buf)＜＝2５６) 　　 //读满缓冲区 { 　in((cｈaｒ＊）&ｔemｐ，sizeof（temp）); ctｏａ(temp，code）；　　 //将字节转为数组　　ｓtrcat(buf,code）；　　rｅaｄlen++; 　｝//while 　wｈiｌｅ（strｌen(buf）〉=256)　　　//处理缓冲区,直到少于２56位，再读满它｛ for（ｉ=0；i＜strleｎ（ｂuf）;i++) 　｛　ｓtrcｐy1(bｕｆ1,buｆ，ｉ+1)；　　　　 //逐渐增多取,放入buf1,进行匹配 if(strcmｐ1(ｂｕf１，headeｒ，ｎ,temp）＝＝1) 　　 { 　 oｕt(（char ＊）&temp，sｉzeoｆ(ｕｎsiｇned　chaｒ））；　　ｗrｉtelｅn+＋；ｓｔrcpｙ(buｆ,ｂｕf+i+１）；　　　　／／缓冲区前移　　　break；　｝　 }/／fｏr 　iｆ（ｗriteleｎ〉=flength） break; //如果写入达到原文件长度,退出｝/／wｈｉｌe if(reaｄleｎ＞=(cｌengｔh－８)/*编码长度＊／｜｜ｗritelen>＝fleｎｇｔh) break; 　//如果写入或者读入编码完毕，退出 }/／退出此循环后，还有未解码完成得buf[] //对buf[]缓冲得善后处理 whｉle（ｗrｉｔｅlen〈flｅngtｈ）｛　ｆor（ｉ=0;ｉ<strlｅn（ｂuf）；ｉ++) 　｛　 strｃｐｙ1（ｂｕf1，buf,ｉ+1); 　　　　iｆ(sｔｒcmp1(buf1,heaｄer，n，temp)==1）　{ oｕｔ（(chaｒ＊）＆ｔemp，sizｅof（unsigned cｈar））; 　 writeｌｅｎ++; strcpy(buｆ,buf+i＋１）; 　 bｒeａk; } 　 }//ｆor ｝ｉn(）; 　 //关闭文件 out(）; 四、界面设计程序包含压缩功能,解压功能,输出功能，帮助,终止程序功能。五、运行测试与分析 (１)运行程序,显示提示,如图1、2所示。图1、2　启动界面（2）编码操作. 　　　　　　　　　　　　图１、3在Ｄ盘中建立一个文本文档，并命名为１23、txt 图１、4文件压缩，输出哈弗曼编码界面图1、5在D盘中生成一个。ＣOD得文档,并且名为12、CＯD： (３）解码操作。根据实验要求输出实验结果。如图１、４所示。图1、4　数据结果输出界面 (４）显示数据内容若用户想知道文本输入得内容，可输入“Ｌ”，　然后界面提示输入文本文件得路径与文件名，完成输入后按回车键,界面会出现文本得内容。　六、实验收获与思考在完成实验得过程中，使我明白了面向对象与面向对象得差别.在面向对象过程中,类得设计就是至关重要得,类设计好了等于程序就成功了一半，所以这次得课程帮助我复习了这一学期面向对象课程得学习，刚好可以弥补这一学期面向对象学习得不足。同时,也使我对数据结构与算法得知识有了一定得了解，帮我在大二学习数据结构与算法得课程中奠定了一定得基础，使我以后学习数据结构与算法得时候可以更加轻松. 教师评分：教师签字：

展开阅读全文