信息论与编码实验.doc_咨信网zixin.com.cn

资源描述

数据库系统课程设计学生姓名：马进孝学号： 20101000479 班号： 116102-02 指导教师：黄鹰中国地质大学（武汉）信息工程学院 2012/5/15年 2 月 25 日实验一 Huffman 编码（2 学时）一、实验目的 1．复习C++程序基本编写方法，熟悉VC 编程环境。 2．会用VC 调试Huffman 编码程序。二、实验内容 1．复习C++代码基本语法（结构体、树等数据结构定义） 2．根据Huffman 编码源代码，学习算法实现流程，培养自己动手能力，在 C++编译器下按步调试跟踪算法。三、实验仪器、设备 1．计算机－系统最低配置 256M 内存、P4 CPU。 2．C++ 编程软件－ Visual C++ 7.0 （Microsoft Visual Studio 2003） Visual C++ 8.0 （Microsoft Visual Studio 2005）四、实验原理 1． Huffman 编码原理： ①将信源符号按概率从大到小的顺序排列，令 p(x1)≥ p(x2)≥…≥ p(xn) ②给两个概率最小的信源符号p(xn-1)和p(xn)各分配一个码位“0”和“1”，将这两个信源符号合并成一个新符号，并用这两个最小的概率之和作为新符号的概率，结果得到一个只包含(n－1)个信源符号的新信源。称为信源的第一次缩减信源，用S1表示。 ③将缩减信源S1的符号仍按概率从大到小顺序排列，重复步骤2，得到只含 (n－2)个符号的缩减信源S2。 ④重复上述步骤，直至缩减信源只剩两个符号为止，此时所剩两个符号的概率之和必为1。然后从最后一级缩减信源开始，依编码路径向前返回，就得到各信源符号所对应的码字。 2．Huffman 树的编码原理：步骤1：将各个符号及其出现频率分别作为不同的小二叉树（目前每棵树只有根节点）步骤2：在步骤1中得到的树林里找出频率值最小的两棵树，将他们分别作为左、右子树连成一棵大一些的二叉树，该二叉树的频率值设为两棵子树频率值之和。步骤3：对上面得到的树林重复步骤2的做法，直到所有符号都连入树中为止。五、实验步骤 1．VC 环境下，建一个C++控制台应用程序，并把源代码考到该程序目录下。 2．项目文件中含有一个预编译头文件，一个主函数入口文件和Huffman 编码算法文件。 3．在入口文件中，输入任一个离散信源进行编码调试。 4．设置好程序断点，仔细分析Huffman 树每步的建立过程。 5．输出离散信源中每个符号的Huffman 编码，并与手工运算的结果进行比较。六、实验报告要求 1．按照实验一附 3 中实验报告样式书写本次实验报告。 2．总结 C++语言学习心得，并结合Huffman 编码实验总结自己的得失，指出今后自己要练习改进之处。根据自己实验情况，对本实验写出建议。七、实验注意事项 1．指针数据结构定义 typedef struct { unsigned long weight; int parent, lchild, rchild; } HTNode, *HuffmanTree; typedef char** HuffmanCode; // 指向存放数组指针的数组即二维数组 2．二叉树生成操作放在数组中（节点n 和数组大小m 关系为：m=2*n-1）。每次在树中找到两颗最小子树，其函数为Select(HuffmanTree HT, int n, int *s1, int *s2)，实际实现的是在数组中找到最小两个元素。另外注意C++的数组起始索引是0，Matlab 起始索引是1；程序中为了方便从1 开始索引数组，HT[0].weight 的大小设为0xffffffffL。为了输出二进制Huffman 码，程序最后对每个符号进行深度优先搜索，得到该符号的二进制字符，然后进行字符串拷贝，直到最后输出。 3哈夫曼是一种编码手段。也就是说保证将来的编码是最小长度的，最终生成最小的哈夫曼编码树，又称哈夫曼最小树。它的原理是将一段文本中出现的字符按出现的频率决定其编码。然后按其最终的编码生成一段明文。知道了这个原理，编码还是很简单的。首先，要实现字符的频度表。也就是说，这18个字符中出现次数最多的一个记作 01，然后按其出现的频率，分别生成最小树就可以了！保证哈夫曼最小树的生成！至于树的生成，可以先生成一个双链表，分别表示左子树，数据，右子树。 #include<iostream> 　　#include<string> 　　using namespace std; 　　typedef struct TreeNode 　　{ 　　char c; 　　int w; 　　int parent; 　　int right; 　　int left; 　　int tag; 　　char * code; 　　}Node; 　　void Find(Node * tree, int n, int & m1, int & m2) 　　{ 　　m1 = -1; 　　while(tree[++ m1].tag != 0); 　　m2 = m1; 　　while(tree[++ m2].tag != 0); 　　for(int i = m2 + 1; i < n; i ++) // 找到最小的两个元素的权值　　{ 　　if(tree[i].tag == 0) // 只搜索没有标记过的元素　　{ 　　if(tree[i].w < tree[m1].w || tree[i].w < tree[m2].w) 　　{ 　　if(tree[m2].w < tree[m1].w) 　　m1 = m2; 　　m2 = i; 　　} 　　} 　　} 　　} 　　void Huffman(Node * tree, int n)//建立Huffman树　　{ 　　int min1, min2; 　　for(int i = 0; i < n - 1; i ++) 　　{ 　　Find(tree, n + i, min1, min2);//找出权值最小的两个顶点为min1,min2 　　tree[n + i].w = tree[min1].w + tree[min2].w;//新的顶点的权值为顶点min1,min2的权值的和　　tree[n + i].left = min1;//n+i的两个孩子结点分别为min1,min2,一个为左孩子，一个为右孩子　　tree[n + i].right = min2; 　　tree[n + i].tag = 0;//父亲顶点tag=0表示该顶点未访问过　　tree[n + i].parent = 0; 　　tree[min1].parent = n + i;//把找的权值最小的两个顶点的父亲指针指向n+i 　　tree[min2].parent = n + i; 　　tree[min1].tag = 1;//已经找过的就不用找了　　tree[min2].tag = 1; 　　} 　　} 　　void HuffmanCoding(Node * tree, int n)// Huffman编码函数　　{ 　　char * code = new char[n]; 　　char * t = code + n - 1; // 指针t指向code的末尾　　int m; 　　for(int i = 0; i < n; i ++) 　　{ 　　int k = i; 　　code = t; 　　*code= '\0'; 　　while(tree[k].parent != 0) 　　{ 　　int p = tree[k].parent; 　　if(tree[p].left == k) 　　*(-- code) = '0';//左孩子编码为0 　　else 　　*(-- code) = '1';//右孩子编码为1 　　k = p; 　　} 　　tree[i].code = new char[strlen(code) + 1]; 　　m=strlen(code); 　　cout<<tree[i].c<<" "<<m<<endl; 　　} 　　} 　　int main() 　　{ 　　int n; 　　while(cin>>n) 　　{ 　　Node * tree = new Node[2 * n - 1]; 　　for(int i = 0; i < n; i ++) 　　{ 　　cin>>tree[i].c>>tree[i].w; 　　tree[i].tag = 0; 　　} 　　Huffman(tree, n);//建立Huffman树　　HuffmanCoding(tree, n);//调用Huffman编码函数　　} 　　return 0; 　　} 实验二 CRC 校验码编码实验（2 学时）一、实验目的 1．学习CRC 编码基本流程, 学会调试循环冗余校验码编码程序。 2．掌握CRC 校验码的编码原理，重点掌握按字节（Byte）编码方法。二、实验内容 1．根据实验原理掌握CRC 校验码编码/解码基本流程。 2．在C++编译器下能够调试编码算法每一个步骤，重点掌握按字节编码的过程。三、实验仪器、设备 1．计算机－系统最低配置 256M 内存、P4 CPU。 2．C++ 编程软件－ Visual C++ 7.0 （Microsoft Visual Studio 2003） Visual C++ 8.0 （Microsoft Visual Studio 2005）四、实验原理 1． CRC 校验码介绍 CRC 校验的基本思想是利用线性编码理论，在发送端根据要传送的k 位二进制码序列，以一定的规则产生一个校验用的监督码（CRC 码）r 位，并附在信息后边，构成一个新的二进制码序列数共 (k+r) 位，最后发送出去。在接收端，则根据信息码和CRC 码之间所遵循的规则进行检验，以确定传送中是否出错。 16 位的CRC 码产生的规则是先将要发送的二进制序列数左移16 位（乘以 16 模2 加减运算法则，既是不带进位和借位的按位加减，这种加减运算实际上就是逻辑上的异或运算，加法和减法等价，乘法和除法运算与普通代数式的乘除法运算是一样，符合同样的规律。接收方将接收到的二进制序列数（包括信息码和 CRC 码）除以多项式，如果余数为0，则说明传输中无错误发生，否则说明传输有误。 2．按位计算CRC 一个二进制序列数可以表示为求此二进制序列数的CRC 码时，先乘以216后（左移16位），再除以多项式G(X) ，所得的余数就是所要求的 CRC 码。可以设：其中 Q n (X) 为整数， R n (X) 为 16 位二进制余数，将上式代入前式得： 2 ）后，再除以一个多项式，最后所得到的余数既是CRC 码。求CRC 码所采用再设：其中 Qn-1(X) 为整数， Rn-1(X) 为 16 位二进制余数，继续代入前式，多次迭代得到：根据 CRC 的定义，很显然，十六位二进制数 R0(X) 即是要求的 CRC 码。 3．按字节计算CRC 对于一个二进制序列数可以按字节表示为下式，其中Bn(X) 为一个字节(共8 位)：求此二进制序列数的CRC码时，先乘以216后（左移16位），再除以多项式G(X)，所得的余数即是所要求的CRC 码。可以设：其中Qn(X) 为整数， Rn(X) 为16位二进制余数，将上式代入前式得：由于：其中RnH8(X) 是Rn(X)的高八位， RnL8(X)是Rn(X)的低八位，代入前式得到：显然，十六位二进制数R0(X)即是要求的CRC码。五、实验步骤项目文件建立步骤同实验二，下面列出对给定字符串 CRC 校验主要步骤：步骤 1：从主函数入口输入一个字符串，并且确定按字节32 位CRC 校验编码，编码多项式采用CCITT 标准形式多项式。步骤 2：调用编码函数，依次读入字符串每个自己，进行模2 除法运算。步骤 3：将原来字符串左移32 位，将除法最后的余式追加到字符串的后32 位中去，得到该字符串CRC 校验编码结果。步骤 4：如果要解码，首先确认编码多项式，然后将接收字符串除以编码多项式。如果能够整除，说明字符串在传输或存储中没有发生错误；否则，表明字符串在传输或存储中产生错误，导致CRC 校验失败。六、实验报告要求 1．按照实验一附 3 中实验报告样式提交本次实验报告。 2．要求写出 CRC 校验编码学习心得，最好是能够结合硬件设计谈一下校验编码的设计体会。根据自己实验情况，写出自己的做实验中遇到的具体问题，对本实验提出建议。七、实验注意事项 1．几个重要概念在实验前一定搞清楚： 1）模 2 加减法 = 异或（XOR）。 2）多项式的表示方法。 3） CRC 校验的基本理论 a 可以参考前面文中的推导。 b 自己通过一个除法运算推导。 4）常用的两种方法： a Bit 长度运算 b Byte 长度运算（可以将字节除法余式表保存下来，通过查表，计算比较快） 2. 程序设计时注意内容： 1）注意检查字节输入顺序与多项式的关系 a 高字节前，低字节后，采用通常理论推导公式编写程序。 b 低字节前，高字节后，采用向右移位方式。（这是数据通信中常用方式，多项式采用反转多项式，添加余式时注意低位在前，高位在后） 2）注意寄存器初始值选择 CCITT 和CRC32 如果用在通信中，常采用初始值为0xffff 或0xffffffffL，可以开始纠正数字通信中几个bit 连续为0 的情况。为保持其输出和采用初始值为 0xffff 或0xffffffffL 一致，最后CRC 校验值要与0xffff 或0xffffffffL 进行异或运算（XOR）得到最终CRC 校验码。 CRC校验码实验要求：编写出CRC码的编码和解码程序。 (1)实验框架：CRC编码－信道传输－CRC解码。 (2)CRC编码将原始数据按照既定的生成多项式进行编码； (2)信道传输中实现模拟信道，某些位数据随机发生差错； (3)CRC解码要能准确判断是否有差错，无差错要恢复出原始数据。设计感言: 这次课程设计历时二个星期多左右，通过课程设计，发现自己的很多不足，自己知识的很多漏洞，看到了自己的实践经验还是比较缺乏，理论联系实际的能力还急需提高。大学里一年的相处还赶不上这十来天的实习，我感觉我和同学们之间的距离更加近了。对我而言，知识上的收获重要，精神上的丰收更加可喜。让我知道了学无止境的道理。我们每一个人永远不能满足于现有的成就，人生就像在爬山，一座山峰的后面还有更高的山峰在等着你。挫折是一份财富，经历是一份拥有。这次课程设计必将成为我人生旅途上一个非常美好的回忆！

展开阅读全文