数据结构知识点全面总结—.pdf

资源描述

第第 1 章章绪论绪论内容提要：内容提要：数据结构研究的内容。数据结构研究的内容。针对非数值计算的程序设计问题，研究计算机的操作对象以及它们之间的关系和操作。数据结构涵盖的内容：基本概念：数据、数据元素、数据对象、数据结构、数据类型、抽象数据类型。基本概念：数据、数据元素、数据对象、数据结构、数据类型、抽象数据类型。数据所有能被计算机识别、存储和处理的符号的集合。数据元素是数据的基本单位，具有完整确定的实际意义。数据对象具有相同性质的数据元素的集合，是数据的一个子集。数据结构是相互之间存在一种或多种特定关系的数据元素的集合，表示为：Data_Structure=（D,R）数据类型是一个值的集合和定义在该值上的一组操作的总称。抽象数据类型由用户定义的一个数学模型与定义在该模型上的一组操作，它由基本的数据类型构成。算法的定义及五个特征。算法的定义及五个特征。算法是对特定问题求解步骤的一种描述，它是指令的有限序列，是一系列输入转换为输出的计算步骤。算法的基本特性：输入、输出、有穷性、确定性、可行性算法设计要求。算法设计要求。正确性、可读性、健壮性、效率与低存储量需求算法分析。算法分析。时间复杂度、空间复杂度、稳定性学习重点：学习重点：数据结构的数据结构的“三要素三要素”：逻辑结构逻辑结构、物理（存储）结构物理（存储）结构及在及在这种结构上所定义的操作这种结构上所定义的操作（运算）（运算）。用计算语句频度来估算算法的时间复杂度。用计算语句频度来估算算法的时间复杂度。第第 2 章章线性表线性表内容提要：内容提要：线性表的逻辑结构定义，对线性表定义的操作。线性表的逻辑结构定义，对线性表定义的操作。线性表的定义：用数据元素的有限序列表示线性表的存储结构：顺序存储结构和链式存储结构。线性表的存储结构：顺序存储结构和链式存储结构。顺序存储定义：把逻辑上相邻的数据元素存储在物理上相邻的存储单元中的存储结构。链式存储结构:其结点在存储器中的位置是随意的，即逻辑上相邻的数据元素在物理上不一定相邻。通过指针来实现！线性表的操作在两种存储结构中的实现。线性表的操作在两种存储结构中的实现。数据结构的基本运算：修改、插入、删除、查找、排序1)修改通过数组的下标便可访问某个特定元素并修改之。核心语句:Vi=x;顺序表修改操作的时间效率是 O(1)2)插入在线性表的第 i 个位置前插入一个元素实现步骤：将第 n 至第 i 位的元素向后移动一个位置；将要插入的元素写到第 i 个位置；表长加 1。注意：事先应判断:插入位置 i 是否合法?表是否已满?应当符合条件：1in+1 或 i=1,n+1 核心语句：for(j=n;j=i;j-)aj+1=a j;a i=x;n+;插入时的平均移动次数为：n(n+1)/2（n+1）n/2O(n)3)删除删除线性表的第 i 个位置上的元素实现步骤：将第 i+1 至第 n 位的元素向前移动一个位置；表长减 1。注意：事先需要判断，删除位置 i 是否合法?应当符合条件：1in 或 i=1,n 核心语句：for(j=i+1;j=n;j+)aj-1=aj;n-;顺序表删除一元素的时间效率为:T（n)=(n-1)/2 O(n)顺序表插入、删除算法的平均空间复杂度为 O(1)单链表：单链表：（1）用单链表结构来存放 26 个英文字母组成的线性表（a，b，c，z）,请写出 C 语言程序。#include#includetypedef struct nodechar data;struct node*next;node;node*p,*q,*head;/一般需要 3 个指针变量int n;/数据元素的个数int m=sizeof(node);/*结构类型定义好之后，每个 node 类型的长度就固定了，m 求一次即可*/void build()/字母链表的生成。要一个个慢慢链入 int i;head=(node*)malloc(m);/m=sizeof(node)前面已求出p=head;for(i=1;idata=i+a-1;/第一个结点值为字符 ap-next=(node*)malloc(m);/为后继结点“挖坑”！p=p-next；/让指针变量 P 指向后一个结点p-data=i+a-1;/最后一个元素要单独处理p-next=NULL;/单链表尾结点的指针域要置空！void display()/字母链表的输出 p=head;while(p)/当指针不空时循环（仅限于无头结点的情况）printf(%c,p-data);p=p-next;/让指针不断“顺藤摸瓜”（2）单链表的修改(或读取）思路：要修改第 i 个数据元素，必须从头指针起一直找到该结点的指针 p，然后才能：pdata=new_value 读取第 i 个数据元素的核心语句是：Linklist*find(Linklist*head,int i)int j=1;Linklist*p;P=head-next;While(p!=NULL)&(jnext;j+;return p;3.单链表的插入链表插入的核心语句：Step 1：s-next=p-next;Step 2：p-next=s；6.单链表的删除删除动作的核心语句（要借助辅助指针变量 q）：q=p-next;/首先保存 b 的指针，靠它才能找到 c；p-next=q-next;/将 a、c 两结点相连，淘汰 b 结点；free(q)；/彻底释放 b 结点空间7.双向链表的插入操作：设 p 已指向第 i 元素，请在第 i 元素前插入元素 x：ai-1 的后继从 ai(指针是 p)变为 x（指针是 s):s-next=p ;p-prior-next=s;ai 的前驱从 ai-1(指针是 p-prior)变为 x(指针是 s);s-prior=p-prior;p-prior=s;8.双向链表的删除操作：设 p 指向第 i 个元素，删除第 i 个元素后继方向：ai-1 的后继由 ai(指针 p)变为 ai+1(指针 p-next);p-prior-next=p-next ;前驱方向：ai+1 的前驱由 ai(指针 p)变为 ai-1(指针 p-prior);p-next-prior=p-prior;数组的逻辑结构定义及存储数组的逻辑结构定义及存储数组：由一组名字相同、下标不同的变量构成N 维数组的特点：n 个下标，每个元素受到 n 个关系约束一个 n 维数组可以看成是由若干个 n1 维数组组成的线性表。存储：事先约定按某种次序将数组元素排成一列序列，然后将这个线性序列存入存储器中。在二维数组中，我们既可以规定按行存储，也可以规定按列存储。设一般的二维数组是 Ac1.d1,c2.d2，则行优先存储时的地址公式为：二维数组列优先存储的通式为：稀疏矩阵（含特殊矩阵）的存储及运算。稀疏矩阵（含特殊矩阵）的存储及运算。稀疏矩阵：矩阵中非零元素的个数较少（一般小于 5%）学习重点：学习重点：线性表的逻辑结构，指线性表的数据元素间存在着线性表的逻辑结构，指线性表的数据元素间存在着线性关系线性关系。在顺序存储结构中，元素。在顺序存储结构中，元素存储的存储的先后位置先后位置反映出这种线性关系，而在链式存储结构中，是靠反映出这种线性关系，而在链式存储结构中，是靠指针指针来反映这种关系的。来反映这种关系的。顺序存储结构用一维数组表示，给定下标，可以存取相应元素，属于顺序存储结构用一维数组表示，给定下标，可以存取相应元素，属于随机存取随机存取的存储结的存储结构。构。链表操作中应注意不要使链意外链表操作中应注意不要使链意外“断开断开”。因此，若在某结点前插入一个元素，或删除。因此，若在某结点前插入一个元素，或删除某元素，必须知道该元素的某元素，必须知道该元素的前驱结点的指针前驱结点的指针。掌握通过画出结点图来进行链表（单链表、循环链表等）的掌握通过画出结点图来进行链表（单链表、循环链表等）的生成、插入、删除、遍历生成、插入、删除、遍历等等操作。操作。数组（主要是二维）在以数组（主要是二维）在以行序行序/列序列序为主的存储中的地址计算方法。为主的存储中的地址计算方法。稀疏矩阵的三元组表存储结构。稀疏矩阵的三元组表存储结构。稀疏矩阵的十字链表存储方法。稀疏矩阵的十字链表存储方法。补充重点：补充重点：1.每个存储结点都包含两部分：每个存储结点都包含两部分：数据域和指针域数据域和指针域(链域链域)2.在单链表中，除了首元结点外，任一结点的存储位置由在单链表中，除了首元结点外，任一结点的存储位置由其直接前驱结点的链域的值其直接前驱结点的链域的值指指示。示。3.在链表中设置头结点有什么好处？在链表中设置头结点有什么好处？头结点即在链表的首元结点之前附设的一个结点，该结点的数据域可以为空，也可存放表长度等附加信息，其作用是为了对链表进行操作时，可以对空表、非空表的情况以及对首元结点进行统一处理，编程更方便。4.如何表示空表？如何表示空表？（1）无头结点时，当头指针的值为空时表示空表；（2）有头结点时，当头结点的指针域为空时表示空表。5.链表的数据元素有两个域，不再是简单数据类型，编程时该如何表示？链表的数据元素有两个域，不再是简单数据类型，编程时该如何表示？因每个结点至少有两个分量，且数据类型通常不一致，所以要采用结构数据类型。6.sizeof(x)计算变量 x 的长度（字节数）；malloc(m)开辟 m 字节长度的地址空间，并返回这段空间的首地址；free(p)释放指针 p 所指变量的存储空间，即彻底删除一个变量。7.链表的运算效率分析：链表的运算效率分析：（1）查找）查找因线性链表只能顺序存取，即在查找时要从头指针找起，查找的时间复杂度为 O(n)。（2）插入和删除插入和删除因线性链表不需要移动元素，只要修改指针，一般情况下时间复杂度为 O(1)。但是，如果要在单链表中进行前插或删除操作，因为要从头查找前驱结点，所耗时间复杂但是，如果要在单链表中进行前插或删除操作，因为要从头查找前驱结点，所耗时间复杂度将是度将是 O(n)。例：在例：在 n 个结点的单链表中要删除已知结点个结点的单链表中要删除已知结点*P，需找到它的，需找到它的前驱结点的地址前驱结点的地址，其时间复杂，其时间复杂度为度为 O（n）8.顺序存储和链式存储的区别和优缺点？顺序存储和链式存储的区别和优缺点？顺序存储时，逻辑上相邻的数据元素，其物理存放地址也相邻。顺序存储的优点是存顺序存储的优点是存储密度大，存储空间利用率高；缺点是插入或删除元素时不方便。储密度大，存储空间利用率高；缺点是插入或删除元素时不方便。链式存储时，相邻数据元素可随意存放，但所占存储空间分两部分，一部分存放结点值，另一部分存放表示结点间关系的指针。链式存储的优点是插入或删除元素时很方便，链式存储的优点是插入或删除元素时很方便，使用灵活。缺点是存储密度小，存储空间利用率低。使用灵活。缺点是存储密度小，存储空间利用率低。顺序表适宜于做查找这样的静态操作；链表宜于做插入、删除这样的动态操作。若线性表的长度变化不大，且其主要操作是查找，则采用顺序表；若线性表的长度变化较大，且其主要操作是插入、删除操作，则采用链表。9.判断：判断：“数组的处理比其它复杂的结构要简单数组的处理比其它复杂的结构要简单”，对吗？，对吗？答：对的。因为数组中各元素具有统一的类型；数组元素的下标一般具有固定的上界和下界，即数组一旦被定义，它的维数和维界就不再改变。数组的基本操作比较简单，除了结构的初始化和销毁之外，只有存取元素和修改元素值的操作。10.三元素组表中的每个结点对应于稀疏矩阵的一个非零元素，它包含有三个数据项，分别三元素组表中的每个结点对应于稀疏矩阵的一个非零元素，它包含有三个数据项，分别表示该元素的表示该元素的行下标行下标、列下标列下标和和元素值元素值。11.写出右图所示稀疏矩阵的压缩存储形式。解：介绍 3 种存储形式。法法 1：用线性表表示：用线性表表示：（(1,2,12)，(1,3,9)，(3,1,-3)，(3,5,14)，(4,3,24)，(5,2,18)，(6,1,15)，(6,4,-7)）法法 2：用十字链表表示：用十字链表表示用途：方便稀疏矩阵的加减运算方法：每个非 0 元素占用 5 个域法法 3：用三元组矩阵表示：用三元组矩阵表示：稀疏矩阵压缩存储的缺点：将失去随机存取功能代码：代码：1.用数组 V 来存放 26 个英文字母组成的线性表（a，b，c，z），写出在顺序结构上生成和显示该表的 C 语言程序。char V30;void build()/字母线性表的生成，即建表操作 int i;V0=a;for(i=1;i=n-1;i+)Vi=Vi-1+1;void display()/字母线性表的显示，即读表操作 int i;for(i=0;iM)上溢 else stop+=e;顺序栈出栈函数 POP()status Pop()if(top=L)下溢 else e=s-top;return(e);队列的定义及操作，队列的删除在一端（队尾）队列的定义及操作，队列的删除在一端（队尾），而插入则在队列的另一端（队头），而插入则在队列的另一端（队头）。因。因此在两种存储结构中，都需要队头和队尾两个指针。此在两种存储结构中，都需要队头和队尾两个指针。队列：只能在表的一端进行插入运算，在表的另一端进行删除运算的线性表。链队列结点类型定义：typedef Struct QNode QElemType data;/元素 Struct QNode *next;/指向下一结点的指针 Qnode,*QueuePtr;链队列类型定义：typedef struct QueuePtr front;/队首指针 QueuePtr rear;/队尾指针 LinkQueue;链队示意图：空链队的特征：front=rear 链队会满吗？一般不会，因为删除时有 free 动作。除非内存不足！入队（尾部插入）：rear-next=S;rear=S;出队（头部删除）：front-next=p-next;2.顺序队顺序队类型定义：#define QUEUE-MAXSIZE 100 /最大队列长度 typedef struct QElemType *base;/队列的基址 int front;/队首指针 int rear;/队尾指针 SqQueue建队核心语句：q.base=(QElemType*)malloc(sizeof(QElemType）*QUEUE_MAXSIZE;/分配空间顺序队示意图：循环队列：队空条件:front=rear (初始化时：front=rear)队满条件：front=(rear+1)%N (N=maxsize)队列长度（即数据元素个数）：L=（Nrearfront）%N 1）初始化一个空队列Status InitQueue(SqQueue&q)/初始化空循环队列 q q.base=(QElemType*)malloc(sizeof(QElemType）*QUEUE_MAXSIZE);/分配空间if(!q.base)exit(OVERFLOW);/内存分配失败，退出程序 q.front=q.rear=0;/置空队列 return OK;/InitQueue;2）入队操作Status EnQueue(SqQueue&q,QElemType e)/向循环队列 q 的队尾加入一个元素 e if(q.rear+1)%QUEUE_MAXSIZE=q.front )return ERROR;/队满则上溢，无法再入队 q.rear=(q.rear+1)%QUEUE_MAXSIZE;q.base q.rear =e;/新元素 e 入队 return OK;/EnQueue;3）出队操作Status DeQueue(SqQueue&q,QElemType&e)/若队列不空，删除循环队列 q 的队头元素，/由 e 返回其值，并返回 OK if(q.front=q.rear)return ERROR;/队列空 q.front=(q.front+1)%QUEUE_MAXSIZE;e=q.base q.front ;return OK;/DeQueue 链队列空的条件是首尾指针相等，而循环队列满的条件的判定，则有队尾加链队列空的条件是首尾指针相等，而循环队列满的条件的判定，则有队尾加 1 等于队头等于队头和设标记两种方法。和设标记两种方法。补充重点：补充重点：1.为什么要设计堆栈？它有什么独特用途？为什么要设计堆栈？它有什么独特用途？调用函数或子程序非它莫属；递归运算的有力工具；用于保护现场和恢复现场；简化了程序设计的问题。2.为什么要设计队列？它有什么独特用途？为什么要设计队列？它有什么独特用途？离散事件的模拟（模拟事件发生的先后顺序,例如 CPU 芯片中的指令译码队列）；操作系统中的作业调度（一个 CPU 执行多个作业）；简化程序设计。3.什么叫什么叫“假溢出假溢出”？如何解决？如何解决？答：在顺序队中，当尾指针已经到了数组的上界，不能再有入队操作，但其实数组中还有空位置，这就叫“假溢出”。解决假溢出的途径采用循环队列。4.在一个循环队列中，若约定队首指针指向队首元素的前一个位置。那么，从循环队列中在一个循环队列中，若约定队首指针指向队首元素的前一个位置。那么，从循环队列中删除一个元素时，其操作是先删除一个元素时，其操作是先移动队首位置移动队首位置，后，后取出元素取出元素。5.线性表、栈、队的异同点：线性表、栈、队的异同点：相同点：逻辑结构相同，都是线性的；都可以用顺序存储或链表存储；栈和队列是两种特殊的线性表，即受限的线性表（只是对插入、删除运算加以限制）。不同点：运算规则不同：线性表为随机存取；而栈是只允许在一端进行插入和删除运算，因而是后进先出表 LIFO；队列是只允许在一端进行插入、另一端进行删除运算，因而是先进先出表 FIFO。用途不同，线性表比较通用；堆栈用于函数调用、递归和简化设计等；队列用于离散事件模拟、OS 作业调度和简化设计等。第四章第四章串串内容提要内容提要：串是数据元素为字符的线性表，串的定义及操作。串是数据元素为字符的线性表，串的定义及操作。串即字符串，是由零个或多个字符组成的有限序列，是数据元素为单个字符的特殊线性表。串比较：int strcmp(char*s1,char*s2);求串长：int strlen(char*s);串连接：char strcat(char*to,char*from)子串 T 定位：char strchr(char*s,char*c);串的存储结构，因串是数据元素为字符的线性表，所以存在串的存储结构，因串是数据元素为字符的线性表，所以存在“结点大小结点大小”的问题。的问题。模式匹配算法模式匹配算法。串有三种机内表示方法：模式匹配算法模式匹配算法：算法目的：确定主串中所含子串第一次出现的位置（定位）定位问题称为串的模式匹配，典型函数为 Index(S,T,pos)BF 算法的实现即编写 Index(S,T,pos)函数BF 算法设计思想：将主串 S 的第 pos 个字符和模式 T 的第 1 个字符比较，若相等，继续逐个比较后续字符；若不等，从主串 S 的下一字符（pos+1）起，重新与 T 第一个字符比较。直到主串 S 的一个连续子串字符序列与模式 T 相等。返回值为 S 中与 T 匹配的子序列第一个字符的序号，即匹配成功。否则，匹配失败，返回值 0。Int Index_BP(SString S,SString T,int pos)/返回子串 T 在主串 S 中第 pos 个字符之后的位置。若不存在，则函数值为 0./其中，T 非空，1posStrLength(S)i=pos;j=1;while(i=S0&jT0)return i-T0;/T 子串指针 j 正常到尾，说明匹配成功，else return 0;/否则属于 iS0情况，i 先到尾就不正常/Index_BP补充重点：补充重点：1.空串和空白串有无区别？空串和空白串有无区别？答：有区别。空串(Null String)是指长度为零的串；而空白串(Blank String),是指包含一个或多个空白字符 (空格键)的字符串.2.“空串是任意串的子串；任意串空串是任意串的子串；任意串 S 都是都是 S 本身的子串，除本身的子串，除 S 本身外，本身外，S 的其他子串称为的其他子串称为S 的真子串。的真子串。”第第 6 章章树和二叉树树和二叉树内容提要：内容提要：树是复杂的非线性数据结构，树，二叉树的递归定义，基本概念，术语。树是复杂的非线性数据结构，树，二叉树的递归定义，基本概念，术语。树：由一个或多个(n0)结点组成的有限集合 T，有且仅有一个结点称为根（root），当 n1时，其余的结点分为 m(m0)个互不相交的有限集合 T1,T2，Tm。每个集合本身又是棵树，被称作这个根的子树。二叉树：是 n（n0）个结点的有限集合，由一个根结点以及两棵互不相交的、分别称为左子树和右子树的二叉树组成。术语：P88 二叉树的性质，存储结构。二叉树的性质，存储结构。性质 1:在二叉树的第 i 层上至多有 2i-1 个结点（i0）。性质 2:深度为 k 的二叉树至多有 2k-1 个结点（k0）。性质 3:对于任何一棵二叉树，若 2 度的结点数有 n2 个，则叶子数（n0）必定为 n21 性质 4:具有 n 个结点的完全二叉树的深度必为性质 5:对完全二叉树，若从上至下、从左至右编号，则编号为 i 的结点，其左孩子编号必为 2i，其右孩子编号为 2i1；其双亲的编号必为 i/2（i1 时为根,除外）。二叉树的存储结构：二叉树的存储结构：一、顺序存储结构按二叉树的结点“自上而下、从左至右”编号，用一组连续的存储单元存储。若是完全/满二叉树则可以做到唯一复原。不是完全二叉树：一律转为完全二叉树！方法很简单，将各层空缺处统统补上“虚结点”，其内容为空。缺点：浪费空间；插入、删除不便二、链式存储结构用二叉链表即可方便表示。一般从根结点开始存储。优点：不浪费空间；插入、删除方便二叉树的遍历。二叉树的遍历。指按照某种次序访问二叉树的所有结点，并且每个结点仅访问一次，得到一个线性序列。遍历规则二叉树由根、左子树、右子树构成，定义为 D、L、R若限定先左后右，则有三种实现方案：DLR LDR LRD先序遍历中序遍历后序遍历树的存储结构，树、森林的遍历及和二叉树的相互转换。树的存储结构，树、森林的遍历及和二叉树的相互转换。回顾 2：二叉树怎样还原为树？要点：逆操作，把所有右孩子变为兄弟！讨论 1：森林如何转为二叉树？法一：各森林先各自转为二叉树；依次连到前一个二叉树的右子树上。法二：森林直接变兄弟，再转为二叉树讨论 2：二叉树如何还原为森林？要点：把最右边的子树变为森林，其余右子树变为兄弟树和森林的存储方式：树和森林的存储方式：树有三种常用存储方式：双亲表示法孩子表示法孩子兄弟表示法问：树二叉树的“连线抹线旋转”如何由计算机自动实现？答：用“左孩子右兄弟”表示法来存储即可。存储的过程就是树转换为二叉树的过程！树、森林的遍历：树、森林的遍历：先根遍历：访问根结点；依次先根遍历根结点的每棵子树。后根遍历：依次后根遍历根结点的每棵子树；访问根结点。讨论：树若采用“先转换，后遍历”方式，结果是否一样？1.树的先根遍历与二叉树的先序遍历相同；2.树的后根遍历相当于二叉树的中序遍历；3.树没有中序遍历，因为子树无左右之分。先序遍历若森林为空，返回；访问森林中第一棵树的根结点；先根遍历第一棵树的根结点的子树森林；先根遍历除去第一棵树之后剩余的树构成的森林。中序遍历若森林为空，返回；中根遍历森林中第一棵树的根结点的子树森林；访问第一棵树的根结点；中根遍历除去第一棵树之后剩余的树构成的森林。二叉树的应用：哈夫曼树和哈夫曼编码。二叉树的应用：哈夫曼树和哈夫曼编码。Huffman 树：最优二叉树（带权路径长度最短的树）Huffman 编码：不等长编码。树的带权路径长度：（树中所有叶子结点的带权路径长度之和）构造 Huffman 树的基本思想：权值大的结点用短路径，权值小的结点用长路径。构造 Huffman 树的步骤（即 Huffman 算法）：(1)由给定的 n 个权值 w1,w2,wn 构成 n 棵二叉树的集合 F=T1,T2,Tn （即森林），其中每棵二叉树 Ti 中只有一个带权为 wi 的根结点，其左右子树均空。(2)在 F 中选取两棵根结点权值最小的树做为左右子树构造一棵新的二叉树，且让新二叉树根结点的权值等于其左右子树的根结点权值之和。(3)在 F 中删去这两棵树，同时将新得到的二叉树加入 F 中。(4)重复(2)和(3),直到 F 只含一棵树为止。这棵树便是 Huffman 树。具体操作步骤：具体操作步骤：学习重点：（本章内容是本课程的重点）学习重点：（本章内容是本课程的重点）二叉树性质及证明方法，并能把这种方法推广到二叉树性质及证明方法，并能把这种方法推广到 K 叉树。叉树。二叉树遍历，遍历是基础，由此导出许多实用的算法，如求二叉树的高度、各结点的层二叉树遍历，遍历是基础，由此导出许多实用的算法，如求二叉树的高度、各结点的层次数、度为次数、度为 0、1、2 的结点数。的结点数。由二叉树遍历的前序和中序序列或后序和中序序列可以唯一构造一棵二叉树。由前序和由二叉树遍历的前序和中序序列或后序和中序序列可以唯一构造一棵二叉树。由前序和后序序列不能唯一确定一棵二叉树。后序序列不能唯一确定一棵二叉树。完全二叉树的性质。完全二叉树的性质。树、森林和二叉树间的相互转换。树、森林和二叉树间的相互转换。哈夫曼树的定义、构造及求哈夫曼编码。哈夫曼树的定义、构造及求哈夫曼编码。补充：补充：1.满二叉树和完全二叉树有什么区别？满二叉树和完全二叉树有什么区别？答：满二叉树是叶子一个也不少的树，而完全二叉树虽然前 k-1 层是满的，但最底层却允许在右边缺少连续若干个结点。满二叉树是完全二叉树的一个特例。2.Huffman 树有什么用？树有什么用？最小冗余编码、信息高效传输第第 7 章章图图内容提要：内容提要：图的定义，概念、术语及基本操作。图的定义，概念、术语及基本操作。图：记为 G(V,E)其中：V 是 G 的顶点集合，是有穷非空集；E 是 G 的边集合，是有穷集。术语：见课件图的存储结构。图的存储结构。1.邻接矩阵(数组)表示法建立一个顶点表和一个邻接矩阵设图 A=(V,E)有 n 个顶点，则图的邻接矩阵是一个二维数组 A.Edgenn。注：在有向图的邻接矩阵中，第 i 行含义：以结点 vi 为尾的弧(即出度边）；第 i 列含义：以结点 vi 为头的弧(即入度边）。邻接矩阵法优点：容易实现图的操作，如：求某顶点的度、判断顶点之间是否有边（弧）、找顶点的邻接点等等。邻接矩阵法缺点：n 个顶点需要 n*n 个单元存储边(弧);空间效率为 O(n2)。2.邻接表(链式)表示法对每个顶点 vi 建立一个单链表，把与 vi 有关联的边的信息（即度或出度边）链接起来，表中每个结点都设为 3 个域:每个单链表还应当附设一个头结点（设为 2 个域），存 vi 信息；每个单链表的头结点另外用顺序存储结构存储。邻接表的优点：空间效率高；容易寻找顶点的邻接点；邻接表的缺点：判断两顶点间是否有边或弧，需搜索两结点对应的单链表，没有邻接矩阵方便。图的遍历。图的遍历。遍历定义：从已给的连通图中某一顶点出发，沿着一些边，访遍图中所有的顶点，且使每个顶点仅被访问一次，就叫做图的遍历，它是图的基本运算。图常用的遍历：一、深度优先搜索；二、广度优先搜索图常用的遍历：一、深度优先搜索；二、广度优先搜索深度优先搜索（遍历）步骤：访问起始点 v;若 v 的第 1 个邻接点没访问过，深度遍历此邻接点；若当前邻接点已访问过，再找 v 的第 2 个邻接点重新遍历。基本思想：仿树的先序遍历过程。广度优先搜索（遍历）步骤：在访问了起始点 v 之后，依次访问 v 的邻接点；然后再依次（顺序）访问这些点（下一层）中未被访问过的邻接点；直到所有顶点都被访问过为止。图的应用（最小生成树，最短路经）图的应用（最小生成树，最短路经）最小生成树（MST）的性质如下：若 U 集是 V 的一个非空子集，若(u0,v0)是一条最小权值的边，其中 u0U，v0V-U；则：(u0,v0)必在最小生成树上。求 MST 最常用的是以下两种：Kruskal（克鲁斯卡尔）算法、Prim（普里姆）算法 Kruskal 算法特点：将边归并，适于求稀疏网的最小生成树。Prime 算法特点:将顶点归并，与边数无关，适于稠密网。在带权有向图中 A 点（源点）到达 B 点（终点）的多条路径中，寻找一条各边权值之和最小的路径，即最短路径。两种常见的最短路径问题：一、单源最短路径用 Dijkstra（迪杰斯特拉）算法二、所有顶点间的最短路径用 Floyd（弗洛伊德）算法一、单源最短路径(Dijkstra 算法)一顶点到其余各顶点（v0j）目的：设一有向图 G=（V,E），已知各边的权值，以某指定点 v0 为源点，求从 v0 到图的其余各点的最短路径。限定各边上的权值大于或等于 0。2、所有顶点之间的最短路径可以通过调用 n 次 Dijkstra 算法来完成，还有更简单的一个算法：Floyd 算法（自学）。学习重点：学习重点：图是应用最广泛的一种数据结构，本章也是这门课程的重点。图是应用最广泛的一种数据结构，本章也是这门课程的重点。基本概念中，连通分量，生成树，邻接点是重点。基本概念中，连通分量，生成树，邻接点是重点。连通图：连通图：在无向图中,若从顶点 v1 到顶点 v2 有路径,则称顶点 v1 与 v2 是连通的。如果图中任意一对顶点都是连通的,则称此图是连通图。非连通图的极大连通子图叫做连通分量。生成树：生成树：是一个极小连通子图，它含有图中全部 n 个顶点，但只有 n-1 条边。邻接点：邻接点：若(u,v)是 E(G)中的一条边，则称 u 与 v 互为邻接顶点。图是复杂的数据结构，也有顺序和链式两种存储结构：数组表示法（重点是邻接距阵）图是复杂的数据结构，也有顺序和链式两种存储结构：数组表示法（重点是邻接距阵）和邻接表。这两种存储结构对有向图和无向图均适用和邻接表。这两种存储结构对有向图和无向图均适用图的遍历是图的各种算法的基础，应熟练掌握图的深度、广度优先遍历。图的遍历是图的各种算法的基础，应熟练掌握图的深度、广度优先遍历。连通图的最小生成树不是唯一的，但最小生成树边上的权值之和是唯一的。连通图的最小生成树不是唯一的，但最小生成树边上的权值之和是唯一的。应熟练掌应熟练掌握握 prim 和和 kruscal 算法，算法，特别是手工分步模拟生成树的生成过程。特别是手工分步模拟生成树的生成过程。从单源点到其他顶点，以及各个顶点间的最短路径问题，掌握熟练手工模拟。从单源点到其他顶点，以及各个顶点间的最短路径问题，掌握熟练手工模拟。补充：补充：1.问：当有向图中仅问：当有向图中仅 1 个顶点的入度为个顶点的入度为 0,其余顶点的入度均为其余顶点的入度均为 1，此时是何形状？，此时是何形状？答：是树！而且是一棵有向树！2.讨论：邻接表与邻接矩阵有什么异同之处？讨论：邻接表与邻接矩阵有什么异同之处？1.联系：邻接表中每个链表对应于邻接矩阵中的一行，链表中结点个数等于一行中非零元素的个数。2.区别：对于任一确定的无向图，邻接矩阵是唯一的（行列号与顶点编号一致），但邻接表不唯一（链接次序与顶点编号无关）。3.用途：邻接矩阵多用于稠密图的存储而邻接表多用于稀疏图的存储3.若对连通图进行遍历，得到的是生成树若对连通图进行遍历，得到的是生成树若对非连通图进行遍历，得到的是生成森林。若对非连通图进行遍历，得到的是生成森林。第第 8 章章查找查找内容提要：内容提要：查找表是称为集合的数据结构。是元素间约束力最差的数据结构：元素间的关系是元素查找表是称为集合的数据结构。是元素间约束力最差的数据结构：元素间的关系是元素仅共在同一个集合中。仅共在同一个集合中。（同一类型的数据元素构成的集合）查找表的操作：查找，插入，删除。查找表的操作：查找，插入，删除。静态查找表：顺序表，有序表等。静态查找表：顺序表，有序表等。针对静态查找表的查找算法主要有:顺序查找、折半查找、分块查找一、顺序查找（线性查找）技巧：把待查关键字 key 存入表头或表尾（俗称“哨兵”），这样可以加快执行速度。int Search_Seq(SSTable ST,KeyType key)ST.elem0.key=key;for(i=ST.length;ST.elem i.key!=key;-i );return i;/Search_Seq/ASL（1n）/2，时间效率为 O(n)，这是查找成功的情况:顺序查找的特点：优点：算法简单，且对顺序结构或链表结构均适用。缺点：ASL 太大，时间效率太低。二、折半查找（二分或对分查找）若关键字不在表中，怎样得知并及时停止查找？典型标志是：当查找范围的上界下界时停止查找。ASL 的含义是“平均每个数据的查找时间”，而前式是 n 个数据查找时间的总和，所以：三、分块查找（索引顺序查找）思路：先让数据分块有序，即分成若干子表，要求每个子表中的数据元素值都比后一块中的数值小（但子表内部未必有序）。然后将各子表中的最大关键字构成一个索引表，表中还要包含每个子表的起始地址（即头指针）。特点：块间有序，块内无序。查找：块间折半，块内线性查找步骤分两步进行：对索引表使用折半查找法（因为索引表是有序表）；确定了待查关键字所在的子表后，在子表内采用顺序查找法（因为各子表内部是无序表）；查找效率 ASL 分析：动态查找表：二叉排序树，平衡二叉树。动态查找表：二叉排序树，平衡二叉树。特点：表结构在查找过程中动态生成。要求：对于给定值 key,若表中存在其关键字等于 key 的记录，则查找成功返回；否则插入关键字等于 key 的记录。二叉排序树的定义-或是一棵空树；或者是具有如下性质的非空二叉树：（1）左子树的所有结点均小于根的值；（2）右子树的所有结点均大于根的值；（3）它的左右子树也分别为二叉排序树。二叉排序树的插入与删除思路：查找不成功，生成一个新结点 s，插入到二叉排序树中；查找成功则返回。SearchBST(K,&t)/K 为待查关键字，t 为根结点指针 p=t;/p 为查找过程中进行扫描的指针 while（p!=NULL）case K=p-data:查找成功，return Kdata:q=p；p=p-L_child /继续向左搜索 K p-data:q=p；p=p-R_child /继续向右搜索 /查找不成功则插入到二叉排序树中nnnnjnASLmjj2211log1)1(log121s=(BiTree)malloc(sizeof(BiTNode);s-data=K;s-L_child=NULL;s-R_child=NULL;/查找不成功，生成一个新结点 s，插入到二叉排序树叶子处case t=NULL：t=s;/若 t 为空，则插入的结点 s 作为根结点K data:q-L_child=s;/若 K 比叶子小，挂左边K q-data:q-R_child=s;/若 K 比叶子大，挂右边 return OK 二叉排序树的删除操作如何实现？如何删除一个结点？假设：*p 表示被删结点的指针；PL 和 PR 分别表示*P 的左、右孩子指针；*f 表示*p 的双亲结点指针；并假定*p 是*f 的左孩子；则可能有三种情况：*p 有两棵子树时，如何进行删除操作？设删除前的中序遍历序列为：.PL s p PR f /显然 p 的直接前驱是 s，s 是*p 左子树最右下方的结点希望删除 p 后，其它元素的相对位置不变。有两种解决方法：法 1：令*p 的左子树为*f 的左子树，*p 的右子树接为*s 的右子树；/即 fL=PL ;SR=PR ;法 2：直接令*s 代替*p /*s 为*p 左子树最右下方的结点二叉排序树的平衡二

展开阅读全文