1、第第1010章章 内部排序内部排序10.1 概述概述10.2 插入排序插入排序10.3 快速排序快速排序10.4 堆排序堆排序10.5 归并排序归并排序10.6 基数排序基数排序10.7 各种排序方法的综合比较各种排序方法的综合比较10.1 概概 述述一、排序的定义一、排序的定义二、内部排序和外部排序二、内部排序和外部排序三、内部排序方法的分类三、内部排序方法的分类一、什么是排序?一、什么是排序?排序是计算机内经常进行的一种操作,其目的是将一组“无序无序”的记录序列调的记录序列调整为整为“有序有序”的记录序列。例如:将下列关键字序列52,49,80,36,14,58,61,23,97,75调整
2、为14,23,36,49,52,58,61,75,80,971.什么是排序?什么是排序?将一组杂乱无章的数据按一定的规律顺次排列起来。将一组杂乱无章的数据按一定的规律顺次排列起来。2.排序的目的是什么?排序的目的是什么?存放在数据表中存放在数据表中按关键字排序按关键字排序3.3.排序算法的好坏如何衡量?排序算法的好坏如何衡量?时间效率时间效率排序速度(即排序所花费的全部比较次数)排序速度(即排序所花费的全部比较次数)空间效率空间效率占内存辅助空间的大小占内存辅助空间的大小稳稳定定性性若若两两个个记记录录A A和和B B的的关关键键字字值值相相等等,但但排排序序后后A A、B B的先后次序保持不
3、变,则称这种排序算法是稳定的。的先后次序保持不变,则称这种排序算法是稳定的。便于查找!便于查找!二、内部排序和外部排序二、内部排序和外部排序若待排序记录都在内存中,整个排序过程不需要访问外存便能完成,则称此类排序问题为内部排序内部排序;反之,若参加排序的记录数量很大,整个序列的排序过程不可能在内存中 完成,则称此类排序问题为外部排序外部排序。三、内部排序的方法三、内部排序的方法 内部排序的过程是一个逐步扩大逐步扩大记录的有序序列长度有序序列长度的过程。经过一趟排序经过一趟排序有序序列区无 序 序 列 区有序序列区无 序 序 列 区基于不同的“扩大扩大”有序序列长度的方法,内部排序方法方法,内部
4、排序方法大致可分下列几种类型:插入类插入类交换类交换类选择类选择类 归并类归并类基数排序基数排序待排记录的数据类型定义如下待排记录的数据类型定义如下:#define MAXSIZE 1000/待排顺序表最大长度待排顺序表最大长度typedef int KeyType;/关键字类型为整数类型关键字类型为整数类型typedef struct KeyType key;/关键字项关键字项 InfoType otherinfo;/其它数据项其它数据项 RcdType;/记录类型记录类型typedef struct RcdType rMAXSIZE+1;/r0闲置闲置 int length;/顺序表长度顺
5、序表长度 SqList;/顺序表类型顺序表类型1.插入类插入类将无序子序列中的一个或几个记录“插入插入”到有序序列中,从而增加记录的有序子序列的长度。2.交换类交换类通过“交换交换”无序序列中的记录从而得到其中关键字最小或最大的记录,并将它加入到有序子序列中,以此方法增加记录的有序子序列的长度。3.选择类选择类从记录的无序子序列中“选择”关键字最小或最大的记录,并将它加入到有序子序列中,以此方法增加记录的有序子序列的长度。4.归并类归并类通过“归并归并”两个或两个以上的记录有序子序列,逐步增加记录有序序列的长度。10.2 插插 入入 排排 序序插入排序的基本思想是:插入排序的基本思想是:每步将
6、一个待排序的对象,按其关键码大小,每步将一个待排序的对象,按其关键码大小,插入到前面已经排好序的一组对象的适当位置上,直插入到前面已经排好序的一组对象的适当位置上,直到对象全部插入为止。到对象全部插入为止。简言之,边插入边排序,保证子序列中随时都是排好序的简言之,边插入边排序,保证子序列中随时都是排好序的有序序列R1.i-1Ri无序序列 Ri.n一趟直接插入排序的基本思想:有序序列R1.i无序序列 Ri+1.n实现实现“一趟插入排序一趟插入排序”可分三步进行:可分三步进行:3将Ri 插入插入(复制)到Rj+1的位置上。2将Rj+1.i-1中的所有记录记录均后移后移 一个位置;1在R1.i-1中
7、查找查找Ri的插入位置,R1.j.key Ri.key Rj+1.i-1.key;直接插入排序直接插入排序(基于顺序查找)(基于顺序查找)表插入排序表插入排序(基于链表存储)(基于链表存储)不同的具体实现方法导致不同的算法描述不同的具体实现方法导致不同的算法描述折半插入排序折半插入排序(基于折半查找)(基于折半查找)希尔排序希尔排序(基于逐趟缩小增量)(基于逐趟缩小增量)小改进小改进大改进大改进1)直接插入排序直接插入排序新元素插入到哪里?新元素插入到哪里?例例1 1:关键字序列关键字序列T=(13,6,3,31,9,27,5,11),),请写出直接插入排序的中间过程序列。请写出直接插入排序的
8、中间过程序列。【13】,6,3,31,9,27,5,11【6,13】,3,31,9,27,5,11【3,6,13】,31,9,27,5,11【3,6,13,31】,9,27,5,11【3,6,9,13,31】,27,5,11【3,6,9,13,27,31】,5,11【3,5,6,9,13,27,31】,11【3,5,6,9,11,13,27,31】在已形成的有序表中线性查找,并在在已形成的有序表中线性查找,并在适当位置插入,把原来位置上的元素向后顺移。适当位置插入,把原来位置上的元素向后顺移。最简单的排序法!最简单的排序法!最简单的排序法!最简单的排序法!一、直接插入排序一、直接插入排序利用“
9、顺序查找顺序查找”实现“在R1.i-1中查找查找Ri的插入位置”算法的实现要点:算法的实现要点:从Ri-1起向前进行顺序查找,监视哨设置在R0;R0=Ri;/设置“哨兵”循环结束表明Ri的插入位置为 j+1R0jRifor(j=i-1;R0.keyRj.key;-j);/从后往前找j=i-1插入位置插入位置 对于在查找过程中找到的那些关键字不小于Ri.key的记录,并在查找的同时实现记录向后移动;for(j=i-1;R0.keyRj.key;-j)Rj+1=RjR0jRij=i-1上述循环结束后可以直接进行“插入”插入位置插入位置令 i=2,3,,n,实现整个序列的排序。for(i=2;i=n
10、;+i)if(Ri.keyRi-1.key)在 R1.i-1中查找Ri的插入位置;插入Ri;void InsertionSort(SqList&L)/对顺序表 L 作直接插入排序。for(i=2;i=L.length;+i)if(L.ri.key L.ri-1.key)/InsertSortL.r0=L.ri;/复制为监视哨for(j=i-1;L.r0.key 1)/while/BubbleSorti=n;i=lastExchangeIndex;/本趟进行过交换的 /最后一个记录的位置 if(Rj+1.key Rj.key)Swap(Rj,Rj+1);lastExchangeIndex=j;/
11、记下进行交换的记录位置 /iffor(j=1;j i;j+)lastExchangeIndex=1;冒泡排序的算法分析冒泡排序的算法分析最好情况:初始排列已经有序,只执行一趟起泡,做最好情况:初始排列已经有序,只执行一趟起泡,做 n-1 次关键码比较,不移动对象。次关键码比较,不移动对象。最坏情形:最坏情形:初始排列逆序,初始排列逆序,算法要执行算法要执行n-1 1趟起泡,第趟起泡,第i趟趟(1 i n)做了做了n-i 次关键码比较,执行了次关键码比较,执行了n-i 次对象交换。次对象交换。因此:因此:时间效率:时间效率:O O(n n2 2)因为要考虑最坏情况因为要考虑最坏情况空间效率:空间
12、效率:O O(1 1)只在交换时用到一个缓冲单元只在交换时用到一个缓冲单元稳稳 定定 性:性:稳定稳定 2525和和2525*在排序前后的次序未改变在排序前后的次序未改变时间分析时间分析:最好的情况(关键字在记录序列中顺序有序):最好的情况(关键字在记录序列中顺序有序):只需进行一趟起泡只需进行一趟起泡“比较比较”的次数:的次数:最坏的情况(关键字在记录序列中逆序有序):最坏的情况(关键字在记录序列中逆序有序):需进行需进行n-1趟起泡趟起泡“比较比较”的次数:的次数:0“移动移动”的次数:的次数:“移动移动”的次数:的次数:n-1 冒泡排序的优点:冒泡排序的优点:冒泡排序的优点:冒泡排序的优
13、点:每一趟整理元素时,不仅可以完全确定一每一趟整理元素时,不仅可以完全确定一个元素的位置(挤出一个泡到表尾),个元素的位置(挤出一个泡到表尾),一旦下趟没有交换一旦下趟没有交换发生,还可以提前结束排序。发生,还可以提前结束排序。有没有比冒泡排序更快的算法?有没有比冒泡排序更快的算法?有!有!快速排序法快速排序法全球公认!全球公认!因为它每趟都能准确定位不止因为它每趟都能准确定位不止1 1个个元素!元素!2)快速排序快速排序从待排序列中任取一个元素从待排序列中任取一个元素从待排序列中任取一个元素从待排序列中任取一个元素 (例如取第一个例如取第一个例如取第一个例如取第一个)作为中心,作为中心,作为
14、中心,作为中心,所有比它小的元素一律前放,所有比它大的元素一律后放,所有比它小的元素一律前放,所有比它大的元素一律后放,所有比它小的元素一律前放,所有比它大的元素一律后放,所有比它小的元素一律前放,所有比它大的元素一律后放,形成左右两个子表;形成左右两个子表;形成左右两个子表;形成左右两个子表;然后再对各子表重新选择中心元素并依此规则调整,直然后再对各子表重新选择中心元素并依此规则调整,直然后再对各子表重新选择中心元素并依此规则调整,直然后再对各子表重新选择中心元素并依此规则调整,直到每个子表的元素只剩一个。此时便为有序序列了。到每个子表的元素只剩一个。此时便为有序序列了。到每个子表的元素只剩
15、一个。此时便为有序序列了。到每个子表的元素只剩一个。此时便为有序序列了。基本思想:基本思想:优点:优点:因为每趟可以确定不止一个元素的位置,而且呈指数增因为每趟可以确定不止一个元素的位置,而且呈指数增加,所以特别快!加,所以特别快!前提:前提:顺序存储结构顺序存储结构 stlowhigh设设 Rs=52 为枢轴为枢轴 将 Rhigh.key 和 枢轴的关键字进行比较,要求Rhigh.key 枢轴的关键字 将 Rlow.key 和 枢轴的关键字进行比较,要求Rlow.key 枢轴的关键字high23low80high14low52例如例如R052lowhighhighhighlow 可见,经过“
16、一次划分一次划分”,将关键字序列 52,49,80,36,14,58,61,97,23,75 调整为:23,49,14,36,(52)58,61,97,80,75 在调整过程中,设立了两个指针:low 和high,它们的初值分别为:s 和 t,之后逐渐减小 high,增加 low,并保证 Rhigh.key52,和 Rlow.key52,否则进行记录的“交换”。int Partition(RedType&R,int low,int high)pivotkey=Rlow.key;while(lowhigh)while(low=pivotkey)-high;RlowRhigh;while(lowh
17、igh&Rlow.key=pivotkey)+low;RlowRhigh;return low;/返回枢轴所在位置/Partition快速排序快速排序 首先对无序的记录序列进行“一次划分一次划分”,之后分别分别对分割所得两个子序列“递归递归”进行快速排序进行快速排序。无 序 的 记 录 序 列无序记录子序列(1)无序子序列(2)枢轴枢轴一次划分分别进行快速排序void QSort(RedType&R,int s,int t)/对记录序列Rs.t进行快速排序 if(s H.rim中除中除ri外,其他都具有堆特征。外,其他都具有堆特征。现调整现调整ri的值的值,使,使H.rim为堆。为堆。基于初始
18、堆进行堆排序的算法步骤:基于初始堆进行堆排序的算法步骤:堆的第一个对象堆的第一个对象堆的第一个对象堆的第一个对象r r00具有最大的关键码,将具有最大的关键码,将具有最大的关键码,将具有最大的关键码,将r r00与与与与r r n n 对调,把具有最大关键码的对象交换到对调,把具有最大关键码的对象交换到对调,把具有最大关键码的对象交换到对调,把具有最大关键码的对象交换到最后最后最后最后;再对前面的再对前面的再对前面的再对前面的n n-1-1个对象,使用堆的调整算法,个对象,使用堆的调整算法,个对象,使用堆的调整算法,个对象,使用堆的调整算法,重新建立堆。结果具有次最大关键码的对象又上重新建立堆
19、。结果具有次最大关键码的对象又上重新建立堆。结果具有次最大关键码的对象又上重新建立堆。结果具有次最大关键码的对象又上浮到堆顶,即浮到堆顶,即浮到堆顶,即浮到堆顶,即r r00位置位置位置位置;再对调再对调再对调再对调r r00和和和和r r n-n-1 1,然后对前,然后对前,然后对前,然后对前n n-2-2个对象重新个对象重新个对象重新个对象重新调整,调整,调整,调整,如此反复,最后得到全部排序好的对象如此反复,最后得到全部排序好的对象如此反复,最后得到全部排序好的对象如此反复,最后得到全部排序好的对象序列序列序列序列。如何如何“建堆建堆”?两个问题两个问题:如何如何“筛选筛选”?定义堆类型
20、为定义堆类型为:typedef SqList HeapType;/堆采用顺序表表示之所谓“筛选筛选”指的是,对一棵左/右子树均为堆的完全二叉树,“调整调整”根结根结点点使整个二叉树也成为一个堆。堆堆筛筛选选98814973556412362740例如例如:是大顶堆是大顶堆12但在 98 和 12 进行互换之后,它就不不是堆了,因此,需要对它进行“筛选”。98128173641298比较比较比较void HeapAdjust(RcdType&R,int s,int m)/已知 Rs.m中记录的关键字除 Rs 之外均 /满足堆的特征,本函数自上而下调整 Rs 的 /关键字,使 Rs.m 也成为一个
21、大顶堆/HeapAdjustrc=Rs;/暂存 Rs for(j=2*s;j=Rj.key)break;/再作“根”和“子树根”之间的比较,/若“=”成立,则说明已找到 rc 的插 /入位置 s,不需要继续往下调整Rs=Rj;s=j;/否则记录上移,尚需继续往下调整if(jm&Rj.keyRj+1.key)+j;/左/右“子树根”之间先进行相互比较 /令 j 指示关键字较大记录的位置建堆是一个从下往上进行建堆是一个从下往上进行“筛选筛选”的过程。的过程。40554973816436122798例如例如:排序之前的关键字序列为123681734998817355 现在,左/右子树都已经调整为堆,
22、最后只要调整根结点,使整个二叉树是个“堆”即可。98494064361227堆排序的时间复杂度分析:堆排序的时间复杂度分析:1.对深度为 k 的堆,“筛选”所需进行的关键字比较的次数至多为2(k-1);3.调整“堆顶”n-1 次,总共进行的关键 字比较的次数不超过 2(log2(n-1)+log2(n-2)+log22)2n(log2n)因此,堆排序的时间复杂度为O(nlogn)。2.对 n 个关键字,建成深度为h(=log2n+1)的堆,所需进行的关键字比较的次数至多 4n;堆排序算法分析:堆排序算法分析:空间效率:空间效率:O(1)。仅在第二个仅在第二个for循环中交循环中交换记录时用到一
23、个临时变量换记录时用到一个临时变量temptemp。稳定性:稳定性:不稳定。不稳定。优点:优点:对小文件效果不明显,但对大文件对小文件效果不明显,但对大文件有效。有效。10.5 归归 并并 排排 序序归并排序的过程基于下列基本思想基本思想进行:将两个或两个以上的有序子序列“归并”为一个有序序列。在内部排序中,通常采用的是2-路归并排序。即:将两个位置相邻位置相邻的记录有序子序列归并为一个一个记录的有序序列。有有 序序 序序 列列 Rl.n有序子序列有序子序列 Rl.m有序子序列有序子序列 Rm+1.n这个操作对顺序表而言,是轻而易举的。void Merge(RcdType SR,RcdType
24、&TR,int i,int m,int n)/将有序的记录序列 SRi.m 和 SRm+1.n /归并为有序的记录序列 TRi.n/Mergefor(j=m+1,k=i;i=m&j=n;+k)/将SR中记录由小到大地并入TR if(SRi.key=SRj.key)TRk=SRi+;else TRk=SRj+;if(i=m)TRk.n=SRi.m;/将剩余的 SRi.m 复制到 TRif(j=n)TRk.n=SRj.n;/将剩余的 SRj.n 复制到 TR更实际的意义:可以把一个长度为更实际的意义:可以把一个长度为n n 的无序序列看的无序序列看成是成是 n n 个长度为个长度为 1 1 的有序
25、子序列的有序子序列 ,首先做两两,首先做两两归并,得到归并,得到 n n/2/2 个长度为个长度为 2 2 的有序子序列的有序子序列 ;再做两两归并,再做两两归并,如此重复,直到最后得到一个,如此重复,直到最后得到一个长度为长度为 n n 的有序序列。的有序序列。例:例:例:例:关键字序列关键字序列T=(21,25,49,25*,93,62,72,08,37,16,54),请给出归并排序的具体实),请给出归并排序的具体实现过程。现过程。lenlen=1=1lenlen=2=2lenlen=4=4lenlen=8=8lenlen=16=16整个归并排序仅需整个归并排序仅需整个归并排序仅需整个归并
26、排序仅需 loglog2 2n n 趟趟趟趟归并排序算法分析:归并排序算法分析:时间效率:时间效率:O(O(n nloglog2 2n n)因为在递归的归并排序算法中,函数因为在递归的归并排序算法中,函数Merge()做一趟两路归做一趟两路归并排序,需要调用并排序,需要调用merge()函数函数 n/(2len)O(n/len)次,而次,而每次每次merge()要执行比较要执行比较O(len)次,另外整个归并过程有次,另外整个归并过程有 log2n “层层”,所以算法总的时间复杂度为,所以算法总的时间复杂度为O(nlog2n)。空间效率:空间效率:O(O(n n)因为需要一个与原始序列同样大小
27、的辅助序列(因为需要一个与原始序列同样大小的辅助序列(TR)。这)。这正是此算法的缺点。正是此算法的缺点。稳定性:稳定性:稳定稳定稳定稳定10.6 基基 数数 排排 序序基数排序基数排序是一种借助“多关键字排序”的思想来实现“单关键字排序”的内部排序算法。多关键字的排序多关键字的排序链式基数排序链式基数排序一、多关键字的排序一、多关键字的排序 n 个记录的序列个记录的序列 R1,R2,,Rn对关键字对关键字 (Ki0,Ki1,Kid-1)有序有序是指:其中其中:K0 被称为被称为 “最主最主”位关键字位关键字Kd-1 被称为被称为 “最次最次”位关键字位关键字 对于序列中任意两个记录 Ri 和
28、 Rj(1ijn)都满足满足下列(词典词典)有序有序关系:(Ki0,Ki1,Kid-1)(Kj0,Kj1,Kjd-1)实现多关键字排序通常有两种作法:最低位优先最低位优先LSD法法最高位优先最高位优先MSD法先对先对K0进行排序进行排序,并按 K0 的不同值将记录序列分成若干子序列之后,分别对 K1 进行排序,.,依次类推,直至最后对最次位关直至最后对最次位关键字排序完成为止键字排序完成为止。先对 Kd-1 进行排序,然后对 Kd-2 进行排序,依次类推,直至对最主位直至对最主位关键字关键字 K0 排序完成为止排序完成为止。排序过程中不需要根据“前一个”关键字的排序结果,将记录序列分割成若干个
29、(“前一个”关键字不同的)子序列。例如例如:学生记录含三个关键字:系别系别、班号班号和班内的序列号班内的序列号,其中以系别为最主位关键字。无序序列无序序列对对K2排序排序对对K1排序排序对对K0排序排序3,2,301,2,153,1,202,3,182,1,201,2,152,3,183,1,202,1,203,2,303,1,202,1,201,2,153,2,302,3,18 1,2,152,1,202,3,183,1,203,2,30LSD的排序过程如下:二、链式基数排序二、链式基数排序假如多关键字的记录序列中,每个关键字的取值范围相同,则按LSD法进行排序时,可以采用“分配分配-收集收
30、集”的方法,其好处是不需要进行关键字间的比较。对于数字型或字符型的单关键字单关键字,可以看成看成是由多个数位或多个字符构成的多多关键字关键字,此时可以采用采用这种“分配分配-收集收集”的办法进行排序进行排序,称作基数排序法称作基数排序法。例如:例如:对下列这组关键字 209,386,768,185,247,606,230,834,539 首先按其“个位数”取值分别为 0,1,9 “分配分配”成 10 组,之后按从 0 至 9 的顺序将 它们“收集收集”在一起;然后按其“十位数”取值分别为 0,1,9 “分配分配”成 10 组,之后再按从 0 至 9 的顺序将它们“收集收集”在一起;最后按其“百
31、位数”重复一遍上述操作。在计算机上实现基数排序时,为减少所需辅助存储空间,应采用链表作存储结构,即链式基数排序,具体作法为:待排序记录以指针相链,构成一个链表;“分配”时,按当前“关键字位”所取值,将记录分配到不同的“链队列”中,每个队列中记录的“关键字位”相同;“收集”时,按当前关键字位取值从小到大将各队列首尾相链成一个链表;对每个关键字位均重复 2)和 3)两步。例如:p369367167239237138230139进行第一次分配进行第一次分配进行第一次收集进行第一次收集f0 r0f7 r7f8 r8f9 r9p230230367 1672373671672371383682391393
32、69 239139138进行第二次分配进行第二次分配p230237138239139p230367167237138368239139f3 r3f6 r6230 237138239139367 167368367167368进行第二次收集 进行第三次收集之后便得到记录的有序序列进行第三次收集之后便得到记录的有序序列f1 r1p230237138239139367167368进行第三次分配进行第三次分配f2 r2f3 r3138 139167230 237239367 368p138139167230237239367368提醒注意:提醒注意:“分配分配”和和“收集收集”的实际操作的实际操作仅为
33、修改链表中的指针和设置队列的仅为修改链表中的指针和设置队列的头、尾指针;头、尾指针;为查找使用,该链表尚需应用算为查找使用,该链表尚需应用算法法Arrange 将它调整为有序表。将它调整为有序表。基数排序的时间复杂度为基数排序的时间复杂度为O(d(n+rd)其中:分配为O(n)收集为O(rd)(rd为“基”)d为“分配-收集”的趟数10.7 各种排序方法的综合比较各种排序方法的综合比较一、时间性能一、时间性能1.平均的时间性能平均的时间性能基数排序基数排序时间复杂度为时间复杂度为 O(nlogn):快速排序、堆排序和归并排序快速排序、堆排序和归并排序时间复杂度为时间复杂度为 O(n2):直接插
34、入排序、起泡排序和直接插入排序、起泡排序和简单选择排序简单选择排序时间复杂度为时间复杂度为 O(n):2.当待排记录序列按关键字顺序有序时当待排记录序列按关键字顺序有序时3.简单选择排序、堆排序和归并排序简单选择排序、堆排序和归并排序的时间性能不随不随记录序列中关键字的分布而改变。直接插入排序直接插入排序和起泡排序起泡排序能达到O(n)的时间复杂度,快速排序快速排序的时间性能蜕化为O(n2)。二、空间性能二、空间性能指的是排序过程中所需的辅助空间大小1.所有的简单排序方法简单排序方法(包括:直接插入、起泡和简单选择)和堆排序堆排序的空间复杂度为为O(1);2.快速排序为快速排序为O(logn)
35、,为递归程序执行过程中,栈所需的辅助空间;3.归并排序归并排序所需辅助空间最多,其空间复杂度为 O(n);4.链式基数排序链式基数排序需附设队列首尾指针,则空间复杂度为 O(rd)。三、排序方法的稳定性能三、排序方法的稳定性能 1.稳定的排序方法指的是,对于两个关键字相等的记录,它们在序列中的相对位置,在排序之前和经过排序之后,没有改变。2.当对多关键字的记录序列进行LSD方法排序时,必须采用稳定的排序方法。排序之前:Ri(K)Rj(K)排序之后:Ri(K)Rj(K)例如:例如:排序前(56,34,47,23,66,18,82,47)若排序后得到结果 (18,23,34,47,47,56,66
36、,82)则称该排序方法是稳定稳定的;若排序后得到结果 (18,23,34,47,47,56,66,82)则称该排序方法是不稳定不稳定的。3.对于不稳定的排序方法,只要能举出一个实例说明即可。4.快速排序、堆排序和希尔排序是不稳快速排序、堆排序和希尔排序是不稳定的排序方法定的排序方法。例如例如:对 4,3,4,2 进行快速排序,得到 2,3,4,4 四、关于四、关于“排序方法的时间复杂度的下限排序方法的时间复杂度的下限”本章讨论的各种排序方法,除基数排序外,其它方法都是基于基于“比较关键字比较关键字”进进行排序的排序方法。行排序的排序方法。可以证明,这类排序法可能达到的最可能达到的最快的时间复杂
37、度为快的时间复杂度为O(nlogn)。(基数排序不是基于“比较关键字”的排序方法,所以它不受这个限制。)例如:对三个关键字进行排序的判定树如下:K1K3K1K2K1K3K2K3K2 K3K2K1K3K1K2K3K3K2K1K2K3K1K3K1K2K1K3K2树上的每一次“比较”都是必要的;树上的叶子结点包含所有可能情况。一般情况下,对n个关键字进行排序,可能得到的结果有n!种,由于含n!个叶子结点的二叉树的深度不小于log2(n!)+1,则对 n 个关键字进行排序的比较次数至少是 log2(n!)nlog2n(斯蒂林近似公式)。所以,基于基于“比较关键字比较关键字”进行排序进行排序的的排序方法
38、,可能达到的最快的时间复杂排序方法,可能达到的最快的时间复杂度为度为 O(nlogn)。10.8外外 部部 排排 序序一一.问题的提出问题的提出 待排序的记录数量很大,不能一次装入内存,则无法利用前几节讨论的排序方法(否则将引起频繁访问内存);对外存中数据的读/写是以“数据块”为单位进行的;读/写外存中一个“数据块”的数据所需要的时间为:TI/O=tseek+tla+n twm 其中 tseek 为寻查时间(查找该数据块所在磁道)tla 为等待(延迟)时间 n twm 为传输数据块中n个记录的时间。按可用内存大小,利用内部排序 方法,构造若干(记录的)有序子序列,通常称外存中这些记录有序子序列
39、为“归并段归并段”;二、外部排序的基本过程二、外部排序的基本过程由相对独立的两个步骤组成:通过“归并归并”,逐步扩大(记录的)有序子序列的长度,直至外存中整个记录序列按关键字有序为止。例如:例如:假设有一个含10,000个记录的磁盘 文件,而当前所用的计算机一次只 能对1000个记录进行内部排序,则 首先利用内部排序的方法得到10个 初始归并段,然后进行逐趟归并。假设进行2路归并(即两两归并),则第一趟第一趟由10个归并段得到5个归并段;最后一趟最后一趟归并得到整个记录的有序序列。第三趟第三趟由 3 个归并段得到2个归并段;第二趟第二趟由 5 个归并段得到3个归并段;假设“数据块”的大小为20
40、0,即每一次访问外存可以读/写200个记录。则对于10,000个记录,处理一遍需访问外存100次(读和写各50次)。分析上述外排过程中访问外存(对外存进行读/写)的次数:由此,对上述例子而言,1)求得10个初始归并段需访问外存100次;2)每进行一趟归并需访问外存100次;3)总计访问外存 100+4 100=500次。外排总的时间还应包括内部排序所需时间和逐趟归并时进行内部归并的时间,显然,除去内部排序的因素外,外部排序的时间取决于逐趟归并外部排序的时间取决于逐趟归并所需进行的所需进行的“趟数趟数”。例如例如,若对上述例子采用5路归并,则只需进行2趟归并,总的访问外存的次数将压缩到 100+
41、2 100=300 次。一般情况下,假设待排记录序列含含 m 个初始归并段个初始归并段,外排时采用 k 路路归并归并,则归并趟数归并趟数为 logkm,显然,随之k的增大归并的趟数将减少,因此对外排而言,通常采用多路归并。k 的大小可选,但需综合考虑各种因素。1.了解排序的定义定义和各种排序方法的特点。熟悉各种方法的排序过程及其依方法的排序过程及其依据的原则据的原则。基于“关键字间的比较关键字间的比较”进行排序的方法可以按排序过程所依据的不同原则分为插入排序插入排序、交换排序交换排序、选选择排序择排序、归并排序归并排序和计数排序等五类。2.掌握各种排序方法的时间复杂度时间复杂度的分析方法。能从“关键字间的比较关键字间的比较次数次数”分析排序算法的平均平均情况和最最坏坏情况的时间性能。按平均时间复杂度划分,内部排序可分为三类:O(n2)的简单排序方法,O(nlogn)的高效排序方法 和 O(dn)的基数排序方法。3理解排序方法“稳定稳定”或“不稳定不稳定”的含义,弄清楚在什么情况下什么情况下要求应用的排序方法必须是稳定的。4.了解外部排序的基本过程及其时间分析。衷心感谢全体同学的支持和配合,衷心感谢全体同学的支持和配合,使我能圆满完成本课程的教学任务。使我能圆满完成本课程的教学任务。希望大家顺利通过课程考试希望大家顺利通过课程考试