您当前位置：首页 > php开源 > php教程 > 数据结构--排序算法总结

数据结构--排序算法总结

来源：程序员人生发布时间：2017-02-04 09:03:40 阅读次数：4038次

概述

排序的分类：内部排序和外部排序

内部排序：数据记录在内存中进行排序

外部排序：因排序的数据量大，需要内存和外存结合使用进行排序

这里总结的8大排序是属于内部排序：

当n比较大的时候，应采取时间复杂度为（nlog2n）的排序算法：快速排序、堆排序或归并排序。

其中，快速排序是目前基于比较的内部排序中被认为最好的方法，当待排序的关键字是随机散布时，快速排序的平均时间最短。

———————————————————————————————————————————————————————————————————————

插入排序——直接插入排序（Straight Insertion Sort）

基本思想：

将1个记录插入到已排序好的有序表中，从而得到1个新的，记录数增1的有序表。

即：先将序列的第1个记录看成1个有序的子序列，然后从第2个记录逐一进行插入，直至全部序列有序为止。

要点：设立哨兵，用于临时存储和判断数组边界

直接插入排序示例：

插入排序是稳定的，由于如果1个带插入的元素和已插入元素相等，那末待插入元素将放在相等元素的后边，所以，相等元素的前后顺序没有改变。

算法实现：

#include<iostream>
using namespace std;

void print(int a[], int n ,int i)
{  
    cout<<i<<":";  
    for(int j= 0; j<8; j++){  
        cout<<a[j] <<" ";  
    }  
    cout<<endl;  
} 

void InsertSort(int a[],int n)
{
	int i,j,tmp;
	for(i=1;i<n;++i)
	{
		// 如果第i个元素大于第i⑴个元素，直接插入
		// 否则
		// 小于的话，移动有序表后插入 
		if(a[i]<a[i⑴])
		{
			j=i⑴;
			tmp=a[i];	// 复制哨兵，即存储待排序元素
			a[i]=a[i⑴];	// 前后移1个元素
			while(tmp<a[j])	 
			{	
				// 哨兵元素比插入点元素小，后移1个元素
				a[j+1]=a[j];
				--j;
			}
			a[j+1]=tmp;	// 插入到正确的位置 
		}
		print(a,n,i); // 打印每趟排序的结果 
	}
}

int main()
{
	int a[8]={3,1,5,7,3,4,8,2};
	print(a,8,0);	// 打印原始序列 
	InsertSort(a,8);
	return 0;
}

分析：

时间复杂度：O（n^2）

插入排序——希尔排序（Shell Sort）

基本思想：

先将全部待排序的记录序列分割成为若干子序列，分别进行直接插入排序，待全部序列中的记录“基本有序”时，再对全部记录顺次进行直接插入排序。

操作方法：

选择1个增量序列{ t1，t2，t3，...，tk }

按增量序列个数k，对序列进行k趟排序；
每趟排序，根据对应的增量ti，将待排序序列分割成若干长度为m的子序列，分别对各子序列进行直接插入排序。仅增量由于为1时，全部序列作为1个整表来处理，表长度即为全部序列的长度。

希尔排序的示例：

算法实现：

**如何选择增量序列？

简单选择：增量序列d = { n/2，n/4，n/8，...，1 } ，其中n为要排序数的个数。

#include<iostream>
using namespace std;

void print(int a[], int n)
{   
    for(int j= 0; j<8; j++){  
        cout<<a[j] <<" ";  
    }  
    cout<<endl;  
}

void ShellInsertSort(int a[],int n,int dk)
{
	int i,j,tmp;
	for(i=dk;i<n;++i)
	{
		// 如果第i个元素大于第i-dk个元素，直接插入
		// 否则
		// 小于的话，移动有序表后插入 
		if(a[i]<a[i-dk])
		{
			j=i-dk;
			tmp=a[i];
			a[i]=a[i-dk]; // 复制哨兵，即存储待排序元素
			while(tmp<a[j])
			{
				// 哨兵元素比插入点元素小，后移dk个元素
				a[j+dk]=a[j];
				j-=dk;
			}
			a[j+dk]=tmp; // 插入到正确的位置 
		}
	}
}

void ShellSort(int a[],int n)
{
	int dk=n/2;
	while(dk>=1)
	{
		ShellInsertSort(a,n,dk);
		dk/=2;
	}
}

int main()
{
	int a[8]={3,1,5,7,3,4,8,2};
	print(a,8);	// 打印原始序列 
	ShellSort(a,8);
	print(a,8); 	// 打印排序后的序列 
	return 0;
}

分析：

可以发现，希尔排序是对简单插入排序算法的1种改进。

但希尔排序是不稳定的排序方法，由于排序进程中可能会改变相同元素在原始序列中的前后关系。

关于希尔排序的时效分析，取决于增量因子序列d的选取，特定情况下可以估算出关键码的比较次数和记录的移动次数。

目前还没有人给出选取最好的增量因子序列的方法。

选择排序——简单选择排序（Simple Selection Sort）

基本思想：

在要排序的1组数中，选出最小（或最大）的1个数与第1个位置的数进行交换；然后在剩下的数当中再找最小（或最大）的数与第2个位置的数交换，顺次类推，直到第n⑴个元素（倒数第2个数）和第n个元素（最后1个数）比较为止。

简单选择排序示例：

操作方法：

第1趟：从n个记录中找出关键码最小的记录与第1个记录交换；

第2趟：从第2个记录开始的n⑴个记录中再选出关键码最小的记录与第2个记录交换；

以此类推...

第 i 趟：从第i个记录开始的n-i+1个记录当选出关键码最小的记录与第i个记录交换，直至全部序列按关键码有序。

算法实现：

#include<iostream>
using namespace std;

void print(int a[], int n ,int i)
{  
    cout<<"第"<<i+1 <<"趟 : ";  
    for(int j= 0; j<8; j++){  
        cout<<a[j] <<"  ";  
    }  
    cout<<endl;  
}

// 返回数组的最小值的键值
int SelectMinKey(int a[],int n,int i)
{
	int k=i;
	for(int j=i+1;j<n;++j)
		if(a[k]>a[j])
			k=j;
	return k;
}

void SelectSort(int a[],int n)
{
	int key,tmp;
	for(int i=0;i<n;++i)
	{
		key=SelectMinKey(a,n,i);	// 选择最小的元素
		if(key!=i)
		{
			// 最小元素与第i位置元素互换 
			tmp=a[i];
			a[i]=a[key];
			a[key]=tmp;
		}
		print(a,n,i);
	}
}

int main()
{
	int a[8]={3,1,5,7,3,4,8,2};
	cout<<"原始序列：";
	for(int i=0;i<8;++i)
	{
		cout<<a[i];
		if(i==7)
			cout<<endl;
		else
			cout<<"  ";
	}
	SelectSort(a,8);
	return 0;
}

选择排序——堆排序（Heap Sort）

基本思想：

1）初始化堆；将数列[ 1 ... n ]构造成最大化堆

2）交换数据：将a[ 1 ]和a[ n ]交换，使a[ n ]是[ 1 ... n ]中的最大值；然后将[ 1 ... n⑴ ]重新调剂为最大堆。接着，将a[ 1 ]和a[ n⑴ ]交换，使a[ n⑴ ]是[ 1 ... n⑴ ]中的最大值；然后将[ 1 ... n⑵ ]重新调剂为最大堆。顺次类推，直到全部数列有序。

堆排序的示例：

实现中用到了“数组实现的2叉堆的性质”。

在第1个元素的索引为0的情形中：

性质1：索引为i 的左孩子的索引是（2*i+1）；

性质2：索引为i 的右孩子的索引是（2*i+2）；

性质3：索引为i 的父节点的索引是floor( ( i⑴ ) / 2 )；

下面演示对a={20,30,90,40,70,110,60,10,100,50,80}, n=11进行堆排序进程

数组a对应的初始结构：

1 初始化堆：

在堆排序算法中，首先要将待排序的数组转换成最大堆。

下面演示将数组{20,30,90,40,70,110,60,10,100,50,80}转换为最大堆{110,100,90,40,80,20,60,10,30,50,70}的步骤。

1.1 i = n/2 - 1，即i = 4

1.2 i = 3

1.3 i = 2

1.4 i = 1

1.5 i = 0

2 交换数据

在将数组转换成最大堆后，接着要进行交换数据，从而使数组成为1个真实的有序数组。

下面是当n = 10时交换数组的示意图：

当n = 10时，首先交换a[0]和a[10]，使得a[10]是a[0 ... 10 ]之间的最大值；然后调剂a[0 ... 9 ]使它成为最大堆。交换以后，a[10]是有序的；

当n = 9时，首先交换a[0]和a[9]，使得a[9]是a[0 ... 9 ]之间的最大值；然后调剂a[0 ... 8 ]使它成为最大堆。交换以后，a[9]是有序的；

... ...

顺次类推，直到a[0 ... 10 ]是有序的。

算法实现：

#include<iostream>
using namespace std;

void maxheap_down(int a[],int start,int end)
{
	int current=start;	// 当前结点的位置
	int left=2*current+1;	// 左孩子的位置
	int tmp=a[current];	// 当前节点的大小
	for(;left<=end;current=left,left=2*left+1)
	{
		if(left<end&&a[left]<a[left+1])
			++left;	// 左右孩子当选择较大者
		if(tmp>=a[left])
			break;	//调剂结束
		else
		{
			// 交换值
			a[current]=a[left];
			a[left]=tmp;
		} 
	} 
}

void HeapSort(int a[],int n)
{
	int i,tmp;
	// 从(n/2⑴) --> 0逐次遍历。遍历以后，得到的数组实际上是1个(最大)2叉堆。
	for(i=n/2⑴;i>=0;--i)
		maxheap_down(a,i,n⑴);
	// 从最后1个元素开始对序列进行调剂，不断的缩小调剂的范围直到第1个元素
	for(i=n⑴;i>0;--i)
	{
		// 交换a[0]和a[i]。交换后，a[i]是a[0...i]中最大的
		tmp=a[i];
		a[i]=a[0];
		a[0]=tmp;
		// 调剂a[0...i⑴]，使得a[0...i⑴]依然是1个最大堆;
		// 即，保证a[i⑴]是a[0...i⑴]中的最大值
		maxheap_down(a,0,i⑴);
	}
}

int main()
{
	int i;
	int a[]={20,30,90,3,21,11,60,10,23,50,80};
	int len=(sizeof(a))/(sizeof(a[0]));
	cout<<"原始序列：";
	for(i=0;i<len;++i)
		cout<<a[i]<<" ";
	cout<<endl;
	HeapSort(a,len);
	cout<<"堆排序后的序列："; 
	for(i=0;i<len;++i)
		cout<<a[i]<<" ";
	cout<<endl;
	return 0;
}

分析：

时间复杂度：O（nlog2n）

遍历1趟的时间复杂度是O（n）；

堆排序是采取2叉堆进行排序的，2叉堆就是1棵2叉树，它需要遍历的次数就是2叉树的深度，而根据完全2叉树的定义，它的深度最少是log2(n+1)，最多也不会超过log22n。因此，遍历次数介于log2(n+1)和log22n之间；因此得出它的时间复杂度是O（nlog2n）。

堆排序稳定性：不稳定的

它在交换数据的时候，是比较父节点和子节点之间的数据，所以即便是存在两个数值相等的兄弟结点，它们的相对顺序在排序中也可能产生变化。

交换排序——冒泡排序（Bubble Sort）

基本思想：

在要排序的1组数中，对当前还未排好序的范围内的全部数，自上而下对相邻的两个数顺次进行比较和调剂，让较大的数往下沉，较小的数往上冒。

即：每当相邻的数比较后发现它们的顺序与排序要求相反时，就将它们互换。

冒泡排序的示例：

算法实现：

#include<iostream>
using namespace std;

void print(int a[], int n ,int i)
{  
    cout<<"第"<<i+1<<"趟 : ";  
    for(int j= 0; j<8; j++){  
        cout<<a[j]<<"  ";  
    }  
    cout<<endl;  
}

void BubbleSort(int r[],int size)
{
	int i,j,temp;
	bool exchange;	//交换标志
	for(i=0;i<size;i++)
	{
		exchange=false;	//本趟排序开始前，交换标志设为假
		for(j=size⑴;j>=i;--j)
			if(r[j]<r[j⑴])
			{
				temp=r[j];	//暂存单元 
				r[j]=r[j⑴];
				r[j⑴]=temp;
				exchange=true;	//产生了交换，故将交换标志置为真 
			}
		if(!exchange)	//本趟没有产生交换，提早终止算法 
			return;
		print(r,size,i);
	}
}

int main()
{
	int r[8]={3,1,5,7,3,4,8,2};
	cout<<"原始序列：";
	for(int i=0;i<8;i++)
	{
		cout<<r[i];
		if(i==7)
			cout<<endl;
		else
			cout<<"  ";
	}
	BubbleSort(r,8);
	return 0;
}

交换排序——快速排序（Quick Sort）

基本思想：

1）选择1个基准元素，通常选择第1个元素或最后1个元素

2）通过1趟排序将待排序的记录分割成独立的两部份，其中1部份记录的元素值均比基准元素值小，另外一部份记录的元素值比基准值大。

3）此时基准元素在其排好序后的正确位置

4）然后分别对这两部份记录用一样的方法继续进行排序，直到全部序列有序

快速排序的示例：

a）1趟排序的进程：

b）排序的全进程：

算法实现：

#include<iostream>
using namespace std;

int Partition(int r[],int first,int end)
{
	int i=first,j=end,temp;	//初始化
	while(i<j)
	{
		//j从后向前扫描，直到r[j]<r[i]，将r[j]移动到r[i]的位置，使关键码小（同轴值相比）的记录移动到前面去；
		while(i<j && r[i]<=r[j]) --j;	//右边扫描
		if(i<j)
		{
			//将较小记录交换到前面
			temp=r[i];
			r[i]=r[j];
			r[j]=temp;
			++i;
		}
		//i从前向后扫描，直到r[i]>r[j]，将r[i]移动到r[j]的位置，使关键码大（同轴值相比）的记录移动到后面去；
		while(i<j && r[i]<=r[j]) ++i;	//左边扫描
		if(i<j)
		{
			//将较大记录交换到后面
			temp=r[i];
			r[i]=r[j];
			r[j]=temp;
			--j;
		}
		//重复上述进程，直到i=j
	}
	return i;
}

void QuickSort(int r[],int first,int end)
{
	if(first<end)
	{
		int pivotpos=Partition(r,first,end);	//1次划分
		QuickSort(r,first,pivotpos⑴);	//对前1个子序列进行快速排序
		QuickSort(r,pivotpos+1,end);	//对后1个子序列进行快速排序
	}
	
}

int main()
{
	int r[8]={3,1,5,7,3,4,8,2};
	cout<<"原始序列：";
	for(int i=0;i<8;i++)
	{
		cout<<r[i];
		if(i==7)
			cout<<endl;
		else
			cout<<"  ";
	}
	QuickSort(r,0,7);
	cout<<"排序后的序列：";
	for(int i=0;i<8;i++)
	{
		cout<<r[i];
		if(i==7)
			cout<<endl;
		else
			cout<<"  ";
	}
	return 0;
}

分析：

快速排序通常被认为在同数量级（O（nlog2n）中平均性能最好的。但如果初始序列按关键码有序或基本有序时，快速排序反而退化为冒泡排序。

为改进之，通常以“3者取中法“来选取基准记录，行将排序区间的两个端点与中点3个记录关键码居中地调剂为支点记录。

快速排序是1个不稳定的排序算法。

归并排序（Merge Sort）

基本思想：

归并排序是将两个（或两个以上）的有序表合并成1个新的有序表，行将待排序序列分为若干个子序列，每一个序列是有序的。然后再将有序子序列合并为整体有序序列。

归并排序示例：

合并方法：

1个元素的表总是有序的，所以对n个元素的待排序列，每一个元素可看成1个有序子表。对子表两两合并，生成n/2个子表，所得子表除最后1个子表长度可能为1外，其余子表长度均为2。再进行两两合并，直到生成n个元素按关键码有序的表。

算法实现：

#include<iostream>
using namespace std;
 
void print(int a[], int n)
{  
    for(int j=0; j<n; j++){  
        cout<<a[j] <<"  ";  
    }  
    cout<<endl;  
} 

void merge(int r[],int left,int mid,int right)
{
	int *rf=new int[right-left+1];	//汇总2个有序区的临时数组 
	int i=left;		 // 第1个有序区的索引
	int j=mid+1;	 // 第2个有序区的索引
	int k=0;		// 临时区域的索引
	while(i<=mid&&j<=right)
	{
		if(r[i]<r[j])
		{
			rf[k++]=r[i++];
		}
		else
		{
			rf[k++]=r[j++];
		} 
	} 
	while(i<=mid)
		rf[k++]=r[i++];
	while(j<=right)
		rf[k++]=r[j++];
	// 将排序后的元素，全部都整合到数组a中。
    for(i=0;i<k;i++)
        r[left + i] = rf[i];
	delete []rf;
}

void MergeSort(int r[],int left,int right)
{
	if(r!=NULL&&left<right)
	{
		int mid=(left+right)/2;
		MergeSort(r,left,mid);		// 递归排序a[start...mid]
		MergeSort(r,mid+1,right);	// 递归排序a[mid+1...end]
		// a[start...mid] 和 a[mid...end]是两个有序空间，
    	// 将它们排序成1个有序空间a[start...end]
		merge(r,left,mid,right);
	}
} 

int main()
{
	int r[9]={32, 21, 67, 11, 5, 43, 99, 18,12};
	cout<<"原始序列：";
	print(r,9);
	MergeSort(r,0,8);
	cout<<"归并排序后的序列：";
	print(r,9);
	return 0;
}

分析：

归并排序的时间复杂度是O（nlog2n）

归并排序的情势就是1颗2叉树，它需要遍历的次数就是2叉树的深度，而根据完全2叉树的深度可以得出它的时间复杂度是O（nlog2n）。

归并排序是稳定的算法，它满足稳定算法的定义。

桶排序/基数排序（Radix Sort）

基本思想：

将数组分到有限数量的桶子里；

假定待排序的数组a中共有n个整数，并且已知数组a中的数据大小范围是[ 0 , MAX ) 。在桶排序时，创建容量为MAX的桶数组r，并将桶数组的元素都初始化为0；将容量为MAX的桶数组中的每个单元都看成1个“桶”。

在排序时，逐一遍历数组a，将数组a的值作为“桶数组r”的下标。当a中的数据被读取时，就将相应的桶的值加1。例如，读取到数组a[3]=5，就将r[5]的值+1。

桶排序的示例：

假定a={8,2,3,4,3,6,6,3,9}, max=10。此时，将数组a的所有数据都放到需要为0⑼的桶中。以下图：

在将数据放到桶中以后，再通过1定算法将桶中的数据提出来并转换成有序数组，这就得到我们需要的有序序列。

算法实现：

#include<iostream>
#include<cstring>	// memset头文件 
using namespace std;

void BucketSort(int a[],int n,int max)
{
	int i,j;
	int buckets[max];
	// 将buckets中的所有数据都初始化为0
	memset(buckets,0,max*sizeof(int));
	// 计数
	for(i=0;i<n;++i)
		++buckets[a[i]]; 
	// 排序
	for(i=0,j=0;i<max;++i)
		while((buckets[i]--)>0)
			a[j++]=i;
}

int main()
{
	int i;
    int a[] = {8,2,1,4,3,7,6,3,9};
    int len = (sizeof(a))/(sizeof(a[0]));
    cout<<"原始序列：";
	for(i=0;i<len;++i)
		cout<<a[i]<<" ";
	cout<<endl;
	BucketSort(a,len,10);
	cout<<"堆排序后的序列："; 
	for(i=0;i<len;++i)
		cout<<a[i]<<" ";
	cout<<endl;
	return 0;
}

—————————————————————————————————————————————————————————————————————————————

总结

各种排序的稳定性，时间复杂度和空间复杂度总结：

对n较大的排序记录。1般的选择都是时间复杂度为O(nlog2n)的排序方法。

生活不易，码农辛苦
如果您觉得本网站对您的学习有所帮助,可以手机扫描二维码进行捐赠
程序员人生

------分隔线----------------------------

上一篇 docker的devicemapper存储驱动

下一篇 CSS3制作3D水晶糖果按钮

分享到:

------分隔线----------------------------

汐颜

积分：3341

6粉丝

0关注

栏目热点