八大排序,三大查找是《数据结构》当中非常基础的知识点,在这里为了复习顺带总结了一下常见的八种排序算法。 常见的八大排序算法,他们之间关系如下:
排序算法.png他们的性能比较:
性能比较.png下面,利用Python分别将他们进行实现。
直接插入排序的核心思想就是:将数组中的所有元素依次跟前面已经排好的元素相比较,如果选择的元素比已排序的元素小,则交换,直到全部元素都比较过。 因此,从上面的描述中我们可以发现,直接插入排序可以用两个循环完成:
第一层循环:遍历待比较的所有数组元素第二层循环:将本轮选择的元素(selected)与已经排好序的元素(ordered)相比较。 如果:selected > ordered,那么将二者交换 代码实现 #直接插入排序 def insert_sort(L): #遍历数组中的所有元素,其中0号索引元素默认已排序,因此从1开始 for x in range(1,len(L)): #将该元素与已排序好的前序数组依次比较,如果该元素小,则交换 #range(x-1,-1,-1):从x-1倒序循环到0 for i in range(x-1,-1,-1): #判断:如果符合条件则交换 if L[i] > L[i+1]: temp = L[i+1] L[i+1] = L[i] L[i] = temp希尔排序的算法思想:将待排序数组按照步长gap进行分组,然后将每组的元素利用直接插入排序的方法进行排序;每次将gap折半减小,循环上述操作;当gap=1时,利用直接插入,完成排序。 同样的:从上面的描述中我们可以发现:希尔排序的总体实现应该由三个循环完成:
第一层循环:将gap依次折半,对序列进行分组,直到gap=1第二、三层循环:也即直接插入排序所需要的两次循环。具体描述见上。 代码实现: #希尔排序 def insert_shell(L): #初始化gap值,此处利用序列长度的一般为其赋值 gap = (int)(len(L)/2) #第一层循环:依次改变gap值对列表进行分组 while (gap >= 1): #下面:利用直接插入排序的思想对分组数据进行排序 #range(gap,len(L)):从gap开始 for x in range(gap,len(L)): #range(x-gap,-1,-gap):从x-gap开始与选定元素开始倒序比较,每个比较元素之间间隔gap for i in range(x-gap,-1,-gap): #如果该组当中两个元素满足交换条件,则进行交换 if L[i] > L[i+gap]: temp = L[i+gap] L[i+gap] = L[i] L[i] =temp #while循环条件折半 gap = (int)(gap/2)简单选择排序的基本思想:比较+交换。
从待排序序列中,找到关键字最小的元素;如果最小元素不是待排序序列的第一个元素,将其和第一个元素互换;从余下的 N - 1 个元素中,找出关键字最小的元素,重复(1)、(2)步,直到排序结束。 因此我们可以发现,简单选择排序也是通过两层循环实现。 第一层循环:依次遍历序列当中的每一个元素 第二层循环:将遍历得到的当前元素依次与余下的元素进行比较,符合最小元素的条件,则交换。 代码实现 # 简单选择排序 def select_sort(L): #依次遍历序列中的每一个元素 for x in range(0,len(L)): #将当前位置的元素定义此轮循环当中的最小值 minimum = L[x] #将该元素与剩下的元素依次比较寻找最小元素 for i in range(x+1,len(L)): if L[i] < minimum: temp = L[i]; L[i] = minimum; minimum = temp #将比较后得到的真正的最小值赋值给当前位置 L[x] = minimum基本思想: 堆排序可以按照以下步骤来完成:
首先将序列构建称为大顶堆; (这样满足了大顶堆那条性质:位于根节点的元素一定是当前序列的最大值) 构建大顶堆.png 取出当前大顶堆的根节点,将其与序列末尾元素进行交换; (此时:序列末尾的元素为已排序的最大值;由于交换了元素,当前位于根节点的堆并不一定满足大顶堆的性质)对交换后的n-1个序列元素进行调整,使其满足大顶堆的性质; Paste_Image.png 重复2.3步骤,直至堆中只有1个元素为止代码实现:
#-------------------------堆排序-------------------------------- #**********获取左右叶子节点********** def LEFT(i): return 2*i + 1 def RIGHT(i): return 2*i + 2 #********** 调整大顶堆 ********** #L:待调整序列 length: 序列长度 i:需要调整的结点 def adjust_max_heap(L,length,i): #定义一个int值保存当前序列最大值的下标 largest = i #执行循环操作:两个任务:1 寻找最大值的下标;2.最大值与父节点交换 while (1): #获得序列左右叶子节点的下标 left,right = LEFT(i),RIGHT(i) #当左叶子节点的下标小于序列长度 并且 左叶子节点的值大于父节点时,将左叶子节点的下标赋值给largest if (left < length) and (L[left] > L[i]): largest = left print('左叶子节点') else: largest = i #当右叶子节点的下标小于序列长度 并且 右叶子节点的值大于父节点时,将右叶子节点的下标值赋值给largest if (right < length) and (L[right] > L[largest]): largest = right print('右叶子节点') #如果largest不等于i 说明当前的父节点不是最大值,需要交换值 if (largest != i): temp = L[i] L[i] = L[largest] L[largest] = temp i = largest print(largest) continue else: break #********** 建立大顶堆 ********** def build_max_heap(L): length = len(L) for x in range((int)((length-1)/2),-1,-1): adjust_max_heap(L,length,x) #********** 堆排序 ********** def heap_sort(L): #先建立大顶堆,保证最大值位于根节点;并且父节点的值大于叶子结点 build_max_heap(L) #i:当前堆中序列的长度.初始化为序列的长度 i = len(L) #执行循环:1. 每次取出堆顶元素置于序列的最后(len-1,len-2,len-3...) # 2. 调整堆,使其继续满足大顶堆的性质,注意实时修改堆中序列的长度 while (i > 0): temp = L[i-1] L[i-1] = L[0] L[0] = temp #堆中序列长度减1 i = i-1 #调整大顶堆 adjust_max_heap(L,i,0)*代码实现
#冒泡排序 def bubble_sort(L): length = len(L) #序列长度为length,需要执行length-1轮交换 for x in range(1,length): #对于每一轮交换,都将序列当中的左右元素进行比较 #每轮交换当中,由于序列最后的元素一定是最大的,因此每轮循环到序列未排序的位置即可 for i in range(0,length-x): if L[i] > L[i+1]: temp = L[i] L[i] = L[i+1] L[i+1] = temp算法思想:
归并排序.gif 归并排序是建立在归并操作上的一种有效的排序算法,该算法是采用分治法的一个典型的应用。它的基本操作是:将已有的子序列合并,达到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。归并排序其实要做两件事:
分解----将序列每次折半拆分合并----将划分后的序列段两两排序合并 因此,归并排序实际上就是两个操作,拆分+合并如何合并? L[first...mid]为第一段,L[mid+1...last]为第二段,并且两端已经有序,现在我们要将两端合成达到L[first...last]并且也有序。
首先依次从第一段与第二段中取出元素比较,将较小的元素赋值给temp[]重复执行上一步,当某一段赋值结束,则将另一段剩下的元素赋值给temp[]此时将temp[]中的元素复制给L[],则得到的L[first...last]有序如何分解? 在这里,我们采用递归的方法,首先将待排序列分成A,B两组;然后重复对A、B序列 分组;直到分组后组内只有一个元素,此时我们认为组内所有元素有序,则分组结束。
代码实现
# 归并排序 #这是合并的函数 # 将序列L[first...mid]与序列L[mid+1...last]进行合并 def mergearray(L,first,mid,last,temp): #对i,j,k分别进行赋值 i,j,k = first,mid+1,0 #当左右两边都有数时进行比较,取较小的数 while (i <= mid) and (j <= last): if L[i] <= L[j]: temp[k] = L[i] i = i+1 k = k+1 else: temp[k] = L[j] j = j+1 k = k+1 #如果左边序列还有数 while (i <= mid): temp[k] = L[i] i = i+1 k = k+1 #如果右边序列还有数 while (j <= last): temp[k] = L[j] j = j+1 k = k+1 #将temp当中该段有序元素赋值给L待排序列使之部分有序 for x in range(0,k): L[first+x] = temp[x] # 这是分组的函数 def merge_sort(L,first,last,temp): if first < last: mid = (int)((first + last) / 2) #使左边序列有序 merge_sort(L,first,mid,temp) #使右边序列有序 merge_sort(L,mid+1,last,temp) #将两个有序序列合并 mergearray(L,first,mid,last,temp) # 归并排序的函数 def merge_sort_array(L): #声明一个长度为len(L)的空列表 temp = len(L)*[None] #调用归并排序 merge_sort(L,0,len(L)-1,temp)写完之后运行了一下时间比较:
1w个数据时: 直接插入排序:11.615608 希尔排序:13.012008 简单选择排序:3.645136000000001 堆排序:0.09587900000000005 冒泡排序:6.687218999999999 #**************************************************** 快速排序:9.999999974752427e-07 #快速排序有误:实际上并未执行 #RecursionError: maximum recursion depth exceeded in comparison #**************************************************** 归并排序:0.05638299999999674 基数排序:0.08150400000000246 10w个数据时: 直接插入排序:1233.581131 希尔排序:1409.8012320000003 简单选择排序:466.66974500000015 堆排序:1.2036720000000969 冒泡排序:751.274449 #**************************************************** 快速排序:1.0000003385357559e-06 #快速排序有误:实际上并未执行 #RecursionError: maximum recursion depth exceeded in comparison #**************************************************** 归并排序:0.8262230000000272 基数排序:1.1162899999999354 从运行结果上来看,堆排序、归并排序、基数排序真的快。 对于快速排序迭代深度超过的问题,可以将考虑将快排通过非递归的方式进行实现。写了 18284 字,被 116 人关注,获得了 275 个喜欢
靡不有初 鲜克有终如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
赞赏支持 喜欢 214 更多分享 16条评论 只看作者 关闭评论 按喜欢排序 按时间正序 按时间倒序 煜_ 3楼 · 2016.08.14 11:50我就喜欢执着原理和实现的少年
1人赞 回复 熊白白 2楼 · 2016.08.13 23:08很清晰,很系统,很到位。
赞 回复LeeLom: @熊白白 谢谢 共同进步
2016.08.13 23:44 回复 添加新评论 Mve 4楼 · 2016.08.14 12:31太六了
赞 回复 buptwz 5楼 · 2016.08.14 13:01龙神好棒
赞 回复 向天飞 6楼 · 2016.08.14 13:07我是新手。数据读出来后再排序?
赞 回复LeeLom: @向天飞 我不太理解什么叫数据读出来再排序?如果你要排序,肯定要遍历整个序列啊
2016.08.14 13:14 回复 添加新评论 叮宕 7楼 · 2016.08.14 15:35后面的数据验证,是精髓。
赞 回复 FlyDragonInSky 8楼 · 2016.08.14 19:24总结得很好,