c語言實現的幾種常用排序算法
概述
最近重新回顧瞭一下數據結構和算法的一些基本知識,對幾種排序算法有瞭更多的理解,也趁此機會通過博客做一個總結。
1.選擇排序-簡單選擇排序
選擇排序是最簡單的一種基於O(n2)時間復雜度的排序算法,基本思想是從i=0位置開始到i=n-1每次通過內循環找出i位置到n-1位置的最小(大)值。
算法實現:
void selectSort(int arr[], int n) { int i, j , minValue, tmp; for(i = 0; i < n-1; i++) { minValue = i; for(j = i + 1; j < n; j++) { if(arr[minValue] > arr[j]) { minValue = j; } } if(minValue != i) { tmp = arr[i]; arr[i] = arr[minValue]; arr[minValue] = tmp; } } } void printArray(int arr[], int n) { int i; for(i = 0; i < n; i++) { printf("%d ", arr[i]); } printf("\n"); } void main() { int arr[10] = {2,5,6,4,3,7,9,8,1,0}; printArray(arr, 10); selectSort(arr, 10); printArray(arr, 10); return; }
如實現所示,簡單的選擇排序復雜度固定為O(n2),每次內循環找出沒有排序數列中的最小值,然後跟當前數據進行交換。由於選擇排序通過查找最值的方式排序,循環次數幾乎是固定的,一種優化方式是每次循環同時查找最大值和最小值可以是循環次數減少為(n/2),隻是在循環中添加瞭記錄最大值的操作,原理一樣,本文不再對該方法進行實現。
2.冒泡排序
冒泡排序在一組需要排序的數組中,對兩兩數據順序與要求順序相反時,交換數據,使大的數據往後移,每趟排序將最大的數放在最後的位置上,如下:
算法實現:
void bubbleSort(int arr[], int n) { int i, j, tmp; for(i = 0; i < n - 1; i++) { for(j = 1; j < n; j++) { if(arr[j] < arr[j - 1]) { tmp = arr[j]; arr[j] = arr[j - 1]; arr[j - 1] = tmp; } } } } void printArray(int arr[], int n) { int i; for(i = 0; i < n; i++) { printf("%d ", arr[i]); } printf("\n"); } void main() { int arr[10] = {2,5,6,4,3,7,9,8,1,0}; printArray(arr, 10); bubbleSort(arr, 10); printArray(arr, 10); return; }
如上是一種最簡單的實現方式,需要註意的可能是i, j的邊界問題,這種方式固定循環次數,肯定可以解決各種情況,不過算法的目的是為瞭提升效率,根據冒泡排序的過程圖可以看出這個算法至少可以從兩點進行優化:
1)對於外層循環,如果當前序列已經有序,即不再進行交換,應該不再進行接下來的循環直接跳出。
2)對於內層循環後面最大值已經有序的情況下應該不再進行循環。
優化代碼實現:
void bubbleSort_1(int arr[], int n) { int i, nflag, tmp; do { nflag = 0; for(i = 0; i < n - 1; i++) { if(arr[i] > arr[i + 1]) { tmp = arr[i]; arr[i] = arr[i + 1]; arr[i + 1] = tmp; nflag = i + 1; } } n = nflag; }while(nflag); }
如上,當nflag為0時,說明本次循環沒有發生交換,序列已經有序不用再循環,如果nflag>0則記錄瞭最後一次發生交換的位置,該位置以後的序列都是有序的,循環不再往後進行。
3.插入排序-簡單插入排序
插入排序是將一個記錄插入到已經有序的序列中,得到一個新的元素加一的有序序列,實現上即將第一個元素看成一個有序的序列,從第二個元素開始逐個插入得到一個完整的有序序列,插入過程如下:
如圖,插入排序第i個元素與相鄰前一個元素比較,如果與排序順序相反則與前一個元素交換位置,循環直到合適的位置。
算法實現:
void insertSort(int arr[], int n) { int i, j, tmp; for(i = 1; i < n; i++) { for(j = i; j > 0; j--) { if(arr[j] < arr[j-1]) { tmp = arr[j]; arr[j] = arr[j-1]; arr[j-1] = tmp; } else { break; } } } return; } void printArray(int arr[], int n) { int i; for(i = 0; i < n; i++) { printf("%d ", arr[i]); } printf("\n"); return; } void main() { int arr[10] = {2,5,6,4,3,7,9,8,1,0}; printArray(arr, 10); insertSort(arr, 10); printArray(arr, 10); return; }
如上,前面提到選擇排序不管什麼情況下都是固定為O(n2)的算法,插入算法雖然也是O(n2)的算法,不過可以看出,在已經有序的情況下,插入可以直接跳出循環,在極端情況下(完全有序)插入排序可以是O(n)的算法。不過在實際完全亂序的測試用例中,與本文中的選擇排序相比,相同序列的情況下發現插入排序運行的時間比選擇排序長,這是因為選擇排序每次外循環隻與選擇的最值進行交換,而插入排序則需要不停與相鄰元素交換知道合適的位置,交換的三次賦值操作同樣影響運行時間,因此下面對這一點進行優化:
優化後實現:
void insertSort_1(int arr[], int n) { int i, j, tmp, elem; for(i = 1; i < n; i++) { elem = arr[i]; for(j = i; j > 0; j--) { if(elem < arr[j-1]) { arr[j] = arr[j-1]; } else { break; } } arr[j] = elem; } return; }
優化代碼將需要插入的值緩存下來,將插入位置之後的元素向後移一位,將交換的三次賦值改為一次賦值,減少執行時間。
4.插入排序-希爾排序
希爾排序的基本思想是先取一個小於n的整數d1作為第一個增量,把全部元素分組。所有距離為d1的倍數的記錄放在同一個組中。先在各組內進行直接插入排序;然後,取第二個增量d2 < d1重復上述的分組和排序,直至所取的增量 =1( < …< d2 < d1),即所有記錄放在同一組中進行直接插入排序為止,希爾排序主要是根據插入排序的一下兩種性質對插入排序進行改進:
1)插入排序在對幾乎已經排好序的數據操作時,效率高,即可以達到線性排序的效率。
2)但插入排序一般來說是低效的,因為插入排序每次隻能將數據移動一位
排序過程如下:
算法實現:基於一種簡單的增量分組方式{n/2,n/4,n/8……,1}
void shellSort(int arr[], int n) { int i, j, elem; int k = n/2; while(k>=1) { for(i = k; i < n; i ++) { elem = arr[i]; for(j = i; j >= k; j-=k) { if(elem < arr[j-k]) { arr[j] = arr[j-k]; } else { break; } } arr[j] = elem; } k = k/2; } } void printArray(int arr[], int n) { int i; for(i = 0; i < n; i++) { printf("%d ", arr[i]); } printf("\n"); return; } void main() { int arr[10] = {2,5,6,4,3,7,9,8,1,0}; printArray(arr, 10); shellSort(arr, 10); printArray(arr, 10); return; }
5.歸並排序
歸並排序是基於歸並操作的一種排序算法,歸並操作的原理就是將一組有序的子序列合並成一個完整的有序序列,即首先需要把一個序列分成多個有序的子序列,通過分解到每個子序列隻有一個元素時,每個子序列都是有序的,在通過歸並各個子序列得到一個完整的序列。
合並過程:
把序列中每個單獨元素看作一個有序序列,每兩個單獨序列歸並為一個具有兩個元素的有序序列,每兩個有兩個元素的序列歸並為一個四個元素的序列依次類推。兩個序列歸並為一個序列的方式:因為兩個子序列都是有序的(假設由小到大),所有每個子序列最左邊都是序列中最小的值,整個序列最小值隻需要比較兩個序列最左邊的值,所以歸並的過程不停取子序列最左邊值中的最小值放到新的序列中,兩個子序列值取完後就得到一個有序的完整序列。
歸並的算法實現:
void merge(int arr[], int l, int mid, int r) { int len,i, pl, pr; int *tmp = NULL; len = r - l + 1; tmp = (int*)malloc(len * sizeof(int)); //申請存放完整序列內存 memset(tmp, 0x0, len * sizeof(int)); pl = l; pr = mid + 1; i = 0; while(pl <= mid && pr <= r) //兩個子序列都有值,比較最小值 { if(arr[pl] < arr[pr]) { tmp[i++] = arr[pl++]; } else { tmp[i++] = arr[pr++]; } } while(pl <= mid) //左邊子序列還有值,直接拷貝到新序列中 { tmp[i++] = arr[pl++]; } while(pr <= r) //右邊子序列還有值 { tmp[i++] = arr[pr++]; } for(i = 0; i < len; i++) { arr[i+l] = tmp[i]; } free(tmp); return; }
歸並的迭代算法:
迭代算法如上面所說,從單個元素開始合並,子序列長度不停增加直到得到一個長度為n的完整序列。
#include<stdio.h> #include<stdlib.h> #include<string.h> void merge(int arr[], int l, int mid, int r) { int len,i, pl, pr; int *tmp = NULL; len = r - l + 1; tmp = (int*)malloc(len * sizeof(int)); //申請存放完整序列內存 memset(tmp, 0x0, len * sizeof(int)); pl = l; pr = mid + 1; i = 0; while(pl <= mid && pr <= r) //兩個子序列都有值,比較最小值 { if(arr[pl] < arr[pr]) { tmp[i++] = arr[pl++]; } else { tmp[i++] = arr[pr++]; } } while(pl <= mid) //左邊子序列還有值,直接拷貝到新序列中 { tmp[i++] = arr[pl++]; } while(pr <= r) //右邊子序列還有值 { tmp[i++] = arr[pr++]; } for(i = 0; i < len; i++) { arr[i+l] = tmp[i]; } free(tmp); return; } int min(int x, int y) { return (x > y)? y : x; } /* 歸並完成的條件是得到子序列長度等於n,用sz表示當前子序列的長度。從1開始每次翻倍直到等於n。根據上面歸並的方法,從i=0開始分組,下一組坐標應該i + 2*sz,第i組第一個元素為arr[i],最右邊元素應該為arr[i+2*sz -1],遇到序列最右邊元素不夠分組的元素個數時應該取n-1,中間的元素為arr[i+sz -1],依次類推進行歸並得到完整的序列 */ void mergeSortBu(int arr[], int n) { int sz, i, mid,l, r; for(sz = 1; sz < n; sz+=sz) { for(i = 0; i < n - sz; i += 2*sz) { l = i; r = i + sz + sz; mid = i + sz -1; merge(arr, l, mid, min(r-1, n-1)); } } return; } void printArray(int arr[], int n) { int i; for(i = 0; i < n; i++) { printf("%d ", arr[i]); } printf("\n"); return; } void main() { int arr[10] = {2,5,6,4,3,7,9,8,1,0}; printArray(arr, 10); mergeSortBu(arr, 10); printArray(arr, 10); return; }
另一種是通過遞歸的方式,遞歸方式可以理解為至頂向下的操作,即先將完整序列不停分解為子序列,然後在將子序列歸並為完整序列。
遞歸算法實現:
void mergeSort(int arr[], int l, int r) { if(l >= r) { return; } int mid = (l + r)/2; mergeSort(arr, l, mid); mergeSort(arr, mid+1, r); merge(arr, l, mid, r); return; }
對於歸並算法大傢可以考慮到由於子序列都是有序的,所有如果左邊序列的最大值都比右邊序列的最小值小,那麼整個序列就是有序的,不需要進行merge操作,因此可以在每次merge操作加一個if(arr[mid] > arr[mid+1])判斷進行優化,這種優化對於近乎有序的序列非常有效果,不過對於一般的情況會有一次判斷的額外開銷,可以根據具體情況處理。
6.快速排序
快速排序跟歸並排序類似屬於分治法的一種,基本思想是通過一趟排序將要排序的數據分割成獨立的兩部分,其中一部分的所有數據都比另外一部分的所有數據都要小,然後再按此方法對這兩部分數據分別進行快速排序,整個排序過程可以遞歸進行,以此達到整個數據變成有序序列。
排序過程如圖:
因此,快速排序每次排序將一個序列分為兩部分,左邊部分都小於等於右邊部分,然後在遞歸對左右兩部分進行快速排序直到每部分元素個數為1時則整個序列都是有序的,因此快速排序主要問題在怎樣將一個序列分成兩部分,其中一部分所有元素都小於另一部分,對於這一塊操作我們叫做partition,原理是先選取序列中的一個元素做參考量,比它小的都放在序列左邊,比它大的都放在序列右邊。
算法實現:
快速排序-單路快排:
如上:我們選取第一個元素v作為參考量及arr[l],定義j變量為兩部分分割哨兵,變量i從l+1開始遍歷每個變量,如果當前變量e > v則i++檢測下一個元素,如果當前變量e < v 則e與arr[j+1]交換,可以看到arr[j+1]由交換前大於v變成小於v arr[i]變成大於v,同時對i++,j++,始終保持:arr[l+1….j] < v, arr[j+1….i-1] > v
代碼實現:
#include <stdio.h> void printArray(int arr[], int n) { int i; for(i = 0; i < n; i++) { printf("%d ", arr[i]); } printf("\n"); return; } void swap(int *a, int *b) { int tmp; tmp = *a; *a = *b; *b = tmp; return; } //arr[l+1...j] < arr[l], arr[j+1,..i)>arr[l] static int partition(int arr[], int l, int r) { int i, j; i = l + 1; j = l; while(i <= r) { if(arr[i] > arr[l]) { i++; } else { swap(&arr[j + 1], &arr[i]); i++; j++; } } swap(&arr[l], &arr[j]); return j; } static void _quickSort(int arr[], int l, int r) { int key; if(l >= r) { return; } key = partition(arr, l, r); _quickSort(arr, l, key - 1); _quickSort(arr, key + 1, r); } void quickSort(int arr[], int n) { _quickSort(arr, 0, n - 1); return; } void main() { int arr[10] = {1,5,9,8,7,6,3,4,0,2}; printArray(arr, 10); quickSort(arr, 10); printArray(arr, 10); }
因為有變量i從左到右依次遍歷序列元素,所有這種方式叫單路快排,不過細心的同學可以發現我們忽略瞭考慮e等於v的情況,這種快排方式一大缺點就是對於高重復率的序列即大量e等於v的情況會退化為O(n2)算法,原因在大量e等於v的情況劃分情況會如下圖兩種情況:
解決這種問題的一另種方法:
快速排序-兩路快排:
兩路快排通過i和j同時向中間遍歷元素,e==v的元素分佈在左右兩個部分,不至於在多重復元素時劃分嚴重失衡。依舊去第一個元素arr[l]為參考量,始終保持arr[l+1….i) <= arr[l], arr(j…r] >=arr[l]原則.
代碼實現:
//arr[l+1....i) <=arr[l], arr(j...r] >=arr[l] static int partition2(int arr[], int l, int r) { int i, j; i = l + 1 ; j = r; while(i <= j) { while(i <= j && arr[j] > arr[l]) /*註意arr[j] >arr[l] 不是arr[j] >= arr[l]*/ { j--; } while(i <= j && arr[i] < arr[l]) { i++; } if(i < j) { swap(&arr[i], &arr[j]); i++; j--; } } swap(&arr[j],&arr[l]); return j; }
針對重復元素比較多的情況還有一種實現方式:
快速排序-三路快排:
三路快排是在兩路快排的基礎上對e==v的情況做單獨的處理,對於重復元素非常多的情況優勢很大:
如上:取arr[l]為參考量,定義變量lt為小於v和等於v的分割點,變量i為遍歷指針,gt為大於v和未遍歷元素分割點,gt指向未遍歷元素,邊界條件跟個人定義有關本文始終保持arr[l+1…lt] < v,arr[lt+1….i-1],arr(gt…..r]>v的狀態。
代碼實現:
#include <stdio.h> void printArray(int arr[], int n) { int i; for(i = 0; i < n; i++) { printf("%d ", arr[i]); } printf("\n"); return; } void swap(int *a, int *b) { int tmp; tmp = *a; *a = *b; *b = tmp; return; } static void _quickSort3(int arr [ ],int l,int r) { int i, lt, gt; if(l >= r) { return; } i = l + 1; lt = l; gt = r ; while(i <= gt) { if(arr[i] < arr[l]) { swap(&arr[lt + 1], &arr[i]); lt ++; i++; } else if(arr[i] > arr[l]) { swap(&arr[i], &arr[gt]); gt--; } else { i++; } } swap(&arr[l], &arr[gt]); _quickSort3(arr, l, lt); _quickSort3(arr, gt + 1, r); return; } void quickSort(int arr[], int n) { _quickSort3(arr, 0, n - 1); return; } void main() { int arr[10] = {1,5,9,8,7,6,3,4,0,2}; printArray(arr, 10); quickSort(arr, 10); printArray(arr, 10); }
三路快排在重復率比較高的情況下比前兩種有較大優勢,但就完全隨機情況略差於兩路快排,可以根據具體情況進行合理選擇,另外本文在選取參考值時為瞭方便一直選擇第一個元素為參考值,這種方式對於近乎有序的序列算法會退化到O(n2),因此一般選取參考值可以隨機選擇參考值或者其他選擇參考值的方法然後再與arr[l]交換,依舊可以使用相同的算法。
7.堆排序
堆其實一種樹形結構,以二叉堆為例,是一顆完全二叉樹(即除最後一層外每個節點都有兩個子節點,且非滿的二叉樹葉節點都在最後一層的左邊位置),二叉樹滿足每個節點都大於等於他的子節點(大頂堆)或者每個節點都小於等於他的子節點(小頂堆),根據堆的定義可以得到堆滿足頂點一定是整個序列的最大值(大頂堆)或者最小值(小頂堆)。如下圖:
堆排序就是一種基於堆得選擇排序,先將需要排序的序列構建成堆,在每次選取堆頂點的最大值和最小值知道完成整個堆的遍歷。
用數組表示堆:
二叉堆作為樹的一種,通常用結構體表示,為瞭排序的方便,我們通常使用數組來表示堆,如下圖:
將一個堆按圖中的方式按層編號可以得到如下結論:
1)節點的父節點編號滿足parent(i) = i/2
2)節點的左孩子編號滿足 left child (i) = 2*i
3)節點右孩子滿足 right child (i) = 2*i + 1
由於數組編號是從0開始對上面結論修改得到:
parent(i) = (i-1)/2
left child (i) = 2*i + 1
right child (i) = 2*i + 2
堆的兩種操作方式:
根據堆的主要性質(父節點大於兩個子節點或者小於兩個子節點),可以得到堆的兩種主要操作方式,以大頂堆為例:
a)如果子節點大於父節點將子節點上移(shift up)
b)如果父節點小於兩個子節點中的最大值則父節點下移(shift down)
shift up:
如果往已經建好的堆中添加一個元素,如下圖,此時不再滿足堆的性質,堆遭到破壞,就需要執行shift up 操作將添加的元素上移調整直到滿足堆的性質。
調整堆的方法:
1)7號位新增元素48與其父節點[i/2]=3比較大於父節點的32不滿足堆性質,將其與父節點交換。
2)此時新增元素在3號位,再與3號位父節點[i/2]=1比較,小於1號位的62滿足堆性質,不再交換,如果此步驟依舊不滿足堆性質則重復1步驟直到滿足堆的性質或者到根節點。
3)堆調整完成。
代碼實現:
代碼中基於數組實現,數組下表從0開始,父子節點關系如用數組表示堆
/*parent(i) = (i-1)/2 left child (i) = 2*i + 1 right child (i) = 2*i + 2 */ void swap(int *a, int *b) { int tmp; tmp = *a; *a = *b; *b = tmp; return; } void shiftUp(int arr[], int n, int k) { while((k - 1)/2 >= 0 && arr[k] > arr[(k - 1)/2]) { swap(&arr[k], &arr[(k-1)/2]); k = (k - 1)/2; } return; }
shift down:
與shift up相反,如果從一個建好的堆中刪除一個元素,此時不再滿足堆的性質,此時應該怎樣來調整堆呢?
如上圖,將堆中根節點元素62刪除調整堆的步驟為:
1)將最後一個元素移到刪除節點的位置
2)與刪除節點兩個子節點中較大的子節點比較,如果節點小於較大的子節點,與子節點交換,否則滿足堆性質,完成調整。
3)重復步驟2,直到滿足堆性質或者已經為葉節點。
4)完成堆調整
代碼實現:
void shiftDown(int arr[], int n, int k) { int j = 0 ; while(2*k + 1 < n) { j = 2 *k + 1; //標記兩個子節點較大的節點,初始為左節點 if (j + 1 < n && arr[j] < arr[j+1]) { j ++; } if(arr[k] < arr[j]) { swap(&arr[k], &arr[j]); k = j; } else { break; } } return; }
知道瞭上面兩種堆的操作後,堆排序的過程就非常簡單瞭
1)首先將待排序序列建成堆,由於最後一層即葉節點沒有子節點所以可以看成滿足堆性質的節點,第一個可能出現不滿足堆性質的節點在第一個父節點的位置,假設最後一個葉子節點為(n – 1) 則第一個父節點位置為(n-1-1)/2,隻需要依次對第一個父節點之前的節點執行shift down操作到根節點後建堆完成。
2)建堆完成後(以大頂堆為例)第一個元素arr[0]必定為序列中最大值,將最大值提取出來(與數組最後一個元素交換),此時堆不再滿足堆性質,再對根節點進行shift down操作,依次循環直到根節點,排序完成。
代碼實現:
#include<stdio.h> /*parent(i) = (i-1)/2 left child (i) = 2*i + 1 right child (i) = 2*i + 2 */ void swap(int *a, int *b) { int tmp; tmp = *a; *a = *b; *b = tmp; return; } void shiftUp(int arr[], int n, int k) { while((k - 1)/2 >= 0 && arr[k] > arr[(k - 1)/2]) { swap(&arr[k], &arr[(k-1)/2]); k = (k - 1)/2; } return; } void shiftDown(int arr[], int n, int k) { int j = 0 ; while(2*k + 1 < n) { j = 2 *k + 1; if (j + 1 < n && arr[j] < arr[j+1]) { j ++; } if(arr[k] < arr[j]) { swap(&arr[k], &arr[j]); k = j; } else { break; } } return; } void heapSort(int arr[], int n) { int i = 0; for(i = (n - 1 -1)/2; i >=0; i--) { shiftDown(arr, n, i); } for(i = n - 1; i > 0; i--) { swap(&arr[0], &arr[i]); shiftDown(arr, i, 0); } return; } void printArray(int arr[], int n) { int i; for(i = 0; i < n; i++) { printf("%d ", arr[i]); } printf("\n"); return; } void main() { int arr[10] = {1,5,9,8,7,6,3,4,0,2}; printArray(arr, 10); heapSort(arr, 10); printArray(arr, 10); }
總結
到此這篇關於c語言實現幾種常用排序算法的文章就介紹到這瞭,更多相關c語言常用排序算法內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!