Java數據結構常見幾大排序梳理
一、排序的概念和分類
1.排序的基本概念
排序是將一批無序的記錄(數據)重新排列成按關鍵字有序的記錄序列的過程。
排序分為內部排序和外部排序
- 若整個排序過程不需要訪問外存便能完成,則稱此類排序問題為內部排序。
- 反之,若參加排序的記錄數量很大,整個序列的排序過程不可能在內存中完成,則稱此類排序問題為外部排序。
內部排序的過程是一個逐步擴大記錄的有序序列長度的過程
2.排序的穩定性
假定在待排序的記錄序列中,存在多個具有相同的關鍵字的記錄,若經過排序,這些記錄的相對次序保持不變,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序後的序列中,r[i]仍在r[j]之前,則稱這種排序算法是穩定的;否則稱為不穩定的。
總結起來就是,如果一個數據在排序過程中發生瞭跳躍行為,則為不穩定的排序;反之,則是穩定的排序。
- 時間復雜度:一個算法執行所耗費的時間
- 空間復雜度:運行完一個程序所需的內存大小。
二、常見排序
1.直接插入排序
直接插入排序的基本操作是講一個記錄插入到已經排好序的有序表中,從而得到一個新的、記錄數增1的有序表。
代碼:
public static void insertSort(int[] array) { for (int i = 1; i < array.length; i++) { int tmp = array[i]; int j = i-1; for (; j >= 0 ; j--) { if(array[j] > tmp) { array[j+1] = array[j]; }else { break; } } //j回退到瞭小於0的地方 array[j+1] = tmp; } }
流程圖解:
時間和復雜度分析: 我們在實現的這個排序算法的時候,隻借助瞭一個輔助的記錄空間。
所以最好的情況就是我們原來需要的排序的元素之間就是有序的,比如說{1,2,3,4,5,6},那麼我們需要比較的次數,其實就是臨近兩個元素的比較,因此沒有移動的記錄,時間復雜度為O(n);
最壞的情況就是元素都是逆序的,如{6,5,4,3,2,1},所以都需要比較,移動次數達到O(n^2).
穩定性:穩定
插入排序,初始數據越接近有序,時間效率越高
2.希爾排序
希爾排序法又稱縮小增量法。希爾排序法的基本思想是:先選定一個整數,把待排序文件中所有記錄分成個組,所有距離為的記錄分在同一組內,並對每一組內的記錄進行排序。然後,重復上述分組和排序的工作。當到達=1時,所有記錄在統一組內排好序。
希爾對記錄的分組,不是簡單地“逐段分割”,而是將相隔某個“增量”的記錄分成一組。
在嚴薇敏的《數據結構》裡面是這樣說的:
上面的話可能有點難理解,下面我們通過畫圖來瞭解一下希爾排序的本質。
希爾排序跟直接插入排序有點相似,可以說是直接插入排序的升級版。不同在於,希爾排序的比較方式變成瞭跳躍式的。比如說下面這組數據的第一次排序。
最終排序完成瞭。
我們來看一下希爾排序的代碼:
public static void shell(int[] array,int gap) { for (int i = gap; i < array.length; i++ ) { int tmp = array[i]; int j = i-gap; for (; j >= 0 ; j -= gap) { if(array[j] > tmp) { array[j+gap] = array[j]; }else { break; } } array[j+gap] = tmp; } } //按照5、3、1分組 public static void shellSort1(int[] array) { int[] drr = {5,3,1}; for (int i = 0; i < drr.length; i++) { shell(array,drr[i]); } }
是不是跟直接插入排序很像?所以我們才說,希爾排序是直接插入排序的升級版。它不是隨便分組後各自排序,而是將相隔某個增量gap的記錄組成一個子序列,實現跳躍式移動,使得排序的效率提高瞭。
所以,選取“增量”是非常關鍵的一步,值得一提的是,選取什麼樣的“增量”,目前為止尚沒有一個沒完美的增量序列。
復雜度分析:
- 時間復雜度[和增量有關系的]:O(n^1.3 – n^1.5)。
- 空間復雜度:O(1)
穩定性:不穩定的。
3.簡單選擇排序
簡單選擇排序:通過n-i次關鍵字間的比較,從n-i+1個記錄中選出關鍵字最小的記錄,並和第 i(1 ≤ i ≤n) 個記錄交換
public static void selectSort1(int[] array) { for (int i = 0; i < array.length; i++) { for (int j = i+1; j < array.length; j++) { //1 2 3 4 5 6 if(array[j] < array[i]) { swap(array,i,j); } } } } public static void swap(int[] array,int i,int j) { int tmp = array[i]; array[i] = array[j]; array[j] = tmp;
有時候,我們可能不需要循環那麼多次,循環一兩次就有序瞭,如果在有序的序列中繼續循環,則會造成時間的浪費。為避免這種情況,所以我們可以對代碼進行稍稍改進:
public static void selectSort(int[] array) { for (int i = 0; i < array.length; i++) { int minIndex = i; for (int j = i+1; j < array.length; j++) { //找到最小值下標 if(array[j] < array[minIndex]) { minIndex = j; } } swap(array,i,minIndex); } }
復雜度分析:
- 時間復雜度:O(n^2)
- 空間復雜度:同接下介紹的冒泡排序一樣,隻有在兩個記錄交換時需要一個輔助空間,所以空間復雜度為O(1).
穩定性:穩定
4.堆排序
堆排序的基本原理也是選擇排序,隻是不在使用遍歷的方式查找無序區間的最大的數,而是通過堆來選擇無序區間的最大的數。
我上一篇文章有詳細介紹,這裡就不再說瞭,大傢感興趣可以去瞭解一下。 Java數據結構之優先級隊列(堆)圖文詳解
這裡也給一下代碼:
public static void heapSort(int[] array) { //1、建堆 O(N) createHeap(array); int end = array.length-1; //2、交換然後調整 O(N * log N) while (end > 0) { swap(array,0,end); shiftDown(array,0,end); end--; } } public static void createHeap(int[] array) { for (int parent = (array.length-1-1)/2; parent >= 0 ; parent--) { shiftDown(array,parent,array.length); } } public static void shiftDown(int[] array,int parent,int len) { int child = 2*parent+1;//左孩子下標 while (child < len) { if(child+1 < len && array[child] < array[child+1]) { child++; } //child下標 就是左右孩子最大值的下標 if(array[child] > array[parent]) { swap(array,child,parent); parent = child; child = 2*parent+1; }else { break; } } }
復雜度分析:
- 時間復雜度:O(n * log2(n))——2指的是以2為底
- 空間復雜度:O(1)
穩定性:不穩定
【註意】
- 堆排序隻能用於順序結構,不能用於鏈式結構
- 由於建初堆的時候所需比較的次數較多,因此記錄次數較少時不宜采用。
5.冒泡排序
冒泡排序是一種交換排序,它的基本思想是:兩兩比較相鄰記錄的關鍵字,如果反序則交換,直到沒有反序的記錄為止。
代碼:
public static void bubbleSort(int[] array) { for (int i = 0; i < array.length-1; i++) { for (int j = 0; j < array.length-1; j++) { if(array[j] > array[j+1]) { swap(array,j+1,j); } } } } public static void swap(int[] array,int i,int j) { int tmp = array[i]; array[i] = array[j]; array[j] = tmp;
復雜度分析:
- 時間復雜度:O(N^2)
- 空間復雜度:O(1)
穩定性:穩定。
6.快速排序
6.1.遞歸快速排序
快速排序是冒泡排序的升級版,它們都屬於交換排序類,即它也是通過不斷比較和移動交換來實現排序,不同的是,快排的實現增大的瞭記錄的比較和移動的距離。
快排將關鍵字較大的數據從前面直接移到後面,關鍵字較小的記錄從後面直接移到前面,從而減少瞭總的比較次數和移動交換次數。
快排的基本思想:
通過一趟排序將待排序的數據分割成獨立的兩部分,其中一部分比另一部小,然後再分別對這兩部分記錄並再次進行排序,以達到整個序列有序。
我們翻譯翻譯一下上面的那段話:
- 首先,你得有一個中間數,比它小的放一邊,比它大的放一邊。這個數,我們稱為基準值。
- 采用分治思想,對左右兩個小區間按照同樣的方式處理,直到小區間的長度 == 1,代表已經有序,或者小區間的長度 == 0,代表沒有數據。
可能大傢看到這裡也還是有點迷惑,我們直接上代碼。
public static void quickSort(int[] array) { quick(array,0,array.length-1); } public static void quick(int[] array,int left,int right) { if(left >= right) { return; } int pivot = partition(array,left,right);//基準 quick(array,left,pivot-1); quick(array,pivot+1,right); }
上面的代碼是不是有點像二叉樹的遍歷?
這二者確實有相似之處,我們後面再講。
上面還有一個partition函數,這個函數是我們快速排序最關鍵的地方。
/** * 找基準 * @param array 待排序數組對象 * @param start左邊界 * @param end右邊界 * @return 基準值下標 */ private static int partition(int[] array,int start,int end) { int tmp = array[start]; while (start < end) { while (start < end && array[end] >= tmp) { end--; } //end下標就遇到瞭 < tmp的值 array[start] = array[end]; while (start < end && array[start] <= tmp) { start++; } //start下標就遇到瞭 > tmp的值 array[end] = array[start]; } array[start] = tmp; return start; }
我們下面通過圖解模擬一下函數的運行過程:
可以看到,當第一輪走完之後,數據由基準值分成瞭兩部分。
之後,我們再次對左右兩部分完成同樣的操作,如下:
一直遞歸下來,跟二叉樹的遍歷類似。
復雜度分析:
時間復雜度:
- 最好情況下:O(nlogn)
- 最壞情況下:O(n^2).
空間復雜度:O(logn)
穩定性:不穩定
- 快排優化
不知大傢看上面的圖解的時候有沒有一點困惑,就是我們這基準選得不好,導致第一趟遞歸下來的效果不好,變成瞭如下圖:
如果我們有一種辦法,先找到相對居中的那個數字,那麼整個排序的時間復雜度是不是大大減小瞭。
於是,有人提出瞭隨機選取一個值來作為基準,稱為隨機選取法。
這種做法,得看運氣,因為假如選的好,剛剛選取中間值,那麼,性能大大提高;如果隨機得不好,比如隨機到最小值或者最大值,那麼性能則變成最差瞭。
所以有人提出一個新的方法,三數取中:
取三個關鍵字先進行排序,將中間數作為基準,一般取左端,右端和中間三個數。
如果運用三數取中這種方法的話,第一次比較的結果如下:
可以看到,11基本上與中間的數字相差不遠瞭,性能大大提高。
所以,這裡我們再寫一個找基準的代碼:
/** * 找基準 三數取中法 * @param array 待排序數組對象 * @param left 左邊界 * @param right 右邊界 * @return 基準值下標 */ private static int findMidValIndex(int[] array,int start,int end) { int mid = start + ((end-start) >>> 1); if(array[start] < array[end]) { if(array[mid] < array[start]) { return start; }else if(array[mid] > array[end]) { return end; }else { return mid; } }else { if(array[mid] > array[start]) { return start; }else if(array[mid] < array[end]) { return end; }else { return mid; } } }
前面quick函數改動一下,如下:
public static void quick(int[] array,int left,int right) { if(left >= right) { return; } //采用三數取中法找基準值 int midValIndex = findMidValIndex(array,left,right); swap(array,midValIndex,left); int pivot = partition(array,left,right);//基準 quick(array,left,pivot-1); quick(array,pivot+1,right); }
其實,優化到這裡已經很棒瞭 。但是,我們還能優化。
這裡先插播一個知識點:
直接插入是簡單排序中性能最好的。 所以如果要我們要排序的數組非常小,直接插入排序會更好。 原因在於,快速排序用到瞭遞歸操作,在大量的數據排序時,這點性能影響相對它的整體算法優勢而言是可以忽略的。但是如果數組隻有不多的數據需要排序,就有點大材小用瞭。
因此,我們在這裡的優化是:
增加一個判斷,當 right-left+1 不大於某個常數時,就用直接插入排序,這個常數是具體情況而定。這樣我們就能保證最大化地利用兩種排序的優勢來完成排序工作瞭。
/** * 優化,加入插入排序 * @param array 待排序數組對象 * @param left 左邊界 * @param right 右邊界 * @return 基準值下標 */ public static void quick(int[] array,int left,int right) { if(left >= right) { return; } //加一個判斷,如果區間內的數據,在排序的過程當中,小於某個范圍瞭,可以使用直接插入排序 if(right-left+1 <= 1400) { //使用直接插入排序 insertSort2(array,left,right); return; } //1、找基準之前,我們找到中間大小的值-使用三數取中法 int midValIndex = findMidValIndex(array,left,right); swap(array,midValIndex,left); int pivot = partition(array,left,right);//基準 quick(array,left,pivot-1); quick(array,pivot+1,right); } //插入排序 public static void insertSort(int[] array,int start,int end) { for (int i = 1; i <= end; i++) { int tmp = array[i]; int j = i-1; for (; j >= start ; j--) { if(array[j] > tmp) { array[j+1] = array[j]; }else { break; } } array[j+1] = tmp; } }
6.2.非遞歸方式實現
我們都知道,遞歸對性能是有一定影響的。所以我們也可以采用非遞歸的方式來實現快速排序
/** * 快速排序非遞歸實現 * @param array 待排序數組 */ public static void quickSort(int[] array) { Stack<Integer> stack = new Stack<>(); int left = 0; int right = array.length-1; int pivot = partition(array,left,right); if(pivot > left+1) { stack.push(left); stack.push(pivot-1); } if(pivot < right-1) { stack.push(pivot+1); stack.push(right); } while (!stack.isEmpty()) { right = stack.pop(); left = stack.pop(); pivot = partition(array,left,right); if(pivot > left+1) { //左邊有2個元素 stack.push(left); stack.push(pivot-1); } if(pivot < right-1) { //右邊有2個元素 stack.push(pivot+1); stack.push(right); } } }
非遞歸復雜度分析:
時間復雜度:
- 最壞情況下: O(n^2)
- 平均情況下:O(nlogn)
空間復雜度:
- 最壞情況下:O(n)
- 平均情況下:O(logn)
穩定性:不穩定
7.歸並排序
歸並排序(MERGE-SORT)是建立在歸並操作上的一種有效的排序算法,該算法是采用分治法(Divide an Conquer)的一個非常典型的應用。將已有序的子序列合並,得到完全有序的序列;即先使每個子序列有序,再使子序列段間有序。若將兩個有序表合並成一個有序表,稱為二路歸並
7.1.遞歸歸並排序
直接上代碼:
//調用瞭mergeSortInternal函數 public static void mergeSort1(int[] array) { mergeSortInternal(array,0,array.length-1); } private static void mergeSortInternal(int[] array,int low,int high) { if(low>=high) { return; } int mid = low + ((high-low) >>> 1);//>>>無符號右移1位。就是除以2,找中間值 //左邊遞歸 mergeSortInternal(array,low,mid); //右邊遞歸 mergeSortInternal(array,mid+1,high); //合並兩邊數組 merge(array,low,mid,high); }
mergeSortInternal函數的圖解:
其實就是對半分開數組
這裡這個merge函數是歸並排序裡面的關鍵,無論是采用遞歸還是非遞歸都必須采用到這部分的函數。
而其本質,其實就是合並兩個數組,並使其有序起來。
merge函數的代碼:
private static void merge(int[] array,int low,int mid,int high) { int[] tmp = new int[high-low+1]; int k = 0;// int s1 = low; int e1 = mid; int s2 = mid+1; int e2 = high; while (s1 <= e1 && s2 <= e2) { if(array[s1] <= array[s2]) { tmp[k++] = array[s1++]; }else { tmp[k++] = array[s2++]; } } while (s1 <= e1) { tmp[k++] = array[s1++]; } while (s2 <= e2) { tmp[k++] = array[s2++]; } //拷貝tmp數組的元素 放入原來的數組array當中 for (int i = 0; i < k; i++) { array[i+low] = tmp[i]; } }
7.2.非遞歸歸並排序
歸並排序除瞭用遞歸的方式來實現,也可以用非遞歸的方式來實現。
public static void mergeSort(int[] array) { int nums = 1;//每組的數據個數 while (nums < array.length) { //數組每次都要進行遍歷,確定要歸並的區間 for (int i = 0; i < array.length; i += nums*2) { int left = i; int mid = left+nums-1; //防止越界 if(mid >= array.length) { mid = array.length-1; } int right = mid+nums; //防止越界 if(right >= array.length) { right = array.length-1; } //小標確定之後,進行合並 merge(array,left,mid,right); } nums *= 2;數組合並後,以1-2-4-8-16-進行循環 } }
圖解如下:
總結
這次常見排序的文章,來來回回寫瞭兩天左右,在寫的過程,也是學習的過程,特別是裡面畫圖的時候,得理清楚整個排序的思想,才能很好的作出整個圖解出來。各位看客老爺們,希望看到能給個三連,感謝!
到此這篇關於Java數據結構常見幾大排序梳理的文章就介紹到這瞭,更多相關Java 排序內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!