内部排序算法：归并排序-阿里云开发者社区

基本思想

n个记录的文件的直接选择排序可经过n-1趟直接选择排序得到有序结果：

初始状态：无序区为R[1..n]，有序区为空。
第1趟排序: 在无序区R[1..n]中选出关键字最小的记录R[k]，将它与无序区的第1个记录R[1] 交换，使R[1..1]和R[2..n]分别变为记录个数增加1个的新有序区和记录个数减少1个的新无序区。
……
第i趟排序: 第i趟排序开始时，当前有序区和无序区分别为R[1..i-1]和R[i..n](1≤i≤n-1)。该趟排序从当前无序区中选出关键字最小的记录R[k]，将它与无序区的第1个记录R[i]交换，使R[1..i] 和R[i+1..n]分别变为记录个数增加1个的新有序区和记录个数减少1个的新无序区。

这样，n个记录的文件的直接选择排序可经过n-1趟直接选择排序得到有序结果。

算法实现

归并排序算法，Java实现，代码如下所示：

`01`	`public` `abstract` `class` `Sorter {`

`02`	`public` `abstract` `void` `sort(int[] array);`

03 }

04

`05`	`public` `class` `MergeSorter` `extends` `Sorter {`

06

`07`	`@Override`

`08`	`public` `void` `sort(int[] array) {`

`09`	`int[] auxArray =` `new` `int[array.length];`

`10`	`mergeSort(array, auxArray,` `0, array.length -` `1);`

11 }

12

13 /**

`14`	`* 基于分治思想，执行归并排序`

`15`	`* @param low 待排序数组下标下界`

`16`	`* @param high 待排序数组下标上界`

17 */

`18`	`private` `void` `mergeSort(int[] array,` `int[] auxArray,` `int` `low,` `int` `high) {`

`19`	`int` `dividedIndex =` `0;` `// 分治位置索引变量`

`20`	`if` `(low < high) {`

`21`	`dividedIndex = (low + high) /` `2;` `// 计算分治位置(采用简单的二分思想)`

`22`	`mergeSort(array, auxArray, low, dividedIndex);` `// 左侧递归归并排序`

`23`	`mergeSort(array, auxArray, dividedIndex +` `1, high);` `// 右侧递归归并排序`

`24`	`merge(array, auxArray, low, dividedIndex, high);` `// 合并分治结果`

25 }

26 }

27

`28`	`private` `void` `merge(int[] array,` `int[] auxArray,` `int` `low,` `int` `dividedIndex,` `inthigh) {`

`29`	`int` `i = low;` `// 指向左半分区数组的指针`

`30`	`int` `j = dividedIndex +` `1;` `// 指向右半分区数组的指针`

`31`	`int` `auxPtr =` `0;` `// 指向辅助区数组的指针`

`32`	`// 合并两个有序数组：array[low..dividedIndex]与array[dividedIndex+1..high]。`

`33`	`while` `(i <= dividedIndex && j <= high) {` `// 将两个有序的数组合并，排序到辅助数组auxArray中`

`34`	`if` `(array[i] > array[j]) {` `// 左侧数组array[low..dividedIndex]中的array[i]大于右侧数组array[dividedIndex+1..high]中的array[j]`

`35`	`auxArray[auxPtr++] = array[j++];`

`36`	`}` `else` `{`

`37`	`auxArray[auxPtr++] = array[i++];`

38 }

39 }

`40`	`// 如果array[low..dividedIndex].length>array[dividedIndex+1..high].length，经过上面合并`

`41`	`// array[low..dividedIndex]没有合并完，则直接将array[low..dividedIndex]中没有合并的元素复制到辅助数组auxArray中去`

`42`	`while` `(i <= dividedIndex) {`

`43`	`auxArray[auxPtr++] = array[i++];`

44 }

`45`	`// 如果array[low..dividedIndex].length<array[dividedIndex+1..high].length，经过上面合并`

`46`	`// array[dividedIndex+1..high]没有合并完，则直接将array[dividedIndex+1..high]中没有合并的元素复制到辅助数组auxArray中去`

`47`	`while` `(j <= high) {`

`48`	`auxArray[auxPtr++] = array[j++];`

49 }

`50`	`// 最后把辅助数组auxArray的元素复制到原来的数组中去，归并排序结束`

`51`	`for` `(auxPtr =` `0, i = low; i <= high; i++, auxPtr++) {`

`52`	`array[i] = auxArray[auxPtr];`

53 }

54 }

55 }

归并排序算法，Python实现，代码如下所示：

`01`	`class` `Sorter:`

02 '''

`03`	`Abstract sorter class, which provides shared methods being used by`

`04`	`subclasses.`

05 '''

`06`	`__metaclass__` `=` `ABCMeta`

07

`08`	`@abstractmethod`

`09`	`def` `sort(self, array):`

10 pass

11

`12`	`class` `MergeSorter(Sorter):`

13 '''

`14`	`Merge sorter`

15 '''

16

`17`	`def` `sort(self, array):`

`18`	`length` `=` `len(array)`

`19`	`# initialize auxiliary list`

`20`	`auxiliary_list` `=` `[0` `for` `x` `in` `range(length)]`

`21`	`self.__merge_sort(array, auxiliary_list,` `0, length` `-` `1)`

22

`23`	`def` `__merge_sort(self, array, auxiliary_list, low, high):`

`24`	`dividedIndex` `=` `0`

`25`	`if` `low<high:`

`26`	`dividedIndex` `=` `(low` `+` `high)` `//` `2`

`27`	`self.__merge_sort(array, auxiliary_list, low, dividedIndex)`

`28`	`self.__merge_sort(array, auxiliary_list, dividedIndex` `+` `1, high)`

`29`	`self.__merge(array, auxiliary_list, low, dividedIndex, high)`

30

`31`	`def` `__merge(self, array, auxiliary_list, low, dividedIndex, high):`

`32`	`i` `=` `low`

`33`	`j` `=` `dividedIndex` `+` `1`

`34`	`pointer` `=` `0`

`35`	`while` `i<=dividedIndex` `and` `j<=high:`

`36`	`if` `array[i]>array[j]:`

`37`	`auxiliary_list[pointer]` `=` `array[j]`

`38`	`j` `=` `j` `+` `1`

39 else:

`40`	`auxiliary_list[pointer]` `=` `array[i]`

`41`	`i` `=` `i` `+` `1`

`42`	`pointer` `=` `pointer` `+` `1`

`43`	`while` `i<=dividedIndex:`

`44`	`auxiliary_list[pointer]` `=` `array[i]`

`45`	`pointer` `=` `pointer` `+` `1`

`46`	`i` `=` `i` `+` `1`

`47`	`while` `j<=high:`

`48`	`auxiliary_list[pointer]` `=` `array[j]`

`49`	`pointer` `=` `pointer` `+` `1`

`50`	`j` `=` `j` `+` `1`

`51`	`# copy elements in auxiliary list to the original list`

`52`	`pointer` `=` `0`

`53`	`i` `=` `low`

`54`	`while` `i<=high:`

`55`	`array[i]` `=` `auxiliary_list[pointer]`

`56`	`i` `=` `i` `+` `1`

`57`	`pointer` `=` `pointer` `+` `1`

排序过程

假设待排序数组为array = {94,12,34,76,26,9,0,37,55,76,37,5,68,83,90,37,12,65,76,49}，数组大小为20，我们以该数组为例，执行归并排序的具体过程，如下所示：

`01`	`[94,12,34,76,26,9,0,37,55,76, 37,5,68,83,90,37,12,65,76,49]`

`02`	`[94,12,34,76,26, 9,0,37,55,76]`

`03`	`[94,12,34, 76,26]`

`04`	`[94,12, 34]`

`05`	`[94, 12]`

`06`	`{12, 94}`

`07`	`{12,34, 94}`

`08`	`[76, 26]`

`09`	`{26, 76}`

`10`	`{12,26,34, 76,94}`

`11`	`[9,0,37, 55,76]`

`12`	`[9,0, 37]`

13 [9, 0]

14 {0, 9}

`15`	`{0,9, 37}`

`16`	`[55, 76]`

`17`	`{55, 76}`

`18`	`{0,9,37, 55,76}`

`19`	`{0,9,12,26,34, 37,55,76,76,94}`

`20`	`[37,5,68,83,90, 37,12,65,76,49]`

`21`	`[37,5,68, 83,90]`

`22`	`[37,5, 68]`

23 [37, 5]

24 {5, 37}

`25`	`{5,37, 68}`

`26`	`[83, 90]`

`27`	`{83, 90}`

`28`	`{5,37,68, 83,90}`

`29`	`[37,12,65, 76,49]`

`30`	`[37,12, 65]`

`31`	`[37, 12 ]`

`32`	`{12, 37 }`

`33`	`{12,37, 65 }`

`34`	`[76, 49 ]`

`35`	`{49, 76}`

`36`	`{12,37,49, 65,76}`

`37`	`{5,12,37,37,49, 65,68,76,83,90}`

`38`	`{0,5,9,12,12,26,34,37,37,37, 49,55,65,68,76,76,76,83,90,94}`

上面示例的排序过程中，方括号表示“分解”操作过程中，将原始数组进行递归分解，直到不能再继续分割为止；花括号表示“归并”的过程，将上一步分解后的数组进行归并排序。因为采用递归分治的策略，所以从上面的排序过程可以看到，“分解”和“归并”交叉出现。

算法分析

时间复杂度

对长度为n的文件，需进行FLOOR(logn) 趟二路归并，每趟归并的时间为O(n)，故其时间复杂度无论是在最好情况下还是在最坏情况下均是O(nlgn)。

空间复杂度

需要一个辅助向量来暂存两有序子文件归并的结果，故其辅助空间复杂度为O(n)，显然它不是就地排序。

排序稳定性

归并排序是一种稳定的排序。

内部排序算法：归并排序

热门文章

最新文章

相关课程

相关电子书

相关实验场景