什么是计数排序?

简介:


11ee4942a1382ee0224dd23ff54303f18adcd848


—————  第二天  —————


54a97a1426ecdc1e0e0eae7900a74f8918559d73

————————————

337d726e5be5fdb26af23ca0dcc42f6fb8e2b575


假定20个随机整数的值如下:

9,3,5,4,9,1,2,7,8,1,3,6,5,3,4,0,10,9 ,7,9

如何给这些无序的随机整数排序呢?

非常简单,让我们遍历这个无序的随机数列,每一个整数按照其值对号入座,对应数组下标的元素进行加1操作。

比如第一个整数是9,那么数组下标为9的元素加1:

51655e750f417f2176edca28ccb759f58b2e33d9

第二个整数是3,那么数组下标为3的元素加1:

458d1ee3d24cdf08039f2a0e4362639d970892d4

继续遍历数列并修改数组......

最终,数列遍历完毕时,数组的状态如下:

2135deb64d172a62373673f2c94f0280b372d48c

数组每一个下标位置的值,代表了数列中对应整数出现的次数。

有了这个“统计结果”,排序就很简单了。直接遍历数组,输出数组元素的下标值,元素的值是几,就输出几次:

0,1,1,2,3,3,3,4,4,5,5,6,7,7,8,9,9,9,9,10

显然,这个输出的数列已经是有序的了。

912aaced551f4a5e05c6302e7b3176c48c8aa8dd


 
  1. public static int[] countSort(int[] array) {

  2.    //1.得到数列的最大值

  3.    int max = array[0];

  4.    for(int i=1; i<array.length; i++){

  5.        if(array[i] > max){

  6.            max = array[i];

  7.        }

  8.    }

  9.    //2.根据数列最大值确定统计数组的长度

  10.    int[] countArray = new int[max+1];

  11.    //3.遍历数列,填充统计数组

  12.    for(int i=0; i<array.length; i++){

  13.        countArray[array[i]]++;

  14.    }

  15.    //4.遍历统计数组,输出结果

  16.    int index = 0;

  17.    int[] sortedArray = new int[array.length];

  18.    for(int i=0; i<countArray.length; i++){

  19.        for(int j=0; j<countArray[i]; j++){

  20.            sortedArray[index++] = i;

  21.        }

  22.    }

  23.    return sortedArray;

  24. }


  25. public static void main(String[] args) {

  26.    int[] array = new int[] {4,4,6,5,3,2,8,1,7,5,6,0,10};

  27.    int[] sortedArray = countSort(array);

  28.    System.out.println(Arrays.toString(sortedArray));

  29. }

这段代码在一开头补充了一个步骤,就是求得数列的最大整数值max。后面创建的统计数组countArray,长度就是max+1,以此保证数组的最后一个下标是max。


7eda58214e17d353368c267d2f58dff69d18058f

95,94,91,98,99,90,99,93,91,92

b2c6f11e8897647e8d89bb8c7e9795b36ed903eb

怎么解决这个问题呢?

很简单,我们不再以(输入数列的最大值+1)作为统计数组的长度,而是以(数列最大值和最小值的差+1)作为统计数组的长度。

同时,数列的最小值作为一个偏移量,用于统计数组的对号入座。

以刚才的数列为例,统计数组的长度为  99-90+1 = 10 ,偏移量等于数列的最小值 90 。

对于第一个整数95,对应的统计数组下标是 95-90 = 5,如图所示:


a189917e03db9e3319ac8a7b7a926bcb9af0a278

什么意思呢?让我们看看下面的例子:

3ded180669c742bc2ddd6bdc4dbc49a1f6d7c9c9

给定一个学生的成绩表,要求按成绩从低到高排序,如果成绩相同,则遵循原表固有顺序。


那么,当我们填充统计数组以后,我们只知道有两个成绩并列95分的小伙伴,却不知道哪一个是小红,哪一个是小绿:

5cba433c4954671da5c2f1d33462da787e26f6b3

下面的讲解会有一些烧脑,请大家扶稳坐好。我们仍然以刚才的学生成绩表为例,把之前的统计数组变形成下面的样子:

92abd9134f358a4aa2009f0563fdd5f6bb0cc4e1

这是如何变形的呢?统计数组从第二个元素开始,每一个元素都加上前面所有元素之和。

为什么要相加呢?初次看到的小伙伴可能会觉得莫名其妙。

因为原来的统计数组(未变形)里面存储的是各个元素的个数,那么向后叠加的目的就是为了计算元素排序后的最终位置(准确来说是最大的最终位置)。比如元素 90 的个数为1, 94个数也为 1,那么向后叠加后94对应的统计数组(变形后)为 2 ,那它就最终的位置就是第二。

变形后的统计数组(countArray)中的值就代表着原数列元素排序后最大的最终位置(在重复元素的情况下还会有其他相同元素在此位置之前)。比如下标是5的值为4,说明 95 排序后的位置最大就是第四。

4eeb96b66de4bbc52cd95447cd8e2f9ca4f7a398

通过变形后的统计数组中的值对应排序后数组sortedArray的下标来控制最终的位置( <---> sortedArray[4-1] );

那么另外一个95在哪?我们可以将accountArray[5] 里面的值减一(4-1),让它排在第三位。

a8985649a1191b451c78ae65e69bd73f58e372b5

通过这样的递减,就可以将重复的元素全部安排妥当,先遇到小绿,就先安排小绿,再遇到小红,然后安排小红,这样小绿和小红排序前和排序后的次序也就可以相同了。

下来我们具体分析整个过程:

我们创建输出数组sortedArray,长度和输入数列一致。然后从后向前遍历输入数列:

第一步,我们遍历成绩表最后一行的小绿:

小绿是95分,我们找到countArray下标是5的元素,值是4,代表小绿的成绩排名位置在第4位。

同时,我们给countArray下标是5的元素值减1,从4变成3,,代表着下次再遇到95分的成绩时,最终排名是第3。

4bdeaf4b57299cd4e13c4cae8fa0ce9396a12ff2

第二步,我们遍历成绩表倒数第二行的小白:

小白是94分,我们找到countArray下标是4的元素,值是2,代表小白的成绩排名位置在第2位。

同时,我们给countArray下标是4的元素值减1,从2变成1,,代表着下次再遇到94分的成绩时(实际上已经遇不到了),最终排名是第1。

1c2ba2ce25fda3a0f6a2b11c1b0d37c94995e439

第三步,我们遍历成绩表倒数第三行的小红:

小红是95分,我们找到countArray下标是5的元素,值是3(最初是4,减1变成了3),代表小红的成绩排名位置在第3位。

同时,我们给countArray下标是5的元素值减1,从3变成2,,代表着下次再遇到95分的成绩时(实际上已经遇不到了),最终排名是第2。

f297aa88de0c55bd2e5baf7435d65e1a13042f1b

这样一来,同样是95分的小红和小绿就能够清楚地排出顺序了,也正因此,优化版本的计数排序属于稳定排序

后面的遍历过程以此类推,这里就不再详细描述了。

d93af4add539d9aed1fff202ffca12db69a0470d

 
  1. public static int[] countSort(int[] array) {

  2.    //1.得到数列的最大值和最小值,并算出差值d

  3.    int max = array[0];

  4.    int min = array[0];

  5.    for(int i=1; i<array.length; i++) {

  6.        if(array[i] > max) {

  7.            max = array[i];

  8.        }

  9.        if(array[i] < min) {

  10.            min = array[i];

  11.        }

  12.    }

  13.    int d = max - min;

  14.    //2.创建统计数组并统计对应元素个数

  15.    int[] countArray = new int[d+1];

  16.    for(int i=0; i<array.length; i++) {

  17.        countArray[array[i]-min]++;

  18.    }

  19.    //3.统计数组做变形,后面的元素等于前面的元素之和

  20.    int sum = 0;

  21.    for(int i=0;i<countArray.length;i++) {

  22.        sum += countArray[i];

  23.        countArray[i] = sum;

  24.    }

  25.    //4.倒序遍历原始数列,从统计数组找到正确位置,输出到结果数组

  26.    int[] sortedArray = new int[array.length];

  27.    for(int i=array.length-1;i>=0;i--) {

  28.        sortedArray[countArray[array[i]-min]-1]=array[i];

  29.        countArray[array[i]-min]--;

  30.    }

  31.    return sortedArray;

  32. }

  33. public static void main(String[] args) {

  34.    int[] array = new int[] {95,94,91,98,99,90,99,93,91,92};

  35.    int[] sortedArray = countSort(array);

  36.    System.out.println(Arrays.toString(sortedArray));

  37. }

a230e090c3a6f8ca7eb75f4b2befea138b887f1f

1.当数列最大最小值差距过大时,并不适用计数排序。

比如给定20个随机整数,范围在0到1亿之间,这时候如果使用计数排序,需要创建长度1亿的数组。不但严重浪费空间,而且时间复杂度也随之升高。

2.当数列元素不是整数,并不适用计数排序。

如果数列中的元素都是小数,比如25.213,或是0.00000001这样子,则无法创建对应的统计数组。这样显然无法进行计数排序。

3fffb8db30b377844543d929b81189acca227ffb



原文发布时间为:2018-10-19

本文作者:小灰

本文来自云栖社区合作伙伴“趣谈编程”,了解相关信息可以关注“趣谈编程”。

相关文章
|
2月前
|
存储 搜索推荐 C++
C++计数排序的实现
C++计数排序的实现
|
2月前
|
搜索推荐 算法 C++
C++基数排序的实现
C++基数排序的实现
|
5月前
|
搜索推荐 BI
排序算法:非比较排序(计数排序)
排序算法:非比较排序(计数排序)
44 0
|
5月前
|
搜索推荐 算法
计数排序详解
计数排序详解
|
5月前
|
搜索推荐 算法
归并排序 与 计数排序
归并排序 与 计数排序
|
9月前
|
算法 搜索推荐
归并排序与计数排序
归并排序与计数排序
47 0
|
搜索推荐 算法
排序算法——计数排序(非比较排序)
​ 哈喽大家好,我是保护小周ღ,本期为大家带来的是排序算法中的计数排序,非常的有意思,值得学习而且计数排序是非交换排序,分享所有源代码,粘贴即可运行,保姆级讲述,包您一看就会,快来试试吧~ ​
|
存储 搜索推荐 算法
计数排序
概念:计数排序不是基于比较的排序算法,其核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。 作为一种线性时间复杂度的排序,计数排序要求输入的数据必须是有确定范围的整数。
基数排序
概念:基数排序是按照低位先排序,然后收集;再按照高位排序,然后再收集;依次类推,直到最高位。有时候有些属性是有优先级顺序的,先按低优先级排序,再按高优先级排序。最后的次序就是高优先级高的在前,高优先级相同的低优先级高的在前。 基数排序基于分别排序,分别收集,所以是稳定的。但基数排序的性能比桶排序要略差,每一次关键字的桶分配都需要O(n)的时间复杂度,而且分配之后得到新的关键字序列又需要O(n)的时间复杂度。假如待排数据可以分为d个关键字,则基数排序的时间复杂度将是O(d*2n) ,当然d要远远小于n,因此基本上还是线性级别的。 基数排序的空间复杂度为O(n+k),其中k为桶
|
算法 容器
计数排序与基数排序
计数排序与基数排序
113 0

热门文章

最新文章