常见的几种排序方式-CSDN博客

1. 排序的概念

排序 所谓排序就是使一串记录按照其中的某个或某些关键字的大小递增或递减的排列起来的操作
稳定性 假定在待排序的记录序列中存在多个具有相同的关键字的记录若经过排序这些记录的相对次序保持不变即在原序列中r[i]=r[j]且r[i]在r[j]之前而在排序后的序列中r[i]仍在r[j]之前则称这种排序算法是稳定的否则称为不稳定的
内部排序 数据元素全部放在内存中的排序
外部排序 数据元素太多不能同时放在内存中根据排序过程的要求不能在内外存之间移动数据的排序

2. 常见排序算法的实现

2.1 插入排序

2.1.1基本思想

直接插入排序是一种简单的插入排序法其基本思想是把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中直到所有的记录插入完为止得到一个新的有序序列

2.1.2 直接插入排序

当插入第i(i>=1)个元素时前面的array[0],array[1],…,array[i-1]已经排好序此时用array[i]的排序码与array[i-1],array[i-2],…的排序码顺序进行比较找到插入位置即将array[i]插入原来位置上的元素顺序后移

    
    public static void insertSort(int[] arr) {
        for (int i = 1; i < arr.length; i++) {
            int tmp = arr[i];
            int j = i - 1;
            while (j >= 0) {
                if (arr[j] > tmp) {
                    arr[j + 1] = arr[j];
                    j--;
                }else {
                    break;
                }

            }
            arr[j + 1] = tmp;
        }
    }

直接插入排序的特性总结

  1. 元素集合越接近有序直接插入排序算法的时间效率越高
  2. 时间复杂度O(N^2)
  3. 空间复杂度O(1)它是一种稳定的排序算法
  4. 稳定性稳定

2.1.3 希尔排序( 缩小增量排序 )

希尔排序法又称缩小增量法。希尔排序法的基本思想是先选定一个整数把待排序文件中所有记录分成多个组所有距离为的记录分在同一组内并对每一组内的记录进行排序。然后取重复上述分组和排序的工作。当到达=1时所有记录在统一组内排好序
在这里插入图片描述

 public static void shellSort(int[] arr) {
        int gap = arr.length;;
        while (gap > 1) {
            gap /= 2;
            shell(arr, gap);
        }
    }
    public static void shell(int[] arr, int gap) {
        for (int i = gap; i < arr.length; i++) {
            int j = i - gap;
            int temp = arr[i];
            while (j >= 0) {
                if (arr[j] > temp) {
                    arr[j + gap] = arr[j];
                    j -= gap;
                }else {
                    break;
                }
            }
            arr[j + gap] = temp;
        }
    }

希尔排序的特性总结

  1. 希尔排序是对直接插入排序的优化。
  2. 当gap > 1时都是预排序目的是让数组更接近于有序。当gap == 1时数组已经接近有序的了这样就会很快。这样整体而言可以达到优化的效果。我们实现后可以进行性能测试的对比
  3. 希尔排序的时间复杂度不好计算因为gap的取值方法很多导致很难去计算因此在好些书中给出的希尔排序的时间复杂度都不固定:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.2 选择排序

2.2.1基本思想

每一次从待排序的数据元素中选出最小或最大的一个元素存放在序列的起始位置直到全部待排序的数据元素排完

2.2.2 直接选择排序:

  • 在元素集合array[i]–array[n-1]中选择关键码最大(小)的数据元素
  • 若它不是这组元素中的最后一个(第一个)元素则将它与这组元素中的最后一个第一个元素交换
  • 在剩余的array[i]–array[n-2]array[i+1]–array[n-1]集合中重复上述步骤直到集合剩余1个元素
public static void selectSort(int[] arr) {
        for (int i = 0; i < arr.length; i++) {
            int minIndex = i;
            for (int j = i + 1; j < arr.length; j++) {
                if (arr[j] < arr[minIndex]) {
                    minIndex = j;
                }
            }
           swap(arr, i, minIndex);
        }
    }

直接选择排序的特性总结:

  1. 直接选择排序思考非常好理解但是效率不是很好。实际中很少使用
  2. 时间复杂度O(N^2)
  3. 空间复杂度O(1)
  4. 稳定性不稳定

2.2.3 堆排序

堆排序(Heapsort)是指利用堆积树堆这种数据结构所设计的一种排序算法它是选择排序的一种。它是通过堆来进行选择数据。需要注意的是排升序要建大堆排降序建小堆

public static void heapSort(int[] arr) {
        createHeap(arr);
        int end = arr.length - 1;
        while (end > 0) {
            swap(arr,0,end);
            siftDown(arr,0,end);
            end--;
        }
    }
    private static void createHeap(int[] arr) {
        for (int i = (arr.length-1-1) / 2; i >=0 ; i--) {
            siftDown(arr,i,arr.length);
        }
    }
    private static void siftDown(int[] arr,int parent,int len) {
        int child = parent * 2 + 1;
        while (child < len) {
            if (child + 1 < len && arr[child] < arr[child+1]) {
                child++;
            }
            if (arr[child] > arr[parent]) {
                swap(arr,child,parent);
                parent = child;
                child = 2 * child +1;
            }else {
                break;
            }
        }
    }

堆排序的特性总结:

  1. 堆排序使用堆来选数效率就高了很多。
  2. 时间复杂度O(N*logN)
  3. 空间复杂度O(1)
  4. 稳定性不稳定

2.3 交换排序

基本思想所谓交换就是根据序列中两个记录键值的比较结果来对换这两个记录在序列中的位置交换排序的特点是将键值较大的记录向序列的尾部移动键值较小的记录向序列的前部移动

2.3.1冒泡排序

public static void bubbleSort(int[] array){
       for (int i = 0; i < array.length - 1; i++) {
           for (int j = 0; j < array.length - i - 1; j++) {
               if (array[j] > array[j+1]) {
                   int temp = array[j];
                   array[j] = array[j+1];
                   array[j+1] = temp;
               }
           }
       }
    }

冒泡排序的特性总结:

  1. 冒泡排序是一种非常容易理解的排序
  2. 时间复杂度O(N^2)
  3. 空间复杂度O(1)
  4. 稳定性稳定

2.3.2 快速排序

快速排序是Hoare于1962年提出的一种二叉树结构的交换排序方法其基本思想为任取待排序元素序列中的某元素作为基准值按照该排序码将待排序集合分割成两子序列左子序列中所有元素均小于基准值右子序列中所有元素均大于基准值然后最左右子序列重复该过程直到所有元素都排列在相应位置上为止

 /**
    
     */
    public static void quickSort(int[] arr) {
        quick(arr, 0, arr.length - 1);
    }
    private static void quick(int[] arr, int start, int end) {
        if (start >= end) {
            return;
        }
        // 减少递归次数(数组趋于有序使用插入排序)
        if (end - start <= 20) {
            insert(arr, start, end);
            return;
        }
        // 使基准左右两边更加平衡
        int i = midThree(arr, start, end);
        swap(arr, start, i);
        int pivot = partition(arr, start, end);
        quick(arr, start, pivot - 1);
        quick(arr, pivot + 1, end);
    }
    /**
     * 找基准 挖坑法
     * @param arr
     * @param left
     * @param right
     * @return
     */
    public static int partition(int[] arr, int left, int right) {
        int tmp = arr[left];
        while (left < right) {
            while (left < right && arr[right] >= tmp) {
                right--;
            }
            arr[left] = arr[right];
            while (left < right && arr[left] <= tmp) {
                left++;
            }
            arr[right] = arr[left];
        }
        arr[left] = tmp;
        return left;
    }

    /**
     * hoare法
     * @param arr
     * @param left
     * @param right
     * @return
     */
    public static int partition2(int[] arr, int left, int right) {
        int tmp = arr[left];
        int i = left;
        while (left < right) {
            while (left < right && arr[right] >= tmp) {
                right--;
            }
            while (left < right && arr[left] <= tmp) {
                left++;
            }
            swap(arr, left, right);
        }
        swap(arr, i, left);
        return left;
    }
    /**
     * 前后指针法
     * @param arr
     * @param left
     * @param right
     * @return
     */
    public static int partition3(int[] arr, int left, int right) {
        int prev = left - 1;
        int cur = left;
        while (cur < right){
            if (arr[cur] < arr[right] && arr[++prev] != arr[cur]){
                swap(arr,prev,cur);
            }
            cur++;
        }
        swap(arr,right,prev + 1);
        return prev + 1;
    }
    /**
     * 三数取中
     * @param arr
     * @param left
     * @param right
     * @return
     */
    private static int midThree(int[] arr, int left, int right) {
        int mid = (left + right) / 2;
        if (arr[left] > arr[right]) {
            if (arr[mid] < arr[right]) {
                return right;
            } else if (arr[mid] > arr[left]) {
                return left;
            }else {
                return mid;
            }
        }else {
            if (arr[mid] < arr[left]) {
                return left;
            } else if (arr[mid] > arr[right]) {
                return right;
            }else {
                return mid;
            }
        }
    }
    public static void insert(int[] arr, int start, int end) {
        for (int i = start + 1; i <= end; i++) {
            int tmp = arr[i];
            int j = i - 1;
            while (j >= start) {
                if (arr[j] > tmp) {
                    arr[j + 1] = arr[j];
                    j--;
                }else {
                    break;
                }

            }
            arr[j + 1] = tmp;
        }
    }
    /**
     * 非递归实现
     * @param arr
     */
    public static void quick(int[] arr) {
        int left = 0;
        int right = arr.length - 1;
        int mid = midThree(arr, left, right);
        Stack<Integer> stack = new Stack<>();
        swap(arr, left, mid);
        int partition = partition(arr, left, right);
        if (partition > left + 1) {
            stack.push(left);
            stack.push(partition - 1);
        }
        if (partition < right - 1) {
            stack.push(partition + 1);
            stack.push(right);
        }
        while (!stack.isEmpty()) {
            right = stack.pop();
            left = stack.pop();
            mid = midThree(arr, left, right);
            swap(arr, left, mid);
            partition = partition(arr, left, right);
            if (partition > left + 1) {
                stack.push(left);
                stack.push(partition - 1);
            }
            if (partition < right - 1) {
                stack.push(partition + 1);
                stack.push(right);
            }
        }
    }

快速排序总结:

  1. 快速排序整体的综合性能和使用场景都是比较好的所以才敢叫快速排序
  2. 时间复杂度O(N*logN)
  3. 空间复杂度O(logN)
  4. 稳定性不稳定

2.4 归并排序

2.4.1 基本思想

归并排序MERGE-SORT是建立在归并操作上的一种有效的排序算法,该算法是采用分治法Divide andConquer的一个非常典型的应用。将已有序的子序列合并得到完全有序的序列即先使每个子序列有序再使子序列段间有序。若将两个有序表合并成一个有序表称为二路归并。 归并排序核心步骤:
在这里插入图片描述

public static void mergeSort(int[] arr) {
        mergeSortFun(arr, 0, arr.length - 1);
    }
    private static void mergeSortFun(int[] arr, int left, int right) {
        if (left >= right) {
            return;
        }
        int mid = (left + right) / 2;
        mergeSortFun(arr, left, mid);
        mergeSortFun(arr, mid + 1, right);
        merge(arr, left, right, mid);
    }
    private static void merge(int[] arr, int left, int right, int mid) {
        int s1 = left;
        int s2 = mid + 1;
        int[] tmp = new int[right - left + 1];
        int k = 0;
        while (s1 <= mid && s2 <= right) {
            if (arr[s1] > arr[s2]) {
                tmp[k++] = arr[s2++];
            }else {
                tmp[k++] = arr[s1++];
            }
        }
        while (s1 <= mid) {
            tmp[k++] = arr[s1++];
        }
        while (s2 <= right) {
            tmp[k++] = arr[s2++];
        }
        for (int i = 0; i < tmp.length; i++) {
            arr[i + left] = tmp[i];
        }
    }

归并排序总结

  1. 归并的缺点在于需要O(N)的空间复杂度归并排序的思考更多的是解决在磁盘中的外排序问题。
  2. 时间复杂度O(N*logN)
  3. 空间复杂度O(N)
  4. 稳定性稳定

2.4.2 海量数据的排序问题

外部排序排序过程需要在磁盘等外部存储进行的排序
前提内存只有 1G需要排序的数据有 100G
因为内存中因为无法把所有数据全部放下所以需要外部排序而归并排序是最常用的外部排序

  1. 先把文件切分成 200 份每个 512 M
  2. 分别对 512 M 排序因为内存已经可以放的下所以任意排序方式都可以
  3. 进行 2路归并同时对 200 份有序文件做归并过程最终结果就有序了

3. 排序算法复杂度及稳定性分析

在这里插入图片描述

排序方法最好平均最坏空间复杂度稳定性
冒泡排序O(n)O(n^2)O(n^2)O(1)稳定
插入排序O(n)O(n^2)O(n^2)O(1)稳定
选择排序O(n^2)O(n^2)O(n^2)O(1)不稳定
希尔排序O(n)O(n^1.3)O(n^2)O(1)不稳定
堆排序O(n * log(n))O(n * log(n))O(n * log(n))O(1)不稳定
快速排序O(n * log(n))O(n * log(n))O(n^2)O(log(n)) ~ O(n)不稳定
归并排序O(n * log(n))O(n * log(n))O(n * log(n))O(n)稳定
阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6