【重拾C语言】六、批量数据组织(二)线性表——分类与检索(主元排序、冒泡排序、插入排序、顺序检索、对半检索)
阿里云国内75折 回扣 微信号:monov8 |
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6 |
目录
前言
线性表是一种常见的数据结构用于存储一组具有相同类型的元素。本文主要介绍了下面几种常见的线性表的排序和检索算法
-
主元排序主元选择排序这是一种选择排序算法它通过选择主元通常是最小或最大元素并将其放置在正确的位置来进行排序。该算法重复选择主元并移动它直到所有元素都有序排列。
-
冒泡排序这是一种简单的排序算法它通过多次比较和交换相邻元素的方式将较大的元素逐渐向右移动。通过重复这个过程直到所有元素都有序排列最终实现排序。
-
插入排序这是一种通过将元素逐个插入已排序序列的合适位置来完成排序的算法。在插入排序过程中将当前元素与已排序序列中的元素逐个比较直到找到合适的插入位置。
-
顺序检索也称为线性搜索是一种简单直接的搜索方法从线性表的起始位置开始逐个比较元素直到找到目标元素或遍历完整个线性表。
-
对半检索二分查找对于已排序的线性表可以使用对半检索来提高搜索效率。该算法通过将目标元素与线性表的中间元素进行比较然后根据比较结果将搜索范围缩小一半。重复这个过程直到找到目标元素或确定目标元素不存在。
六、批量数据组织——数组
6.1~3 数组基础知识
6.4 线性表——分类与检索
6.4.1 主元排序
主元排序主元选择排序是一种简单的排序算法它通过选择线性表中的主元也称为枢轴元素并将其放置在正确的位置上来实现排序。主元排序算法的基本思想是选择一个主元将线性表中小于主元的元素放在主元的左边将大于主元的元素放在主元的右边然后对主元的左右两部分递归地进行排序直到整个线性表有序。
void mainElementSort(int arr[], int left, int right) {
if (left < right) {
int pivot = partition(arr, left, right); // 获取主元的位置
mainElementSort(arr, left, pivot - 1); // 对主元左边的元素进行排序
mainElementSort(arr, pivot + 1, right); // 对主元右边的元素进行排序
}
}
int partition(int arr[], int left, int right) {
int pivotIndex = left; // 将第一个元素作为主元
int pivotValue = arr[left];
int i, j;
for (i = left + 1; i <= right; i++) {
if (arr[i] < pivotValue) {
pivotIndex++;
swap(arr, i, pivotIndex); // 将小于主元的元素交换到主元的左边
}
}
swap(arr, left, pivotIndex); // 将主元放置在正确的位置上
return pivotIndex;
}
void swap(int arr[], int i, int j) {
int temp = arr[i];
arr[i] = arr[j];
arr[j] = temp;
}
在主元排序算法中首先选择一个主元这里选择线性表的第一个元素作为主元。然后从主元的下一个位置开始遍历线性表将小于主元的元素逐个交换到主元的左边并记录交换次数。最后将主元放置在正确的位置上即交换次数加一的位置。这样主元左边的元素都小于主元主元右边的元素都大于主元。
接下来对主元的左右两部分分别递归地应用主元排序算法直到每个子序列只有一个元素为止。最终整个线性表就会被排序。
主元排序是一种简单但有效的排序算法其平均时间复杂度为O(nlogn)其中n是线性表的长度。然而如果每次选择的主元都不合理可能导致算法的性能下降。因此在实际应用中选择合适的主元策略对算法的性能至关重要。
6.4.2 冒泡排序
冒泡排序Bubble Sort是一种简单的排序算法它通过反复交换相邻的元素将最大的元素逐步 "冒泡" 到数组的末尾从而实现排序。冒泡排序算法的基本思想是比较相邻的两个元素如果它们的顺序不正确则交换它们直到整个数组有序。
void bubbleSort(int arr[], int n) {
int i, j;
for (i = 0; i < n - 1; i++) { // 通过n-1次循环将最大元素冒泡到末尾
for (j = 0; j < n - 1 - i; j++) { // 每次循环比较相邻的两个元素
if (arr[j] > arr[j + 1]) {
int temp = arr[j];
arr[j] = arr[j + 1];
arr[j + 1] = temp; // 交换位置使更大的元素向后移动
}
}
}
}
在冒泡排序算法中外层循环控制冒泡的轮数内层循环用于比较相邻的两个元素并进行交换。每一轮循环都将最大的元素冒泡到当前未排序部分的末尾。通过n-1次循环就可以将整个数组排序完成。
冒泡排序的时间复杂度为O(n^2)其中n是数组的长度。尽管冒泡排序的时间复杂度较高但它的实现较为简单且在某些情况下可能具有一定的优势。然而在处理大型数据集时通常会选择更高效的排序算法。
6.4.3 插入排序
插入排序Insertion Sort是一种简单直观的排序算法它通过构建有序序列不断将未排序的元素插入到已排序序列中的适当位置从而实现排序。插入排序算法的基本思想是将数组分为已排序和未排序两部分每次从未排序部分取出一个元素将其插入到已排序部分的正确位置。
void insertionSort(int arr[], int n) {
int i, j, key;
for (i = 1; i < n; i++) {
key = arr[i]; // 从未排序部分取出一个元素
j = i - 1;
while (j >= 0 && arr[j] > key) {
arr[j + 1] = arr[j]; // 将比key大的元素向后移动
j--;
}
arr[j + 1] = key; // 将key插入到正确的位置上
}
}
在插入排序算法中将数组分为已排序部分初始为空和未排序部分。从未排序部分依次取出元素将其与已排序部分的元素从右向左进行比较直到找到合适的位置插入。为了插入元素需要将比插入元素大的元素向右移动一个位置为插入元素留出空间。最后将插入元素放置在正确的位置上即完成一次插入操作。
通过n-1次循环就可以将整个数组排序完成。
插入排序的时间复杂度为O(n^2)其中n是数组的长度。尽管插入排序的时间复杂度较高但它对小型数据集的排序效果较好并且在部分已经有序的情况下插入排序的性能会更加出色。
6.4.4 顺序检索线性搜索
顺序检索Sequential Search也称为线性搜索是一种简单直观的搜索算法。顺序检索算法的基本思想是从给定的数据集合中按顺序逐个比较元素直到找到目标元素或搜索完整个数据集合。
int sequentialSearch(int arr[], int n, int target) {
for (int i = 0; i < n; i++) {
if (arr[i] == target) {
return i; // 找到目标元素返回元素的索引
}
}
return -1; // 未找到目标元素返回-1表示失败
}
顺序检索算法通过遍历数据集合逐个比较元素和目标元素是否相等。如果找到了目标元素就返回该元素在数据集合中的索引如果遍历完整个数据集合仍未找到目标元素则返回-1表示搜索失败。
顺序检索的时间复杂度为O(n)其中n是数据集合的大小。由于顺序检索需要逐个比较元素它的效率较低特别是在大型数据集合上。然而在小型数据集合或无序数据集合中进行简单搜索时顺序检索是一种常用的方法。
6.4.5 对半检索二分查找
对半检索Binary Search也称为二分查找是一种高效的搜索算法用于在有序数组或列表中查找目标元素。对半检索算法的基本思想是将数组或列表分成两部分通过比较目标元素与中间元素的大小关系确定目标元素可能在的那一部分然后继续在该部分中进行查找缩小搜索范围直到找到目标元素或确定目标元素不存在。
int binarySearch(int arr[], int n, int target) {
int low = 0;
int high = n - 1;
while (low <= high) {
int mid = (low + high) / 2; // 计算中间元素的索引
if (arr[mid] == target) {
return mid; // 找到目标元素返回元素的索引
} else if (arr[mid] < target) {
low = mid + 1; // 目标元素在右半部分调整搜索范围
} else {
high = mid - 1; // 目标元素在左半部分调整搜索范围
}
}
return -1; // 未找到目标元素返回-1表示失败
}
对半检索算法通过比较目标元素与中间元素的大小关系将数组或列表分成两部分。如果中间元素等于目标元素就返回中间元素的索引如果中间元素小于目标元素说明目标元素在右半部分将搜索范围缩小到右半部分如果中间元素大于目标元素说明目标元素在左半部分将搜索范围缩小到左半部分。通过不断缩小搜索范围最终可以找到目标元素或确定目标元素不存在。
对半检索的前提是数组或列表必须是有序的因为它利用了有序性质进行二分查找。对半检索的时间复杂度为O(log n)其中n是数组或列表的长度。由于每次都将搜索范围缩小一半对半检索的效率非常高。
算法比较
#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#define SIZE 100000
void swap(int arr[], int i, int j) {
int temp = arr[i];
arr[i] = arr[j];
arr[j] = temp;
}
int partition(int arr[], int left, int right) {
int pivotIndex = left; // 将第一个元素作为主元
int pivotValue = arr[left];
int i, j;
for (i = left + 1; i <= right; i++) {
if (arr[i] < pivotValue) {
pivotIndex++;
swap(arr, i, pivotIndex); // 将小于主元的元素交换到主元的左边
}
}
swap(arr, left, pivotIndex); // 将主元放置在正确的位置上
return pivotIndex;
}
void primeSort(int arr[], int left, int right) {
if (left < right) {
int pivot = partition(arr, left, right); // 获取主元的位置
primeSort(arr, left, pivot - 1); // 对主元左边的元素进行排序
primeSort(arr, pivot + 1, right); // 对主元右边的元素进行排序
}
}
void bubbleSort(int arr[], int n) {
int i, j;
for (i = 0; i < n - 1; i++) { // 通过n-1次循环将最大元素冒泡到末尾
for (j = 0; j < n - 1 - i; j++) { // 每次循环比较相邻的两个元素
if (arr[j] > arr[j + 1]) {
int temp = arr[j];
arr[j] = arr[j + 1];
arr[j + 1] = temp; // 交换位置使更大的元素向后移动
}
}
}
}
void insertionSort(int arr[], int n) {
int i, j, key;
for (i = 1; i < n; i++) {
key = arr[i]; // 从未排序部分取出一个元素
j = i - 1;
while (j >= 0 && arr[j] > key) {
arr[j + 1] = arr[j]; // 将比key大的元素向后移动
j--;
}
arr[j + 1] = key; // 将key插入到正确的位置上
}
}
int sequentialSearch(int arr[], int n, int target) {
for (int i = 0; i < n; i++) {
if (arr[i] == target) {
return i; // 找到目标元素返回元素的索引
}
}
return -1; // 未找到目标元素返回-1表示失败
}
int binarySearch(int arr[], int n, int target) {
int low = 0;
int high = n - 1;
while (low <= high) {
int mid = (low + high) / 2; // 计算中间元素的索引
if (arr[mid] == target) {
return mid; // 找到目标元素返回元素的索引
} else if (arr[mid] < target) {
low = mid + 1; // 目标元素在右半部分调整搜索范围
} else {
high = mid - 1; // 目标元素在左半部分调整搜索范围
}
}
return -1; // 未找到目标元素返回-1表示失败
}
double measureTime(clock_t start, clock_t end) {
return ((double) (end - start)) / CLOCKS_PER_SEC;
}
int main() {
int arr[SIZE];
// 使用时间作为随机数种子
srand(time(NULL));
// 待排序的数组
for (int i = 0; i < SIZE; i++) {
arr[i] = rand();
};
int n = sizeof(arr) / sizeof(arr[0]); // 数组的长度
int target = 7; // 待搜索的目标元素
// 测量主元排序算法的运行时间
clock_t start = clock();
primeSort(arr, 0, n);
clock_t end = clock();
printf("Prime Sorting Time: %.6f seconds\n", measureTime(start, end));
// 测量冒泡排序算法的运行时间
start = clock();
bubbleSort(arr, n);
end = clock();
printf("Bubble Sort Time: %.6f seconds\n", measureTime(start, end));
// 测量插入排序算法的运行时间
start = clock();
insertionSort(arr, n);
end = clock();
printf("Insertion Sort Time: %.6f seconds\n", measureTime(start, end));
// 测量顺序检索算法的运行时间
start = clock();
int sequentialSearchResult = sequentialSearch(arr, n, target);
end = clock();
printf("Sequential Search Time: %.6f seconds\n", measureTime(start, end));
printf("Sequential Search Result: %d\n", sequentialSearchResult);
// 测量对半检索算法的运行时间
start = clock();
int binarySearchResult = binarySearch(arr, n, target);
end = clock();
printf("Binary Search Time: %.6f seconds\n", measureTime(start, end));
printf("Binary Search Result: %d\n", binarySearchResult);
return 0;
}