C语言——自定义类型详解(结构体,联合体,枚举,位段)
阿里云国内75折 回扣 微信号:monov8 |
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6 |
专栏C语言
个人主页HaiFan.
专栏简介本专栏主要更新一些C语言的基础知识也会实现一些小游戏和通讯录学时管理系统之类的有兴趣的朋友可以关注一下。
结构体
前言
一、结构体
1.结构体类型的声明
结构体是什么结构体就是一些值的集合这些值称为成员变量结构的每个成员可以是不同类型的变量。
struct tag//结构体的名字
{
member-list;//这是结构体的成员
}variable-list;//这就是结构体的声明
如描述运动和人数
struct sport
{
int run;//跑步
int soccer;//足球
int badminton;//羽毛球
char name[100];//姓名
};//分号不能丢
这里的runsoccerbadmintonname都是成员变量
。
结构体中有一个特殊的声明就是在声明结构的时候可以不完全声明。
如
//匿名结构体类型
struct
{
int a;
char b;
float c;
}x;
上面的结构体在声明的时候省略了结构体的标签(tag)这种结构体被称为匿名结构体。
2.结构体的自引用
在一个结构体中包含一个类型为该结构本身的成员是否可以呢
struct Node
{
int data;
struct Node next;
};
这样做可行吗
很显然不可行。那么正确的用法是是什么呢
struct Node
{
int data;
struct Node* next;
};
在自引用中若使用结构本身的成员每次在调用结构体的时候会发生嵌套所以应该使用指针类型。指针就是地址不会发生嵌套。
typedef struct
{
int data;
Node* next;
}Node;
typedef struct Node
{
int data;
struct Node* next;
}Node;
这两个代码哪一个是合法的呢答案是第二个因为第一个结构体成员是Node* next;
在调用该next成员的时候typedef还没有起到作用。
3.结构体变量的定义和初始化
有了结构体的成员该如何定义变量其实很简单。
struct Point
{
int x;
int y;
}p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2
这是定义结构体的两种方式。
结构体的初始化
struct Stu //类型声明
{
char name[15];//名字
int age; //年龄
};
struct Stu s = {"zhangsan", 20};//初始化
这就是结构体的初始化。
struct Stu s;
scanf("%s %d",s.name, &s.age);
也可以通过自己输入进行初始化。
4.结构体内存对齐
前面已经介绍了结构体的基本使用那么如何计算结构体的大小呢我们知道int4字节char1字节double8字节
struct Stu
{
char name[10];
int age;
double len;
float w;
long a;
long long c;
};
我们知道不同的数据类型占多少字节那么这个结构体的大小是10+4+8+4+4+8=38吗
很奇怪结果并不是所有成员所占的字节数相加。下面为大家介绍结构体的内存对齐这是一个特别热门的考点。
结构体大小如何计算
首先得掌握结构体的对齐规则
- 第一个成员在与结构体变量偏移量为0的地址处。
- 其他成员变量要对齐到某个数字对齐数的整数倍的地址处。 对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。 VS中默认的值为8
- 结构体总大小为最大对齐数每个成员变量都有一个对齐数的整数倍。
- 如果嵌套了结构体的情况嵌套的结构体对齐到自己的最大对齐数的整数倍处结构体的整 体大小就是所有最大对齐数含嵌套结构体的对齐数的整数倍。
struct S1
{
char c1;
int i;
char c2;
};
printf("%d\n", sizeof(struct S1));
char占1个字节int占4个字节根据规则1要先从偏移量为0的地址处开始。再根据规则2找到int的倍数的位置开始对齐然后在找最后一个c2的位置除了0其他数都是1的倍数所以c2对齐到8的位置即可现在结构体的大小为9再根据规则3结构体总大小为最大对齐数每个成员变量都有一个对齐数的整数倍所以要继续扩大直到找到所有成员中最大对齐数的整数倍为止也就是12.
struct S2
{
double d;
char c;
int i;
};
printf("%d\n", sizeof(struct S2));
这个结构体的大小是多少
首先double占8个字节从0的位置开始对齐后面的char占1个字节对齐到double后面的位置即可然后就是int占4个字节先找到4的倍数的位置开始对齐然后看此时的大小是不是结构体成员中对齐数最大的数的倍数如果是则此时的大小就是结构体的大小若不是则继续对齐直到找到结构体成员中对齐数最大的数的倍数为止。
此时算出来的大小为1616是double 8的倍数所以16就是该结构体的大小。
struct S2
{
double d;
char c;
int i;
};
printf("%d\n", sizeof(struct S2));//16
struct S3
{
char c1;
struct S2 s2;
double d;
};
printf("%d\n", sizeof(struct S3));
那么嵌套的结构体的大小是多少呢
还是老规矩先把c1对齐到0的位置处然后根据规则4先找到s2结构体里的最大对齐数在找到该数的倍数处开始对齐注这里就不是在对齐8个而是对齐s2结构体的大小16个
之后在对齐最后一个double d。
此时结构体的大小是31但是并不满足规则3继续对齐最后结构体的大小就是32.
为什么存在内存对齐?
大部分的参考资料都是如是说的
1.平台原因(移植原因) 不是所有的硬件平台都能访问任意地址上的任意数据的某些硬件平台只能在某些地址处取某些特 定类型的数据否则抛出硬件异常。
2.性能原因 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。性能原因在于为了访问未对齐的内存处理器需要作两次内存访问而对齐的内存访问仅需要一次访 问。
总体来说
结构体的内存对齐是拿空间来换取时间的做法。
那在设计结构体的时候我们既要满足对齐又要节省空间如何做到
让占用空间小的成员尽量集中在一起。
3.1修改默认对齐数
之前我们见过#pragma
这个预处理命令这里我们再次使用就可以改变我们的默认对其数。
#include <stdio.h>
#pragma pack(8)//设置默认对齐数为8
struct S1
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数还原为默认
#pragma pack(1)//设置默认对齐数为1
struct S2
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数还原为默认
int main()
{
//输出的结果是什么
printf("%d\n", sizeof(struct S1));
printf("%d\n", sizeof(struct S2));
}
结论 结构在对齐方式不合适的时候我么可以自己更改默认对齐数。
5.结构体传参
直接看代码
struct S
{
int data[1000];
int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
print1(s); //传结构体
print2(&s); //传地址
return 0;
}
上面的print1和print2哪一个更好
答案是print2.
原因
函数传参的时候参数是需要压栈会有时间和空间上的系统开销。如果传递一个结构体对象的时候结构体过大参数压栈的的系统开销比较大所以会导致性能的下降。
结论 结构体传参的时候要传结构体的地址。
二、位段
1.什么是位段
位段的声明和结构是类似的但有两个不同。
1.位段的成员必须是intunsigned in或者signed int。
2.位段成员名后边跟一个冒号和一个数字。
struct stu
{
int _people : 2;
int _run : 5;
int _go : 10;
};
stu就是一个位段类型。
那么位段stu的大小是多少呢
printf("%d", sizeof(struct stu));
答案是4为什么会是4呢
int占4字节32个bit位而位段里面的2510表示的是占多少bit位成员一占2个bit位成员而占5个bit位成员3占10个bit位总共占17个bit位没有超过int的大小所以是四个字节。
struct stu
{
int _people : 2;
int _run : 5;
int _go : 10;
int _a : 30;
};
那么这个printf("%d", sizeof(struct stu));
是多少呢
按照前面的分析方法前三个成员总共占17个bit位第四个成员占30个bit位一个int是不够存放的所以要在开辟一个空间存放第四个成员所以得到的结果是8.
2.位段的内存分配
- 位段的成员可以是 int unsigned int signed int 或者是 char 属于整形家族类型
- 位段的空间上是按照需要以4个字节 int 或者1个字节 char 的方式来开辟的。
- 位段涉及很多不确定因素位段是不跨平台的注重可移植的程序应该避免使用位段
struct S
{
char a:3;
char b:4;
char c:5;
char d:4;
};
struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
那么这些数值是如何在位段中进行内存分配的呢
一共是8个字节。
先把10的补码写出来00001010因为a只要3个bit位所以就发生了神奇的现象——截断所谓截断就是只把前三个bit位拿出后面的全部不要。就得到了
在把12的补码写出来00001100在发生截断只要前4个bit位
在把3的补码写出00000011截断只要前5个bit位因为一个char已经无法满足继续存c截断之后的补码了所以要开辟一个新空间来存放c。
同样再按照相同的规则存放d即可。int类型也是这样。
3.位段的跨平台问题
- int 位段被当成有符号数还是无符号数是不确定的。
- 位段中最大位的数目不能确定。16位机器最大1632位机器最大32写成27在16位机
器会出问题。 - 位段中的成员在内存中从左向右分配还是从右向左分配标准尚未定义。
- 当一个结构包含两个位段第二个位段成员比较大无法容纳于第一个位段剩余的位时是
舍弃剩余的位还是利用这是不确定的。
总结 跟结构相比位段可以达到同样的效果但是可以很好的节省空间但是有跨平台的问题存在。
三、枚举
什么是枚举枚举就是遍历 比如一到十 一 一 列举出来。
只要是可以 一 一 列举出来的都可以使用枚举。
1.枚举类型的定义
enum Sex
{
man,
woman
};
这就是枚举类型{}中的内容是枚举的可能取值也叫做枚举常量。
注用逗号隔开最后一个枚举常量后面没有符号
当然这些取值都是有值的。
默认从0开始每次都会递增1当然在定义的时候也可以赋值。
enum Sex
{
man = 1,
woman = 4
};
2.枚举的优点
我们可以使用 #define 定义常量为什么非要使用枚举
枚举的优点
- 增加代码的可读性和可维护性
- 和#define定义的标识符比较枚举有类型检查更加严谨。
- 防止了命名污染封装
- 便于调试
- 使用方便一次可以定义多个常量
后面我会用枚举和动态内存来优化通讯录。
四、联合共用体
1.联合类型的定义
联合也是一种特殊的自定义类型
这种类型定义的变量也包含一系列的成员特征是这些成员共用同一块空间。
union u
{
int a;
char b;
};
int main()
{
union u de;
printf("%d", sizeof(de));
return 0;
}
由此可见a和b共用同一块空间。空间是数据类型最大的那一个。
2.联合的特点
联合的成员是共用同一块内存空间的这样一个联合变量的大小至少是最大成员的大小因为联合至少得有能力保存最大的那个成员。
3.联合体大小的计算
- 联合的大小至少是最大成员的大小。
- 当最大成员大小不是最大对齐数的整数倍的时候就要对齐到最大对齐数的整数倍。
union Un1
{
char c[5];
int i;
};
int main()
{
printf("%d\n", sizeof(union Un1));
return 0;
}
最大成员的大小是c占5个字节这里面的最大对齐数是4字节因为5不是4的倍数所以要进行对齐直到找到最大对齐数的整数倍的位置即可也就是8.