【网络协议】聊聊套接字socket-CSDN博客

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6

网络编程我们知道是通过socket进行编程的其实socket也是基于TCP和UDP协议进行编程的。但是在socket层面是感知不到下层的所以在设置参数的时候其实是端到端协议智商的网络层和传输层。TCP是数据流所以设置为SOCK_STREAM而UDP是基于数据报的设置为SOCK_DGRAM

基于 TCP 协议的 Socket 程序函数调用过程

整体流程其实就是显示服务端进行bind ip+端口 可以进一步确定机器和将数据发送给那个应用程序然后就开始监听状态。

在内核中为每个 Socket 维护两个队列。一个是已经建立了连接的队列这时候连接三次握手已经完毕处于 established 状态一个是还没有完全建立连接的队列这个时候三次握手还没完成处于 syn_rcvd 的状态。

服务端拿出一个已经完成的连接进行处理客户端通过connect函数创建连接指明要连接的目标IP+port。内核会给客户端分配一个临时的端口。

监听的 Socket 和真正用来传数据的 Socket 是两个一个叫作监听 Socket一个叫作已连接 Socket。
连接建立完成就通过一写一读的模式进行处理数据。

Socket 在 Linux 中就是以文件的形式存在的。除此之外还存在文件描述符。写入和读出也是通过文件描述符。
在这里插入图片描述

基于 UDP 协议的 Socket 程序函数调用过程

UDP因为不需要进行连接所以只需要端口和IP使用senddtp就可以发送数据recvfrom接收数据。
在这里插入图片描述

服务器如何接更多的项目

因为上面的方式其实就是一个客户端对应一个服务端的模式但是对于高性能、高并发系统来说其实都是需要一个服务端进行同时处理上千上万的客户端请求处理所以这种方式不可以那么服务端最大TCP连接数其实是受到文件描述符限制 也就是ulimit 文件描述符的数目另一个就是内存每个TCP连接都要占用一定的内存硬件资源也是有限制的。

多进程方式

一种方式就是有一个专门处理连接+转发任务的进程但是当有新的客户端请求进来的时候这个主进程会fork新的进程进行处理客户端的请求因为是通过frok的形式所以会复制文件描述符的列表也会复制内存空间。所以子进程也可以访问内核态统一打开文件列表的文件当子进程处理完毕之后就可以通过函数的返回值进行判断。如果是整数就是父进程如果是0就是子进程。

在这里插入图片描述

多线程方式

线程相比进程暂用的资源更少但是对于C10K问题来说其实还有有点捉襟见肘。

IO 多路复用

select模式
由于socket是文件描述符所以可以通过一个线程进行所有的文件描述符将所有的文件描述符放在一起fd_set中会实时监听那些文件描述符有变化当发生变化的时候就将fd_set设置为1表示socket可读或者可写然后继续调用select进行监听下一轮的变化。

epollo
因为监听这种方式需要遍历所有的文件描述符并且有最大数据限制。
所以最好的方式是那个文件描述符有变化进行主动通知的方式在内核的实现方式不是通过轮训的方式而是通过注册callback函数的方式当某个文件描述符发送变化的时候主动通知。
在这里插入图片描述
比如创建了m n x三个socket。那么会先创建一个epoll对象也就是一个文件描述符对应结构其实就是一个红黑树保存所有这个监听所有的socket。当添加一个socket的时候其实就是加入这个红黑树红黑树的节点指向这个结构将这个结构挂在被监听的socket事件列表中当一个socket来了一个事件的时候就可以从列表中获取epoll对象并调用call back进行回调。
epoll 被称为解决 C10K 问题的利器

小结

本篇主要介绍了UDP和TCP网络编程流程细节以及支撑大量连接的高并发的服务端不容易多进程、多线程、IO多路复用等。

推荐阅读https://blog.csdn.net/jia970426/article/details/130611163?spm=1001.2014.3001.5501

[https://blog.csdn.net/jia970426/article/details/132947333?spm=1001.2014.3001.5501]

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6