无论是select/poll/epoll都是IO多路复用模型,“多路”是指多个网络连接,“复用”是指一个线程。全称是一个线程去处理多个网络连接。这种方式可以减少服务端线程的上下文切换,支持大并发的请求。
多个网络连接到服务器,可以看做为文件描述符fd(Linux系统一切皆文件)。用户态收集到所有的fd后,传递给内核态由内核去监听是否有数据到来。若有数据到来,再由用户态去处理数据。
1. select
select利用等待队列机制让用户进程适当的在没有资源可读/写时睡眠,有资源可读/写时唤醒。
select采用是的轮询的方式,在Linux中一切皆文件,那么网络socket也属于文件的一种。首先将所有的文件描述符保存到fds[i]数组中。
-
select()
函数接收的参数为fd_set
(底层是一个bitmap数组,底层默认大小为1024); - 将
fds[i]
转化为fd_set
集合; - 将
fd_set
由用户态拷贝到内核态(内核判断哪个socket有数据),select是阻塞函数; - 在内核会不断遍历fd_set,当某个
socket
有数据到来时,会将fd_set
置位(即标识有数据到来,修改fd_set)并且select()返回; - select()返回后,仍需遍历
fd_set
,判断哪个socket
有数据到来;
fd_set置位:因为fd_set本身是bitmap结构。fd需要被监听,则置1;fd不需要被监听,则置0;置位直接去修改bitmap的值,将置位的fd读取出来。
select提高效率的最主要一点是:将fd_set放到了内核态,让内核去判断是否有socket返回数据。
select缺点:
- fd_set的大小一般为1024个位置,虽然可以调整其大小,但是依旧存在上限;
- fd_set发生置位后,不能重复使用,需要重新初始化;
- fd_set需要从用户态拷贝到内核态;
- select()返回后,需要再次遍历fd_set集合;
select阻塞:并且select并没有使用自旋去时刻的遍历fd_set,而是使用的是等待队列的方式,当某个socket接收到数据时,唤醒select进程。
select流程:将文件描述符fd收集起来,交给内核,让内核去判断哪个fd有数据,当其中一个或多个fd有数据时,fd会被置位,select返回,然后再次遍历所有的fd判断哪个fd有数据并进行处理。
2. poll
poll的工作原理实际上和select相同。改进的是传入内核的fd的结构体,使用的是pollfds(pollfd的数组)。
struct pollfd{
int fd; //文件描述符
short events; //pollfd在意事件(读事件/写事件/读写事件等)
short revents; //对事件的回馈(置位标识符)
}
poll没有使用select中的fd_set(底层是bitmap),而是采用的pollfds。
有数据时,会置位pollfd revents字段,然后poll方法返回。返回后遍历pollfds,判读发生的事件(然后恢复pollfd revents,可以重用pollfds)。
- 解决了select的1024的限制;
- 解决了fd_set不能重用的问题;
但是fds用户态到内核态切换+用户态处理数据需遍历整个fds没有解决。
3. epoll
- 创建epfd,使用int epfd=epoll_create(10)创建;
- 将文件描述符fd,加入到epfd中,使用epoll_ctl()函数;
- 使用epoll_wait监听所有的fd。
一旦fd就绪(存在数据)就会通过callback回调机制来激活对应的fd,进行重排操作。并唤醒epoll函数(不需要和select/poll进行遍历)。
用户态和内核态共享epfd内存,内核去判断哪个fd有数据到来。无需用户态到内核态的拷贝开销。
epoll的置位:重排(将有数据的fd重排在前面,然后进行返回)。
epoll的遍历:epoll_wait有返回值,返回值便是事件个数,这样的话,后续遍历时只需要遍历总数个。遍历复杂度为O(1)。
select和epoll的区别
select和epoll均是解决IO多路复用,均直接在内核中判断socket是否就绪。并且调用select、epoll方法后线程会被阻塞。
(1)select(支持的文件描述符为1024,epoll并无限制;
(2)select会将fd_set由用户态拷贝到内核态,而epoll用户态和内核态共享epfd内存,无需拷贝fd数组。
(3)select在内核轮询fd_set,epoll通过回调的方式激活fd;
(4)当socket有数据到达时,select会置位fd_set,而epoll会重排fd数组。
(5)select被唤醒后,需要重新遍历fd_set获取被激活的fd,而epoll会直接返回事件个数,无需遍历。
推荐阅读
相关文章
IO学习(1)Java-BIO体系学习
IO学习(2)-各种IO模型
IO学习(3)— IO和NIO的区别
IO学习(4)— select、poll、epoll的区别