IO学习(4)— select、poll、epoll的区别

无论是select/poll/epoll都是IO多路复用模型,“多路”是指多个网络连接,“复用”是指一个线程。全称是一个线程去处理多个网络连接。这种方式可以减少服务端线程的上下文切换,支持大并发的请求。

多个网络连接到服务器,可以看做为文件描述符fd(Linux系统一切皆文件)。用户态收集到所有的fd后,传递给内核态由内核去监听是否有数据到来。若有数据到来,再由用户态去处理数据。

1. select

select利用等待队列机制让用户进程适当的在没有资源可读/写时睡眠,有资源可读/写时唤醒。

select采用是的轮询的方式,在Linux中一切皆文件,那么网络socket也属于文件的一种。首先将所有的文件描述符保存到fds[i]数组中。

  1. select()函数接收的参数为fd_set(底层是一个bitmap数组,底层默认大小为1024);
  2. fds[i]转化为fd_set集合;
  3. fd_set由用户态拷贝到内核态(内核判断哪个socket有数据),select是阻塞函数;
  4. 在内核会不断遍历fd_set,当某个socket有数据到来时,会将fd_set置位(即标识有数据到来,修改fd_set)并且select()返回;
  5. select()返回后,仍需遍历fd_set,判断哪个socket有数据到来;

fd_set置位:因为fd_set本身是bitmap结构。fd需要被监听,则置1;fd不需要被监听,则置0;置位直接去修改bitmap的值,将置位的fd读取出来。

select提高效率的最主要一点是:将fd_set放到了内核态,让内核去判断是否有socket返回数据。

select缺点:

  • fd_set的大小一般为1024个位置,虽然可以调整其大小,但是依旧存在上限;
  • fd_set发生置位后,不能重复使用,需要重新初始化;
  • fd_set需要从用户态拷贝到内核态;
  • select()返回后,需要再次遍历fd_set集合;

select阻塞:并且select并没有使用自旋去时刻的遍历fd_set,而是使用的是等待队列的方式,当某个socket接收到数据时,唤醒select进程。

select流程:将文件描述符fd收集起来,交给内核,让内核去判断哪个fd有数据,当其中一个或多个fd有数据时,fd会被置位,select返回,然后再次遍历所有的fd判断哪个fd有数据并进行处理。

2. poll

poll的工作原理实际上和select相同。改进的是传入内核的fd的结构体,使用的是pollfds(pollfd的数组)。

struct pollfd{
  int fd;   //文件描述符
  short events;  //pollfd在意事件(读事件/写事件/读写事件等)
  short revents; //对事件的回馈(置位标识符)
}

poll没有使用select中的fd_set(底层是bitmap),而是采用的pollfds。

有数据时,会置位pollfd revents字段,然后poll方法返回。返回后遍历pollfds,判读发生的事件(然后恢复pollfd revents,可以重用pollfds)。

  • 解决了select的1024的限制;
  • 解决了fd_set不能重用的问题;

但是fds用户态到内核态切换+用户态处理数据需遍历整个fds没有解决。

3. epoll

  • 创建epfd,使用int epfd=epoll_create(10)创建;
  • 将文件描述符fd,加入到epfd中,使用epoll_ctl()函数;
  • 使用epoll_wait监听所有的fd。

一旦fd就绪(存在数据)就会通过callback回调机制来激活对应的fd,进行重排操作。并唤醒epoll函数(不需要和select/poll进行遍历)。

用户态和内核态共享epfd内存,内核去判断哪个fd有数据到来。无需用户态到内核态的拷贝开销。

epoll的置位:重排(将有数据的fd重排在前面,然后进行返回)。

epoll的遍历:epoll_wait有返回值,返回值便是事件个数,这样的话,后续遍历时只需要遍历总数个。遍历复杂度为O(1)。

select和epoll的区别

select和epoll均是解决IO多路复用,均直接在内核中判断socket是否就绪。并且调用select、epoll方法后线程会被阻塞。

(1)select(支持的文件描述符为1024,epoll并无限制;
(2)select会将fd_set由用户态拷贝到内核态,而epoll用户态和内核态共享epfd内存,无需拷贝fd数组。
(3)select在内核轮询fd_set,epoll通过回调的方式激活fd;
(4)当socket有数据到达时,select会置位fd_set,而epoll会重排fd数组。
(5)select被唤醒后,需要重新遍历fd_set获取被激活的fd,而epoll会直接返回事件个数,无需遍历。

推荐阅读

1. IO 多路复用是什么意思?

2. PHP7中I/O模型内核,跟着学习一下吧!

相关文章

IO学习(1)Java-BIO体系学习
IO学习(2)-各种IO模型
IO学习(3)— IO和NIO的区别
IO学习(4)— select、poll、epoll的区别

推荐阅读更多精彩内容