I/O复用 select/poll/epoll

转载自I/O复用 select/poll/epoll

一、概述

I/O复用使得程序能同时监听多个文件描述符,这对提高程序的性能至关重要。

I/O复用虽然能同时监听多个文件描述符,但本身是阻塞的。并且当多个描述符同时就绪时,如果不采用额外的措施,程序就只能按照顺序依次处理其中的每个文件描述符,使得服务器程序看起来像串行工作一样。要实现并发,只能使用多进程或者多线程等方式实现。

linux下实现I/O复用的系统调用主要有select、poll、epoll。

二、select

select系统调用的用途是,在一段时间内,监听用户感兴趣的文件描述符上可写和异常事件。

#include <sys/select.h>
int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds,
            const struct timeval *timeout);

1、nfds

nfds参数指被监听文件描述符的总数,通常设为做大文件描述符值加1。

2、readfds, writefds, exceptfds

分别指向可读,可写和异常事件对应的文件描述符集合。select通过这三个参数传入自己感兴趣的文件描述符,内核修改它们来通知应用程序哪些文件描述符已经就绪。

fd_set结构体仅包含一个整型数组,该数组每一个元素的每一位都标记一个文件描述符,是一个bitmap。其最大文件描述符的数量由FD_SETSIZE指定,这限制了select能同时处理的文件描述符总量。

3、timeout

超时时间。该参数与poll、epoll不同,是一个timeval结构类型指针。可以精确到微妙。如果给timeval中tv_sec和tv_usec传递的都是0,则表示立即返回,非阻塞。如果给timeout传递null,则select将一直阻塞,直到某个文件描述符就绪。

4、返回值

成功时,返回就绪(可读、可写和异常)文件描述符总数。超时时间内没有任何文件返回0。失败返回-1,并设置errno。如果等待期间,接收到信号,则立刻返回-1,并设置errno为EINTR。

三、poll

poll和select相似,也是在指定时间内轮询一定数量的文件描述符,以测试其中是否有就绪者。poll原型如下:

#include<poll.h>
int poll(struct pollfd * nfds_t nfds, int timeout);

struct pollfd{
  int fd;
  short events;
  short revents;
};

1、fds

fds参数是一个pollfd结构类型的数组,它指定了所有我们感兴趣文件描述符上发生的可读、可写和异常等事件。

pollfd中fd是文件描述符,events是注册的事件,revents是实际发生的事件,由内核填充,用来通知应用程序fd上实际发生了哪些事件。

2、nfds

指定被监听事件几何fds的大小
typedef unsigned long int nfds_t;

3、timeout

poll的超时时间。单位是毫秒,当值为-1时,poll调用将永远阻塞,直到某个事件发生;当timeout为0,poll将立即返回。

4、返回值

返回值与select相同

四、epoll

epoll是linux特有的I/O复用函数。它在实现和使用上与select、poll有很大差别。

  • 用一组函数来完成任务,而不是单个函数。
  • 把用户关系的文件描述符上的事件放在内核里的一个事件表中,无需像select、poll那样每次调用都重复传入文件描述符和事件集。
  • 需要一个额外的文件描述符,来唯一标识内核中这个事件表。这个文件描述符由epoll_create函数创建。
1、epoll_create
#include<sys/epoll.h>
int epoll_create(int size);

size参数现在不起作用,只是给内核一个提示,告诉它事件表需要多大。该函数返回的文件描述符用于其它epoll函数的第一个参数,以指定要访问的内核事件表。

2、epoll_ctl
#include<sys/epoll.h>
int epoll_ctl(int epfd, int op, int fd, struct epoll_event * event);

/*op有三种类型:
EPOLL_CTL_ADD,往事件表中注册fd上的事件
EPOLL_CTL_MOD,修改fd上的注册事件
EPOLL_CTL_DEL,删除fd上的注册事件*/

struct epoll_event {
  __uint32_t events;  /* Epoll events */
  epoll_data_t data;  /* User data variable */
};

3、epoll_wait

是epoll系统调用主要的接口函数。它在一段时间内等待一组文件描述符上的事件,其原型如下:

#include<sys/epoll.h>
int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);

  • timeout含义与poll相同
  • 函数返回的含义与select/poll相同
  • maxevents表示最多监听多少个事件

epoll_wait如果检测到事件,就将所有就绪事件从内核事件表中复制到它的第二个参数events指向的数组中。这个数组只用于输出epoll_wait检测到的事件。而不像select/poll那样即用于输入,也用于输出。因此提高了应用程序索引就绪文件的描述符的效率。

4、LT和ET模式

epoll对文件描述符的操作有两种模式:LT(level trigger,电平触发)和ET(edge trigger)

LT模式是默认的工作模式,此模式下epoll相当于一个效率较高的poll。当往epoll内核事件表中注册一个文件描述符上的EPOLLET事件时,epoll将采用ET模式,ET是epoll高效的规则模式。

对于LT,epoll_wait检测到其上有事件发生并将此事件通知应用程序后,应用程序可以不立即处理该事件。因此应用程序下次调用epoll_wait时,还将向应用程序通知该事件,直至该事件被处理。

对于ET,epoll_wait检测到其上有事件发生并将此事通知应用程序后,应用程序必须立即处理该事件,后续epoll_wait将不再向应用程序通知这一事件。ET模式在很大程度上降低了同一事件被重复触发次数,因此效率比LT高。每个使用ET模式的文件描述符都应该是非阻塞的。如果文件描述符是阻塞的,那么读写操作都会因没有后续事件而处于阻塞状态。

五、三组I/O复用函数比较

  • 三者都由timeout参数指定超时时间,直到一个或多个文件描述符上有时间发生时返回,返回值就是文件描述符的数量。返回0表示没有事件发生。

  • 1、select没有文件描述符与事件绑定,它仅仅是一个文件描述符的几何,因此select需要提供三个此类参数来区分传入的可读,可写,异常事件。一方面使得其不能处理更多事件,另一方面内核对fd_set集合在线修改,应用程序下次需要重置此三个fd_set集合。

  • 2、poll则比select聪明些,它把文件描述符和事件都定义在其中,任何任何事件都被统一处理,从而简化了编程接口。由于select/poll每次都需要返回整个用户注册事件集合,应用程序索引文件描述符时间复杂度为O(n)

  • 3、epoll在内核维护一个事件表,并提供epoll_ctl来控制向其中添加、删除、修改事件。这样,epoll调用直接从该内核事件表中取得用户注册事件,从而无需反复从用户空间读入这些事件。epoll_wait系统调用的events参数仅用来返回就绪事件,使得应用程序索引就绪事件描述符的时间复杂度为O(1)

  • 4、poll/epoll分别采用nfds和maxevents参数指定最多监听的文件描述符合事件。这两个数值都能达到系统允许的最大最大文件描述符数,65536。而select允许最大监听最大文件描述符数量通常有限制。

  • 5、select/poll都支持相对低效的LT模式,epoll可在ET模式下工作,epoll还支持EPOLLONESHOT事件

  • 6、活动连接比较多是,epoll效率未必比select、poll高,因为此时回调函数被触发过于频繁。epoll适用于连接数量较多,但活动连接相对较少的情况。

  • 7、select,poll,epoll本质上都是同步I/O,因为他们都需要在读写事件就绪后自己负责进行读写,也就是说这个读写过程是阻塞的,而异步I/O则无需自己负责进行读写,异步I/O的实现会负责把数据从内核拷贝到用户空间。

参考文献:
1、Linux IO模式及 select、poll、epoll详解
2、Anker—工作学习笔记
3、细说select、poll和epoll之间的区别与优缺点
4、select,poll,epoll优缺点及比较