可以睡眠的poll

简介:

在file_operations中有许多的回调函数,正是这些回调函数实现了vfs,vfs提供了一个机制,这些回调函数提供了不同的策略,等于说实现了vfs,照理说这些函数不应该有任何限制,但是唯独一个poll回调函数与众不同,它不能睡眠,这是为何呢?

除了poll以外的回调函数都拥有直接的语义,比如read就是读,write就是写,因此系统调用层可以直接将执行路径交给vfs,比如在sys_read函数中,几乎做了简单的判断之后就马上调用了真正文件系统的file_operations的read函数,但是poll函数比较特殊,它并没有简单的语义,其实它就是轮询,可是它不像read,write那样系统调用层和vfs层那么统一,poll在vfs层的意思就是“看看这个文件是否有动作”,但是在系统调用层的意义就是“看看这些文件中哪个有动作”,这就是不同,为了将系统调用层的语义平滑的过度到vfs层,就必须在系统调用和vfs只见插入机制,这个机制实现了poll,当然还包括select。在poll的实现中,靠的是进程的状态来同步睡眠/唤醒动作的,它并不是在将进程加入睡眠队列后马上睡眠,而是不睡眠等到所有poll的文件描述符均加入队列后再睡眠,其实仅仅是左一个调度罢了,总体框架如下:

for (;;)

set_current_state(TASK_INTERRUPTIBLE)

for each fd to poll

ask driver if I/O can happen

add current process to driver wait queue

if one or more fds are ready

break

schedule_timeout_range(...)

注意,这里是在一开始就将进程的状态设置为TASK_INTERRUPTIBLE但是不睡眠,在中间的for循环中陆续将进程加入到睡眠队列,到了最后才切换进程,等于说就是睡眠了,看看这个糟糕的实现,在设置了进程TASK_INTERRUPTIBLE状态后那么大一会才将进程切换,这很是丑陋,丑陋的本质原因就是vfs实现的poll是poll一个文件描述符,但是系统调用的语义是poll一大堆的文件描述符,在没有必要添加适配机制的情况下,只好用进程状态来实现了,2.6.29内核实在是看不下去这个局面了,于是提出了poll和别的file_operations的回调函数一样,也可以睡眠,并且可以用传统的睡眠唤醒函数来唤醒进程:

+static int pollwake(wait_queue_t *wait, unsigned mode, int sync, void *key)

+{

+ struct poll_wqueues *pwq = wait->private;

+ DECLARE_WAITQUEUE(dummy_wait, pwq->polling_task);

+

+ set_mb(pwq->triggered, 1);

+

+ /* perform the default wake up operation */

+ return default_wake_function(&dummy_wait, mode, sync, key);

+}

static void __pollwait(struct file *filp, wait_queue_head_t *wait_address, poll_table *p)

{

- struct poll_table_entry *entry = poll_get_entry(p);

+ struct poll_wqueues *pwq = container_of(p, struct poll_wqueues, pt);

+ struct poll_table_entry *entry = poll_get_entry(pwq);

if (!entry)

return;

get_file(filp);

entry->filp = filp;

entry->wait_address = wait_address;

- init_waitqueue_entry(&entry->wait, current);

+ init_waitqueue_func_entry(&entry->wait, pollwake);

+ entry->wait.private = pwq;

add_wait_queue(wait_address, &entry->wait);

}

+int poll_schedule_timeout(struct poll_wqueues *pwq, int state,

+ ktime_t *expires, unsigned long slack)

+{

+ int rc = -EINTR;

+

+ set_current_state(state);

+ if (!pwq->triggered)

+ rc = schedule_hrtimeout_range(expires, slack, HRTIMER_MODE_ABS);

+ __set_current_state(TASK_RUNNING);

+

+ /* clear triggered for the next iteration */

+ pwq->triggered = 0;

+

+ return rc;

+}

int do_select(int n, fd_set_bits *fds, s

for (;;) {

unsigned long *rinp, *routp, *rexp, *inp, *outp, *exp;

- set_current_state(TASK_INTERRUPTIBLE);

inp = fds->in; outp = fds->out; exp = fds->ex;

rinp = fds->res_in; routp = fds->res_out; rexp = fds->res_ex;

@@ -411,10 +436,10 @@ int do_select(int n, fd_set_bits *fds, s

to = &expire;

}

- if (!schedule_hrtimeout_range(to, slack, HRTIMER_MODE_ABS))

+ if (!poll_schedule_timeout(&table, TASK_INTERRUPTIBLE,

+ to, slack))

timed_out = 1;

}

- __set_current_state(TASK_RUNNING);

poll_freewait(&table);

我们可以看到在这个可睡眠的poll的补丁中,去掉了刻意为了适配加入的设置进程状态的语句,加入了统一的linux的睡眠/唤醒机制,poll_schedule_timeout是个新加入的函数,实际上它就是poll中的睡眠函数,和wait_event没有本质区别的,这样的话,加入这些函数,poll的实现和别的回调函数变得统一起来的。

实际上,我发现在2.6.29内核中,代码变得更加统一了,内核逻辑变得更加统一了,和前一篇文章我谈到的cred从task_struct中分离一样,poll可睡眠的意义也十分的大,比如将来为了加入新的机制要大改代码,起码file_operations中的回调函数都是统一的,这样就可以将之独立成一个模块而不用和别的模块杂糅。


 本文转自 dog250 51CTO博客,原文链接:http://blog.51cto.com/dog250/1273940

相关文章
|
6月前
每日一道面试题之在 Queue 中 poll()和 remove()有什么区别?
每日一道面试题之在 Queue 中 poll()和 remove()有什么区别?
浅谈select,poll和epoll的区别
云栖号资讯:【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! select,poll和epoll其实都是操作系统中IO多路复用实现的方法。 select select方法本质其实就是维护了一个文件描述符(fd)数组,以此为基础,实现IO多路复用的功能。
浅谈select,poll和epoll的区别
|
4天前
|
Unix
poll 函数 I/O 多路复用的技术
【4月更文挑战第14天】poll 是另一种在各种 UNIX 系统上被广泛支持的 I/O 多路复用技术,虽然名声没有 select 那么响,能力一点不比 select 差,而且因为可以突破 select 文件描述符的个数限制,在高并发的场景下尤其占优势。
一文搞懂select、poll和epoll区别(上)
一文搞懂select、poll和epoll区别
144 0
一文搞懂select、poll和epoll区别(上)
|
Linux 调度 网络协议
poll&&epoll实现分析(一)——poll实现
0.等待队列 在Linux内核中等待队列有很多用途,可用于中断处理、进程同步及定时。我们在这里只说,进程经常必须等待某些事件的发生。等待队列实现了在事件上的条件等待: 希望等待特定事件的进程把自己放进合适的等待队列,并放弃控制全。
1015 0
poll&&epoll实现分析(二)——epoll实现
Epoll实现分析——作者:lvyilong316 通过上一章分析,poll运行效率的两个瓶颈已经找出,现在的问题是怎么改进。首先,如果要监听1000个fd,每次poll都要把1000个fd 拷入内核,太不科学了,内核干嘛不自己保存已经拷入的fd呢?答对了,epoll就是自己保存拷入的fd,它的API就已经说明了这一点——不是 epoll_wait的时候才传入fd,而是通过epoll_ctl把所有fd传入内核再一起"wait",这就省掉了不必要的重复拷贝。
1004 0
|
存储 网络协议 Linux
select的限制以及poll的使用
1.先说select在多路IO中的限制:1)linux中每个程序能够打开的最多文件描述符是有限制的。默认是1024.可以通过ulimit -n进行查看和修改: xcy@xcy-virtual-machine:~/test/sock10_poll$ ulimit -n1024xcy@xcy-vi...
1098 0
|
消息中间件 Unix C语言