APR分析-线程篇

APR分析-线程篇

并行一直是程序设计领域的难点,而线程是并行的一种重要的手段,而且线程的一些特性也能在进程并行时发挥很好的作用(在“线程同步篇”中详细阐述)。

APR线程的源代码的位置在$(APR_HOME)/threadproc目录下,本篇blog着重分析unix子目录下的thread.c文件内容,其相应头文件为$(APR_HOME)/include/apr_threadproc.h。

一、线程基础

《深入理解计算机系统》(以下称CS.APP)一书中对线程基础概念的讲解让我眼前豁然开朗,这里不妨引述一下:

(1)在传统观点中,进程是由存储于用户虚拟内存中的代码、数据和栈,以及由内核维护的“进程上下文”组成的,其中“进程上下文”又可以看成“程序上下文”和“内核上下文”组成,可参见下面图示:

进程--

|-进程上下文

|-程序上下文

|-数据寄存器

|-条件码

|-栈指针

|-程序计数器

|-内核上下文

|-进程ID

|- VM结构

|- Open files

|-已设置的信号处理函数

|- brk pointer

|-代码、数据和栈(在虚存中)

|-栈区<-- SP

|-共享库区

|-运行时堆区<-- brk

|-可读/写数据区

|-只读代码/数据区<-- PC

(2)另种观点中,进程是由线程、代码和数据以及内核上下文组成的,下图更能直观的展示出两种观点的异同:

进程--+

|-线程

|-栈区<-- SP

|-线程上下文

|-线程ID

|-数据寄存器

|-条件码

|-栈指针

|-程序计数器

|-内核上下文

|-进程ID

|- VM结构

|-Open files

|-已设置的信号处理函数

|-brk pointer

|-代码、数据(在虚存中)

|-共享库区

|-运行时堆区<-- brk

|-可读/写数据区

|-只读代码/数据区<-- PC

对比两种观点我们可以得出以下几点结论:

(a)从观点(2)可以看出进程内的多个线程共享进程的内核上下文和代码、数据(当然不包括栈区);

(b)线程上下文比进程上下文小,且切换代价小;

(c)线程不像进程那样有着“父-子”体系,同一个进程内的线程都是“对等的”,主线程与其他线程不同之处就在于其是进程创建的第一个线程。

二、APR线程管理接口

如今应用最广泛的线程包就是PosixThread了。APR对线程的封装也是基于Posix

thread的。

APR线程管理接口针对apr_thread_t这个基本的数据结构进行操作,apr_thread_t的定义很简单:

/* apr_arch_threadproc.h */

struct apr_thread_t {

apr_pool_t *pool;

pthread_t *td;

void *data;

apr_thread_start_t func;

apr_status_t exitval;

};

这个结构中包含了线程ID、线程函数以及该函数的参数数据。不过APR的线程函数定义与Pthread的有不同,“Pthread线程函数”是这样的:

typedef void *(start_routine)(void*);

而“APR线程函数”如下:

typedef void *(APR_THREAD_FUNC *apr_thread_start_t)(apr_thread_t*,void*);

1、apr_thread_create

apr_thread_create内部定义了一个dummy_worker的“Pthread线程函数”,并将apr_thread_t结构作为参数传入,然后在dummy_worker中启动“APR的线程函数”。在该函数的参数列表中有一项类型为apr_threadattr_t:

struct apr_threadattr_t {

apr_pool_t *pool;

pthread_attr_t attr;

};

这个类型封装了线程的属性,不同的线程属性会导致线程的行为有所不同。Pthread提供多种线程属性设置接口,可是APR并未全部提供,必要时我觉得可以自己来调用Pthread接口。APR提供的属性设置接口包括设置线程的可分离性、线程栈大小和栈Guard区域属性。

2、apr_thread_exit

进程退出我们可以直接调用exit函数,而线程退出也有几种方式:

(1)隐式退出-可以理解为线程main routine代码结束返回;

(2)显式退出-调用线程包提供的显式退出接口,在apr中就是apr_thread_exit;

(3)另类显式退出-调用exit函数,不仅自己退出,其所在线程也跟着退出了;

(4)被“黑”退出-被别的“对等”线程调用pthread_cancel而被迫退出。

apr_thread_exit属于种类(2),该种类退出应该算是线程的优雅退出了。apr_thread_exit做了3个工作,分别为设置线程返回值、释放pool中资源和调用pthread_exit退出。

3、apr_thread_join和apr_thread_detach

进程有waitpid,线程有join。线程在调用apr_thread_exit后,只是其执行停止了,其占有的“资源”并不一定释放,这里的“资源”我想就是“另种观点”中的“线程上下文”,线程有两种方式来释放该“资源”,这主要由线程的“可分离”属性决定的。如果线程是“可分离的”,当线程退出后就会自动释放其“资源”,如果线程为“非可分离的”,则必须由“对等线程”调用join接口来释放其资源。apr_thread_detach用来将其调用线程转化为“可分离”线程,而apr_thread_join用来等待某个线程结束并释放其资源。

三、小结

基本的线程管理接口相对较简单,关键是对线程概念的理解。接下来的“线程同步”则是件比较有趣的话题。

推荐阅读更多精彩内容

  • 线程 在linux内核那一部分我们知道,线程其实就是一种特殊的进程,只是他们共享进程的文件和内存等资源,无论如何对...
    大雄good阅读 407评论 0 2
  • 摘要 线程概念,线程与进程的区别与联系学会线程控制,线程创建,线程终止,线程等待了解线程分离与线程安全学会线程同步...
    狼之足迹阅读 283评论 2 3
  • 又来到了一个老生常谈的问题,应用层软件开发的程序员要不要了解和深入学习操作系统呢? 今天就这个问题开始,来谈谈操...
    tangsl阅读 3,135评论 0 22
  • 文/Barnabas|图/网络 前天有个小聚会,期间有一个人问:“我要怎样做才可以充满激情呢?” 各式各样的回答都...
    梦想教练Barnabas阅读 172评论 0 0
  • 团队开发证书管理 概要: 1.证书 配置文件基本概念介绍2.团队开发证书配置文件管理 引用iOS App 签名的原理
    ITCodeShare阅读 530评论 0 0