第一章 温故而知新

  • 在早期一般一个设备都有对应的一个i/o控制器,通过一个总线(BUS)相连
  • 后来cpu、gpu计算能力加强,其他的还是慢速,中间需要有一个东西协调,北桥芯片是负责协调高速运转的,以便能高速进行交换数据,专门处理低速设备的叫南桥芯片,专门处理磁盘、USB、键盘、鼠标等
  • 为了尽可能的利用cpu的使用率,采取的策略是每个程序运行一段时间以后都主动让出cpu给其他程序,是的一段时间内每个程序都有机会运行一小段时间,这种写作模式叫分时系统
  • 分时操作系统有一问题就是假如一旦运行一个死循环的函数,程序会一直站用cpu,操作系统没有办法进行切换给别的程序,因此诞生了更先进的操作系统模式--多任务系统
  • 所有的应用程序都以进程的方式运行在比操作系统权限耕地的级别,每个进程都有自己独立的地址空间,使得进程之间的地址空间相互隔离
  • 操作系统接管所有的硬件资源,cpu由操作系统统一分配,每个进程根据进程优先级的高低来获得cpu,但是运行时间超出一定的时间,操作系统会暂停该进程,将cpu资源分配给其他等待运行的进程。这种cpu分配方式叫抢占式,因为切换速度快,用户看起来是多个程序同时运行
  • 现在操作系统会有一个虚拟地址的概念,虚拟地址可以理解为程序所拥有的内存与真实物理内存的中间层,通过某种映射方法,将虚拟地址转换为真实的物理地址,利用虚拟内存的概念可以达到地址空间隔离,更加安全,真实物理内存利用起来更方便的效果
  • 每一个进程都有独立的虚拟内存空间,保证隔离
  • 在早期操作系统中内存会存在3个问题:地址空间不隔离;内存使用效率低;程序运行的地址不确定
  • 分段:基本思路是把一段与程序所需要的内存空间大小的虚拟空间映射到某个物理地址上,假设程序需要10MB,就分配真实的10MB进行映射,缺点就是使用效率低,如果内存不足,被换入换出的是整个程序,这样的问题就是造成了大量磁盘io操作。
  • 程序局部性原理:当一个程序在运行时,某个时间段内,只会频繁用到一小部分数据
  • 因为分段的不足,为了更细粒度的内存分割以及映射,使程序局部性原理得到充分利用,引出了分页
  • 分页:把地址空间划分成固定大小的页,每一页的大小由硬件决定,或硬件支持多种大小的页,由操作系统决定页的大小
  • 目前pc上的操作系统都是采用4kb大小的页
  • 把进程的虚拟地址空间以页为单位进行分割,把常用的数据和代码页装载到内存中,把不常用的代码和数据保存在磁盘中,需要的时候再取出来
  • 一个进程可以理解为对应一个虚拟内存,只不过有些用到的数据以页的形式映射到了真正的物理内存中,有些映射在磁盘中,还有些没有被用到所以没有映射关系,这样可以提高内存的使用效率
  • 把虚拟内存中存在的页--虚拟页
  • 物理内存中的页--物理页
  • 磁盘中的页--磁盘页
  • 可以理解为页是内存进行数据交换的最小单位,当数据在磁盘中,会以页的形式读取并装载到内存
  • 以页的形式还有一个好处是可以设置每个页的权限,只有操作系统有权限更改这些属性,
  • 虚拟内存与物理内存进行映射转换的东西叫MMU(看英文全称,可以叫内存管理单元),目前这个东西都集成在cpu内部了,是硬件级别的支持
  • cpu进行操作的都是虚拟内存中的地址,是经过mmu转换为物理内存地址
  • 线程:偶尔称为轻量级进程,是程序执行的最小单元
  • 一个进程由一个或多个线程组成,各个线程之间共享内存空间(代码段、数据段、堆等),即共享堆以及全局变量、静态变量
  • 每一个线程拥有自己的寄存器、栈等
  • 由于多线程是可以共享堆等内容的,所以相对于多进程应用,多线程在数据共享方面效率高
  • 当线程数量<处理器数量,线程的并发是真正的并发
  • 在单处理器上处理多线程,并发是一种模拟出来的状态,操作系统会让这些多线程程序轮流执行,每次仅执行一小段时间,处理器在不断的切换,这种现象称为线程调度
  • 线程调度通常拥有三个状态:运行、就绪、等待
  • 运行中线程拥有一段可以执行的时间,这段时间叫时间片
  • 时间片用尽的时候,该进程进入就绪状态
  • 时间片用尽之前进程就开始等待某时间,那么它进入等待状态
  • 每当一个程序离开运行状态时,调度系统就会选择一个其他的就绪线程继续执行
  • 目前调度方式以及算法都有各自的特点,但是都能看到优先级调度、轮转法的影子
  • 线程本身自带有优先级,高优先级会更早的执行
  • 线程的优先级不仅可以由用户手动设置,系统也会根据不同线程的表现自动调整优先级
  • 系统认为,通常情况下,这种简单的题的线程叫io密集型线程,难题叫cpu密集型线程
  • io密集型线程总是比cpu密集型线程容易得到优先级的提升
  • 在优先级调度下,有一种饿死现象,就是总是有高优先级线程在它前面被执行,他一直没有被执行
  • 为了避免饿死现象的发生,调度系统会逐步提升那些等待过长时间得不到执行的线程的优先级,在这种策略下,一个线程等待的时间足够长的话,它的优先级一定会提高到它能够被执行的地步
  • 改变线程优先级的方式如下:

    1.用户指定优先级

    2.根据进入等待状态的频繁程度进行提升或降低优先级

    3.长时间得不到执行,会被提高优先级
  • 当用尽时间片之后,线程会被剥夺继续执行的权利,进入就绪状态,这个过程叫抢占
  • Linux将所有执行的实体都叫任务,不管线程还是进程
  • 多线程涉及到了共享数据,引出的就是并发时数据一致性问题
  • 避免多线程对同一数据数据进行读写引发的不可预料的问题,需要进行访问数据的同步
  • 同步:一个线程访问数据未结束时,其他线程不能对该数据进行操作
  • 同步常见的方法是锁,用的时候先尝试获取锁,用完再释放锁,在锁已经被占用的时候试图获取锁,线程会等待,直到锁重新可用
  • 二元信号量:是最简单的一种锁,只有两种状态,占用与非占用,第一个试图获取该二元信号量的线程会获得该锁,并将二元信号量置为占用,此后其他的所有试图获取该二元信号量的线程将会等待,直到该锁释放
  • 对于允许多个线程并发访问的资源,多元信号量简称信号量,一个初始值为n的信号量允许n个线程并发访问,用一个将信号量-1,如果信号量<0,则进入等待状态,否则仅需执行,线程用完了,释放信号量+1,如果信号量还富裕,就唤醒等待中的线程
  • 信号量可以被系统中的一个线程获取,但是由另外一个线程释放
  • 互斥量:资源仅同时允许一个线程访问,哪个线程获取,就要哪个线程释放
  • 读写锁多个线程读取是没有问题,相对高效
  • 条件变量:作用类似栅栏,iOS中也有一个类似的,应用场景是多个线程都完成了,再进行下一步操作

推荐阅读更多精彩内容