计算机内部的二进制运算

最近看了一些 C 语言相关的文章,复习了一些二级制运算相关的知识点,记录一下。

内存中的数据存取与运算是通过硅半导体来实现的,即可以简单理解为内存由无数个二进制单元(即一个比特,bit)构成。但在实际写代码进行运算中,很少有数据可以直接用一个0 或者1,比如truefalse来表示,所以通常由内存中 8 个 bit 构成一个 byte 来表示内存的一个最小基本存储单位。

printf("size of int is %lu bytes.\n", sizeof(int));
//输出:size of int is 4 bytes.

执行上述语句,可以知道当前环境int类型在内存中占用 4 个 byte,即大小为 4*8 = 32 bit。在不考虑正负性的情况下,理论上一个int类型可以存储0~2^32之间数值。而通常情况下,为了考虑符号,每个int类型的第一个二进制位填充0代表正整数,1代表负整数,因此int类型的值范围是 - 2^31 ~ 2^31-1。

真值与源码

真值,即数值的二进制数值。
原码,即在真值的最高位补上0(表示正整数,结果与真值相同)或1(表示负整数)表示符号。

比如值为 -8 的int类型的原码为:10000000 00000000 00000000 00001000,值为 16 的int类型的原码为00000000 00000000 00000000 00010000

为了方便后续描述,将数值的int长度缩小为一个字节(即 8 bit)

比如用原码计算16 + (-8)则表示为:

  00010000
+10001000
---------
  10011000

可以看到,如果计算机按照上述的加法规则,就会得到10011000的结果,转成十进制就是 -24。显然,这是错误的答案。

补码的思想

我们希望只设计加法运算器,不用减法运算器,即找到一种通用方案,采用该方案计算1 - 1 ,可以直接根据二进制的加法规则计算1 + (-1)得到 0,而不必考虑如何做二进制减法。然而利用原码对16 + (-8)进行二进制加法运算发现,用原码来表示负整数依然行不通。

现在问题来了:如何用二级制来表示负整数呢?简化一下,即00000001加上什么样的二进制数 X 可以得到00000000

从右向左思考,X 最低位必须是 1,根据二进制加法规则:1 + 1 = 0,进位为 1。再考虑次低位,X 的次低位也必须是 1,然后加上 1 得 0 进一位...,依次类推,X 的所有位数都必须都是 1,才可以得到00000000,即:

  00000000
+11111111
---------
100000000

这在数学上是不可接受的,但是在计算机中却刚好合适,因为在计算机设计中,int 类型长度是确定的,所以无论结果最后是多少位,多余的位会被丢弃,即最终计算结果为00000000 = 十进制 0(我们上述为了方便,int 假设为 8 位),这也是我们预期的结果:1 + (-1) = 0。
因此,问题转化为如何合理地将 -1 变成二级制11111111

反码与补码

带符号整数有原码、反码、补码等几种表示方式,反码和补码是对原码进行某种转换后得到的二进制表示。

正整数的原码、反码和补码都一样。

负数的反码是对原码的除符号位外的其他位进行取反后的结果(取反即如果该位为 0 则变为 1, 而该位为 1 则变为 0 的操作);负数的补码是先求其原码的反码,然后在反码的末尾位加 1 后得到的结果,即负数补码是其反码 + 1。

用补码计算16 + (-8)则表示为:

  00010000
+11111000
---------
100001000

最终结果是00001000 = 十进制 8(去掉超出长度的高位)。由此看出,补码就是我们想要的解决方案,利用补码来进行二进制加法运算可以实现加减法用同一种电路 - 与门来计算。

补码的本质

要将正数转成对应的负数,其实只要用 0 减去这个数就可以了。比如,-8其实就是 0 - 8。
已知8的二进制是00001000,-8就可以用下面的式子求出:

  00000000
-00001000
---------

因为00000000(被减数)小于00001000(减数),所以不够减。请回忆一下小学算术,如果被减数的某一位小于减数,我们怎么办?很简单,问上一位借 1 就可以了。
所以,0000000也问上一位借了 1,也就是说,被减数其实是100000000,算式也就改写成:

100000000
-00001000
---------
  11111000

进一步观察,可以发现100000000 = 11111111 + 1,所以上面的式子可以拆成两个:

  11111111
-00001000
---------
  11110111
+00000001
---------
  11111000

上述通过计算 0 - 8 得到的11111000

按照补码的定义,对 -8 的原码10001000取反得到反码11110111加 1 最终得到补码10001000,与我们上述计算结果一致,证明补码就是我们想要的二进制数值表示方案。因此,数值在计算机中一律用补码表示和存储,在计算时可以化减为加,只做加法计算。

推荐阅读更多精彩内容