从上文:计算机的原码、反码和补码可知,计算机有三种编码方式来表示同一个数:
对于+1和-1,
[+1] = [0001]原 = [0001]反 = [0001]补
[-1] = [1001]原 = [1110]反 = [1111]补
为什么计算机采用补码的形式来表示负数呢?
首先我们知道,一个数在计算机中有正负之分,这个数的最高位(符号位)用来表示它的正负,其中0表示正数,1表示负数。
对于计算机来说,加法是最基础的运算,要设计的尽量简单。
根据加法的运算法则,a-b等于a+(-b)。
如果能将符号位也参与到运算中,而非单独“辨识符号位”,就可以大大简化计算机的基础电路。
于是,人们开始探索只保留加法,并将符号位参与到运算中的方法。
首先来看原码:1 - 1 = 0
1 - 1 = 1 + (-1)
= [0001]原 + [1001]原
= [1002]原
= -2
这显然是错误的。
对于反码:
1 - 1 = 1 + (-1)
= [0001]反 + [1110]反
= [1111]反
= [1000]原
= -0
用反码进行计算,发现结果是对的。但有一个问题是“0”的表示有两个:
而0带符号是没有意义的。
且采用补码形式,对于4位的二进制,其表达的范围为:[1000]反~[0111]反,即[1111]原~[0111]原,也即[-7,7]。
因为“0”有两个编码形式,所以等于浪费了一个编码。
而补码解决了反码的问题:
1 - 1 = 1 + (-1)
= [0001]补 + [1111]补
= [0000]补
= [0000]原
= 0
使用补码, 不仅仅解决了0的符号以及存在两个编码的问题,而且还能够用[1000]来表示-8,即多表示一个最低数。
即对于4位的二进制,使用原码或反码表示的范围为[-7,+7],而使用补码表示的范围为[-8,7]。
因为计算机采用补码来表示负数,所以对于编程中常用到的32位int类型,可以表示范围是:[-2^31,2^31-1] 。