为便于软件的移植,浮点数的表示格式应该有统一标准(定义)。1985年IEEE(Institute of Electrical and Electronics Engineers)提出了IEEE754标准。
该标准规定基数为2,阶码E用移码表示,尾数M用原码表示,根据原码的规格化方法,最高数字位总是1,该标准将这个1缺省存储,使得尾数表示范围比实际存储的一位。实数 的IEEE754标准的浮点数格式为:具体有三种形式:IEEE754三种浮点数的格式参数类型 存储位数 偏移值 数符(s) 阶码(E) 尾数(M) 总位数 十六进制 十进制 短实数(Single,Float) 1位 8位 23位 32位 0x7FH +127 长实数(Double) 1位 11 位 52位 64位 0x
3FFH +1023 临时实数(延伸双精确度,不常用) 1位 15位 64位 80位 0x
3FFFH +16383 对于阶码为0或为255(2047)的情况,IEEE有特殊的规定:如果 E 是0 并且 M 是0,这个数±0(和符号位相关)
如果 E = 2 ?? 1 并且 M 是0,这个数是 ±无穷大(同样和符号位相关)
如果 E = 2 ?? 1 并且 M 非0,这个数表示为不是一个数(NaN)。标准浮点数的存储在尾数中隐含存储着一个1,因此在计算尾数的真值时比一般形式要多一个整数1。
对于阶码E的存储形式因为是127的偏移,所以在计算其移码时与人们熟悉的128偏移不一样,正数的值比用128偏移求得的少1,负数的值多1,为避免计算错误,方便理解,常将E当成二进制真值进行存储。
例如:将数值-0.
5按IEEE754单精度格式存储,先将-0.5换成二进制并写成标准形式:-0.510=-0.12=-1.0×2-12,这里s=1,M为全0,E-127=-1,E=12610=011111102,则存储形式为:
1、 01111110 000000000000000000000000=BE00000016这里不同的下标代表不同的进制。公式在单精度时:V=(-1)^s*2^(E-126)*
M在双精度时:V=(-1)^s*2^(E-1022)*M