c 標準庫的float.h標頭檔案包含了一組與浮點值相關的依賴於平台的常量。這些常量是由 ansi c 提出的,這讓程式更具有可移植性。在講解這些常量之前,最好先弄清楚浮點數是由下面四個元素組成的:
元件元件描述
s符號 ( +/- )
b指數表示的基數,2 表示二進位制,10 表示十進位制,16 表示十六進製制,等等...
e指數,乙個介於最小值emin和最大值emax之間的整數。
p精度,基數 b 的有效位數
基於以上 4 個組成部分,乙個浮點數的值如下:
floating-point = ( s ) p x be
或floating-point = (+/-) precision x baseexponent
下面的值是特定實現的,且是通過 #define 指令來定義的,這些值都不得低於下邊所給出的值。請注意,所有的例項 flt 是指型別 float,dbl 是指型別 double,ldbl 是指型別 long double。巨集描述
flt_rounds
定義浮點加法的捨入模式,它可以是下列任何乙個值:
flt_radix 2
這個巨集定義了指數表示的基數。基數 2 表示二進位制,基數 10 表示十進位制,基數 16 表示十六進製制。
flt_mant_dig
dbl_mant_dig
ldbl_mant_dig
這些巨集定義了 flt_radix 基數中的位數。
flt_dig 6
dbl_dig 10
ldbl_dig 10
這些巨集定義了捨入後不會改變表示的十進位制數字的最大值(基數 10)。
flt_min_exp
dbl_min_exp
ldbl_min_exp
這些巨集定義了基數為 flt_radix 時的指數的最小負整數值。
flt_min_10_exp -37
dbl_min_10_exp -37
ldbl_min_10_exp -37
這些巨集定義了基數為 10 時的指數的最小負整數值。
flt_max_exp
dbl_max_exp
ldbl_max_exp
這些巨集定義了基數為 flt_radix 時的指數的最大整數值。
flt_max_10_exp +37
dbl_max_10_exp +37
ldbl_max_10_exp +37
這些巨集定義了基數為 10 時的指數的最大整數值。
flt_max 1e+37
dbl_max 1e+37
ldbl_max 1e+37
這些巨集定義最大的有限浮點值。
flt_epsilon 1e-5
dbl_epsilon 1e-9
ldbl_epsilon 1e-9
這些巨集定義了可表示的最小有效數字。
flt_min 1e-37
dbl_min 1e-37
ldbl_min 1e-37
這些巨集定義了最小的浮點值。
下面的例項演示了 float.h 檔案中定義的一些常量的使用。
#include讓我們編譯和執行上面的程式,這將產生下列結果:#include
intmain
()
themaximum value of
float
=3.4028234664e+38
theminimum value of
float
=1.1754943508e-38
thenumber of digits
inthe number
=7.2996655210e-312
浮點數的範圍和精度
無論是單精度還是雙精度在儲存中都分為三個部分 符號位 sign 0代表正,1代表為負 指數字 exponent 用於儲存科學計數法中的指數資料,並且採用移位儲存 尾數部分 mantissa 尾數部分1範圍 float 和double 的範圍是由指數的位數來決定的。float 的指數字有 8位,而 d...
float double精度和範圍
1.範圍 float和double的範圍是由指數的位數來決定的。float的指數字有8位,而double的指數字有11位,分布如下 float 1bit 符號位 8bits 指數字 23bits 尾數字 double 1bit 符號位 11bits 指數字 52bits 尾數字 於是,float的指...
float,double範圍和精度
今天遇到一題zoj 1128,資料範圍是 0 x1下面引用 1.範圍 float和double的範圍是由指數的位數來決定的。float的指數字有8位,而double的指數字有11位,分布如下 float 1bit 符號位 8bits 指數字 23bits 尾數字 double 1bit 符號位 11...