C語言中魔性的float浮點數精度問題

2022-10-06 02:36:05 字數 3020 閱讀 4606

如果你以前接觸過c語言,那麼對下面的這段**一定很熟悉:

#include

int main(void)

相信很多人不用執行,能夠直接報出答案, f_num1 = 21.75 , f_num2 = 13.45 , f_num1 + f_num2 = 35.2 ,無論是從常識還是理論角度都不難理解。

下面我們執行一下程式,驗證我們的猜測正不正確:

f_num1 = 21.750000

f_num2 = 13.450000

f_num1 + f_num2 = 35.200001

f_num1 和 f_num2 的結果和我們預想的一樣,之所以後面多了四個0,是因為 %f 預設保留6位有效數字。但是 f_num1 + f_num2 的結果是什麼鬼,這個 35.200001 是從**來的?

是不是一下子顛覆了我們的認知?

驚不驚喜,意不意外,刺不刺激?是不是發現自從學了c語言,連簡單的算術都不會算了?

別急,還有更令你崩潰的。

下面我們看看以上程式的c++版本:

#include

using namespace std;

int main(void)

直接來看輸出結果吧:

f_num1 = 21.75

f_num2 = 13.45

f_num1 + f_num2 = 35.2

很神奇是不是?因為這個結果看起來正常多了。

看到這裡,相信我們的心裡都有老大乙個疑問:為什麼c程式和c++程式對同樣的數字處理,輸出的結果卻不一樣的? cout 到底做了些什麼?

為了驗證cout對浮點數的處理,我們不妨看一下下面的程式:

#include

using namespace st

int main(void)

看結果來分析比較直觀,執行以上程式,結果如下:

num1 = 5

num2 = 5

num3 = 5.14

num4 = 5.14

num5 = 5.12346

num6 = 5.98765

從 num1 和 num2 , num3 和 num4 這兩組結果可以知道, cout 對於 float 型別數值小數點後面的0是直接省去了的(這點和c語言格式化輸出的%g有點像)。

從 num5 和 num6 兩組結果不難分析出, cout 對於浮點型數值,最多保留6位有效數字。

以上是cout處理浮點數時的特點,應該記住。

事實上,我們使用 iostream 庫里的 cout.setf 不難使 cout 恢復精度。我們對上面的**修改如下:

#include

using namespace std;

int main(void)

輸出的結果就與c語言版本一模一樣了:

f_num1 = 21.750000

f_num2 = 13.450000

f_num1 + f_num2 = 35.200001

文章寫到這裡,相信你已經看出來問題的所在了。

不錯,之所以結果不一樣,正是由於精度引起的!

讓我們回顧一下官方教材裡關於 float 精度的描述:

浮點型和表示單精度、雙精度和擴充套件精度值。 c++ 標準指定了乙個浮點數有效位數的最小值,然而大多數編譯器都實現了更高的精度。 通常, float 以乙個字(32位元)來表示, double 以2個字(64位元)來表示, long double 以3或4個字(96或128位元)來表示。一般來說,型別 float 和 double 分別有7和16個有效位;型別 long double 則常常被用於有特殊浮點需求的硬體,它的具體實現不同,精度也各不相同。( 《c++ primer第五版》 )

由以上描述,我們不難知道,對於 float 來說,最多只有7個有效位,這也就意味著,當實際儲存的精度大於 float 的精度範圍時,就會出現精度丟失現象。

為了進一步佐證上述問題,我們不妨將 float 的數值放大10億倍,看看裡面儲存的值到底是多少:

#include

using namespace std;

int main(void)

以上程式執行結果如下:

f_num1 = 21.750000

f_num2 = 13.450000

f_num10 = 21749999616.000000

f_num20 = 13449999360.000000

由此我們不難推斷,21.75在實際儲存時,程式設計客棧並不是儲存的21.75,而是21.749999616,同樣的,12.45儲存的是12.449999360,這樣計算出來之後自然就會造成結果的不正確。

我們再來看乙個精度丟失造成運算結果不正確的例子。

#include

using namespace std;

int main(void)

如果精度不丟失,運算結果應該為1才對,可是因為精度丟失,導致最後的加1實際和沒加效果一樣,計算出來的結果是0。

num2 - num1 = 0

那麼,既然float有這麼多稀奇古怪的問題,應該怎麼去解決和避免呢?

首先,當然推薦大家在程式設計時盡量使用高精度的浮點型別

比如double就比float精度要高,很多時候,使用double能夠避免很多問題,比如本文一開始提到的問題,如果使用double就能完美解決:

#include

int main(void)

大家可以自己執行一下看看結果。

double 型別可以解決大部分精度丟失問題,基本上滿足日常使用了,但是仍然不能避免精度丟失( double 也有精度限制),這時候就需要想另外的方法來解決了。

前面提到過, cout 其實是可以解決這種精度丟失問題的,所以如果不是對效率要求過高或者要求格式化輸出(其實 cout 也可以實現格式化輸出,此處不詳細展開)必須使用 printf ,在編寫c++程式時,建議使用 cout 代替 printf 。

本文只是簡單的介紹了一下浮點型數值的精度問題,如果要深入細究,肯定不止這麼多內容,比如浮點型數值在記憶體中是如何儲存的?在位元組裡是如何分布 的?這才是真正核心的原理部分。在這裡只淺嘗輒止地講述了一下,但相信閱讀者已經對精度問題有了乙個初步的認識。

C語言中的浮點數比較

浮點數分為單精度和雙精度兩種。在記憶體中的儲存方式按照ieee754標準。通常情況下,單精度佔4個位元組,雙精度佔8個位元組。可以使用sizeof驗證一下。include int main 輸出結果為4 8 x和y變數在十進位制數值上是相等的都是0.1。但是0.1用二進位制表示的時候就會丟失精度,只...

C語言中浮點數的精度問題

1.浮點數出現精度問題的原因 浮點 位元組數有效數字位 float46 double815 實際上一般選用double型別,double有15位有效數字若輸入的數字為16位則會有誤差。int main 2.怎樣才能減少誤差帶來的影響 使用巨集定義乙個eps來判斷誤差 define eps 0.000...

c語言整數轉浮點數 浮點數的秘密

我們在學習 c 語言時,通常認為浮點數和小數是等價的,並沒有嚴格區分它們的概念,這也並沒有影響到我們的學習,原因就是浮點數和小數是繫結在一起的,只有小數才使用浮點格式來儲存。其實,整數和小數可以都使用定點格式來儲存,也可以都使用浮點格式來儲存,但實際情況卻是,c 語言使用定點格式儲存整數,使用浮點格...