演算法求二進位制數中1的個數

任意給定乙個32位無符號整數n，求n的二進位制表示中1的個數，比如n = 5（0101）時，返回2，n = 15（1111）時，返回4

這也是一道比較經典的題目了，相信不少人面試的時候可能遇到過這道題吧，下面介紹了幾種方法來實現這道題，相信很多人可能見過下面的演算法，但我相信很少有人見到本文中所有的演算法。如果您上頭上有更好的演算法，或者本文沒有提到的演算法，請不要吝惜您的**，分享的時候，也是學習和交流的時候。

我總是習慣叫普通法，因為我實在找不到乙個合適的名字來描述它，其實就是最簡單的方法，有點程式基礎的人都能想得到，那就是移位+計數，很簡單，不多說了，直接上**，這種方法的運算次數與輸入n最高位1的位置有關，最多迴圈32次。

int bitcount(unsigned int n)
return c ;
}

乙個更精簡的版本如下

int bitcount1(unsigned int n)

這種方法速度比較快，其運算次數與輸入n的大小無關，只與n中1的個數有關。如果n的二進位制表示中有k個1，那麼這個方法只需要迴圈k次即可。其原理是不斷清除n的二進位制表示中最右邊的1，同時累加計數器，直至n為0，**如下

int bitcount2(unsigned int n)
return c ;
}

為什麼n &= (n – 1)能清除最右邊的1呢？因為從二進位制的角度講，n相當於在n - 1的最低位加上1。舉個例子，8（1000）= 7（0111）+ 1（0001），所以8 & 7 = （1000）&（0111）= 0（0000），清除了8最右邊的1（其實就是最高位的1，因為8的二進位制中只有乙個1）。再比如7（0111）= 6（0110）+ 1（0001），所以7 & 6 = （0111）&（0110）= 6（0110），清除了7的二進位制表示中最右邊的1（也就是最低位的1）。

由於表示在程式執行時動態建立的，所以速度上肯定會慢一些，把這個版本放在這裡，有兩個原因

1. 介紹填表的方法，因為這個方法的確很巧妙。

2. 型別轉換，這裡不能使用傳統的強制轉換，而是先取位址再轉換成對應的指標型別。也是常用的型別轉換方法。

int bitcount3(unsigned int n) 
;     // 初始化表 
for (int i =0; i <256; i++) 
unsigned int c =0 ; 
// 查表
unsigned char* p = (unsigned char*) &n ; 
c = bitssettable256[p[0]] + 
bitssettable256[p[1]] + 
bitssettable256[p[2]] + 
bitssettable256[p[3]]; 
return c ; 
}

先說一下填表的原理，根據奇偶性來分析，對於任意乙個正整數n

1.如果它是偶數，那麼n的二進位制中1的個數與n/2中1的個數是相同的，比如4和2的二進位制中都有乙個1，6和3的二進位制中都有兩個1。為啥？因為n是由n/2左移一位而來，而移位並不會增加1的個數。

2.如果n是奇數，那麼n的二進位制中1的個數是n/2中1的個數+1，比如7的二進位制中有三個1，7/2 = 3的二進位制中有兩個1。為啥？因為當n是奇數時，n相當於n/2左移一位再加1。

再說一下查表的原理

對於任意乙個32位無符號整數，將其分割為4部分，每部分8bit，對於這四個部分分別求出1的個數，再累加起來即可。而8bit對應2^8 = 256種01組合方式，這也是為什麼表的大小為256的原因。

注意型別轉換的時候，先取到n的位址，然後轉換為unsigned char*，這樣乙個unsigned int（4 bytes）對應四個unsigned char（1 bytes），分別取出來計算即可。舉個例子吧，以87654321（十六進製制）為例，先寫成二進位制形式-8bit一組，共四組，以不同顏色區分，這四組中1的個數分別為4，4，3，2，所以一共是13個1，如下面所示。

10000111

01100101

01000011

00100001 = 4 + 4 + 3 + 2 = 13

原理和8-bit表相同，詳見8-bit表的解釋

int bitcount4(unsigned int n)
;    unsigned int count =0 ;
while (n)
return count ;
}

首先構造乙個包含256個元素的表table，table[i]即i中1的個數，這裡的i是[0-255]之間任意乙個值。然後對於任意乙個32bit無符號整數n，我們將其拆分成四個8bit，然後分別求出每個8bit中1的個數，再累加求和即可，這裡用移位的方法，每次右移8位，並與0xff相與，取得最低位的8bit，累加後繼續移位，如此往復，直到n為0。所以對於任意乙個32位整數，需要查表4次。以十進位制數2882400018為例，其對應的二進位制數為10101011110011011110111100010010，對應的四次查表過程如下：紅色表示當前8bit，綠色表示右移後高位補零。

第一次（n & 0xff） 10101011110011011110111100010010

第二次（(n >> 8) & 0xff） 00000000101010111100110111101111

第三次（(n >> 16) & 0xff）00000000000000001010101111001101

第四次（(n >> 24) & 0xff）000000000000000000000000

10101011

int bitcount7(unsigned int n)
;     return table[n &0xff] +
table[(n >>8) &0xff] +
table[(n >>16) &0xff] +
table[(n >>24) &0xff] ;
}

當然也可以搞乙個16bit的表，或者更極端一點32bit的表，速度將會更快。

網上都這麼叫，我也這麼叫吧，不過話說回來，的確有平行的意味在裡面，先看**，稍後解釋

int bitcount4(unsigned int n)

速度不一定最快，但是想法絕對巧妙。說一下其中奧妙，其實很簡單，先將n寫成二進位制形式，然後相鄰位相加，重複這個過程，直到只剩下一位。以217（11011001）為例，有圖有真相，下面的圖足以說明一切了。217的二進位制表示中有5個1

完美法

int bitcount5(unsigned int n)

最喜歡這個，**太簡潔啦，只是有個取模運算，可能速度上慢一些。區區兩行**，就能計算出1的個數，到底有何奧妙呢？為了解釋的清楚一點，我盡量多說幾句。

第一行**的作用

先說明一點，以0開頭的是8進製數，以0x開頭的是十六進製制數，上面**中使用了三個8進製數。

將n的二進位制表示寫出來，然後每3bit分成一組，求出每一組中1的個數，再表示成二進位制的形式。比如n = 50，其二進位制表示為110010，分組後是110和010，這兩組中1的個數本別是2和3。2對應010，3對應011，所以第一行**結束後，tmp = 010011，具體是怎麼實現的呢？由於每組3bit，所以這3bit對應的十進位制數都能表示為2^2 * a + 2^1 * b + c的形式，也就是4a + 2b + c的形式，這裡a,b,c的值為0或1，如果為0表示對應的二進位制位上是0，如果為1表示對應的二進位制位上是1，所以a + b + c的值也就是4a + 2b + c的二進位制數中1的個數了。舉個例子，十進位制數6（0110）= 4 * 1 + 2 * 1 + 0，這裡a = 1, b = 1, c = 0, a + b + c = 2，所以6的二進位制表示中有兩個1。現在的問題是，如何得到a + b + c呢？注意位運算中，右移一位相當於除2，就利用這個性質！

4a + 2b + c 右移一位等於2a + b

4a + 2b + c 右移量位等於a

然後做減法

4a + 2b + c –(2a + b) – a = a + b + c，這就是第一行**所作的事，明白了吧。

第二行**的作用

在第一行的基礎上，將tmp中相鄰的兩組中1的個數累加，由於累加到過程中有些組被重複加了一次，所以要捨棄這些多加的部分，這就是&030707070707的作用，又由於最終結果可能大於63，所以要取模。

需要注意的是，經過第一行**後，從右側起，每相鄰的3bit只有四種可能，即000, 001, 010, 011，為啥呢？因為每3bit中1的個數最多為3。所以下面的加法中不存在進製的問題，因為3 + 3 = 6，不足8，不會產生進製。

tmp + (tmp >> 3)-這句就是是相鄰組相加，注意會產生重複相加的部分，比如tmp = 659 = 001 010 010 011時，tmp >> 3 = 000 001 010 010，相加得

0010100

10011

0000010

10010---------------------

001011100

101011 + 101 = 3 + 5 = 8。（感謝網友di哈指正。）注意，659只是個中間變數，這個結果不代表659這個數的二進位制形式中有8個1。

注意我們想要的只是第二組和最後一組（綠色部分），而第一組和第三組（紅色部分）屬於重複相加的部分，要消除掉，這就是&030707070707所完成的任務（每隔三位刪除三位），最後為什麼還要%63呢？因為上面相當於每次計算相連的6bit中1的個數，最多是111111 = 77（八進位制）= 63（十進位制），所以最後要對63取模。

感謝網友 gussing提供

struct _byte 
; long get_bit_count( unsigned char b )

演算法 求二進位制數中1的個數

演算法 求二進位制數中1的個數

演算法 求二進位制數中1的個數

求二進位制數中1的個數

相關推薦

演算法求二進位制數中1的個數

演算法求二進位制數中1的個數

演算法求二進位制數中1的個數