統計給定文字檔案中漢字的個數

2021-10-23 16:36:37 字數 852 閱讀 3629

漢字機內碼在計算機的表達方式的描述是,使用二個位元組,每個位元組最高位一位為1.

計算機中,補碼第一位是符號位,1 表示為負數,所以 漢字機內碼的每個位元組表示的十進位制數都是負數  

所以這題也就可以簡化為輸入字串判斷其中字元轉化為十進位制數是否小於零.

注意:漢字是有兩個小於零的字元組成,所以在統計結果的時候就要將count除以2了✔

getchar()函式:從stdio流中讀字元,相當於getc(stdin),它從標準輸入裡讀取下乙個字元.

getchar有乙個int型的返回值.當程式呼叫getchar時.程式就等著使用者按鍵.使用者輸入的字元被存放在鍵盤緩衝區中.直到使用者按回車為止(回車字元也放在緩衝區中).當使用者鍵入回車之後,getchar才開始從stdin流中每次讀入乙個字元.getchar函式的返回值是使用者輸入的第乙個字元的ascii碼,如出錯返回-1,且將使用者輸入的字元回顯到螢幕.如使用者在按回車之前輸入了不止乙個字元,其他字元會保留在鍵盤快取區中,等待後續getchar呼叫讀取.也就是說,後續的getchar呼叫不會等待使用者按鍵,而直接讀取緩衝區中的字元,直到緩衝區中的字元讀完為後,才等待使用者按鍵.
注意:如果輸入的是中文字元,由於漢字是兩個位元組,所以getchar()函式對漢字要處理兩次.比如我輸入2個漢字,getchar()處理4次,返回4個值,由於是中文返回的肯定是負數.

統計乙個文字檔案中單詞的個數(超簡單思路)

1.先將文字檔案中的內容追加到bufferstring型別的變數中,然後將bufferstring轉換為string型別,因為string類有乙個方法,可以將乙個串中某個字元,全部用指定字元 比如空格 來代替 string.replace a b 然後遇到空格就計數。轉換後計算是很簡單的,但是轉換非...

Python實現統計文字檔案字數的方法

統計文字檔案的字數,從當前目錄下的file.txt取檔案 coding gbk import string import sys reload sys def compareitems w1,c1 w2,c2 if c1 c2 return 1 elif c1 c2 return cmp w1,w2...

Python 去除文字檔案中的空行

讀取存在空行的檔案,刪除其中的空行,並將其儲存到新的檔案中 usr bin env python coding utf 8 time 2019 3 18 21 41 author cunyu site cunyu1943.github.io file deleteblanklines.py soft...