統計乙個英文文字的單詞出現的頻率(有標點符號的)

2021-07-29 14:26:20 字數 702 閱讀 7176

該程式為單詞頻率統計,可讀取乙個英文文字檔案(含標點符號),可在螢幕上輸出個單詞在英文文字中出現的次數。

/*詞頻統計*/

/*汪強*/

#include

#include

#include

#define i 1000

int b;

struct word

s[i];

void file1()//讀出檔案內的單詞

while(!feof(p))}}

fclose(p);

}void file2()//將單詞及其頻率寫入檔案內

for(j=0;jif((fwrite(&s[j],sizeof(struct word),1,q)!=1)&&(s[j].num>0))

printf("無法開啟此檔案!\n");

fclose(q);

}void count()//統計所有單詞的個數

void hz()//統計每個單詞出現的頻率

else flag=1;

}while(flag)

flag=0;}}

}void sort()//將單詞按字典順序排序

}}void shuchu()//輸出單詞及單詞的頻率

printf("\n\n");

}int main()//主函式

任選乙個英文文字,如何統計其中單詞出現的個數

思路 首先要讀取英文文字.txt,然後對讀取文字進行 空格化 方便單個單詞的識別,最後將資料寫入新文字中。如下 import collections with open test.txt r encoding utf 8 as f string f.read split text collectio...

hadoop python 統計單詞出現的頻率

map函式如下 import sys 呼叫標準輸入流 for line in sys.stdin 讀取文字內容 line line.strip 對文字內容分詞,形成乙個列表 words line.split 讀取列表中每乙個元素的值 for word in words map函式輸出,key為wor...

任乙個英文的純文字檔案,統計其中的單詞出現的個數

import re with open a.txt r as f total f.readlines 讀取文字檔案的每一行 s 用於儲存單詞以及單詞的個數 for line in total 對每一行進行單詞識別 a re.findall r a z a z line 具體參考re模組的使用 for...