詞頻統計程式

2021-08-28 07:35:09 字數 1904 閱讀 2170

詞頻統計程式要求:

首先定義結構體,初始化,主函式等

typedef struct word              //字典樹的結構體定義

;typedef struct tlist //結構體定義:單詞和對應頻率

;struct tlist list[5000000]; //定義結構體陣列

word *root;

char str[200]=""; //字元資料初始化為空

char tempword[1000];

int size=0; //size為一篇文章中字串的個數

void output();

void display();

int main();

建立新的單詞庫的函式

void createword(char *str)       //新建單詞庫

p->next[id] = q;

p = p->next[id];

} else //若未到達鍊錶結尾,指標指向下乙個

}p->num++; //重複單詞數加1

}

讀庫內的函式

void readword(word *p,int len)     //讀單詞的函式    

else

readword((word*)p->next[i],len);

len--;}}

if(p->num!=0)

}

輸出函式

void output()                           //輸出函式

將輸入的英文寫入在result中

void display() //將讀入的檔案輸入到result中

while((x=fgetc(fp))!=eof) //從txt文件中讀入 讀入失敗時,函式值為eof(-1) fgetc為從檔案中讀取乙個字元

else

} tempword[len]='\0';

createword(tempword); //建立對文字最後乙個英文本串的讀取

len=0;

fclose(fp);

readword(root,0);

struct tlist temp;

for(i=0;ilist[j].time||(list[i].time==list[j].time&&strcmp(list[i].word,list[j].word)>0))

printf("英文單詞及詞頻統計結果如下:\n");

output();

}

主函式

int main() //主函式

在除錯的過程中,一開始總出現錯誤:「開啟檔案錯誤」

經檢查過後發現,是由於data.txt檔案和result.txt檔案沒有新增到正確位置,後加入工作區間中,如下

然後便能執行出結果了。

❤菜鳥程式,如有錯誤,敬請指正。❤

詞頻統計程式

做乙個詞頻統計程式,該程式具有以下功能 1 可匯入任意英文文字檔案 2 統計該英文檔案中單詞數和各單詞出現的頻率 次數 並能將單詞按字典順序輸出。3 將單詞及頻率寫入檔案。本程式思路大概為 1.開啟需要的txt檔案,把其中的文字內容讀入程式流中 2 將文字內容中的大寫字母轉化為小寫,去除,等特殊字元...

單詞詞頻統計程式(map set 應用)

題目 輸入大量單詞,每詞一行,不超過20字元,沒有空格。按出現次數從多到少輸出這些單詞及其出現次數。出現次數相同的,按字典序輸出。實現 include include include includeusing namespace std struct word struct rule int mai...

菜鳥學習c map使用練習 實現詞頻統計程式

c 練習,使用map實現詞頻統計程式。程式實現兩個功能 1 統計文字中各個單詞的出現次數 2 查詢指定輸入單詞在文字中是否出現 需注意 練習比較隨意,多使用全域性變數,正式使用形參實參傳遞引數比較好。include include include include using namespace st...