三國演義人物詞頻統計 1

沒有把長度為1的單詞進行篩選

path = 'c:\\users\\desktop\\三國演義.txt'

text = open(path,'r',encoding='utf-8').read()

#使用結巴的函式對文字進行分詞

words = jieba.lcut(text)

#定義字典型別去儲存文字和文字出現的次數

counts = {}

for word in words:

counts[word] = counts.get(word,0) + 1

items = list(counts.items())

#根據iems的第二個值進行從大到小的排序

items.sort(key = lambda x:x[1],reverse=true)

for i in range(10):

word,count = items[i]

#左對齊，佔位10位，填充字元為空格

我們在儲存檔案的時候要選擇對應的儲存格式，否則我們在讀取檔案的時候會報錯

三國演義人物詞頻統計 2

對長度為1的單詞進行篩選 import jieba path c users desktop 三國演義.txt text open path,r encoding utf 8 read 使用結巴的函式對文字進行分詞 words jieba.lcut text 定義字典型別去儲存文字和文字出現的次數 ...

python三國演義人物出場統計

開源 usr bin env python coding utf 8 e10.4calthreekingdoms.py import jieba excludes txt open threekingdom.txt rb read words jieba.lcut txt counts for wo...

《三國演義》簡介

三國演義是我國最早的一部長篇章回體歷史描寫了三國時期的歷史故事，集體表現了統治者之間政治和軍事鬥爭。該書最早的版本是明嘉靖元年刊印的三國志通俗演義分24卷，240則，每則乙個七言標題。此後新的刊本迭出，卷數回目引用詩詞等均有改動。清康熙時，毛綸毛宗崗父子對三國志演義進行了修...

三國演義人物詞頻統計 1

三國演義人物詞頻統計 2

python三國演義人物出場統計

《三國演義》簡介

相關推薦