發現本部落格的文章也有隨意**了,而且排名還比原文高。所以加上申明,本文不得**。
下面是正文,看到微博上詞頻分析很火,自己也試了下。
過程很簡單,但結果很有趣,所以先上結果。
成果基本可以由下面這首"唐詩"概括,o(≧v≦)o~~好棒~
不見萬里在何處
琵琶明月尤不知
不得春風思故人
長安將軍今無人
出現頻率最高的如下:
從結果還可以分析出一些東西:
比如:蜀道之難難於上青天,僅僅這一句就出現過三次,[出典] 李白 《蜀道難》。
還可以從詞頻中分析出,詩人們大多生活在長安生活,因為僅僅長安這個首都就出現過12次之多。
還可以看出大部分唐詩主要是表達思念的,而思念的物件排名第一的居然是將軍、第二的是故人、第三才是美人。。。╭( ̄m ̄*)╮╭( ̄m ̄*)╮╭( ̄m ̄*)╮
總的來看,唐詩的內容還是負能量遠大於正能量,哈哈。
以下是前50的詞頻:
不得**
唐詩三百首
在佛家的眼裡,世界是乙個又乙個的因果迴圈,萬法皆幻,永劫回歸的問題則是糾纏哲學家的問題。表達成為乙個程式設計師都能夠明白的語言,它則是乙個for的無休止迭代。for 又度過乙個無聊的週末,它沒有止境。所幸的是在我的床頭,還擺著一本唐詩三百首,那是上次地壇書市的時候買的。對於某些市儈的人來說,它是一堆...
用C 來學習唐詩三百首和全唐詩
將每一首詩提取之後存入poem物件中 由於 唐詩三百首 只有320首詩,所以處理起來很快,但是 全唐詩 就沒有這麼簡單了,單單這個txt檔案就有8m多的大小,裡面的內容可想而知。所以針對 全唐詩 自然不能採用和 唐詩三百首 一樣的 了,得修改一番。於是,就變成下面這樣子的。這段 執行起來的速度還是不...
用C 來學習唐詩三百首和全唐詩
將每一首詩提取之後存入poem物件中 由於 唐詩三百首 只有320首詩,所以處理起來很快,但是 全唐詩 就沒有這麼簡單了,單單這個txt檔案就有8m多的大小,裡面的內容可想而知。所以針對 全唐詩 自然不能採用和 唐詩三百首 一樣的 了,得修改一番。於是,就變成下面這樣子的。這段 執行起來的速度還是不...