直接上**吧:
# -*- coding: utf-8 -*
import jieba
import jieba.posseg as pseg
import os,sys
from sklearn import feature_extraction
from sklearn.feature_extraction.text import tfidftransformer
from sklearn.feature_extraction.text import countvectorizer
if __name__ == '__main__':
corpus=["我 來到 北京 清華大學",
"他 來到 網易 杭研 大廈",
"小明 碩士 畢業 於 中國 科學院",
"我 愛 北京 天安門"]
vectorizer=countvectorizer()
transformer=tfidftransformer()
tfidf=transformer.fit_transform(vectorizer.fit_transform(corpus))
word=vectorizer.get_feature_names()
weight=tfidf.toarray()
for i in range(len(weight)):
print(u"--------這裡輸入第",i,u"類文字的詞語tf-idf權重-----")
for j in range(len(word)):
print(word[j],weight[i][j])
python的jieba簡單使用
函式 含義jieba.cut string 精確模式,返回乙個可迭代的資料型別 jieba.cut string,cut all true 全模式,輸出文字string中的所有可能的單詞 jieba.cut for search string 搜尋引擎模式,適合搜尋引擎建立索引的分詞結果 jieba...
python中的jieba簡單使用
jieba常用三個函式 jieba.lcut x jieba.lcut x,cut all true jieba.lcut for rearch x 練習 import jieba s 中國特色社會主義進入新時代,我國社會主要矛盾已經轉化為人民日益增長的美好 生活需要和不平衡不從分的發展之間的矛盾。...
jieba安裝與簡單使用
windows 下使用命令安裝 在聯網狀態下,在命令列下輸入 pip install jieba 進行安裝,安裝完成後會提示安裝成功 在 pycharm 中安裝 開啟 settings,搜尋 project interpreter,在右邊的視窗選擇 號,點選後在搜尋框搜尋 jieba,點選安裝即可 ...