1、gensim.models.word2vec
1)訓練出模型
2)兩詞的相似度
3)某個詞的相關詞
4)好-壞,美-醜,找出某個詞的對應詞
5)從幾個詞中尋找不合群的詞
6)匯出詞向量
模型的訓練,依據分詞後的預料文字
2、gensim.corpora.dictionar
1)gensim.corpora.dictionar 生成詞典
2)doc2bow,詞袋模型,句中每個詞的(id,詞頻)
3)生成句中每個詞的(id,tf-idf)。根據每個文件的tfidf,計算新文件與語料庫中文件的相似度
4)潛在語義索引(lsi)。將語料庫中文件劃分出幾個主題,生成文件與主題的相關程度。
5)利用lda做主題分類的情況。將語料庫中文件劃分出幾個主題,生成文件與主題的相關程度。
python中numpy庫的一些使用
想不用第三方庫實現點深度學習的基礎部分,發現numpy真的好難 笑 在此做點遇到的函式的筆記 慣例官方文件 但真的屬實弟弟排版。以下都以import numpy as np為前提。1.np.zip 作用 該函式以多個可迭代的型別資料為輸入,如字典 列表和元組,從這些迭代型別中各取其乙個值,組成新的乙...
urllib庫的一些基本函式的使用
是python自帶的標準庫,無需另外安裝 可以模擬瀏覽器向指定的伺服器傳送請求並儲存返回的資料 在 urllib 庫中,所有與網路請求相關的函式都在 request 模組下 第一行 使用函式 urlopen 時需先導入 request 模組 第二行 建立乙個遠端url的類檔案物件,它的返回值是htt...
Android gridview 使用的一些小問題
1.gridview 水平滑動,網上有很多的介紹,比如 其中我認為對gridview 的 android layout width的設定是比較關鍵的 我是把它設定為乙個定值 例如1000dp 才能夠正常顯示的,其他情況下顯示不出來。2.對於gridview 某一項 子view 的獲取,使用getch...