短文本分類遇到的bug

2021-08-13 22:24:21 字數 332 閱讀 9764

1.安裝了包tgrocery,其中引用了classifier 和converter,但是報錯沒有converter的模組

原因:1.改包只能在linux 環境下跑。

2.改包使用python 2 寫的。因此,from tgrocery  import  grocery 會報錯。

修改:新增乙個點.  ,之後不會報錯了。

from .classifier import *

from .converter import *

即使改好了資料夾的位置,還是會有其他的錯誤出現。如下:

因此,放棄這個包吧...畢竟最近都沒有人在維護了。

分類演算法 七) 短文本分類

深入做文字分類的同學都知道,短文本分類相對來說比較難。因為較短的文字包含的資訊較少,有時候模型很難學到關鍵特徵。參考 指出 但是對於長文字直接用cnn就不行了,textcnn會比han模型泛化能力差很多。當然如果在textcnn前加一層lstm,這樣效果可以提公升很大。另外還有一點很重要的是,實際使...

2020 12 13 NLP 中文短文本分類

nlp 中文短文本分類 wordcloud 製作詞云 import jieba import pandas as pd import numpy as np from scipy.misc import imread from wordcloud import wordcloud,imagecolo...

Chat NLP 中文短文本分類專案實踐(上)

目前,隨著大資料 雲計算對關係型資料處理技術趨向穩定成熟,各大網際網路公司對關係資料的整合也已經落地成熟,筆者 未來資料領域的挑戰將主要集中在半結構化和非結構化資料的整合,nlp 技術對個人發展越來越重要,尤其在中文文字上挑戰更大。在本場 chat 以及現在和未來工作中,筆者都將致力於中文文字的挖掘...