1、在使用 stanfordcorenlp (下面簡稱為:nlp) 的時候,如果在使用完不關閉服務的話(呼叫 close() 方法),那麼 nlp 是不會主動關閉服務程序的
2、乙個 nlp 服務程序大概占用的記憶體為 4g
3、可以通過引數 memory 來指定 nlp 服務所占用的 記憶體,可選的值為 4g、6g、8g。值得注意的是,並不一定會占用指定的 memory 這麼多記憶體,
而是以實際占用記憶體為主。例如如果指定的引數 memory 值為 4g,但實際使用的記憶體僅為 1g,則 nlp 服務會只占用 1g 記憶體,而不是 4g
4、在定義 nlp 時是不會載入資源的,而是在使用的時候才會載入資源。例如分詞的時候,在定義 nlp 時不載入資源,而是在使用 word_tokenize 方法來進行分詞時才載入資源。並且僅在第一次的時候載入資源,在第二次及之後的呼叫中是不載入資源的。
5、nlp 載入資源的時間約為 8.5 秒(在使用 word_tokenize 時是花費這麼多時間,其他方法還未測試過)
6、在不包括第一次呼叫 word_tokenize 的情況下,分詞所花費的平均時間約為 0.1 秒
7、word_tokenize 不支援自定義字典
linux ubuntu debian 使用筆記
基於debian的ubuntu使用apt get 可方便地進行安裝或公升級系統,分下面幾個步驟 第一步,獲得最近的軟體包的列表 列表中包含一些包的資訊,比如這個包是否更新過。第二步,如果這個包沒有發布更新,就不管它 apt get update對應的就是第一步。apt get upgrade 與ap...
Linq Lambda GroupBy使用筆記
今天看mvc遇到了groupby的lambda表示式.有興趣詳細的看下去.得此筆記.記錄之.不羅嗦.上 得到list物件 資料來源 var groupmail xmall.plugin.edm.utility.datacache.emailgroup.cachelist 首先得到乙個資料來源物件 這...
Vim 使用筆記
set hlsearch set nohlsearch 搜尋後清除上次的加亮 nohl nohlsearch 拷貝 很有用的一句話,規定了格式選項,讓它換行不自動空格 set formatoptions tcrqn set fo r set noautoindent 再 shift insert 正...