Go語言統計中文詞語的個數,分詞

2021-07-03 05:30:45 字數 992 閱讀 5289

主要目的是統計一篇文章中的出現詞語最多的個數,目前只是出個大概的框架,統計出來的結果只有兩種,

一種是兩個字的一種是三個字的,而且準確率不高,需要優化的地方太多,

先記下來,回頭閒了繼續優化一下,把準確率和處理速度提上來.

菜鳥寫的不好,望大家多多指教.

package main

import (

"fmt"

"io/ioutil"

"strings"

)var tri map[string]int = make(map[string]int)

var dou map[string]int = make(map[string]int)

var num int = 2

var path string = "test.txt"

func main()

func get_slice(n int, buf byte, str *string)

y = x + 3

for y < n-2 else

}break

} else

}if i := strings.count(*str, three); i > 1

i = i + 3

} else }}

func paixu(map map[string]int) int

num := len(list)

for i := 0; i < num; i++

} }return list

}func getvalue(list int, map map[string]int)

} }}func rm_duplicate(list *int) int

for _, i := range *list else

if k == len(x)-1

}} }

return x

}

php簡單統計中文個數的方法

之前的公司是做外貿的用bdsywkfw到的都是英文所以統計的長度的時候是用strlen這個函式,一直也沒bdsywkfw有錯誤,但是現在統計中文的時候這個就出錯了,現在做一下記錄測試 輸出 9 程式設計客棧echo mb strlen 你好abc utf 8 輸出 5 echo mb strwidt...

80x86 組合語言 正負數分別存放 統計個數

自己定義一組有符號的位元組數 小於100個 然後將其分別存入兩個陣列中,其中正數和負數的個數分別存入各自陣列的第乙個單元,最後顯示正數的個數和負數的個數,形式為 n 和 m 要求 統計部分用乙個過程完成,顯示部分用乙個過程或軟中斷完成,軟中斷的向量自己根據系統要求決定。提問者採納 2014 06 1...

快速統計二進位制中1的個數 分析篇

今天做了一道題,發現n n 1 這個式子很好奇,然後試著算了一遍發現它竟然能夠快速統計二進位制1的個數,特此拿來分享一下。首先,分析一下該式子,先可以簡化為 n n n 1 我們先做乙個例項,n 1234 5678 十進位制123 4567 8二進位制 0001 0010 0011 0100 010...