華為提交包,沒通過原因是:聊天沒有遮蔽銘感詞
策劃設計:輸入框裡面輸入完成後 銘感詞變成「*」,本來想讓伺服器寫,下發資料,這樣只能客戶端實現了。
關於銘感詞dirtyconfig.lua檔案:裡面大概是這樣的,有excell根據工具直接序列化為這樣的lua檔案,這個因專案而異。
開發思路:
設計思路:使用dfa演算法實現,但是想用文字內容作為主鍵,這樣感覺快些。
首先初始化銘感詞資料,按照第乙個詞語,依次儲存。每乙個字元,都是乙個node(拿空間換時間,主要看資料結構設計)。
根據輸入的文字,如果第乙個字在表裡面有,則儲存在posword構裡面。
每次根據輸入的第幾個文字,去posword裡面查詢是否這個單詞第二個存在。如果存在,更新記錄的node節點。知道當前的node.isend為true,則記錄所有的單詞index。
資料結構設計:
銘感詞:
**實現:
感覺銘感詞演算法還可以優化,有好的想法希望大家可以指教。
csdn連線:
使用者評論,關鍵詞遮蔽
badword array 小黃 小白 小藍 array fill index,number,value 函式用給定的鍵值填充陣列。array fill 0,count badword 結果 array 0 1 2 array combine 函式通過合併兩個陣列來建立乙個新陣列,其中的乙個陣列元素...
聊天系統違禁詞過濾
網路遊戲作為一種多人互動遊戲,方便玩家在遊戲中交流是很重要的。為了防止玩家在遊戲中說違禁的東西,所有的聊天系統都需要對聊天資訊進行過濾。本文描述了一種簡單的基於dfa的演算法用於過濾聊天內容中的違禁詞,演算法的執行複雜度,遍歷 輸入字串n,最多對每個字元執行一次二分查詢lgn,所以最壞情況下也是o ...
敏感詞遮蔽 AC自動機
上一周我們講了trie樹,這次的ac自動機是trie樹的乙個改進版,也是乙個多模式串匹配演算法。ac自動機 找尋符合條件的字尾。1 首先我們構建乙個如圖的trie樹 如下圖 2 在學習kmp演算法的時候,我們說到了好字首的字首子串和字尾子串匹配。在trie樹中,我們借鑑這個思路,如果出現了不匹配字元...