使用基於字的二元模型,實現乙個拼音到漢字的轉換程式
基本思路
使用維特比演算法計算概率 p(x|o,λ) 最大的隱含序列 x
實現過程
維特比演算法**
平滑處理
正確長句
正確的長句多為有固定的長詞的句子,且新聞用詞更易**準確,與訓練語料有關,也與模型有關(二元模型注重前後二字的關係,對多次出現的長詞**效果好)
錯誤分析
大哥打掃(大嫂)過年好
你的歷屆時(理解是)正確的
看到大佬們的楊麗(樣例)
句子長度
句子長度隨機5
710每句用時
0.0086
0.0037
0.0087
0.0114
字準確率
0.8185
0.6429
0.6554
0.7558
句準確率
0.3629
0.2857
0.2353
0.1765
句子長度越短,字準確率越低,但在句子長度較短區域字準確率下降緩慢;
句子長度越短,句準確率越高,但隨機情況準確率最高;
句子長度越短,每句用時越少。
由於後三組(句子長度為5、6、7)為群中樣例前20行修改後的結果,有的句子修改後較為生硬(如「她是我最愛」),也沒有出現較長名詞,故句準確率沒有隨機時高。
收穫了解了隱馬爾可夫模型、viterbi 演算法,增長了知識;
作為人工智慧導論的第一項實驗,體會了 「求最大概率」、「求最短路徑」 這一極富人工智慧色彩的拼音輸入法專案,與課上學到的大多數問題一樣,都將具體問題轉化為對一組或乙個值的求解,淺淺地立即了人工智慧思想。
改進方案
由於時間安排不合理沒有將演算法變得更精細,之後有時間可以加入三元輸入、更精細的平滑**(帶引數)、專有名詞鞏固等。還可以訓練更多語料,避免詞**為新聞詞彙。
輸入一顆二元查詢樹,將該樹轉換為它的映象
二叉樹 一 題目 輸入一顆二元查詢樹,將該樹轉換為它的映象,即在轉換後的二元查詢樹中,左子樹的結點都大於右子樹的結點。用遞迴和迴圈兩種方法完成樹的映象轉換。例如輸入 8 6 10 5 7 9 11 輸出 8 10 6 11 9 7 5 定義二元查詢樹的結點為 struct bstreenode a ...
輸入一顆二元查詢樹,將該樹轉換為它的映象
輸入一顆二元查詢樹,將該樹轉換為它的映象,即在轉換後的二元查詢樹中,左子樹的結點都大於右子樹的結點。例如給定下列的輸入 然後有如下的輸出 解法一 遞迴 首先交換根節點8的左右子樹,10,6的左右子樹順序不變,然後交換根節點6的左右子節點,直到左右子節點為空為止。bstreenode digui bs...
15 輸入一顆二元查詢樹,將該樹轉換為它的映象
題目 輸入一顆二元查詢樹,將該樹轉換為它的映象,即在轉換後的二元查詢樹中,左子樹的結點都大於右子樹的結點。用遞迴和迴圈兩種方法完成樹的映象轉換。例如輸入 8 6 10 5 7 9 11 輸出 8 10 6 11 9 7 5 定義二元查詢樹的結點為 struct bstreenode a node i...