基於字的二元模型拼音輸入

2021-10-22 10:16:33 字數 951 閱讀 6386

​ 使用基於字的二元模型,實現乙個拼音到漢字的轉換程式

基本思路

使用維特比演算法計算概率 p(x|o,λ) 最大的隱含序列 x

實現過程

維特比演算法**

平滑處理

正確長句

正確的長句多為有固定的長詞的句子,且新聞用詞更易**準確,與訓練語料有關,也與模型有關(二元模型注重前後二字的關係,對多次出現的長詞**效果好)

錯誤分析

大哥打掃(大嫂)過年好

你的歷屆時(理解是)正確的

看到大佬們的楊麗(樣例)

句子長度

句子長度隨機5

710每句用時

0.0086

0.0037

0.0087

0.0114

字準確率

0.8185

0.6429

0.6554

0.7558

句準確率

0.3629

0.2857

0.2353

0.1765

句子長度越短,字準確率越低,但在句子長度較短區域字準確率下降緩慢;

句子長度越短,句準確率越高,但隨機情況準確率最高;

句子長度越短,每句用時越少。

由於後三組(句子長度為5、6、7)為群中樣例前20行修改後的結果,有的句子修改後較為生硬(如「她是我最愛」),也沒有出現較長名詞,故句準確率沒有隨機時高。

收穫了解了隱馬爾可夫模型、viterbi 演算法,增長了知識;

作為人工智慧導論的第一項實驗,體會了 「求最大概率」、「求最短路徑」 這一極富人工智慧色彩的拼音輸入法專案,與課上學到的大多數問題一樣,都將具體問題轉化為對一組或乙個值的求解,淺淺地立即了人工智慧思想。

改進方案

由於時間安排不合理沒有將演算法變得更精細,之後有時間可以加入三元輸入、更精細的平滑**(帶引數)、專有名詞鞏固等。還可以訓練更多語料,避免詞**為新聞詞彙。

輸入一顆二元查詢樹,將該樹轉換為它的映象

二叉樹 一 題目 輸入一顆二元查詢樹,將該樹轉換為它的映象,即在轉換後的二元查詢樹中,左子樹的結點都大於右子樹的結點。用遞迴和迴圈兩種方法完成樹的映象轉換。例如輸入 8 6 10 5 7 9 11 輸出 8 10 6 11 9 7 5 定義二元查詢樹的結點為 struct bstreenode a ...

輸入一顆二元查詢樹,將該樹轉換為它的映象

輸入一顆二元查詢樹,將該樹轉換為它的映象,即在轉換後的二元查詢樹中,左子樹的結點都大於右子樹的結點。例如給定下列的輸入 然後有如下的輸出 解法一 遞迴 首先交換根節點8的左右子樹,10,6的左右子樹順序不變,然後交換根節點6的左右子節點,直到左右子節點為空為止。bstreenode digui bs...

15 輸入一顆二元查詢樹,將該樹轉換為它的映象

題目 輸入一顆二元查詢樹,將該樹轉換為它的映象,即在轉換後的二元查詢樹中,左子樹的結點都大於右子樹的結點。用遞迴和迴圈兩種方法完成樹的映象轉換。例如輸入 8 6 10 5 7 9 11 輸出 8 10 6 11 9 7 5 定義二元查詢樹的結點為 struct bstreenode a node i...