手寫識別軟體背景知識

2021-03-31 08:56:58 字數 1044 閱讀 8879

1.手寫識別軟體

手寫識別軟體包括兩部分:識別程式和識別字典。 (

1)識別程式是指可執行**和生成這些可執行**的源程式(也可稱為源**)。這一源**其實就是程式化的識別演算法。 (

2)識別字典是在識別程式執行過程中必須要用到的特殊的資料庫,它包含可識別字符集中全部字元的手寫特徵描述(即模板)。識別字典是由字典生成程式對大量的訓練樣本進行複雜的運算生成的,字典生成程式和識別程式息息相關,但並不一致。識別字典的構造和生成是影響乙個識別軟體的效能的至關重要的關鍵部分;不同的公司由於所掌握的訓練樣本的不同和字典生成程式的不同,不可能生成和使用同樣的識別字典。

2.識別過程描述

聯機手寫文字的識別過程即是將通過手寫裝置取樣得到的筆跡資料,經過識別程式的處理,最後轉化為計算機所使用的文字**的過程。通常分為四個階段:預處理、歸一化、特徵抽取、特徵匹配。見下圖

3.識別效能指標

通常評價乙個識別軟體的好壞,主要依據以下幾個效能指標:

(1)識別率:指對特定的某個大規模的測試樣本集的識別正確率,通常細分為首選正確率和十選正確率。測試樣本集通常分為:工整字、連筆字、自由書寫字(即倒插筆字)。(見國家八六三評測)

因此,識別能力(如能否識別連筆字?能否識別倒插筆?)也是識別效能評價的乙個重要指標。

(2)識別速度:每識別乙個待測樣本(字)所耗費的

cpu執行時間。

(3)可識別字符集的範圍大小:通常包括標準漢字(

gb2312

規定的6763

個漢字)、異體字(繁體字和非標準的簡化字)、英文本母、阿拉伯數字、標點、符號等。

(4)識別字典的大小

(5)對記憶體(

ram)的需求:即在識別過程中所需要的記憶體(

ram)的多少。

如果乙個識別軟體的識別率很高、識別速度很快、可識別字符集範圍很全面、識別字典很小、記憶體需求也很少,那麼它就是乙個非常好的識別軟體了。

識別效能取決於識別程式和識別字典的構造。

手寫數字識別

這幾天在想這做字元識別方面的程式,看了很多 但是發現 上的幾乎用處都不是特別的大,理論一大堆,但是用在程式裡面則很難實現,看到有些 上說用連碼法,但是連碼法對結構的變化太敏感了,但是也從一些 裡獲得了一些靈感,我採用的是網格匹配法,準備工作採集樣本,得到了樣本的網格資訊用於接下來的識別,當然也可 一...

Tensorflow MNIST 手寫識別

這是乙個系列,記錄我tensorflow開發常用的 小常識,有些是參考網上 講的可能有點爛,求不要打臉,嚶嚶嚶 送給那些需要的人。可以相互交流,喜歡的加我吧。wx lxp911221 根據官方文件敲 mnist機器學習入門 第乙個例子,碰到乙個煩了我很久的問題 input data 一直找不到。wh...

tensorflow 手寫識別

coding utf 8 import tensorflow as tf from tensorflow.examples.tutorials.mnist import input data 載入資料集 mnist input data.read data sets mnist data one h...