手寫識別專案(7 15)

2021-08-03 21:36:54 字數 1770 閱讀 7349

手寫識別專案總結(7.15)

近一周完成了之前計畫表上的兩個任務並有額外完成部分:

最初我們認為對程式進行預處理的效果很差是因為程式的不完善,在對程式修改了之後發現還是無法解決預處理效果不好的問題。然後我們轉換了乙個角度,認為有可能是在軟體拍照上傳環節失真所導致的。我們對程式進行修改後,使其可以直接讀取計算機內的進行處理,再與通過軟體上傳處理的效果進行對比後驗證了我們的猜想。軟體上傳過程中是將壓縮再傳到電腦上進行處理的,測試中一張普通2m左右的**通過軟體上傳進行處理時被壓縮到了僅僅

3k,的質量大大降低,所以預處理方面總是無法得到想要的結果。

①對乙個含框的算式進行處理並識別其中的數字

②:在①的基礎上對多個算式進行識別,主要是先對多個算式分割成單一算式然後分別單個處理識別。

實驗所用算式樣例:

(便於實驗:算式間隔恆定,方框統一為正方形)

①同一豎列中相鄰算式的間隔不可變化,由於程式分割是根據算式座標定位,若變化則對算式的分割有一定影響

②單列算式題量不能太多(目前按照要求只實現單列五個算式為最好效果),因為程式分割部分演算法仍存在一些不可消除的誤差,已經將誤差降到最低

③拍照時相機若不與捲麵平行,則拍出來的試卷邊框不為理想中的正方形(或長方形),容易對程式的演算法處理部分產生偏差,對結果會有一定的影響。理想認為此產品投入使用時用掃瞄器對試卷進行掃瞄上傳,所以此部分的問題及上乙個模組內的解析度問題對實際使用並不會產生太大的影響

④算式分割時對單個方框內數字的提取總是無法提取出完整的數字,而總產生數字與方框下邊框相連的地方,從而對數字的二值化處理及識別產生影響。問題原因:對程式分割和數字提取出的座標錯誤。

⑤其他部分:由於學姐之前完成的是手寫識別部分,直接在軟體上手寫的字型較粗,二值化後較容易識別。但是拍照上傳模組與直接手寫模組較不同,拍照(掃瞄)傳輸到程式上的字型較細,所以識別率有所降低。這個地方的問題我們目前預想兩種處理方法:

1)看能不能將二值化的數字加粗後進行識別,此方法演算法較難實現;

2)擴充更多的資料庫,以增加識別率,但是存在資料庫越大程式的運算速度也會隨之降低等問題。目前這方面問題仍在與學姐溝通尋求解決方法

附:專案組每個人測試100個資料的統計表(可能會有一些類似書寫不規範現象等問題影響識別率) 合計

a80%

70%100%

70%70%

100%

30%80%

40%30%

67%b

90%90%

100%

70%70%

100%

40%80%

50%30%

72%c

90%90%

100%

70%80%

100%

50%80%

50%40%

75%d

90%80%

100%

60%80%

100%

40%70%

30%30%

68%e

80%90%

100%

80%80%

100%

40%70%

40%40%

72%總識別率

86%84%

100%

70%80%

100%

40%80%

42%34%

71.6%

在以上任務完成的基礎上,由於之前程式的結構並不是很突出,所以我們開始對程式進行模組化處理,並新增一些便於使用者理解的注釋。另外bug除錯工作也正在進行中。(此部分的細化總結將在下一次專案總結中給出。)

鋼管識別專案2

鋼管識別專案2 一 需求 將 鋼管識別專案1 中識別出來的結果匯入csharp的gui中,通過手工輔助操作,對識別的結果進行修正。二 初步分析 現在已經實現了影象處理的相關演算法,能夠自動處理影象得到上圖的結果,那麼下面需要做的就是 2.1 傳遞結果到csharp中去 採用的方法是比較熟悉的 csh...

鋼管識別專案1

鋼管識別專案1 一 原始需求 二 初步分析 鋼管的特點是由於其是有深度的,這就造成了管子的內部形成乙個陰影。尋找並識別這個陰影,是解決問題的主要方法。同時需要注意到的一點是管子它本身的排列是有符合物理特性的,就是大體上要符合下圖的這種情況,這是個先驗知識。干擾在於這個陰影不僅是管子內部才有的,管子和...

鋼管識別專案2

鋼管識別專案2 一 需求 將 鋼管識別專案1 中識別出來的結果匯入csharp的gui中,通過手工輔助操作,對識別的結果進行修正。二 初步分析 現在已經實現了影象處理的相關演算法,能夠自動處理影象得到上圖的結果,那麼下面需要做的就是 2.1 傳遞結果到csharp中去 採用的方法是比較熟悉的 csh...