人工智慧
正在向縱深發展,所有的
ai人都在努力的讓計算機、機器解決人類生活和工作中的問題。而在這過程中,深度學習演算法讓計算機、機械人有了自我學習的能力。海量的資料輸入為深度學習大腦,深度學習大腦從資料中大量汲取養分。
作為深度學習的代表作,目前的智力已經可以達到
2-3歲孩子的水平,甚至在某些方面的能力已經超越人類。前不久的利用
谷歌大腦
開發的alphago
與李世石的圍棋大戰讓越來越多的人了解了深度學習,了解了人工智慧技術的進步。
海量的網路資源終究無法替代現實生活場景,如何讓深度學習大腦更懂這個世界?
答案就是
——讓深度學習的大腦到生活中去。在生活中探索和學習。作為計算機,它要怎麼才能進入人類的世界呢?入口在**?機器視覺、語音輸入
……機器視覺和語音輸入等方面都為計算機提供了有效的資料入口,這也是為何目前
人臉識別
、ocr
識別
、語音識別
等領域在深度學習領域走在技術最前沿的重要原因。入口很重要。
從出生到死亡,在這短暫又漫長的週期裡人類要經歷包括生活技能的學習,書本知識的學習,經驗的積累等等。計算機在深度學習的幫助下,有了自己的思維能力,它掌握了一定的生活技能,現在它已經進入了
2.0的階段。快速的書本學習和經驗積累。
書本知識的學習
什麼是
ocr,即
光學字元識別
技術。人類社會經過幾千年的經驗積累,並將這些經驗大量的編纂在書籍。要讓計算機從這些書籍中獲取到資訊,關鍵的一步就是資訊文字化。
ocr技術就是完成這一步驟的工作。通過掃瞄或拍照的方式,將書本資訊採集成,利用
ocr識別出書本資訊,最後將這些資訊輸入到深度學習大腦中。
現實生活經驗積累
在現實生活中,馬路上、走道,大量的廣告牌、路標、指引資訊等。這些自然場景下的字元要讓計算機進行學習同樣需要用到
ocr技術。自然場景下的
ocr技術目前還處於較為初級的階段。如何在自然場景下有效的定位到文字資訊。如何對複雜環境下,將定位到的文字向文字文字轉化。作為科技的巨頭
——微軟,一直致力於
自然場景下的
ocr識別
,並取得了較大的突破。
ocr識別現狀
當前,ocr
主要應用還集中在書本或證件等層面,這些材料具有文字清晰、字型統一等諸多特點。但是,卻是日常生活中最常使用到的。市場上身份證識別、駕駛證識別、行駛證識別、銀行卡識別、文件識別、票據識別等這些都是
ocr帶來的生活和工作便捷的重要體現。
相信,隨著行業發展的不斷深入。
ocr一定會為人們帶來越來越多的驚喜。
開啟神秘程式設計世界的大門
從 2000 年畢業,我做這行已經超過十二年了。最初接觸電腦程式,還是 dos 下的 qbasic 那已經離現在有接近二十年了。最初,我只是會照貓畫虎,按照老師的程式抄個素數數列,或者列印個三角形什麼的。初步理解程式的結構和意義,要等到讀大學以後了。那個時候在老師的鼓勵下,自己買書學習 delphi...
開啟C世界的大門(二)
資料的屬性及組合 前面說到了c世界中的最小單元是資料,而資料又有各種不同的屬性。這節,又又將針對資料的屬性進行詳細的介紹。01 資料的屬性 還引用現實中的例子,人有不同的語言,而不同的語言又有不同的使用範圍,正如大家所知道的,英語的範圍最為廣泛,一些方言使用的範圍很小。c世界中也一樣,資料的屬性也可...
開啟我的部落格之旅
從考完專案管理工程師,心就開始有些浮躁。既然選擇了技術這條不歸的道路,就應該勇往直前的走下去。程式設計師的修真,最終還是修自身!下定決心寫部落格也是有原因的,早就想把自己工作的一些感悟寫下來,由於懶散成性,又因為工作沒有網路,所以也一直耽擱了,今天重返論壇,發現平時乙個特別不善言談的同事,寫的部落格...