深度學習是機器學習中乙個新興的研究方向,也是乙個複雜的機器學習演算法。深度學習的概念源於人工神經網路的研究,建立模擬人腦進行分析學習的神經網路,以模仿人腦的機制來解釋資料,強調模型結構的深度和明確特徵學習的重要性。因此,深度學習使計算機實現模仿視聽和思考等人類的活動,解決了大量複雜的模式識別難題,從而推動計算機視覺、智慧型語音等複雜ai基礎技術的落地。可以說,深度學習演算法決定了未來ai的發展趨勢,乃是兵家必爭之地。
隨著深度學習技術在智慧型駕駛、智慧型金融、智慧型製造、智慧型農業、智慧型醫療、智慧型家居等領域的逐步應用,作為引領這一輪科技革命和產業變革的戰略性技術,人工智慧的產業化已經取得了顯著的效果,顯示出帶動性很強的「頭雁」效應。中國、美國、英國、德國、法國、日本等主要國家都紛紛將人工智慧上公升為國家級戰略,積極搶占人工智慧競爭的制高點。我國還進一步強調要加強人工智慧領域前沿技術布局,支援科學家勇闖人工智慧科技前沿的「無人區」。
經歷了60多年的發展之後,人工智慧已經開始走出實驗室,進入到了產業化階段。具體表現出以下幾個方面的特點:
深度學習通過構建多隱層模型和海量訓練資料,來學習更有用的特徵,最終提公升分析準確性。深度學習能夠通過資料探勘進行海量資料處理,自動學習資料特徵,尤其適用於包含少量未標識資料的大資料集;採用層次網路結構進行逐層特徵變換,將樣本的特徵表示變換到乙個新的特徵空間,從而使分類或**更加容易。因此,深度學習自2023年由jeffery hinton實證以來,在雲計算、大資料和晶元等的支援下,已經成功地從實驗室中走出來,開始進入到了商業應用,並在機器視覺、自然語言處理、機器翻譯、路徑規劃等領域取得了令人矚目的成績。
在深度學習應用逐步深入的同時,學術界也在繼續探索新的演算法。一方面,繼續深度學習演算法的深化和改善研究,如深度強化學習、對抗式生成網路、深度森林、圖網路、遷移學習等,以進一步提高深度學習的效率和準確率。另一方面,一些傳統的機器學習演算法重新受到重視,如貝葉斯網路、知識圖譜等。另外,還有一些新的類腦智慧型演算法提出來,將腦科學與思維科學的一些新的成果結合到神經網路演算法之中,形成不同於深度學習的神經網路技術路線,如膠囊網路等。
自從李飛飛等在2023年成功建立imagenet資料集以來,該資料集就已經成為了業界圖形影象深度學習演算法的基礎資料集,通過舉辦比賽等方式極大地促進了演算法的進步,使得演算法分類精度已經達到了95%以上。這也使得一些大型研究機構和企業逐漸認識到了資料的價值,紛紛開始建立自己的資料集,以便進行資料探勘和提公升深度學習模型的準確率。如美國國家標準研究院的mugshot、谷歌的svhn、微軟的ms coco等影象基礎資料集,史丹福大學的squad、卡耐基梅隆大學的q/a dataset、salesforce的wikitext等自然語言資料集以及2000 hub5 english、chime、ted-lium等語音資料集。
雖然人工智慧技術發展已經取得了前所未有的成績,但隨著深度學習技術應用的不斷深化和產業化步伐的逐步加快,人工智慧技術發展也面臨著不少挑戰。
一是在有限樣本和計算單元的情況下,對複雜函式的表示能力有限,其針對複雜分類問題的泛化能力受限。二是通過深度學習是一種基於概率統計的演算法,機器系統學習到的是大概率內容,不是知識,無法像人類一樣進行舉一反三的應用。三是深度學習存在黑箱問題,不能解釋其自身做出決策的原因。
由於大資料技術的出現和使用時間還不長,各類基礎資料不論從數量上還是從質量上來看,都尚需要較長時間的積累。一方面,某些關鍵領域和學術資料集還嚴重不足。另一方面,已有規模化的基礎資料集不僅資料質量良莠不齊,而且基本上由少數幾家巨頭或**所掌握,鑑於監管和競爭等因素,無法實現有效流動。基礎資料的缺乏,使得深度學習模型訓練也造成了樣本基礎缺失。
雖然已經出現了tensorflow、caffe、cntk、torch、mxnet、paddlepaddle等深度學習計算框架,但由於深度學習應用場景眾多,相關應用呈現碎片化特點,無論從功能還是效能角度來講,用於實現最後應用落地的開源計算框架與實際需求之間都還存在著相當的距離,滿足產業發展需求且具有絕對統治地位的開源計算框架也還沒有出現。同時,深度學習晶元還只是剛剛起步,而且還基本上屬於專有領域的晶元,通用智慧型晶元的產業化還需要較長時間的探索。
由於黑箱問題及其基於概率統計的特點,基於深度學習的智慧型系統存在產生不可控結果的隱患。我們已經看到,使用了人工智慧技術的智慧型駕駛汽車出現了多次的事故,甚至造成了人員的**。另外,使用了智慧型演算法的自動駕駛飛機也出現了多次墜機事故。這些事故不僅造成了人們的生命和財產損失,也嚴重打擊了人們對人工智慧的信心。實際上,這些事故的發生除了有技術方面的原因之外,還涉及到ai倫理的問題,也就是如何保證人類與智慧型系統之間的和諧共處、協同合作等問題。目前來看,ai的倫理問題還需要較長的探索過程。
短期來看,人工智慧技術的發展將圍繞對上述問題的解決進行。下面從演算法理論、資料集基礎、基礎設施、人機協同等以下幾個方面進行**。
在演算法理論層面,將繼續按照深度學習完善和新演算法的兩條主線發展。首先,深度學習在提公升可靠性、可解釋性等方面的研究以及零資料學習、無監督學習、遷移學習等模型的研究將成為熱點方向,這不僅僅是深度學習演算法本身發展的需要,也是產業發展的需要。其次,學術界將繼續開展新型演算法的探索,包括對傳統機器學習演算法的改進、傳統機器學習演算法與深度學習的結合以及與深度學習迥異的新型演算法等。
在計算平台與晶元方面,大型企業自研計算框架、自建計算平台,甚至是自研晶元等,仍將是普遍現象。這主要是由於以下兩個方面的原因。一是企業出於自身資料和業務安全的考慮,對使用其他機構提供的訓練平台仍然持有不信任的態度;二是每個企業的資料中心和相關平台都有其自身的特點,自研計算框架、自建計算平台和自研晶元能夠更好地滿足自身的業務發展需要。
在人機協同機制方面,「人在迴路」將成為智慧型系統設計的必備能力。目前,機器智慧型並沒有實現人們所希望的「以人為中心」,仍然還是以機器為中心,這也是人類屢受智慧型系統傷害的主要原因之一。因此,將人類認知模型引入到機器智慧型中,使之能夠在推理、決策、記憶等方面達到類人智慧型水平,將成為學術界和產業界共同追求的目標,並可能在一定的時間內取得較好的階段性成果。
長期來看,人工智慧技術將分別沿著演算法和算力兩條主線向前發展,並逐步帶領人類進入到人機協同的新時代。
深度學習是基於馮·諾依曼體系結構發展起來的。由於受到記憶體牆等相關方面的制約,難以達到較高的計算效率。為此,近些年來ibm等已經開始進行顛覆馮·諾依曼體系結構的類腦智慧型演算法與技術的探索。類腦智慧型借鑑大腦中「記憶體與計算單元合一」等資訊處理的基本規律,在硬體實現與軟體演算法等多個層面,對於現有的計算體系與系統做出本質的變革,並實現在計算能耗、計算能力與計算效率等諸多方面的大幅改進。目前,隨機興奮神經元、擴散型憶阻器等已經在ibm、麻薩諸塞州阿姆赫斯特大學、清華大學等機構研製成功,ibm已經研製成功truenorth晶元,清華大學團隊也成功研製出了基於憶阻器的puf晶元。
隨著智慧型裝備和智慧型機械人等智慧型終端的逐漸增多,智慧型終端的快速反應以及相互之間的協同行動需求將會越來越迫切,對智慧型服務的實時性將會越來越強烈。這就要求智慧型服務從雲端向網路邊緣甚至終端擴散,智慧型模型與演算法需要部署在網路邊緣或終端之上,就近提供網路、計算、儲存、應用等核心能力,從而滿足通訊、業務、安全等各方面的關鍵需求。目前,英偉達、高通等都已經陸續開展了用於邊緣網路或終端的ai專用晶元。而隨著5g網路的普遍部署,邊緣智慧型將會獲得快速的發展。
隨著人工智慧應用在生產生活中的不斷深入融合,智慧型終端的互聯互通將會成為必然。由於跨框架體系開發及部署需要投入大量資源,因此儘管每個終端的智慧型模型可能不同,但深度學習計算框架的模型底層表示將會逐漸趨同,形成深度學習通用計算框架和平台。隨著計算框架的整合,gpu和tpu等晶元將可能會被通用ai晶元所替代。
不論現在還是將來,人工智慧無疑都將是最為消耗計算資源的業務和應用之一,計算效率也將是智慧型體永恆的追求目標。量子計算具有強大的計算能力和效率,已經成為全球公認的下一代計算技術。ibm已經在近期推出了世界上第乙個商用的通用近似量子計算系統里程碑產品ibm q system one,客戶可以通過網際網路使用這台量子計算機進行大規模的資料計算,為人工智慧計算展示了良好的前景。
人工智慧已經逐漸向工業、農業、交通、醫療、金融等各個領域滲透,並開始形成新的業態,成為了新一輪技術革命的制高點。因此,必須積極主動把握人工智慧技術和產業發展機遇,認清技術發展趨勢,在類腦智慧型、邊緣智慧型、通用平台與晶元、量子計算等前沿技術領域加快布局,勇闖人工智慧科技前沿的「無人區」,才能抓住人工智慧時代發展的主動權。
第一次作業
1.用較低的成本,開發出滿足客戶需求的軟體,開發的軟體可靠性高,易於維護和移植 2.分為設計階段,開發階段和測試執行階段 1 設計階段 分析客戶需求,明確要解決哪些問題,實現哪些功能,以及確定基本方法 2 開發階段 a.概要設計 畫出流程圖,進行模組化劃分,建立模組的層次結構以及呼叫關係 b.詳細設...
第一次作業
1.4 非計算機專業 程式和軟體有何不同?答 程式是通過計算機語言寫出來的具有許多演算法的摸板,是實現軟體功能的底層推手 推手的意思可以理解為動力 所以,程式是軟體的內在因子,而軟體是乙個或多個程式通過編譯器編譯出來的成品。1.3 查詢資料,解釋什麼是圖靈測試?答 指測試者與被測試者 乙個人和一台機...
第一次作業
1.解釋什麼是圖靈測試?圖靈測試 又稱 圖靈判斷 是圖靈提出的乙個關於機械人的著名判斷原則。一種測試機器是不是具備人類智慧型的方法。如果說現在有一台電腦,其運算速度非常快 記億容量和邏揖單元的數目也超過了人腦,而且還為這台電腦編寫了許多智慧型化的程式,並提供了合適種類的大量資料,使這台電腦能夠做一些...