一
人工智慧在模擬人類邏輯思維方面戰功赫赫,許多方面已經遠遠超過人類。然而在模擬人類形象思維方面一直舉步維艱。比如在影象識別方面,乙個小孩都能在幾秒內識別一張臉,而計算機卻要花很長時間去計算這張臉的各個部位尺寸,人在識別的時候並沒有那麼做,明顯和計算機的識別過程走的不是乙個路子。
錢學森先生指出應該和心理學家合作,可惜心理學許多東西還找不到和計算機結合的方法。許多自然科學的東西和人文科學的東西(也可以說邏輯思維和形象思維)似乎難於找到結合的方法,而是各行其是,無法進行學科交叉。
二
在氣象、**、**、彩票的**中,神經網路(ann)和支援向量機(svm)等取得了一系列令人矚目的成果。然而其準確度還遠遠達不到人們的預期。原因是這些資料模型擬合能力不夠強大或者泛化能力不夠嗎?我曾經這麼認為過。我甚至懷疑有些問題是不能用時間序列方法來解的,比如彩票,對其歷史資料的分析未必有助於對未來的**,因為他是完全隨機的,歷史並不對未來產生任何影響。
但是我現在更傾向於說,這是因為對問題的特徵提取有問題,也可以說是情景描述或者說知識表達問題,包括彩票也不是什麼完全隨機,只不過是一種模式識別,只要能準確描述彩票機的初始行為就能得出中獎號碼。
【修改】:彩票的**不能用時間序列方法,因為下一次的中獎號碼與歷史號碼並無任何聯絡,只和彩票搖獎機器的當前狀態有關。**也類似,主要和當前政治經濟等因素有關,與歷史資料關係不大。所以說**和彩票的**還是不能用時間序列的思路來解,當今市場上這方面的軟體明顯走入了死胡同(相關作者別仍臭雞蛋,俺只是希望大家試試多種辦法)。
用神經網路或svm等方法搞這些**是不可行的,除非輸入資料是搖獎機器狀態資料(對**來說是描述當前政治經濟形式的資料),很明顯要得到這些資料是難如登天。
三
在對骰子的**中,就發生過許多辯論。自然科學家認為:只要能得到骰子躑出時的方向力度旋轉,以及空氣濕度風向等等所有因素,就能準確算出骰子的結果。可見連骰子也不是什麼隨機過程,這是決定論,克拉克等人為代表。那麼是不是說,概率隨機等玩意只是權宜之計,暫時用來解決那些難於完全把握的問題?
四
蝴蝶效應同樣如此,由於過程太複雜難於測出每一步每乙個物理量所以無法**,於是就把它神秘化了。
五
在考察了氣象、**、**、彩票、骰子、蝴蝶效應這些複雜的,至今困擾科學界的問題之後,發現乙個問題(考察之後能找到一點結論這才是關鍵),就是這些問題的解決不僅僅是靠提高cup速度或者建構比神經網路更強大的工具就能解決的,知識表達才是突破口。陸汝鈐院士提出的知件與硬體軟體並列大概正是認識到知識表示重要性的**遠矚的提議。
六
上述幾個問題代表了時間序列**的難題,共同點是,對他們的描述極其困難。比如氣象,氣象衛星、雷達、高空氣球等等手段收集到的資料量無比巨大,然而就算是這麼巨大的資料量也無法保證對大氣地球的完整描述。當今最大型的計算機均用於氣象和**資料分析,就是因為資料太多,且抓不到重點,不知道哪些資料更重要些,能不能給每個資料賦予權重。結果就是氣象和****從來沒有準確過。各種**軟體在****中也同樣遭遇滑鐵盧。這些問題都屬於當今最難的問題,屬於複雜巨系統的例子。中科院戴汝為院士對包括人類社會和網路虛擬社會在內的複雜巨系統研究不知有麼有什麼新突破。
七
複雜性問題作為新興的科學最前沿,是產生圖靈獎得主最多的領域。以上幾個難題之所以難於解決,我曾說過是知識表達問題,說的更本質些,我想應該是複雜性問題,他們是np難題,過於複雜的描述使得它們的求解成為指數複雜度,ann,svm之類的聯結解法面對龐大的資料同樣無可奈何。資料探勘又成為了乙個可能的突破口。
雜篇 模式識別 機器學習 我的學習
這篇文章的想法 於吳伯凡老師的課程 認知方 在吳伯凡老師的知識框架下,我想說一說我對模式識別和機器學習的淺薄認識。機器學習是近幾年很熱門的乙個門類,這學期我選了這門課,不是說要多深入地學習,我是乙個數學一直不太好的人,也決定了我這門課可能也無法太過精進。但我還是選了這門課,期於這門課能帶給我新的視野...
程式和行為模式識別技術
最近對路邊的紅外線監控產生了不少興趣,而後又牽涉到了同類的一些東西,發現挺重要,挺有前景。我們都知道模式識別用在機器上代名詞那就是人工智慧了,說白了那就是動態資料處理。遵循一條規律或者多條規律,我們稱之為字典,就像人的記憶一樣。又因為我們現實生活中有太多的東西需要半自動化和完全自動化,有些是人力所不...
《模式識別和機器學習》資源
作者主頁 prml作者christopher m.bishop發布的樣章 勘誤 習題答案 講義等資料,參考書是經典的 pattern recognition and machine learning by chris bishop springer 2006 and probabilistic gr...