馬納瑞斯曾給自然語言處理(natural language processing)提出以下定義:「自然語言處理可以定義為研究在人與人交際中以及人與計算機交際中的語言問題的一門學科。自然語言處理要研製表示語言能力和語言應用的模型,建立計算框架來實現這樣的語言模型,提出相應的方法來不斷地完善這樣的語言模型,根據這樣的語言模型設計各種實用系統,並**這些實用系統的評測技術。」因此自然語言處理是一門交叉學科,涉及語言學、電腦科學、數學、自動化技術等不同的學科。
自然語言處理的內容十分廣泛,大致有以下一些方向:
(1)機器翻譯 (2)自動文摘 (3)資訊檢索 (4)文件分類 (5)問答系統
(6)資訊過濾 (7)資訊抽取 (8)文字挖掘 (9)輿情分析 (10)隱喻計算 (11)文字編輯和自動校對 (12)作文自動評分 (13)光讀字元識別 (14)語音識別 (15)文語轉換 (16)人識別
那麼學習自然語言處理需要哪些先備知識呢?
概率最大似然估計
條件概率
貝葉斯法則
隨機變數
二項式分布
聯合概率分布和條件概率分布
貝葉斯決策理論
期望和方差 熵
聯合熵和條件熵
互資訊相對熵
交叉熵困惑度
雜訊通道模型
線性分類
線性不可分
構造核函式
那麼學習完這些預備知識後就開始學習自然語言處理吧!
VML初步接觸
什麼是vml?vml vector markup language 是乙個最初由microsoft開發的xml詞表,現在也只有ie5.0以上版本對vml提供支援。使用vml可以在ie中繪製向量圖形,所以有人認為vml就是在ie中實現了畫筆的功能。下面介紹一下vml的優點 基於xml標準 xml是公認...
glsl初步接觸
在看計算機系的同學的 時,我還不知道glsl這種東西。我還以為opengl繪製就是使用glbegin和glend。我還深深地納悶 opengl這貨畫東西完全不給力,是怎麼做到跟directx相比的?然後我看到了 裡的gluseprogram,看到了程式裡完全沒有出現glbegin這種語句。後來我才知...
初步接觸ubuntu
1 檔案部分helloworld 建立檔案 sudo vi aa.txt 由於許可權問題所以加上管理員許可權sudo 然後進入編輯介面 寫入helloworld 按esc退出 輸入 wq 寫入write並退出quit 檢視檔案 修改檔案許可權 此處還是要用sudo chmod 今天把學習到的先記錄到...