近期讀了《自然語言處理的形式模型》一書,為馮志偉老先生的科研精神點讚。致敬。
作者根據依存語法和德國配價語法的精髓,針對n.chomsky短語結構語法的弱點和漢語語法的特點,在80年代初提出了multiple branched multiple labeled tree analysis,即多叉多標記樹形圖分析法(有稱「中文資訊mmt模型」)。
早期的mmt模型提出漢語中的一系列的特徵/值系統,用於揭示或者挖掘深層次的語法、語義以及語用資訊。在各類特徵中,主要分為三類:
以上也稱為「雙態原則」,這對於自然語言自動處理系統的設計具有指導作用。在實際操作時,計算機先從「字典」中查詢靜態特徵,在靜態特徵的基礎上進一步求解動態特徵。下面就這些特徵/值進行梳理。
CY周回顧(9月16日)
生活回顧 又過了貌視 繁忙的一周,一周過得有點累,工作之餘娛樂卻兩不忘,加上週六健身室狂奔跑20分鐘,更是累。發現生活方式需要一點調整了,希望白天有最好的精神,所以晚上要減少掉熬夜了 身體是革命的本錢 技術回顧 本週看了夢境加速器的部分 乙個用ace架構的客戶端,由於之前對ace確實了解太過膚淺,所...
9月16日 自學問題
1.靜態不能調非靜態,非靜態可以調靜態 2.string 轉 int還是不會 integer.parse string型別變數 int 轉string string變數.valueof integer型別 3.final修飾屬性 可以考慮賦值的位置有 顯示初始化 塊中初始化 構造器中初始化 不能用方...
10月9日 產品資訊
2017年10月9日 星期一 起點學院早報 1.國家旅遊局預計 八天長假國內旅遊人數將達7.1億人次,同增10 國內旅遊收入5900億元,增長12.2 在居民生活水平不斷提高的大背景下,旅遊業增長是必然的,同時也會帶動餐飲,生活服務類行業 2.摩拜與ofo投資人正談判推動二者合併,以結束燒錢的競爭。...