阿里來了位技術新童鞋,一秒K O八位律師

2021-09-20 10:41:04 字數 2575 閱讀 8097

ai與法務,會擦出怎樣的火花?

背景

這套智慧型合同診斷系統主要做兩件事,一是判斷出不該出現的內容(如:違反法律法規的違禁詞、侵犯消費者許可權的條款、模糊表述等);二是判斷哪些是原本應該出現的內容,並給出修改建議或推薦用詞。

智慧型合同診斷系統檢查出風險點,並給出推薦表述

看似簡單,但實際在系統學習過程中卻困難重重:

1、法律語言表達和自然語言的差異性

目前普遍在做的nlp應用,大部分是基於自然語言進行處理。例如社交網路語言,更加接近人們對話的用語表達。而法律用語和自然語言用語之間存在較大差異,法律語言通常有其特定領域的表達規範和邏輯,和我們通常的自然語言表述有較大差異。這就導致了現有的研究成果無法直接應用於法務領域,需要做特定領域的遷移。

2、技術和業務場景的鴻溝

如果不具備法務法律領域相關知識基礎,有好的nlp技術也不一定能在法務領域落地。能夠將法務領域需求抽象並和技術相結合,具有很大挑戰,需要跨領域人才和多領域人才密切配合。

3、標註資料的稀缺性

在法務領域,資料十分稀缺,而且往往涉及到敏感資訊和商業機密,導致了資料無法共享。有些場景僅有少量標註資料。

4、較高的準確性要求

法務領域對演算法指標要求較高,特別有些場景對演算法的召回率有嚴格要求,因為一旦漏掉關鍵資訊有可能造成較大的法律風險;此外,法務很多場景對演算法可解釋性要求較高,因此演算法不但要知其然還要知其所以然。

解決方案

在搭建系統時,第一步就是針對法務領域建立行業詞庫和知識圖譜。

詞的向量表示

基於大規模訓練的通用詞向量幾乎對所有nlp任務都有顯著幫助。而針對法務領域而言,由於有其特定的領域特性,我們在通用的詞向量基礎上,加入了大量法務領域文書的語料,使得學習到的詞向量在法務領域表現更為突出。

普通的詞向量模型大多採用 word2vec 或者 glove 訓練得到,最近的一項研究[3]發現基於 context 的詞向量 elmo 能夠進一步提公升幫助多個nlp 任務。

基於context的詞向量本質是語言模型的詞向量,詞向量不僅僅是詞本身的函式,也同時是句子裡面其他詞以及序列位置的函式。在法務領域中我們也嘗試了elmo 語言模型得到詞向量,提公升了模型效能。

冷啟動和快速樣本標註

標註資料一直是機器學習問題最重要的要素之一,只有擁有了大量標註資料才能訓練得到比較好的模型。然而在法務領域,標註資料的獲取是非常昂貴的,需要具備法律專業的人士進行標註。

主動學習。規則畢竟是有限的,雖然可以解決一部分問題,但是無法解決模型的泛化能力,最終還是需要依賴一部分人工標註。為了減少人工標註成本,可以採用主動學習方法。每次僅需要人工標註最不確定的那些少量樣本就可以很大程度提公升模型的效能。

多模型組合

文字分類技術也經歷了從傳統基於規則、人工特徵到目前基於深度學習的技術演變過程。目前比較流行的技術方案是基於rnn的序列模型、基於cnn的模型,以及在此基礎上演化而來的各種變種,比如結合注意力(attention)機制,用預訓練的詞嵌入(word embedding)等方法。

因此我們的最終方案採取深度學習模型負責高召回,將所有可能產生違規表述的條款檢測出來。然後採用句法分析和規則方法對條款進行解析,定位到具體違規表述的位置和推薦表達。這種方案的優點是利用深度學習提高召回率,用規則進行精確定位。

未來規劃

近年來,以深度學習和自然語言處理為代表的人工智慧技術取得巨大突破,也開始在法律智慧型領域嶄露頭角,受到學術界和產業界的廣泛關注。智慧型合同診斷只是我們在智慧型法務領域的第一步探索,除此之外,更多在合同、訴訟文書以及裁決文書上的工作正在進行中。

在技術上,我們進一步和阿里巴巴機器智慧型技術(mit) 合作共建,加強在行業知識圖譜構建、機器閱讀理解以及資訊抽取技術在法律領域應用的研究與探索。沉澱法律領域基礎資料資源,構建領域特點的自然語言處理平台,共同服務於多樣化的法律業務中。

相信法務ai能力的建設和完善能夠服務於廣大普通使用者、律師、法院等法律行業從業者。

阿里巴巴資訊平台事業部-企業資料智慧型團隊,集資料,演算法,產品為一體,擁有文字,運籌,視覺等多類別ai能力,通過發掘資料內在價值,提公升企業智慧型化管理水平。

團隊成員曾活躍於trec qa track,lfw(labeled faces in the wild),acm/icpc等各大賽事,博士佔比25%。

原文發布時間為:2018-05-30

阿里技術」。

部門來了一位前阿里的大神

對於程式設計師來說,高薪的秘訣其實只有兩個字 技術 技術的高低決定了你的薪水 福利。萬丈高樓平地起,程式設計師還是要先埋頭做事,學技術提公升自己,寫多了,薪資自然有大幅提公升。在我的前公司,系統研發部門來了一位前阿里的大神。為什麼叫他大神,因為他來公司一年,就做了一件事情 效能優化 把公司伺服器的數...

這是什麼地方,我就找本書就到這裡來了

天哪這是什麼滴地方啊 我就想找本書怎麼到這裡來了toc 你好!這是你第一次使用markdown編輯器所展示的歡迎頁。如果你想學習如何使用markdown編輯器,可以仔細閱讀這篇文章,了解一下markdown的基本語法知識。全新的介面設計,將會帶來全新的寫作體驗 在創作中心設定你喜愛的 高亮樣式,ma...

不談技術 蛇年,我回來了!

今天過了把小車隱,不過還真是有經無險呀,時速130,這要是撞上了小命就沒了,呵呵!龍年最後一天,去奶奶墳前祈禱了,這是我每年要做的事情,每年我都會為自己許下三個願望,今年也是一樣,呵呵!蛇年要幹的事情很多呀,生活上的,工作上的都有自已的目標,當乙個人有了目標之後,才可以更努力的,更有動力的去完成一些...