BERT破的11項紀錄具體都是什麼?

2021-09-02 02:14:04 字數 1442 閱讀 4054

1.  multinli(multi-genre natural language inference,文字蘊含識別)

文字間的推理關係,又稱為文字蘊含關係。樣本都是文字對,第乙個文字m作為前提,如果能夠從文字m推理出第二個文字n,即可說m蘊含n,m->n。兩個文字關係一共有三種entailment(蘊含)、contradiction(矛盾)、neutral(中立)

2.   qqp(quora question pairs,文字匹配)

判斷兩個問題是不是同乙個意思,即是不是等價的。屬於分類任務

3.   qnli(question natural language inference,自然語言問題推理)

是乙個二分類任務。正樣本為(question,sentence),包含正確的answer;負樣本為(question,sentence),不包含正確的answer。

4.    sst-2(the stanford sentiment treebank,斯坦福情感分類樹) 

分類任務。

5.    cola(the corpus of linguistic acceptability,語言可接受性語料庫) 

分類任務,**乙個句子是否是acceptable。

6.     sts-b(the semantic textual similarity benchmark,語義文字相似度資料集) 

樣本為文字對,分數為1-5,用來評判兩個文字語義資訊的相似度。

7.     mrpc(microsoft research paraphrase corpus,微軟研究釋義語料庫)

樣本為文字對,判斷兩個文字對語音資訊是否是等價的 

8.      rte(recognizing textual entailment,識別文字蘊含關係)  

與mnli相似,只不過資料集更少

9.      wnli(winograd nli,自然語言推理)

小的資料集 

10.   squad(the standford question answering dataset,斯坦福問答資料集) 

question,從phrase中選取answer。

11.   ner(named entity recognition,命名實體識別) 

12.   swag(the situations with adversarial generations dataset,) 

第11周 專案1(1)二叉樹的層次遍歷演算法

問題描述及 ifndef btree h included define btree h included 煙台大學計控學院 作 者 楊徵 完成日期 2015年11月9日 問題描述 實現二叉樹的層次遍歷演算法,並對用 a b d g c e,f 建立的二叉樹進行測試 endif btree h in...

第11周專案4 類族的設計

檔名稱 project.cpp 完成日期 2015年5月20日 版本號 v1.0 問題描述 按以下的提示,由基類的設計和測試開始,逐漸地完成各個類的設計,求出圓格柱體的表面積 體積並輸出並且完成要求的計算任務 1 先建立乙個point 點 類,包含資料成員x,y 座標點 實現需要的成員函式,並設計m...

第11周專案4 1點圓的關係

編號及 檔名稱 score.cpp 完成日期 2015年5月27日 版本號 v1.0 問題描述 問題輸入 先建立乙個point類,包含資料成員x,y 在以point為基類,派生出circle類,增加資料成員半徑,基類的成員表示圓心,定義乙個友元函式,判斷點與圓的位置關係 問題輸出 include i...