答案當然不是大公司。雖說計算資源這乙個點,現在語言模型越搞越大,創業公司恐怕很難負擔得起訓練成本。
但這麼想通常都是錯的。
有一家 nlp 創業公司不僅解決了這個問題:他們今年初與國內一家大型雲服務企業達成合作(合作詳情後續會隨研究成果一起公布),提供充足的計算資源:數千枚 ai 晶元。
而且更重要的是在團隊方面,這家創業公司的演算法團隊主要來自以清華大學、卡內基梅隆大學,由 xlnet 和 transformer-xl 模型的第一作者領銜。
恩,前面說的這家公司就是迴圈智慧型(recurrent ai)。本週六(3月20日)下午,北京,迴圈智慧型(recurrent ai)的聯合創始人楊植麟博士,將在智源悟道1.0 ai研究成果發布會上做主題報告以及參與圓桌討論。
毫無疑問,語言大模型的價值仍需要朝多種方向進行持續研究和探索。除了繼續參與「悟道·文匯」模型的後續打造,迴圈智慧型已啟動另一項計畫:nlp moonshot。該計畫旨在面向產業落地的方向,訓練超大規模的中文預訓練語言模型,在銀行、保險、教育和房產等眾多行業的實際落地中,最大化 nlp 產業應用的價值。
「超大規模模型是最大化價值的基礎,nlp moonshot 計畫不會停留在學術研究層面,而是推動技術邊界、落地產業價值。」迴圈智慧型的聯合創始人,也是該計畫的負責人楊植麟博士這樣介紹該計畫的使命。
目前迴圈智慧型的 nlp moonshot 小組仍需要新成員加入,如果你對大規模預訓練模型非常感興趣,曾經在 ai 頂會發表過**或者正在從事相關的前沿研究,具備十足的創新能力,歡迎你的加入。
你的核心工作內容將包括:
迴圈智慧型資深演算法總監陳虞君、資深演算法總監杜羽倫和演算法工程師徐瀚偉表示,「我們有top團隊和massive算力去做前沿的nlp研究,也有豐富的垂直領域資料和商業化場景去大試牛刀。歡迎跟我們一起踏上『探月』之旅。」
迴圈智慧型將為優秀人才提供有競爭力的薪水和期權,為卓越人才提供百萬+年薪和有吸引力的期權。
計算資源
眾所周知,訓練超大規模模型也需要價值不菲的計算資源。在計算資源方面,迴圈智慧型已經與一家大型雲服務企業達成合作,數千枚 ai 晶元計算資源已就位。
團隊實力
迴圈智慧型團隊曾創造 state of the art 模型 xlnet 和 transformer-xl(聯合創始人楊植麟博士是兩個模型的第一作者),具有在數千塊 tpu 上訓練超大規模模型的大量實踐,對預訓練有豐富經驗。
專案前景
研發中的超大規模預訓練語言模型面向產業落地,迴圈智慧型已服務和即將服務多家銀行、保險、房產、教育等行業的頭部客戶,具備企業線上線下溝通智慧型化和人員效率提公升等方面的豐富落地應用場景。
關於迴圈智慧型
去大公司還是去小公司工作?
去大公司還是小公司工作?這個問題問大多數 it 人都會選擇前者。如果換乙個問法,去大公司還是去初創公司 startup 工作?或許有極小一部分人能改變一下決定。對於 it 人來說,選擇到大公司工作的理由可能有 覺得 錢多人傻,幹嘛不去?有人認為 機會多,有發展 也有人被小公司的眉毛鬍子一把抓嚇怕了,...
去大公司還是小公司工作
對於 it 人來說,選擇到大公司工作的理由可能有 覺得 錢多人傻,幹嘛不去?有人認為 機會多,有發展 也有人被小公司的眉毛鬍子一把抓嚇怕了,認為大公司 正規一些 或是覺得 有挑戰,起碼幾千萬使用者,數千台機器,數億 pageview,想想就激動 也有人說,有很多牛人在那,能學到東西 的確,大公司有很...
去大公司還是小公司工作
去大公司還是小公司工作?這個問題問大多數 it人都會選擇前者。如果換乙個問法,去大公司還是去初創公司 startup 工作?或許有極小一部分人能改變一下決定。對於 it 人來說,選擇到大公司工作的理由可能有 覺得 錢多人傻,幹嘛不去?有人認為 機會多,有發展 也有人被小公司的眉毛鬍子一把抓嚇怕了,認...