從AI技術到使用者需求 深思考CEO楊志明談創業心得

2021-08-29 15:52:57 字數 2717 閱讀 4625

期號 | ai英雄總第100期

作者 | 小羿

「在ai創業中,技術必須從使用者場景出發,圍繞使用者需求來研發,而不是盲目圍繞技術閉門造車。」

在接受網易智慧型採訪的過程中,楊志明這樣表達他對於技術創業的心得。

在這之前,這家叫做深思考人工智慧(以下簡稱"深思考")的公司以及ceo楊志明似乎頗為低調。

實際上,深思考這家公司已經成立了整整三年,目前有近70餘人,其突出的技術是「多模態深度語義理解技術」,可同時理解文字、視覺影象背後的深度語義,目前面向場景為智慧型醫療大健康和汽車智慧型商業。

這已經是楊志明在ai領域的第四次連續創業,他長於ai演算法,在人工智慧領域有十餘年學研經驗,是中國科學院軟體所人工智慧方向博士、中科院大學mba,主持過多項國家級重大核心系統研發,擁有百餘項智財權。

專攻多模態深度語義理解

推出深思考大腦(ideepwise.ai)4.0

「ai技術的發展會經歷感知、識別、理解、決策四個階段。前兩個階段我們已經發展比較好了,目前我們正在解決理解的問題,」楊志明說,「比如讓機器識別『暴力』,不能簡單識別出一把刀就是暴力,如果乙個水果旁邊放著一把刀呢? 那就可能不是暴力。」

8月初,深思考推出了「多模態深度語義理解」深思考大腦(ideepwise.ai)4.0,憑藉此項技術,深思考近日在中文語義理解與人機互動領域最高水平的smp2018-ecdt賽事中獲得冠軍,蟬聯2017、2018兩屆冠軍。

楊志明表示,深思考大腦(ideepwise.ai)4.0在多輪人機互動語義理解方面有突出優勢,使得機械人能夠與人多輪人機互動,能夠理解上下文,最厲害的是在人機互動的過程中實現會話意圖的自由切換與準確識別,其語義理解是多模態的,能夠同時理解文字、語音和視覺影象背後的深度語義。

但是,我們如何評價機器理解的效果?楊志明稱目前學界還沒有統一的技術評價標準,但是在具體領域,我們主要看最終的產品效果就可以。比如在醫療篩查領域,可以看最終的準確率怎麼樣。

布局醫療ai篩查領域

60秒可分類7萬個細胞

目前,深思考一方面是在ai核心前沿技術領域繼續突破,另一方面利用ai技術結合業務場景來落地。

創業三年,楊志明認為最關鍵的就是找到剛需場景,用ai技術賦能這些場景,產生更好服務,最大的挑戰是如何用技術來解決這些場景下的產品化問題。

深思考目前更多地將多模態深度語義理解技術應用在醫學健康領域。楊志明說,深思考大腦4.0可以理解醫學文章,做健康諮詢和健康篩查,比如宮頸癌細胞篩查等。深思考已經面向醫療機構推出了全自動人工智慧宮頸癌細胞輔助閱片系統,這套系統可以在60秒內分類7萬個細胞,快速進行ai宮頸癌篩查。

目前,深思考的宮頸癌細胞篩查方案除了與國內一些三甲醫院合作外,但更多的是進駐第三方檢測機構,楊志明稱面向後者的市場占有率已達到了60-70%。

談到深思考在醫療大健康領域的未來布局,楊志明稱,我們先從單點突破,然後再進行縱向和橫向的拓展,持續建立起病理細胞學平台,進而用遷移學習方法逐漸從宮頸癌細胞篩查拓展到其他病理細胞篩查上。

「不同於其他ai醫療公司的是:我們已經積累了大量的關於細胞分類的基礎技術,在病理細胞學上頗有研究,比較容易進行其他病種遷移。」楊志明說到。

關於盈利模式,楊志明表示,未來基於病理細胞學的篩查平台有兩種盈利模式,一種是「雲模式」,演算法都在雲端,可以任意接入不同的醫療機構的終端裝置,不斷積累資料並優化模型,對於客戶來說入門使用成本適宜,易用大規模擴充套件。另外一種盈利模式是「端模式」,主要針對於某些不適合接入雲端的醫療場景,提供ai演算法+晶元的一站式智慧型醫療解決方案。

值得一提的是,深思考已經推出了專用ai晶元dpu,分別是智慧型醫療專用ai晶元m-dpu,還有智慧型商業專用ai晶元b-dpu。深思考的dpu是基於fpga平台研發的,主要針對特定場景解決方案來使用,用dpu整合運算深思考大腦(ideepwise.ai)4.0核心演算法,形成完整解決方案。

汽車智慧型展廳業務是現金牛

看好車內場景互動

ai落地應該從場景和使用者需求出發,但在這個過程中有業務需求與ai技術的巨大鴻溝,因為ai落地與傳統業務結合往往是乙個跨領域的複雜問題。

因此,改變醫療行業並非一蹴而就,即使在醫療篩查行業普及ai技術也並非易事。在推進醫療篩查的業務之外,深思考又開闢了汽車智慧型展廳的現金牛業務。

據悉,深思考憑藉自身在人機互動、多模態語義理解和大資料領域多年的人工智慧技術積累,將ai賦能線上雲平台和線**驗入口,以4s展廳為切入點,針對傳統4s展廳留客難、體驗差、無法分析客戶關注點、產品介紹不夠全面規範等痛點,用ai構建了以智慧型視覺分析與理解平台、大資料分析平台、智慧型迎賓機械人、多模態深度語義理解與人機互動平台為一體的智慧型展廳。

同時,深思考也通過大資料分析平台為智慧型展廳提供使用者畫像。從年齡、性別、購車諮詢時的情緒、停留時間、關注焦點、購車偏好等多個維度的大資料分析,輔助4s店長和主機廠商決策層做決策,形成一套商業領域的多模態人工智慧機械人大腦解決方案,帶來全新的購車、售車體驗。

目前深思考已簽約億元大單,將落地數千家智慧型展廳,還有多家品牌汽車主機廠商正與深思考深度接洽。

與此同時,深思考也在利用自己在ai互動上的技術優勢來布局汽車內部場景,主要涉及人與車的互動方案。在楊博士看來,未來汽車上肯定會有乙個人機互動的入口,這個入口有可能是車機大屏,有可能是投射3d螢幕等等,而且語音語義互動、手勢互動等等多模態的人機互動會是未來人車互動的乙個趨勢。

但是如果想在前裝普及這種新互動模式,起碼還需要3年的時間。目前市面上的車內語音互動方案還有很大的問題,一是語音控制方面不能夠完成最終的任務,往往只能完成一半還是需要觸控操作;二是聽不懂,雖然機器能聽清什麼問題,但聽不懂問題,無法理解問題,也沒有上下文理解記憶能力,無法完成操作。楊志明博士稱,如果想在車內人機互動上取得突破,還需要深挖下去,將演算法和應用場景深度結合,對產品進行精細化打磨才行。

從技術專家到技術管理,我對管理的思考

工作第七個年頭,我從技術專家,變成了一名技術管理者。最近一直在忙碌中思考如何成為一名優秀的技術管理者。這篇文章,主要會從兩個觀點和維度,來談談自己的一些認知和思考總結。首先,從工程師到技術管理的轉變,有兩個觀點要明確 1 技術leader是團隊最好的工程師之一 2 技術leader是為團隊服務,解決...

從《思考的技術》到網點競爭力提公升

今天非常有幸,聽到了鄭總講述關於網點競爭力提公升的思考及措施,深受鼓舞,也深刻感受到了全行深化改革的決心。其實整場演講,讓我印象最深刻的恰恰是鄭總對於問題的研究方法,這讓我想起了最近正在學習一本書,大前研一的 思考的技術 大前研一是一位世界級的管理學大師,因為是科學家出身,所以他應該是第乙個把科學研...

遇見技術棧 我從從開發轉型到AI工程師的經歷

我是乙個對ai有信仰的人,從開始的前端開發,到後來的後端開發,通過一年多的學習和工作,成功轉型到ai工程師。下面我介紹下自己在專案和學習中使用技術 產品 框架等內容介紹出來,並進行點評和分享。以下是我在processon上畫的技術時間軸,如有對此有興趣請移步 技術時間軸 以下是我在processon...