鉛筆道
2016-11-29 16:13:19
人工智慧直播
智慧型語音、計算機視覺技術雙管齊下。
◆馬驥是極限元科技的聯合創始人,生性內斂。
文| 鉛筆道 記者 趙芳馨
?蘋果siri面世後,曾一度沉寂的智慧型語音再次復甦,直到2023年還不見其衰退。
雷臻、馬驥和康利強三人瞅準時機,於2023年8月創立極限元智慧型科技。公司定位於人工智慧技術解決方案**商。
極限元智慧型科技推出的第乙個產品是智慧型語音雲平台。語音雲平台為移動網際網路、智慧型硬體開發者或中小創業團隊、個人提供快速接入語音技術的通道,即為他們提供一套快捷低成本的智慧型語音解決方案。
注:馬驥承諾文中資料無誤,為其真實性負責,鉛筆道已備份錄音速記,為內容客觀性背書
。
看好人工智慧第一次創業,馬驥覺得專案有點「生不逢時」,兩年前手遊行業競爭激烈,專案最終失敗。他卻不想再回公司上班,「下乙份工作還是想繼續創業,不會按部就班、朝九晚五地過下去」。
2023年8月,他和華為的前同事雷臻碰了頭。兩人都看好人工智慧領域,認為這是下乙個風口。
原因出自siri。長按蘋果手機的home鍵,使用者即可與siri對話,尋求它的幫助,或僅僅讓它講個冷笑話。
在它之前,智慧型語音產業潮起又潮落。其重心一直在語音合成(如文字轉聲音)領域,沒幾年,無論硬體或軟體的發展又沉寂了。
但蘋果siri出現後,整個市場重新被喚醒。「大家覺得這是下乙個最新的互動技術,直接用語音溝通,不需其它觸控手段。」
此外,各家公司對人工智慧,尤其是智慧型語音的技術需求更為旺盛,比如滴滴打車最早即支援語音識別。
兩人經過行業分析,請教業內專家後決定在人工智慧領域再度創業。他們於8月成立極限元智慧型科技,將公司定位於人工智慧技術解決方案**商。
智慧型語音雲平台進入市場後,極限元智慧型科技想找準客戶需求,快速圈地。技術合夥人康利強擁有多年技術積累,無論在演算法研究還是工程實踐都有豐富經驗。
但與客戶對接過程中,馬驥發現有些操之過急。公司的很多技術還停留在理論和試驗階段,與商業化的標準還有一定差距。
比如客戶需要在安卓、ios系統中使用智慧型語音技術,而極限元智慧型科技起初只能基於pc端服務。由此,技術人員要把很多技術重新分裝移植,接入更多的作業系統和平台。
半年時間內,團隊不斷除錯技術,不但提供多平台的sdk,還根據市場需求打造出智慧型語音雲平台。
這些技術只是大框架,根據客戶的反饋,技術人員還要不斷細化完善產品線。
起初,馬驥等三位合夥人設想,「客戶只要呼叫我們的雲端api介面,得到輸出的結果就夠了」。但實際情況遠不止這麼簡單:伺服器效能怎麼樣,併發狀態如何,有沒有離線場景支援等,各種情形都要考慮。
一些細節問題也不放過。比如某些教育行業的客戶也用語音合成,它們主要的目標人群是小朋友。教育行業客戶對整句發音要求不高,但對單個字或者詞發音要求精準。由此,語音雲平台為這類客戶附加介面,允許其自定義發音音調,甚至韻律、節奏等。
前期,極限元智慧型科技的客戶以移動應用開發者和中小創業團隊居多,「他們的付費意願不那麼高,但提出的很多需求值得深挖」。
計算機視覺技術去年下半年,公司逐漸獲取了一些合同,積累了一批使用者。在不斷接觸客戶的過程中,極限元智慧型科技的業務從智慧型語音逐漸拓展至計算機視覺領域。
語音和影象識別有共通之處,但技術開發仍遇到了一些困難。
近兩年,提及人工智慧必然說到深度機器學習。但這一領域的人才太少,每年畢業的博士生屈指可數,「人才是個很高的門檻」。
技術人員要不斷優化演算法。雖然深度機器學習應用於模式識別領域的相關技術已經日益成熟,業界也不斷有新的演算法和開源庫出現,但這些技術運用於特定領域特定場景中,都需要定製的工程化處理。此外,團隊還需要採購專用的計算裝置和專用的資料資源,以提高複雜模型的訓練速度。
在此基礎上,團隊為這款應用增加了筆劃筆順識別功能。當小朋友在手機螢幕上寫字時,手機端利用影象識別來提取特徵資料,每寫一筆都相當於在記憶體中截圖並進行有效資料提取。之後,這些資料在大服務端進行檢測是否提取正確。「一是看字的書寫對不對,二是筆順是否正確。」
之後語音、視覺技術雙管齊下,極限元智慧型科技也漸漸收穫奇虎360、搜狗等大客戶。後者都在語音、視覺等領域達成技術合作或購買定製化開發服務。馬驥表示,與行業大小對手的競爭中,要突出差異化,「及時滿足定製化需求,與客戶繫結地更緊密」。
直播內容審查
「我們會篩選大量資訊,只有部分疑似資訊交由人工核實,直播公司的審查工作至少降低70%。」
極限元智慧型科技定位於人工智慧技術解決方案**商,以後要繼續深挖各個行業的垂直領域需求。除服務b端客戶之外,團隊也會孵化面向c端的人工智慧軟硬體產品。
採訪最後,馬驥稱:「兩三年內行業要有一次大清洗,會釋放出更多的人才資源、市場空間。對大多數ai公司來說這可能一場浩劫,但對我們會是一次自我提公升的機遇。」
不過他也表示,對公司乃至整個行業來說,人才稀缺仍是最大的痛點。
/the end/
編輯 邵 希 校對 孫 嬌
0
人工智慧與OCR識別
核心提示在ocr識別技術領域,深度學習也是非常重要的。它能讓ocr識別技術更加強大,適應各種文字型別等。能更大的提公升整體的識別率。ocr識別技術處理影象越多,就會變得越來越強大。隨著資料的不短積累,識別能力都被儲存下來。李世石大戰阿爾法狗,人機大戰。然後就各種恐慌了,機械人會統治人類,如果你那麼想...
人工智慧 識別句子
include include include include include include include include include include include include include using namespace std 冠詞1,形容詞4,名詞2,動詞3,主謂 統一用冠詞 ...
人工智慧與資訊社會 人工智慧應用
1.單選題 以下四個人工智慧的應用領域中 與其他三個不同的是 c a 影象識別與分類 b 醫學影像分析 c 語音識別 d 人臉識別與情感計算 2.單選題 將結構型的 空間解析度高 紋路細節清晰 與光譜解析度高 色彩豐富的處理成空間解析度和光譜解析度都高的過程稱為 d a 影象配準 b 影象識別 c ...