盤點2023年計算機視覺領域技術突破

2021-09-07 03:44:45 字數 1638 閱讀 4912

2019-01-04 10:36:23

回顧2023年,是屬於人工智慧的一年,不論是google、facebook、intel、阿里巴巴等通過產業布局進入人工智慧領域的網際網路企業,亦或如曠視科技face++、極鏈科技video++、優必選科技這樣直接以人工智慧起家的原生技術企業,都將ai注入到每個角落,掀起了一輪又一輪的技術高潮。

因而,除了nlp研究突破接連不斷,cv領域同樣精彩紛呈,伴隨著各式各樣落地應用如此接近人們的生活,技術也變得越發成熟。本文整理了在2023年,在cv技術領域取得的最主要的一些重大技術突破。

biggan發布

ian goodfellow在2023年設計了gan,在之後的幾年中,圍繞這個概念產生了多種多樣的應用程式。

其中,在iclr 2019**中出現的biggan,同樣是乙個gan,只不過更強大,是擁有了更聰明的課程學習技巧的gan,由它訓練生成的影象連它自己都分辨不出真假,因為除非拿顯微鏡看,否則將無法判斷該影象是否有任何問題,因而,它更被譽為史上最強的影象生成器。

在計算機影象研究史上,biggan帶來的突破是劃時代的,比如在imagenet上進行128×128解析度的訓練後,它的is得分能達到166.3,是之前最佳得分52.52分3倍;除了搞定128×128小圖之外,biggan還能直接在256×256、512×512的imagenet資料上訓練,生成更讓人信服的樣本。

英偉達video-to-video synthesis

fast.ai18分鐘訓練imagenet

在普遍認知還停留在需要大量計算資源來執行適當的深度學習任務時,fast.ai通過使用16個公共aws雲例項,每個配備8個nvidia v100 gpu,執行fast.ai和pytorch,用18分鐘在imagenet上將影象分類模型訓練到了93%的準確率,重新整理了乙個新的速度記錄。

這是乙個令人驚喜的結果,尤其在公共基礎設施上訓練imagenet能達到這種準確性,並且比其專有tpu pod群集上的谷歌dawnbench記錄快40%,執行成本僅約為40美元。這意味著乙個關鍵的里程碑出現了,幾乎所有人都可以在乙個相當大的資料集上訓練大規模神經網路。

除了這些重要的節點之外,2023年的計算機視覺技術也部署更多方面,不論是亞馬遜發布rekognition將計算機視覺置於開發人員、微軟為onedrive和sharepoint推出了新的ai服務、google相簿讓我們的記憶變得可搜尋、還是每個場景下都正在逐漸普及的ai人臉識別等等,計算機視覺正在逐步滲透到我們生活的每個部分。

最後,最值得注意的是,計算機視覺的市場增長幾乎與其技術能力的增長是一樣快的,預計到 2023年,計算機視覺領域會帶來超過262億美元的收益,因而在人工智慧的未來裡,計算機視覺一定是最有力的表現形式,並將隨處可見。

百度2023年計算機視覺筆試題

第一部分 有些題目不記得了 解析 首先this指標的作用 編譯器在識別類時,要經歷三個過程 1.識別類名 2.識別類中的成員變數 3.識別函式並對函式進行改寫 預設的為函式加上指標this 在類中呼叫函式就是要通過this指標來儲存這個類的位址,然後根據this指標提供的位址來對類成員變數進行操作。...

2023年的計算機競賽

10月中旬 競賽名稱 ccf noip全國分割槽聯賽初賽 參賽資格 所有中小學生都可以參加 考察方式 紙質試卷筆試 120分鐘 滿分100分 考查內容 計算機基礎知識 11月中旬 競賽名稱 ccf noip全國分割槽聯賽複賽 參賽資格 初賽達到省分數線選手均可參加 考查方式 兩次上機程式設計 寒假 ...

北航2023年計算機複試上機

第一題 從輸入的字串中,統計空格,回車,tab出現的次數 include include include int main buf i 0 len strlen buf for i 0 i 第二題 將兩個公升序字串合併成乙個公升序字串,相同的字母,出現一次。include include int c...