tvm的作用是針對不同的硬體平台,包括cpu、gpu、tpu等,對各種深度學習框架的**(主要是inference過程)進行統一優化,目的是使得演算法模型在各種不同的硬體平台上的執行得到加速
1.可以end-to-end優化,也可以優化使用者指定的各種操作;
2.autotvm自動優化操作池;
3.提供乙個tvm rpc用於硬體程式除錯,支援模擬器;
4.vta stack集群優化
autotvm的效率問題,搜尋範圍的操作池非常大
1.排序演算法穩定性及其意義
2.桶排序及應用
3.定長陣列實現定長棧和佇列
1、o(n²)演算法:冒泡、選擇、插入排序都是穩定的;o(nlogn)演算法:歸併穩定、堆排序和快速排序不穩定。
2、桶排序是非比較排序,另有計數排序和基數排序(未講),應用:無序陣列排序後相鄰數的差的最大值。
3、index和size控制棧,start、end、size控制佇列
4、棧實現佇列,佇列實現棧
1、回顧retinanet和mask r-cnn的工作
2、從backbone、head、postprocess三個方面改進目標檢測演算法
1、介紹retinanet和mask r-cnn的思想
2、目標檢測的改進方向,從目標檢測的整個流程來逐個分析,從backbone、head和postprocess操作等方面進行改進
3、backbone的主要問題在於,現在檢測框架中用於提取特徵的cnn都是用於imagenet分類任務預訓練的,而分類任務本身是對localization和scale不敏感的,用這種backbone做檢測任務肯定存在一定問題。在此基礎上曠視提出了detnet專門用於檢測任務的backbone
4、head的概念廣泛存在於single stage和two stage檢測演算法中,其中single stage演算法在recall rate上效果較好,two stage演算法在accuracy上表現較好。同時two stage演算法往往被詬病速度較慢,其原因在於所用head較重。因此提出一種light-head r-cnn演算法,減輕head 的計算量,提高速度的同時,保留two stage檢測演算法的優點。
5、postprocess是現在檢測框架中不可缺少的一部分,以nms為主,但卻是以一種游離於end-to-end框架之外的形式存在。需要做一些改進。
(algorithm, hardware)和(inference, training)兩兩結合,構成四個維度來介紹深度學習硬體加速
algorithms for efficient inference
hardware for efficient inference
1、asic
2、tpu
3、eie
algorithms for efficient training
hardware for efficient training
2023年11月5日學習日誌
一 搭建開發環境 1.安裝visio stu 2017 版本 2.安裝sql server 2008 r2 資料庫 二 建立應用程式 1.新建 專案 2.net 版本選擇 4.0 4.61 出於相容性考慮,建議低版本 3.開發語言選擇 c 4.專案型別選擇 控制台程式 5.專案名稱及位置 位置路徑建...
遞迴2023年11月24日
遞迴2018年11月24日 以下內容僅供娛樂,歡迎隨時 請多指教!1 用遞迴函式求斐波那契數列的第n項 斐波那契數列從第三個數起,後乙個數等於前面兩個數之和,例如 1 1 2 3 5 8 13 21 34 include intfun int n intmain 2 猴子吃桃問題 有一群猴子,去摘了...
2023年11月12日 複習
utf 8,unicode,gbk 的差異 沒聽懂。中文位元組 utf8 3個 gbk 2個 n 1actname sxj actpwd 123 while true name input name mima input mima n n 1 if actname name and actpwd m...