由於 gpu 上的 sm 數量會因所用的特定 gpu 而異,因此為支援可移植性,您不得將 sm 數量硬編碼到**庫中。相反,應該以程式設計方式獲取此資訊。
以下所示為在 cuda c/c++ 中獲取 c 結構的方法,該結構包含當前處於活動狀態的 gpu 裝置的多個屬性,其中包括裝置的 sm 數量:
int deviceid;
cudagetdevice(&deviceid); // `deviceid` now points to the id of the currently active gpu.
cudadeviceprop props;
cudagetdeviceproperties(&props, deviceid); // `props` now has many useful properties about
// the active gpu device.
#include int main()
tesla v100 的裝置屬性:
device id: 0
number of sms: 80
compute capability major: 7
compute capability minor: 0
warp size: 32
