課程目錄:CUDA培訓(xùn)
4401 人關(guān)注
(78637/99817)
課程大綱:

    CUDA培訓(xùn)

 

 

 

CUDA入門
1. CUDA 簡介
2. CUDA kernel函數(shù),warp,線程組織
3. 系統(tǒng)架構(gòu)
4. 內(nèi)存映射
5. CUDA三步式編程結(jié)構(gòu)
在CUDA-GDB中理解CUDA
1. CUDA-GDB 基本用法
2. 觀察GPU寄存器
3. 觀察錯誤信息
4. 從GPU上打印信息
5. 試驗:編譯和調(diào)試向量乘法程序
使用NSight調(diào)試CUDA程序
1. NSight簡介,安裝和設(shè)置環(huán)境信息
2. 在CUDA info窗口觀察計算狀態(tài)
3. 試驗:編譯和調(diào)試矩陣向量乘法程序
4. 試驗:使用Nsight調(diào)試CUDA程序
使用CUDA profiler 優(yōu)化CUDA程序
1. 測量GPU時間,nvprof,命令行選項
2. 分析熱點,采樣視圖
3. 內(nèi)存優(yōu)化,共享內(nèi)存
4. 試驗:使用nvprof優(yōu)化CUDA程序
GPU深度學(xué)習(xí)的應(yīng)用
深度學(xué)習(xí)GPU解決方案:
基于GPU的交互式深度學(xué)習(xí)訓(xùn)練平臺:DIGITS;
深度學(xué)習(xí)框架的GPU加速:TensorFlow,Caffe等;
NVIDIA深度學(xué)習(xí)SDK:cuDNN,TensorRT,NCCL;
深度學(xué)習(xí)顯卡選擇;
OpenACC并行編程
OpenACC上機(jī)實戰(zhàn):Helloworld
OpenACC四步開發(fā)流程:判斷并行性,并行化表達(dá),顯式數(shù)據(jù)傳遞,優(yōu)化
判斷并行性:Profile工具pgprof
并行化表達(dá):引導(dǎo)關(guān)鍵字Kernerls和Parallel Loop
顯式管理數(shù)據(jù)的拷貝:引導(dǎo)關(guān)鍵字Data
OpenCL并行編程
OpenCL:編程模型,存儲模型
生態(tài)(覆蓋intel,amd,nvidia,移動端arm)
CUDA vs OpenCL
OpenCL向哪里走
AMD ROCM HC/HIP編程
AMD并行編程
AMD生態(tài)
hipify轉(zhuǎn)換
HC/HIP編程
HIP vs OpenCL

主站蜘蛛池模板: 精品国产午夜理论片不卡| 机机对机机120分免费无遮挡 | 欧美另类老少配hd| 精品少妇无码AV无码专区| 国产成人精品亚洲2020| a级黄色一级片| 久99久无码精品视频免费播放| 亚洲伊人久久大香线蕉AV| 免费v片在线观看视频网站| 国产剧情片视频资源在线播放| 国产精品久久久久久久小唯西川| 天干天干天啪啪夜爽爽AV| 日韩av片无码一区二区不卡电影 | 国产福利在线导航| 7m精品福利视频导航| chinesektv直男少爷| 一级毛片成人午夜| 中文无遮挡h肉视频在线观看| 久久精品午夜福利| 久久精品人人做人人爽电影| 亚洲av一本岛在线播放| 可以看的黄色软件| 国产亚洲国产bv网站在线| 国产女王丨vk| 国产大片www| 国产剧情丝袜在线观看| 尹人香蕉久久99天天| 欧美性色欧美a在线播放| 污视频软件大全| 欧美精品久久天天躁| 欧美综合图片一区二区三区| 没带罩子的英语老师| 欧美精品久久一区二区三区| 欧美综合婷婷欧美综合五月| 永久免费无码网站在线观看 | 国产精品免费_区二区三区观看| 国产线路中文字幕| 国产精品一区欧美激情| 国产日韩欧美中文字幕| 女人是男人的未来你的皮肤很柔顺| 好看的国产精彩视频|