NVIDIA 開發者社區
免費培訓課程

CUDA 基礎---矩陣乘法以及共享內存

課程介紹:

CUDA編程方法是目前廣泛使用的并行化程序編程方法。在深度學習,計算機視覺,生物醫療,環境科學,氣象預報,石油勘探等領域具有大量的使用場景。通過這堂課,您將學會:

  • 利用CUDA編程模型實現矩陣乘法
  • 共享內存基礎
  • 利用共享內存加速矩陣乘法
湖南快乐十分

受眾目標:針對GPU平臺程序有開發需求的開發者

時長:1小時

CUDA 優化---共享內存以及常量內存

課程介紹:

本次課程將深入的介紹如何利用共享內存和常量內存來加速GPU程序,通過本次課程,您將學會:

  • 深層次的共享內存的知識
  • 常量內存的概念
  • 利用常量內存和共享內存加速GPU程序

受眾目標:針對有GPU平臺開發需求的開發者

時長:1小時

CUDA 優化---多流執行

活動日期:2019年7月9日,晚8點-9點半

課程介紹:

多流執行是CUDA編程模型中的重要加速手段,本次課程將深入的介紹如何利用多流執行來加速GPU程序,通過本次課程,您將學會:

  • GPU流的基本概念
  • 多流執行的應用
  • GPU程序的性能分析

受眾目標:針對有GPU平臺開發需求的開發者

時長:1小時

CUDA 優化---cuBLAS 的使用

活動日期:2019年7月23日,晚8點-9點半

課程介紹:

NVIDIA cuBLAS庫是標準基本線性代數子程序( Basic Linear Algebra Subroutines)的GPU加速庫. 使用cuBLAS API,您可以通過將密集型計算部署到單個GPU來加速應用程序,或者有效地擴展和分配到多GPU配置的服務器上,通過本次課程,您將學到:

  • cuBLAS基礎介紹
  • cuBLAS的應用
  • cuBLAS的實例展示

受眾目標:針對有GPU平臺開發需求的開發者

時長:1小時

CUDA 并行計算編程基礎

課程介紹:CUDA編程方法是目前廣泛使用的并行化程序編程方法。在深度學習,計算機視覺,生物醫療,環境科學,氣象預報,石油勘探等領域具有大量的使用場景。通過這堂課,您將學會:

  • GPU基本架構
  • CUDA編程模型---包括CUDA的線程層次,如何更加高效的調用線程來執行程序命令
  • CUDA訪存處理---包括多種存儲類型的調用,以及如何利用不同類型的存儲加速CUDA程序
  • CUDA多流執行---包括創建多流執行的CUDA程序,以及利用多流執行加速CUDA程序的方法

在本次課程中,還會以實際程序為例子,詳細展示如何在實際應用中利用GPU加速我們的應用程序

目標受眾:針對有GPU平臺程序開發需求的開發人員

時長:1小時

使用 NVIDIA 免費工具 TensorRT 加速推理實踐 - YOLO 目標檢測

課程介紹:

此課程將會介紹如何利用 TensorRT 加速 YOLO 目標檢測,課程將會著重介紹編程方法。本次課程還會涉及到 TensorRT 中數據類型,流處理,多精度推理等細節的展示:

  • TensorRT 簡介
  • TensorRT 優化 YOLO 的實戰編程
  • TensorRT 實例展示

目標受眾:對于 TensorRT 有一定基礎的開發人員

時長:1個小時

利用 NVIDIA 開源免費工具 DIGITS 實現生成對抗網絡(GAN)

課程介紹:

此課程將協助用戶開發出定制免編程 GAN 訓練工具,會詳細介紹如何利用NVIDIA 免費開源工具 DIGITS 實現對抗生成網絡(GAN)的訓練,如何安裝自定義組建,如何測試訓練效果等內容:

  • NVIDIA DIGITS 簡介
  • 數據集的處理
  • DIGITS 組件的安裝
  • GAN 的調試
  • 測試

目標受眾:針對有圖像處理和機器視覺知識背景的開發者

時長:1個小時

人工智能課程:使用 TensorRT 加速推理結果計算 ,配合 Deepstream

課程介紹:

此課程將會介紹 TensorRT 的基本信息,包括:

  • TensorRT 的性能特點
  • TensorRT 的優化原理
  • TensorRT 的開發方法細節
  • TensorRT 和 TensorFlow 的集成開發方法
  • Deepstream 的性能特點以及開發使用

目標受眾: 針對有模型訓練知識背景的技術人員

時長:1小時

GPU人工智能服務器的搭建

課程介紹:

在這門課中,您將學會如何從頭開始配置一臺GPU AI 服務器,我們會結合硬件系統和軟件系統介紹完整的解決方案。內容包括:

  • 硬件平臺系統的搭建
  • GPU 的性能特點
  • 當前已經成熟的解決方案
  • 軟件系統的安裝配置
  • CUDA,cuDNN 以及 NVIDIA DeepLearning SDK 的介紹

完成上述實驗,您可以自己根據不同的需求,配置一臺包含軟件和硬件的成熟系統。

目標受眾: 針對有GPU平臺程序開發需求的技術人員

時長:1小時

NVIDIA 交互式 GPU 訓練平臺: DIGITS - 開源免費的深度學習管理工具

課程介紹:

  • DIGITS 誕生背景及功能簡介
  • DIGITS 的訓練數據集導入
  • DIGITS 的基本模型訓練操作:圖片分類
  • DIGITS 用于目標檢測
  • DIGITS 用于圖像分割
  • DIGITS 遷移學習的使用
  • DIGITS Plugin 的使用

目標受眾: 針對有圖像處理和機器視覺知識背景的人員

時長:1.5小時

Style-Gan 的架構與實現

課程介紹:

A Style-Based Generator Architecture for Generative Adversarial Networks 是NVIDIA在2018年發布的一個新的生成對抗網絡方法。StyleGAN是一步一步地生成人工的圖像,從非常低的分辨率開始,一直到高分辨率(1024×1024)。通過分別地修改網絡中每個級別的輸入,它可以控制在該級別中所表示的視覺特征,從粗糙的特征(姿勢、面部形狀)到精細的細節(頭發顏色),而不會影響其它的級別。此課程將會介紹 Style-Gan 的基本框架和原理,并具體介紹模型的訓練,以及訓練好模型的應用,包括:

  • StyleGan 介紹、架構特點,以及與傳統的 Gan 之間的區別
  • StyleGan 效果和應用
  • StyleGan 模型訓練以及實際代碼中,利用 StyleGan 模型生成圖片

目標受眾:針對有模型訓練知識背景的技術人員

時長:1小時

課程咨詢及開課時間請微信添加社區小助手了解

qr-developer

NVIDIA 深度學習學院

深度學習和加速計算應用開發培訓
全配置云端GPU實驗資源