AMD VCK5000 Versal™ 開發卡采用 AMD 7nm Versal 自適應 SoC 架構,用於優化 5G、數據中心計算、AI、信號處理、雷達等應用。VCK5000 特定域架構得到了 Vitis™、Vitis AI,以及 Mipsology Zebra® 和 Aupera® VMSS 等合作夥伴解決方案的全麵支持,不僅帶來了強大的單位功耗性能(馬力),同時還在 C/C++ 軟件可編程性中保持了易用性。
與 nVidia 旗艦 GPU 相比,VCK5000 開發平台在標準 AI 基準測試中提供接近 100% 的每瓦計算效率和 2 倍的 TCO,因此是為雲端應用和邊緣應用實現 CNN、RNN 和 NLP 加速的理想開發平台。
如果您是一名 AI 開發人員,請使用 Mipsology Zebra 將 TensorFlow 和 PyTorch 訓練模型直接帶到 Versal 上推斷並使用 Aupera 視頻機器學習流媒體服務器解決方案在 FPGA 平台上構建、配置和部署計算機視覺應用。
查看合作夥伴解決方案,閱讀技術文章並獲得重要特性,以便使用 VCK5000 執行 AI 推斷開發
ML 任務繁重:H.264 解碼 + Yolov3 + 3x ResNet-18
視頻任務繁重:H.264 解碼 + tinyYolov3 + 3x ResNet-50
Zebra 將高性能與前所未有的易用性結合在一起,是 AMD 的首選 AI 加速器,可用於為基於圖像的 AI 應用計算神經網絡。
Zebra 可無縫替換 GPU/CPU,以更快的速度和更低的功耗計算任何基於圖像的神經網絡。使用 Zebra,無需重新訓練您的網絡或應用,也無需對其做出任何修改。Zebra 使用簡單的 Linnux 命令執行部署,因此使用 Zebra,無需掌握 FPGA 知識。
Aupera VMSS 是一個麵向視頻 AI 推斷應用的軟件框架。使用 VMSS2.0,用戶無需編碼,便可使用圖形用戶界麵 (GUI) 快速構建、配置和部署計算機視覺流水線。使用 Aupera 的節點工具套件並執行解碼、預處理和後處理等任務,可輕鬆構建自定義流水線,也可通過創建自定義節點構建該流水線,這些自定義節點可通過 GUI 上傳、構建、測試和使用。
Aupera 的商用視頻 AI 應用也可通過該框架配置、啟動和查看。用戶可選擇通過視頻疊加或發送文本輸出來檢查自定義流水線的結果。
數據中心越來越多地采用人工智能來管理從設備監控到服務器優化的各種任務。基於 FPGA 的自適應計算在數據中心中起著核心作用,通常被證明是運行複雜 AI 工作負載的最高效、最具成本效益的解決方案。
2021 自適應計算挑戰賽展示了將 VCK5000 開發卡與 Vitis AI 結合使用的最佳方式。
如果您想使用 AI 引擎和可編程邏輯實現算法加速,我們提供 AI引擎 C/C++ 高層次抽象 API 和 Vitis 加速庫。Vitis 端到端流程使用 C/C++ 開發,在 X86 或嵌入式處理器上運行,並通過 XRT 管理與加速器的運行時交互。硬件組件或內核可以用 C/C++ 開發,也可以使用 RTL 用於 PL 和 AI 引擎。
卡規格 | VCK5000 | |
---|---|---|
器件 | VC1902 | |
計算 | 有源 | 無源* |
INT8 TOPs(峰值) | 145 | 145 |
尺寸 | ||
高度 | 完整 | 完整 |
長度 | 完整 | 3/4 |
寬度 | 雙插槽 | 雙插槽 |
存儲器 | ||
片外內存容量 | 16 GB | 16 GB |
片外總帶寬 | 102.4 GB/s | 102.4 GB/s |
內部 SRAM 容量 | 23.9 MB | 23.9 MB |
內部 SRAM 總帶寬 | 23.5 TB/s | 23.5 TB/s |
接口 | ||
PCI Express | Gen3 x 16 / Gen4 x 8 | Gen3 x 16 / Gen4 x 8 |
網絡接口 | 2x QSFP28 (100GbE) | 2x QSFP28 (100GbE) |
邏輯資源 | ||
查找表 (LUT) | 899,840 | 899,840 |
最大總功率 | 225W | 225W |
散熱 | 活躍 | 無源 |
* 我們隻提供有源開發板。如果您從 VCK5000 移除風扇,請按照 硬件安裝指南,將其變為無源。