面向 AI 推斷的 VCK5000 Versal 開發(fā)卡
產(chǎn)品描述
Xilinx? VCK5000 Versal? 開發(fā)卡基于 Xilinx 7nm Versal? ACAP 架構(gòu)構(gòu)建,旨在滿足需要高吞吐量 AI 推斷和信號(hào)處理計(jì)算性能的設(shè)計(jì)需求。
相較于當(dāng)前服務(wù)器級(jí) CPU,VCK5000 的計(jì)算能力提升了 100 倍,相較于當(dāng)前服務(wù)器級(jí) GPU,VCK5000 的 MLPerf 推斷性能更佳,并且支持標(biāo)準(zhǔn)化開發(fā)流程,VCK5000 是云計(jì)算加速和邊緣計(jì)算應(yīng)用的理想開發(fā)平臺(tái)。
VCK5000 完全由 Vitis? AI 開發(fā)環(huán)境提供支持,包含優(yōu)化的 IP、工具、庫、模型和示例設(shè)計(jì)等。它采用高效易用的設(shè)計(jì)理念,可在 VCK5000 上充分發(fā)揮人工智能加速的潛力。您可以使用 Python 或 C++ API 在幾分鐘內(nèi)運(yùn)行 Tensorflow、Pytorch 或 Caffe 模型,無需事先掌握任何 FPGA 硬件知識(shí)。
主要特性與優(yōu)勢(shì)
優(yōu)異的 AI 推斷平臺(tái)
145TOPS (Int8) @ $2,495
使用 AI 引擎進(jìn)行 AI 推斷,在 MLPerf 1.0 上優(yōu)于 nVidia T4 的性能
隨時(shí)可用的解決方案
帶兩個(gè) DPU 變體解決方案的 Vitis AI 1.3(384 和 288 個(gè) AIE 內(nèi)核)
支持具有 50 多個(gè)模型的專區(qū)
自然語言 (BERT) 演示
MLPerf 提交 ResNet-50 演示(性能比 T4 高 11%)
使用 Vitis AI 啟動(dòng)設(shè)計(jì),開發(fā)板用戶指南
開發(fā)板特性
功耗與熱量
卡規(guī)格 | VCK5000 | |
---|---|---|
器件 | VC1902 | |
計(jì)算 | 有源 | 無源* |
INT8 TOPs(峰值) | 145 | 145 |
尺寸 | ||
高度 | 完整 | 完整 |
長度 | 完整 | 3/4 |
寬度 | 雙插槽 | 雙插槽 |
存儲(chǔ)器 | ||
片外內(nèi)存容量 | 16 GB | 16 GB |
片外總帶寬 | 102.4 GB/s | 102.4 GB/s |
內(nèi)部 SRAM 容量 | 23.9 MB | 23.9 MB |
內(nèi)部 SRAM 總帶寬 | 23.5 TB/s | 23.5 TB/s |
接口 | ||
PCI Express | Gen3 x 16 / Gen4 x 8 | Gen3 x 16 / Gen4 x 8 |
網(wǎng)絡(luò)接口 | 2x QSFP28 (100GbE) | 2x QSFP28 (100GbE) |
邏輯資源 | ||
查找表 (LUT) | 899,840 | 899,840 |
最大總功率 | 225W | 225W |
散熱 | 活躍 | 無源 |