GTC 2018图形
技术大会日本站上,NVIDIA发布了一款新的计算
卡Tesla T4,第一次采用和
RTX 20系列游戏卡一样的Turing图灵架构,核心规格超越RTX 2070,功耗却低得不可思议。
Tesla T4搭配TensorRT软件组成的新平台,主要面向AI应用,包括智能语音、翻译、视频、图像、
推荐等应用领域,号称处理查询的速度比仅采用CPU时快了40倍,同时延迟更低。
该卡采用了PCI-E扩展卡样式,全覆盖金属外壳,散热器隐藏在内部,整体极具质
感也相当干练,同时因为面向计算领域而没有视频输出接口。
它配备了2560个图灵架构CUDA核心,低于RTX 2080 2944个,但是高于RTX 2070 2304个,
同时集成320个Tensor推理核心,但未提及RT光线追踪核心,可能因为无用而被屏蔽。
性能方面,FP32单精度浮点计算性能8.1TFlops(每秒8.1万亿次),FP16/32半精度和单精度
混合计算性能65TFlops,INT8、INT4整数计算性能则是130Tops、260Tops。
显存搭配16GB GDDR6,双倍于游戏卡,不过带宽仅320GB/s,
因此要么降低了位宽,要么降低了频率。
最外的是功耗,
整卡仅75W,无需辅助供电,而核心规模更小、计算性能更低的RTX2070还要175-
185W,显然这块卡在计算、功耗方面都做了特殊的优化,同时似乎也暗示RT光线追踪
是相当的耗电。