在北京召开的GTC 2016技术大会上,NVIDIA CEO黄仁勋(老黄)亲自发布了新一代高性能计算卡Tesla P40、Tesla P4,专为人工智能、深度学习、神经网络推演而生。
它们俩将取代上代麦克斯韦架构的Tesla M40/M4,都进化到了最新的帕斯卡架构,当然也有16nm工艺。
Tesla P40基于高端大核心GP100,并且开启全部3840个流处理器(此前的Titan X只有3584个),核心频率1303-1531MHz,FP32单精度浮点计算能力12TFlops,INT8(八位数据专用推理指令) 47TOPS,响应速度比CPU快45倍。
该卡搭配384-bit 24GB GDDR5显存,等效频率7.2Gbps,整卡功耗250W,被动散热。
顺带一提,GP100大核心的Tesla P100也只开启了3584个流处理器,完整也是3840个,搭配显存是GDDR5X。
Tesla P4的核心则是GTX 1080/1070同款的GP104,全部2560个流处理器,核心频率只有810-1063MHz,单精度性能5.5TFlops,INT8 22TOPS,搭配256-bit 6Gbps 8GB GDDR5显存,功耗50-75W,半高被动散热。
相比于前辈,它们的计算性能分别提升了70%、1.5倍,INT8特性也是首次加入,功耗则维持不变。