GPU双精度浮点性能简单分析
双精度浮点运算在许多领域有重要作用,不光与人类的科学技术发展有关也与我们的生活和业余爱好息息相关。举个例子不管是你喜爱影视后期,还是喜欢CAD CAE CAM,为了让自己省时省力都需要有一张软件支持并且双精度性能良好的GPU。 运算卡篇:世界上两大GPU供应商AMD与NVIDIA都有自己的运算卡系列,AMD的是FirePro S系列 NVIDIA是Tesla系列 其中NVIDIA的运算卡令人无语的一点的,就是麦克斯韦架构的运算卡相比开普勒架构双精度不升反降。就拿GM200核心的Tesla M40和GK110核心的Tesla K40比较一下,可以看出Tesla M40双精度浮点只有0.21TFlops,而更老的Tesla K40都有1.43TFlops。可见麦克斯韦架构低功耗的背后并不是高性能,而是大缩水,这一点在后面还会再次提到。NVIDIA Tesla软件支持还是很好的,有着20个领域的几百款软件支持。 AMD的规格一直是领先的,比如AMD FirePro S9300X2,高达0.87TFlops的双进度浮点运算性能,1TB/s的显存带宽,还有HBM显存。 同时,AMD运算卡也支持相当数量的软件,官方网站上还有专门的查询页面。 运算卡也活跃在工作站上 专业图形卡篇:世界上两大GPU供应商也都有各自的专业图形卡,分别是AMD的FirePro W系列和NVIDIA的Quadro系列 专业图形卡比运算卡更加亲民,软件支持更加广泛,什么Adobe全家桶应该都支持。