在GTC 2017大会上,Nvidia正式发布了下一代超级核弹:Tesla V100,拥有5120颗CUDA,815平方毫米面积,12nm制程工艺,售价为149000美元,约合人民币102万元。

  据黄仁勋介绍,Tesla V100采用台积电12nm工艺制程,增加了与深度学习高度相关的Tensor单元,在815平方毫米面积的硅片上集成了210亿个晶体管,5210个CUDA核心,其单精度浮点运算性能达到15 TFLOP/s,双精度浮点运算性能达到7.5 TFLOP/s。此外,还拥有16MB缓存,采用的是16GB HBM2显存,显存带宽为900GB/S。

  Tesla V100 可谓是 Nvidia 今年最重量的一款新品,根据 NVIDIA 官方资料,Tesla V100 可提供 7.5TFLOPS 的 FP64 倍精确度浮点数运算性能,15TFLOPS 的 FP32 单精确度浮点数运算性能。

  此外,针对 Deep Learning 还有导入了一个全新的 Tensor Core 架构设计,让 Tesla V100 运算卡的深度学习运算效能比上一代 Pascal 架构产品提升 5 倍,达到 100TFLOPS 以上的运算能力。此外,NVIDIA 新推出的 Tesla V100 运算卡亦导入了新一代的 NVIDIA NVLink 技术,吞吐量是上一代的两倍。

  相比较来看,上代旗舰 Tesla P100 也只有 3584 个 CUDA 单元而已,拥有 153 亿个晶体管,核心面积 610 平方毫米。此外,Tesla V100 的 L2 缓存由 Tesla P100 的 4096KB 增加到了 6144KB,每组 SM 单元的寄存器文件大小总数从 14336KB 增加到了 20480KB。

  NVIDIA 表示,Tesla V100 将首先用在用于深度学习超算 DGX-1 上,内部拥有 8 张 Tesla V100 计算卡,峰值计算性能高达960 TFLOPS,号称 8 小时便可以完成 TITAN X 八天的工作量。 

 

  首款导入 Tesla V100 的产品将会是 NVIDIA DGX-1V,而每台 DGX 将会使用 8 张 Telsa V100;全新的 DGX-1V 建议售价为 149,000 美元,预计第三季出货。另外,还有采用 4 组 Tesla V100、定位为个人用超级电脑的 DGX Station,参考价格 6.9 万美元。采用 8 组 Tesla V100 的多功能 GPU 云端运算服务器 HGX-1 with Tesla V100,价格未公开。最后,还有被动散热设计的 PCI Express 扩充卡 FHHL,可提供 Skylake 世代 CPU 约 15 到 20 倍的深度学习性能。

  黄仁勋表示,AI 革命快速展开并正加速中,NVIDIA 的 GPU 深度学习平台已成为研发人员及网路业者进入 AI 市场的重要途径。现在,全世界各大互联网和云服务提供商都在使用英伟达的 GPU 芯片,包括 Facebook、Alphabet 公司旗下的谷歌、IBM、微软和阿里巴巴集团。英伟达的芯片包含人工智能和深度学习功能,能够加快数据的分析过程。

  而在今年第一季度,英伟达数据中心业务的营收增长了一倍以上,增长到了 4.09 亿美元,受此影响,周三英伟达的股价大涨了 17.83%,报收于 121.29 美元,刷新了历史纪录,总市值攀升到了 720 亿美元。

  而现在,汽车芯片行业和人工智能以及游戏行业,Nvidia 都全面开花获得业绩补强。再加上强势新品的帮助,Nvidia 乐观估计,它在第二季度的营收可能会达到 19.5 亿美元,上下浮动率约为 2%、而分析师们预测的平均数字则是 18.9 亿美元。

  而接下去,感到难受的应该会是英特尔和 AMD,英伟达已经展现出了咄咄逼人的态势,这两家老牌芯片巨头的日子不好过。