NVIDIA新一代Ada GPU内核图曝光 Tensor单元升级到第四代

5月24日上午11点,NVIDIA将亮相台北电脑展举办专题演讲,虽然老黄缺席,但GeForce业务高级副总裁在列,还是有希望公布RTX 40系显卡的消息甚至是提前发布。

在此之前,爆料达人Kopte7kimi分享了号称是AD102 GPU的内核设计图。

AD102也就是Ada Lovelace家族的次顶配核心,也是RTX 40系游戏旗舰卡的配置,大概率对应RTX 4090 Ti、RTX 4090显卡。

分析来看,AD102内建多大12组GPC(显示计算簇),比上代GA102多出70%。每组GPC包括6个TPC(2个SM),每个SM单元包括4个子核心,这都与安培相同,但不同的是,每个SM子核心包含128组FP32单元,加上IN32整数单元合计达到192。

完整AD102包括24组SM,所有就是12288个FP32单元加上6144 INT32,说通俗易懂点就是18432个CUDA。

缓存方面,AD102核心中,每组SM享有192KB L1,比安培增加50%,共计4.5MB。L2增加到96MB,是安培的16倍。

相应的,ROP和RT光追单元规模自然也是水涨船高,AD102最多384个ROP,RTX 3090 Ti不过112个。另外,光追单元升级到第三代,Tensor单元升级到第四代。

基于此,RTX 4090最终实现性能翻番似乎并不是可望不可及的虚妄,就FP32单精度浮点来说,外界预期能到90T,而RTX 3090 Ti不过40T,代价就是超600W的功耗……

推荐DIY文章
金佳蓝doi事件始末个人资料 le sserafim金佳蓝霸凌事件实锤了吗
2022年油价最新调整价格 今年油价一共调整了多少次最新消息
哈尔滨男子烧伤身亡未发现涉黑线索 哈尔滨烧伤事件始末后续结果
上海社会面清零还要多久什么时候解封 上海疫情预计什么时候结束恢复正常
印度一地暴发罕见番茄流感 番茄流感是什么有哪些症状?
淘宝520有满减活动吗什么时候开始 淘宝520活动力度大吗2022
精彩新闻

超前放送