浮点单元是Zen 2架构中变化比较大的部分,在去年的EPYC罗马处理器中AMD就表示浮点性能吞吐量翻倍,原因就在于完全支持了AVX2指令,位宽从128bit提升到了256bit,这样不用再将以往的256bit指令拆分为两个指令用两个周期执行了,实现了浮点性能翻倍。
整数执行单元中,调度器从84个增加到了92个,物理寄存器从168个增加到了180个,从每周期6发射提升到了7发射,总体来说这方面的改进更多地是量变,进一步优化执行单元的效率及执行速度。
载入/存储单元中,同样是提升队列的深度,提升TLB缓存容量,提升带宽,降低延迟,最主要的是带宽从每周期的16B翻倍到了32B字节。
缓存一致性上,前面已经介绍过了L1、L2、L3缓存的变化了,其中L2缓存不变,L3缓存翻倍,L1指令缓存减半,但关联性翻倍。
Zen2架构中还增加了一些新的指令,比如CLWB、WBNOINVD、QOS等,不详细解释了,这些指令主要跟内存、缓存有关,主要目标还是提高缓存性能、降低延迟,它们主要是给EPYC处理器准备的,锐龙3000消费级处理器支持这些指令主要还是沾光。
最后值得一提的是处理器的安全性,由于后发优势,Zen2架构在安全性、漏洞防护等问题上更具优势,Zen架构上就已经免疫了多个Spectre幽灵、Meltown熔断等变种漏洞,Zen2架构上进一步硬件免疫了幽灵漏洞变种,这点对消费级处理器来说影响不大,但对企业级用户来说很重要。
第三代锐龙的终极目标:要多核还要单核 更要能效、低温
不论是7nm工艺还是Chiplets设计,亦或者是Zen 2微内核架构,AMD在霄龙、锐龙处理器上追求的目标不外乎性能、能效,结合之前处理器表现出来的优势及槽点,具体来说就是继续保持多核性能优势、提升单核性能、提高能效、降低功耗及发热,还有就是更低的成本,不过售价这方面还跟市场有关,要看具体产品,这里先不谈了。
在性能这点上,AMD在7nm Zen2上追求的是性能提升,首先是IPC性能,在从推土机架构到Zen架构上,AMD实现了52%的IPC性能提升,不过那个有特殊加成,但从Zen到Zen2上,AMD表示他们也实现了15%的IPC性能提升,这点就难能可贵了,毕竟现在的高性能CPU架构提升越来越难,以往Intel产品提升5%的IPC性能就算不错了。
其次,AMD还要实现更高的频率,锐龙一代、二代处理器在这方面就吃过亏,加速频率也就4.3GHz而已,相比Intel已经实现的5GHz加速频率差了很远,导致AMD在单核性能上吃亏不少,游戏性能也因此落败。
在7nm Zen2上,AMD总算有了突破,锐龙9 3900X 12核处理器的加速频率也达到了4.6GHz,16核的锐龙9 3950X更是达到了4.7GHz频率,而且AMD表示他们的加速频率不单单是追求单核最高频率,可能的情况下更愿意让多个核心达到加速频率,这样一来性能会更强。
综合IPC性能及频率的提升,AMD在锐龙3000上终于实现了单核性能的大进步,官方数据显示单线程性能提升了21%,考虑到锐龙一代、二代上单核性能与Intel酷睿处理器最大的差距也不过20%左右,这次的提升足以让AMD在单核性能上追平甚至超越Intel酷睿。
与此同时,AMD一直有优势的多核性能上还会继续保持,锐龙3000上最大核心数翻倍到了16核32线程,随着核心增加多核性能也基本保持了线性增长,6核12线程的处理器CINBEBCN R20多核跑分是3678,12核24线程的锐龙3000就是7248分,基本上就是同步增长的。
更重要的是,在性能增长的同时AMD反而降低了处理器的功耗,每瓦性能比要比目前的锐龙7 2700X以及Intel的酷睿i7-9700K处理器有了50%到70%的增长,锐龙7 3700X的绝对功耗反而从前两者的195W、157W降至135W,能效表现让人刮目相看。
考虑到锐龙7 2700X以及Intel的酷睿i7-9700K处理器都是14nm工艺水平的,7nm的锐龙3000处理器在能效上有两代工艺的差距,官方称同性能下功耗降低了50%,能效上可以说是降维打击。
伴随着能效的提升,AMD的锐龙3000处理器在发热上也很有优势,Intel的6核、8核酷睿处理器发热之高让很多玩家不爽,但锐龙7 3700X要冷静的多,这个优势在锐龙一代、二代上就已经如此了。
除了硬件上的改进,AMD在优化方面也跟上来,锐龙3000处理器就得到了微软的支持,在最新的Windows 10 5月更新(1903版)上,它也支持了AMD处理器的快速CPU状态切换功能,涉及到一些突发工作负载时,锐龙3000处理器的频率提升时间从30毫秒减少到了1-2毫秒,简单来说就是在需要的时候可以更快速度提升频率,这样就可以提升应用程序的响应速度,AMD表示PCmark 10的启动时间就缩短了6%,Rocket League游戏的启动时间更是减少了15%。
第三代锐龙的完美搭配:X570芯片组+PCIe 4.0带宽
在处理器之外,不得不说的还有全新一代X570芯片组,相比以往的芯片组由祥硕操刀设计,这次的X570是AMD亲自上阵,为的就是实现PCIe 4.0技术支持,而且不惜成本地上了14nm制程工艺。
与PCIe 3.0相比,PCIe 4.0的速率从8GT/s提升到了16GT/s,带宽翻倍提升。主要优点如下:
①速度更快,x16双向带宽达到了32GB/s,是PCIe 3.0的两倍。
②向下兼容,PCIe 4.0也能兼容PCIe 3.0设备。
③更多连接,PCIe 4.0带宽高,1条顶2条,可以连接更多设备而不需要担心性能下降。
PCIe 4.0在消费级平台上目前还是AMD X570/锐龙3000的独家功能,所以群联、慧荣等公司推出的PCIe 4.0主控以及厂商的PCIe 4.0硬盘要想发挥威力,AMD平台是首选,可以将SSD的读写性能提升到5GB/s级别,未来还可以进一步提升到6.5GB/s。
此外,X570平台除了PCIe 4.0之外,其他SATA、USB 3.1 Gen2、NVMe等标准也要比Intel的Z390平台更好,扩展接口数量更多,搭配更灵活,所以在X570平台上,AMD及主板厂商有了打造顶级平台的底气,这一点也是跟以往300、400系芯片组最大的不同,有先进技术就能任性。
当然,考虑到PCIe 4.0目前比较少支持,不追求极限性能的话大家完全可以选择X470、B450等平台,AMD之前也确认过了,除了PCIe 4.0支持之外,其他平台上锐龙3000处理器的性能也是一样的,不会受影响的。
总结:从优秀到卓越,第三代锐龙各种优点“我全都要”
从AMD的7nm Zen2架构设计来看,AMD在这一代处理器上可以说志向远大,不论单核还是多核性能,或者是能效、温度、成本,AMD的目标简直就是下面这张图所展示的那样:
没错,锐龙3000处理器上AMD表现出来的就是各种优势都要占尽,不给友商留活路的感觉,通过先进的7nm工艺、独特的Chiplets小芯片、全面改进的Zen2架构实现了性能、能效的同步增长,而且以往最弱的单核性能这次也追上来了。
对于锐龙3000处理器的性能,AMD的官方测试展示了很多了,不过我们这里不打算详细列举了,上面这张图就是综合代表了,单核、多核性能都要比Intel的酷睿i9处理器要强。
AMD官方的PPT并不能代表实际的性能如此,最终的表现如何还要看测试, AMD“全都要”的目标到底能实现多少。完全评测也会在7月7日的晚上9点解禁,来太平洋电脑网打开看详细的对比数据吧。