麦克雷 Mavom.cn

标题: 现在桌面电脑的单核性能对比手机确实已经没有任何优势了 [打印本页]

作者: RaymondKew    时间: 5 天前
标题: 现在桌面电脑的单核性能对比手机确实已经没有任何优势了
看把吧里之前有人发的这个帖子有感
他那个帖子原文是
苹果A18Pro的单核性能超过了285k和9950x,而高通骁龙8E和联发科天玑9400的单核性能也比285k和9950x差不了多少了,依旧超过大部分电脑处理器
我详细的说一下吧
事情要从远处的英特尔,以前的牢i说起
i9 9900ks,8c16t, 当时的最强游戏cpu
首发售价4299元
放到现在多核cpu性能打平手机,单核不如手机的东西(图3)
当然手机单核能领先5年前pc 50%并且持平最新3799元(二级市场普遍炒到4000+了)的cpu 9800x3d也是有理由的
骁龙8elite所用的二代Oryon L cpu是名副其实的大核心,其架构又宽又深,频率还能跑到4.32ghz“恐怖如斯的高频”
二代Oryon L rob重排序缓冲区足足有679
zen5 448
zen4 320
Oryon M 314
zen3 256
6~10代酷睿(14nm++++传奇耐电王 )224
而且二代Oryon L还有8发射
zen5 8发射
Oryon M 6发射
zen3 6发射
zen4 同zen3为6发射
12~14代酷睿 同zen4为6发射
6~11代酷睿14nm++++, 4发射
再说L2 L3缓存
二代Oryon L双核共享12mb L2(共享设计所以一颗核心就能访问全部,就像amd x3d处理器一颗核心就能访问全部96mb的l3一样)无L3
Oryon M 六核共享12mb L2 无L3
7800x3d 9800x3d每核心1mb L2,96mb L3
5700x3d每核心512kb L2,96mb L3
6~10代桌面酷睿 每核心256kb L2,2mb L3
13~14代i5k及以上酷睿每大核2mb L2,3mb L3
L1指令缓存的话则是zen3~zen5,1到14代酷睿大核均为每颗核心32kb
Oryon L有每核心128kb
当然,L1 cache 32kb 是算好能覆盖一整个4KB页的,从第一代core到十代都是这么设计的。每个set有8个entry,也就是说可以同时缓存8页,加大容量一方面提高延迟的同时可能会导致很大一部分entry在很多时候是闲置浪费性能。
不是说 x86 的 L1 特别小,而是 ARM 的指令密度偏低, x86 更高, 导致 ARM 需要更高的 L1i 缓存去弥补这个短板, 而 x86 需要在前端解码上提升复杂度. Zen 3 做到的非常出色的一点就是解码的效率有了提升.
另外一点就是缓存大了会导致延迟增大. L1d 缓存作为第一级缓存, 如果延迟大会显著提升平均访存时间, 即便说大缓存能提升命中率降低平均访问时间, 但是这样成本也更高.
L1 cache的替换以及prefetch策略都是很复杂的,延迟的提高对性能的影响会大于容量的提高。
总的来说,增加容量三个思路,第一个是增加cacheline的大小,但是相应的cache miss的延迟会大大增加,尤其是考虑到L1会缓存虚拟地址,一旦miss意味着penalty会增加更多。另外如果增加wayness或者sets,会造成寻址延迟增高,也是得不偿失。
增大L1 cache会导致cache miss的延迟大大增加,貌似是因为cache miss之后需要把原来的cache内容重新擦写并重新对应cache line?
凭借大而宽又深的架构,巨量的二缓+“恐怖如斯的4.32ghz高频”,2024年最新手机售价3500+的骁龙8elite就能够单核性能领先2020年5ghz的9900ks达58%
当然,3D V-Cache是一种通过扩展L3缓存容量来增强性能的技术,这种方法在保持较少L3缓存管理单元的同时,实现了较低成本的大容量最后一级缓存(LLC)。与此相对的是,Apple Silicon以及与之有着相似设计理念的高通骁龙旗舰版,它们选择的是取消L3缓存,转而大幅提升L2缓存的容量。NVIDIA的RTX 40系显卡也采取了类似的策略,直接增加了L2缓存的规模。虽然这三种方案表面上都是增加了缓存容量,但它们的实现途径各不相同,因此最终的性能表现也会有所差异。
然后仅需主板18瓦的cpu多核功耗就能打平两百瓦的9900ks也不是什么很难理解的事了。
i9 11900k首发4699元,规格上为8核心16线程,三级缓存16MB,频率基准已上
3.5GHz全核加速4.7GHz、TVB 全核加速4.8GHZ、睿频2.0加速5.1GHZ、睿频MAX3.0加速5.2

(, 下载次数: 6)

(, 下载次数: 4)

(, 下载次数: 5)

(, 下载次数: 6)

(, 下载次数: 6)

(, 下载次数: 5)

(, 下载次数: 5)

(, 下载次数: 6)

(, 下载次数: 6)
作者: elva    时间: 5 天前
这真是12级么......
作者: 艾的民    时间: 5 天前
兼容性赶上x86再说
作者: hafereerve    时间: 5 天前
你说完这么多,x86遗老不还是只会一句能打游戏么
(, 下载次数: 6) 手机那边每年20%的单核提升,电脑这边amd两年提升5%,牢英提升-15%,原先x86还只小输苹果,现在输完高通输公版arm,接下来没得输了。
作者: megulse    时间: 5 天前
呵呵
作者: youfu    时间: 5 天前
你怎么不从skylake开始算,拿九代十代显得arm很强是吗
(, 下载次数: 6)
喜欢吹单核,牙膏的royal core有100%ipc提升,你怎么不吹呢
作者: Gabrielfer    时间: 5 天前
架构都都不一样,你在这巴拉巴拉。  性能赶上?怎么赶上的,用你的嘴巴赶上得么?真当别人没用过ARM的CPU? 服务器级别的CPU单核性能远远弱于桌面级,也落后于X86架构的性能,就这你手机的芯片单核性能赶得上arm架构服务器CPU单核能力了?
作者: 艾的民    时间: 5 天前
乐子
(, 下载次数: 6)
作者: rvyotld008    时间: 5 天前
既然这么强,那么工作室和服务器一定是一排手机串在一起提供服务吧
(, 下载次数: 6)
作者: Gabrielfer    时间: 5 天前
(, 下载次数: 5)

(, 下载次数: 6)
作者: 神马电影sp3    时间: 5 天前
要不你虚拟个x86跑跑分
作者: Alealokato    时间: 5 天前
经典跑分王,比数据无敌,结果给x86压力是给不上一点的
作者: WesleyRib    时间: 5 天前
同样吃一粒米,他的运动能力不如蚂蚁
作者: myesrwdo65    时间: 5 天前
每年都能见到手机u秒桌面u的言论
(, 下载次数: 6)
作者: 艾的民    时间: 5 天前
这个b楼主是个发帖机器人,怎么举报它




欢迎光临 麦克雷 Mavom.cn (http://imac.ly/) Powered by Discuz! X3.5