麦克雷

标题: 发现一个很有意思的东西 [打印本页]

作者: lesliesu    时间: 2024-5-21 07:54
标题: 发现一个很有意思的东西
看来不用去装MacOS monterey去看内存带宽和DRAM功耗了,极客湾有测试截图
wle m2跑6800-7000 内存带宽占用显示31-35GB/s徘徊
m1跑 5100 内存带宽占用显示24-26GB/s
燕十三口中a17Pro wle只跑了4400是带宽问题又被打脸了
(, 下载次数: 0)
(, 下载次数: 0)
(, 下载次数: 0)
作者: lesliesu    时间: 2024-5-21 07:54
同时m2 GPU满载pkg明显比m1要高不少,pkg多出来了5w,GPU核心只多出来的2-3w,CPU多了1w,剩下的1-2w就是DRAM功耗了
作者: e51664983    时间: 2024-5-21 07:55
早就论证过根本没有什么带宽问题,纯粹是跑那些测试已经没办法提高ALU效率了,苹果也不想浪费时间在这上面,有了米谁还愿吃糠啊
作者: anitabc18    时间: 2024-5-21 07:56
这种测试,你测安卓一样能测出来带宽占用远不到内存上限,但是像9200/9300用了更大的9600内存跑分一下就比低配内存更强,特别是曼哈顿,
带宽都是固定分配的,不是内存上限,然后slc缓存提供的额外带宽你这个测不出来,就像a15的带宽需求你跑这个测试肯定也没问题,但是a16升级带宽后他曼哈顿跑分和wle就是更强
(, 下载次数: 0)
作者: anitabc18    时间: 2024-5-21 07:57
你这个测试来测移动端任何gpu带宽都没问题
(, 下载次数: 0) ,包括最吃带宽的rdna,
但是实际上你看看桌面端没有l2缓存设计的时候带宽配置多大,比如wle才跑2w的3060就配了360g的带宽,m2m wle跑多少?接近2.8w?400g带宽,你是觉得老黄傻还是?

作者: admin    时间: 2024-5-21 07:57
雖然十三確實邏輯不對 但你們的方式完全不對...哪有這樣測瓶頸的
這種一般都是驅動從計數器層面取得的數據,我建議先用PC使用一下proifile和PCM工具測量就知道問題在哪裡了。
按照這方式永遠不可能從計數器得出帶寬或fp32/填充率瓶頸這些的,因為有哪個真的給你跑到理論值上限啊,那都是單一代碼寫benchmark跑到的,是對某種路徑的測量。
比方說計數器只跑到50~60%甚至70~80%可是實際上對於帶寬早就瓶頸了,GPU利用率可以當成流水線阻塞所以能跑到99~100%,可是帶寬是另一回事啊...
舉個例子你拿NV的卡跑自己從Unity/UE上做的,刻意弄成VRAM帶寬瓶頸,然後打開其他工具看到帶寬使用率能100%嗎?
根本不可能好不好。
你們這些條件要成立除非流水線上一個stall都沒有,充分隱蔽延遲利用率最大化,每次切換可能最小化成本,使得利用率非常高,但也不可能100%。
即使shader 1 pass render 大量都是紋理填充率 多邊形優化得好 把光柵效率幹到最高(單個多邊形片段夠大)->頂天70~80%使用率
就算是無聊測過一個全部跑HDR 16bit 32bit的逆天東西(不等於HDR常數顏色) 把VRAM帶寬也就最高幹到76%左右也沒100%,但確實就是瓶頸最慢的地方。
有些奇葩情況甚至利用率很低但實際上還是瓶頸,例如海量的CS都沒有批合併資源使用亂七八糟,利用率會低到10%,但確實可能出現這樣的數字『L2 13% VRAM 11% TMU 9% ROP 7%...』等的東西。
雖然這種奇葩應該是要優化掉的就是。
一般而言最好還是針對具體執行做profile,哪有直接看個PCM就知道問題的,還那花那麼多時間跑分析幹嘛?
十三有問題沒錯但不代表你們這樣沒問題...
另外跑一些benchmark可能會用到計數器等,就會導致其他工具沒辦法執行分析這個benchmark,建議還是動手做一個比較好。
作者: e51664983    时间: 2024-5-21 07:58
吧宠最搞笑的是用一个错误的观点去证明另一个观点,先预设了人家有问题然后去论证有问题
(, 下载次数: 0)
作者: e51664983    时间: 2024-5-21 07:58
这玩意谁最好都不要洗,iOS 上现在可以用xcode 设置3个档位的GPU,其中最小档位限制了10GB的带宽且不限制频率,分分钟能让你们看看真正的带宽瓶颈是什么样子,谁再洗脸就会肿。
作者: hmfdmqvp59    时间: 2024-5-21 07:58
安卓这边是多少
作者: anitabc18    时间: 2024-5-21 07:59
某人给a17洗带宽已经丧心病狂了,都是些莫名其妙的测试,还真以为准了,安卓这边8gen3明确缺带宽,包括9200,9300的低内存版,都是实测证明更高规格的内存跑更高的分,如果按楼主的这种测试9200会缺带宽简直nm搞笑,为什么arm发布g720技术文档里带宽降低百分之40以后9300立马就站起来了,
安卓不认,连自家果跌的m2pro 乞丐版对比满血版实测都不认了,16c的m2pro跑曼哈顿效率吊打10和19c的m2/m2pro都不认了,
作者: anitabc18    时间: 2024-5-21 07:59
安卓这边我知道gpu带宽是单独给的,之前测试最吃带宽的spec多线程+gpu同时测试,几乎也不影响gpu性能,也就是其他测试你无论占用多大带宽是不影响gpu使用带宽的
作者: e51664983    时间: 2024-5-21 08:00
十三连两个9300可用带宽是多大都没测过就敢在这放,他连8650都买不起你还指望他能说点正常的?
作者: q97649582    时间: 2024-5-21 08:01
有后续嘛
(, 下载次数: 0)
作者: admin    时间: 2024-5-21 08:02
簡單根據臥樓所說,不過沒去手動分離(這樣可以更穩定,不講太多Unity小問題)

(, 下载次数: 0)

(, 下载次数: 0)

(, 下载次数: 0)

(, 下载次数: 0)
社團是ディーゼルマイン 就不講具體名字了 應該很好查
主要是這太奇葩了都沒多少多邊形什麼一堆的 浪費帶寬嚴重
黃油是優化最爛的區域 所以可以看到一堆奇葩 如果覺得75-80%太高 我可以找其他的例子 不過最好還是『市面上』的遊戲會比較貼切合乎現實點
(, 下载次数: 0)
有需要的話可以弄其他的 比如某個特酷炫太閃亮的機器人少女亂飛那個 3D的應該不少人懂就是了
作者: admin    时间: 2024-5-21 08:03
(, 下载次数: 0)
我覺得你還是去質疑一下nvidia甚至直接重新發明計算機好了...
還是乾脆apple的PMU就是不一樣
(, 下载次数: 0)




欢迎光临 麦克雷 (http://imac.ly/) Powered by Discuz! X3.5