【图片】转载大卫黄评测 m4p 的 llm 性能【高通吧】

高通吧关注：176,957贴子：4,467,381

32回复贴，共1页

转载大卫黄评测 m4p 的 llm 性能

就像我之前说的 m4p 一个算力仅相当于 9400 水平的 GPU 配不上这个带宽一点都不 pro。
果然只要评测者动点脑筋，针对 rag 高并发推测解码立刻让苹果现形，以上 3 个都是针对算力，苹果再拿 8Tflops GPU 的到处混可不行

解决方案很简单加 matrix 单元，保守提升个 5 倍没啥问题

送TA礼物

IP属地:江苏

来自iPhone客户端1楼2024-11-14 10:25回复

@NPacific @虚伪的我 @sky之城Angel

IP属地:江苏

来自iPhone客户端2楼2024-11-14 10:25

每日一吹

IP属地:四川

来自Android客户端3楼2024-11-14 10:37

M4M比M3M根本没提升，70B都是10t/s

IP属地:上海

来自Android客户端4楼2024-11-14 10:39

收起回复

不过虽说M系算力独一档的菜，M4Pro倒不是和图里其他几个芯片一个级别的。。。像是M4Ultra，图形性能都要被4090爆烂的

IP属地:上海

来自Android客户端5楼2024-11-14 10:52

收起回复

@刘子瑶641 @艾芯 @麒麟9020 @NukaCola

IP属地:广东

来自Android客户端6楼2024-11-14 11:01

13果然理解力有问题

IP属地:江苏

7楼2024-11-14 11:10

收起回复

特定优化、特定用途m4m又不差，关键是内存给够，你只跑70b用来生产，完全很值，要多用途就有点吃鸡

IP属地:福建

来自iPhone客户端8楼2024-11-14 11:12

果然对比的最低是48GB的rtx a6000，这要是用24G的4090

IP属地:贵州

来自iPhone客户端9楼2024-11-14 11:20

收起回复

用了2年chatgpt就没用过全文总结和批处理

IP属地:加拿大

来自iPhone客户端10楼2024-11-14 11:46

收起回复

没有tensor导致的

IP属地:四川

来自iPhone客户端11楼2024-11-14 12:15

收起回复

算力低带宽高，LLM decode定制

计算密集型任务就露馅了

IP属地:北京

12楼2024-11-14 12:30

才发现 13 破防了，根本看不懂本贴还专门发贴哈哈哈@NPacific @happy燕十六 @xpenryn

IP属地:江苏

来自iPhone客户端13楼2024-11-14 15:22

收起回复

所以说为什么极客湾张黑黑他们测m4系列gpu，大模型推理一定要单独占个特别大的篇幅

不过说实话，苹果它乐意给内存，它这方面活该强，但是黄狗就一定为了他那b专业卡卡消费卡的显存，它也是活该炸显存

IP属地:美国

来自iPhone客户端15楼2024-11-16 17:34

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧热议榜

32回复贴，共1页

<返回高通吧

发表回复

发贴请遵守贴吧协议及“七条底线”贴吧投诉

内容:

使用签名档查看全部

发表

保存至快速回贴

日	一	二	三	四	五	六

转载大卫黄评测 m4p 的 llm 性能

登录百度账号

扫二维码下载贴吧客户端