高通吧 关注:176,957贴子:4,467,381
  • 32回复贴,共1

转载大卫黄评测 m4p 的 llm 性能

只看楼主收藏回复

就像我之前说的 m4p 一个算力仅相当于 9400 水平的 GPU 配不上这个带宽一点都不 pro。
果然只要评测者动点脑筋,针对 rag 高并发推测解码立刻让苹果现形,以上 3 个都是针对算力,苹果再拿 8Tflops GPU 的到处混可不行
解决方案很简单加 matrix 单元,保守提升个 5 倍没啥问题


IP属地:江苏来自iPhone客户端1楼2024-11-14 10:25回复
    @NPacific @虚伪的我 @sky之城Angel


    IP属地:江苏来自iPhone客户端2楼2024-11-14 10:25
    回复
      每日一吹


      IP属地:四川来自Android客户端3楼2024-11-14 10:37
      回复
        M4M比M3M根本没提升,70B都是10t/s


        IP属地:上海来自Android客户端4楼2024-11-14 10:39
        收起回复
          不过虽说M系算力独一档的菜,M4Pro倒不是和图里其他几个芯片一个级别的。。。像是M4Ultra,图形性能都要被4090爆烂的


          IP属地:上海来自Android客户端5楼2024-11-14 10:52
          收起回复
            @刘子瑶641 @艾芯 @麒麟9020 @NukaCola


            IP属地:广东来自Android客户端6楼2024-11-14 11:01
            回复
              13果然理解力有问题


              IP属地:江苏7楼2024-11-14 11:10
              收起回复
                特定优化、特定用途m4m又不差,关键是内存给够,你只跑70b用来生产,完全很值,要多用途就有点吃鸡


                IP属地:福建来自iPhone客户端8楼2024-11-14 11:12
                回复
                  果然对比的最低是48GB的rtx a6000,这要是用24G的4090


                  IP属地:贵州来自iPhone客户端9楼2024-11-14 11:20
                  收起回复
                    用了2年chatgpt就没用过全文总结和批处理


                    IP属地:加拿大来自iPhone客户端10楼2024-11-14 11:46
                    收起回复
                      没有tensor导致的


                      IP属地:四川来自iPhone客户端11楼2024-11-14 12:15
                      收起回复
                        算力低带宽高,LLM decode定制计算密集型任务就露馅了


                        IP属地:北京12楼2024-11-14 12:30
                        回复
                          才发现 13 破防了,根本看不懂本贴还专门发贴哈哈哈@NPacific @happy燕十六 @xpenryn


                          IP属地:江苏来自iPhone客户端13楼2024-11-14 15:22
                          收起回复
                            所以说为什么极客湾 张黑黑他们测m4系列gpu,大模型推理一定要单独占个特别大的篇幅
                            不过说实话,苹果它乐意给内存,它这方面活该强,但是黄狗就一定为了他那b专业卡卡消费卡的显存,它也是活该炸显存


                            IP属地:美国来自iPhone客户端15楼2024-11-16 17:34
                            回复