看到一些天玑9300和8gen3的测评帖,有提到9300的AI算力是48 TOPS,8gen3是 45 TOPS,有几个问题凭我自己的认知想不明白,来吧里求助大家:
1. 9300和8gen3所谓的48 TOPS,45 TOPS指的是INT4精度下的性能吗?
高通Hexagon NPU和联发科APU 790都标注支持INT4和INT8/INT16混合精度,但没注明45 TOPS是哪个精度
2. 9300和8gen3的45 48TOPS是单指NPU部分的算力,还是把NPU+CPU+GPU加一起的总和AI性能?
有篇文章提到,9300单NPU可提供48 TOPS AI算力,NPU+GPU一起是68 TOPS
高通这边针对 X Elite平台,提到过单NPU 45 TOPS,平台总算力75 TOPS的说法
但没找到8gen3的45 TOPS指的是单Hexagon NPU还是NPU GPU CPU相加的成绩
3. 如果9300和8gen3的算力都指的是INT4,我能不能用联发科和高通给的指标,粗略的认为其已经达到rtx2080ti大约1/10的INT4性能?(rtx2080ti大约有430 TOPS INT4或 215 TOPS INT8性能)
4. 高通X Elite,8gen3,8sgen3的NPU算力是不是一样的?
X Elite单NPU是45 TOPS,8gen3也说是45 TOPS(但没注明是否为单NPU算力)
有张8sgen3和8gen3 PPT有写到两者Hexagon都能运行10B参数大小的模型
可以认为8sgen3和8gen3的NPU是同一代同算力吗
5. 安卓系统 Termux下以Ollama运行LLM的时候,是否能调用天玑和高通的APU NPU,还是说Termux Ollama下跑LLM或者MLCChat下跑LLM,目前调用的还只是纯CPU性能?(B站和吧里一些大佬的测试截图)
下面附上一些我找到的截图和依据,我鉴别不了真实性,麻烦大家,占用吧友时间了,感谢
1. 9300和8gen3所谓的48 TOPS,45 TOPS指的是INT4精度下的性能吗?
高通Hexagon NPU和联发科APU 790都标注支持INT4和INT8/INT16混合精度,但没注明45 TOPS是哪个精度
2. 9300和8gen3的45 48TOPS是单指NPU部分的算力,还是把NPU+CPU+GPU加一起的总和AI性能?
有篇文章提到,9300单NPU可提供48 TOPS AI算力,NPU+GPU一起是68 TOPS
高通这边针对 X Elite平台,提到过单NPU 45 TOPS,平台总算力75 TOPS的说法
但没找到8gen3的45 TOPS指的是单Hexagon NPU还是NPU GPU CPU相加的成绩
3. 如果9300和8gen3的算力都指的是INT4,我能不能用联发科和高通给的指标,粗略的认为其已经达到rtx2080ti大约1/10的INT4性能?(rtx2080ti大约有430 TOPS INT4或 215 TOPS INT8性能)
4. 高通X Elite,8gen3,8sgen3的NPU算力是不是一样的?
X Elite单NPU是45 TOPS,8gen3也说是45 TOPS(但没注明是否为单NPU算力)
有张8sgen3和8gen3 PPT有写到两者Hexagon都能运行10B参数大小的模型
可以认为8sgen3和8gen3的NPU是同一代同算力吗
5. 安卓系统 Termux下以Ollama运行LLM的时候,是否能调用天玑和高通的APU NPU,还是说Termux Ollama下跑LLM或者MLCChat下跑LLM,目前调用的还只是纯CPU性能?(B站和吧里一些大佬的测试截图)
下面附上一些我找到的截图和依据,我鉴别不了真实性,麻烦大家,占用吧友时间了,感谢