知识点:效能核/性能核/硬件线程调度器
能效核
Gracemont是能效核的曾用代号,它是Atom处理器所用的Mont系列的第七代架构,它更追求能效,会在多线程以及线程吞吐上有所加强。此高能效x86微架构在有限的体积内实现多核任务负载,并具备宽泛的频率范围。它能够通过低电压能效核降低整体功率消耗,为更高频率运行提供功率热空间。这也让能效核提升性能,以满足更多动态任务负载。
能效核可以利用各种技术进步,在不额外增加处理器功率的情况下对工作负载进行优先级排序,并改进处理器的IPC性能。
Gracemont大幅扩大了分支预测器,现在拥有5000个条目的分支目标缓存区,实现更准确的分支预测。一级指令缓存增大到64KB,在不耗费内存子系统功率的情况下保存可用指令,它还拥有Intel的首款按需指令长度解码器,可生成预解码信息,加速具有大量代码的现代工作负载。采用两组三宽度的簇乱序执行解码器,可在保持能效的同时,每时钟周期解码多达6条指令。
后端执行单元拓宽了,具备5组宽度分配、8组宽度引退、256个乱序窗口入口和17个执行端口,共计拥有4个整数ALU、2个载入AGU、2个存储AGU、2个跳转端口、2个整数存储数据、2个浮点/矢量存储、2个浮点/矢量堆栈、以及第3矢量ALU。
存储系统采用了双载入双存储的配置,每4个核心共享4MB二级缓存,缓存带宽高达64 Bytes/cycle,延迟则是17时钟周期,并支持深度缓冲、高级预取器和Intel资源调配技术。
指令集方面,支持控制流强制技术和虚拟化技术重定向保护等功能;同时它也是首款支持AVX2指令集的“Mont”核心,以及支持整数人工智能操作的新扩展。
与Skylake核心相比,能效核能够在相同功耗下实现40%的单线程性能提升,或者只有不到40%的功耗提供相同的性能。与双核四线程Skylake相比,四个能效核能够在功耗更低的情况下同时带来80%的性能提升,或者在提供相同性能的同时功耗减少80%。
能效核
Gracemont是能效核的曾用代号,它是Atom处理器所用的Mont系列的第七代架构,它更追求能效,会在多线程以及线程吞吐上有所加强。此高能效x86微架构在有限的体积内实现多核任务负载,并具备宽泛的频率范围。它能够通过低电压能效核降低整体功率消耗,为更高频率运行提供功率热空间。这也让能效核提升性能,以满足更多动态任务负载。
能效核可以利用各种技术进步,在不额外增加处理器功率的情况下对工作负载进行优先级排序,并改进处理器的IPC性能。
Gracemont大幅扩大了分支预测器,现在拥有5000个条目的分支目标缓存区,实现更准确的分支预测。一级指令缓存增大到64KB,在不耗费内存子系统功率的情况下保存可用指令,它还拥有Intel的首款按需指令长度解码器,可生成预解码信息,加速具有大量代码的现代工作负载。采用两组三宽度的簇乱序执行解码器,可在保持能效的同时,每时钟周期解码多达6条指令。
后端执行单元拓宽了,具备5组宽度分配、8组宽度引退、256个乱序窗口入口和17个执行端口,共计拥有4个整数ALU、2个载入AGU、2个存储AGU、2个跳转端口、2个整数存储数据、2个浮点/矢量存储、2个浮点/矢量堆栈、以及第3矢量ALU。
存储系统采用了双载入双存储的配置,每4个核心共享4MB二级缓存,缓存带宽高达64 Bytes/cycle,延迟则是17时钟周期,并支持深度缓冲、高级预取器和Intel资源调配技术。
指令集方面,支持控制流强制技术和虚拟化技术重定向保护等功能;同时它也是首款支持AVX2指令集的“Mont”核心,以及支持整数人工智能操作的新扩展。
与Skylake核心相比,能效核能够在相同功耗下实现40%的单线程性能提升,或者只有不到40%的功耗提供相同的性能。与双核四线程Skylake相比,四个能效核能够在功耗更低的情况下同时带来80%的性能提升,或者在提供相同性能的同时功耗减少80%。