首页 > 业界资讯 > 正文

ARM连发四款Mali GPU:一律全新架构

  除了面向64位移动计算的 Cortex-X2 、 Cortex-A710、Cortex-A510 三款全新CPU IP,ARM今天还带来了多达四款新的移动GPU IP,同样启用新的命名规则,分别是 Mali-G710、Mali-G610、Mali-G510、Mali-G310。

  G710、G510、G310分别定位旗舰、主流、入门级市场,依次取代现有的G78、G57、G310。

  G610其实和G710是一回事儿,只是核心数较少时单独使用的名字。

  这是ARM Valhall GPU架构的第三代产品,也是第一次完整覆盖高中低端各个领域。

  搭配同时发布的Cortex-X2/A710/A510 CPU、CoreLink CI-700一致性互连技术、CoreLink NI-700芯片网络一起,它们可以构成完整、强大的SoC解决方案。

  虽然架构变化不大,只是继续优化提升,但是这一代Mali GPU的性能进步还是很可观的:

  G710号称综合性能提升20%、机器学习性能提升35%、纹理性能提升50%、能效提升20%。

  G510综合性能提升100%、机器学习性能提升100%、能效提升22%。

  G310虽然定位最低但变化最大,号称纹理性能提升多达6倍、Vulkan性能提升4.5倍、安卓UI内容性能提升2倍。

  G710的执行引擎设计和G77、G78十分相似,变化更多是一些细节。

  wavefront/warp大小从8翻番到了16,而且 每个执行引擎有两个数据路径 ,最终形成每个核心32个FMA。

  ISA指令集也有了不小的改进,可以更好地满足Vulkan等现代GPU的需求 ,但暂无细节。

  G710还新增了一个执行引擎 ,每个着色器核心的计算性能因此翻番,同时每核心每时钟周期的不同吞吐量也有4倍、8倍的增加。

  纹理单元也是全新的,每时钟周期可以处理最多80亿纹理,再加上面积优化,单位密度纹理性能提升了50%。

  16宽度执行单元单实例变成了4宽度四实例,整体吞吐量不变,但是资源分配更合理,效率更高。

  新的执行引擎每核心每时钟周期FMA翻了一番,同时功耗也优化降低了20%。

  另外,传统的工作管理器(Job Manager)变成了 新的“指令流前端”(Command Stream Frontend) ,负责调度和处理draw-call,还第一次带来了固件层,与硬件紧密配合处理主机需求。

  G710可以配置8-16个不同核心数,G610则是最多6个核心 ,另外二级缓存可以配置2个或4个区块,每个区块256KB或者512KB, 也就是整体最小512KB,最多2MB。

  G510支持2-6个核心配置 ,每核心每执行单元的配置也可以定制,纹理单元也大大加强。

  执行引擎还是2个,但也可以配置为只用1个 ,每时钟周期64 FMA会因此减少到48 FMA。

  ARM列举了G510 10种可能的不同规格配置,计算能力、填充率各有不同,适合不同应用需求。

  G310虽然定位最低,但这次升级力度最大,终于抛弃了古老的Bifrost架构。

  它因此有了新的执行引擎设计,支持灵活的规模配置,每核心可以有16、32、48、64 FMA,纹理单元最低则是每时钟周期2个。

  不过, G310仅支持单核心设计。

  【来源:快科技】【作者:上方文Q】

网友评论

三日内热门评论文章
热门IT产品
  1. ¥7599
    苹果iPhoneX 64GB
    ·
  2. ¥5799
    三星S9
    ·
  3. ¥4498
    vivo NEX旗舰版
    ·
  4. ¥4999
    OPPO Find X
    ·
  5. ¥1799
    努比亚Z18mini
    ·
  6. ¥1499
    OPPO A5
    ·
  7. ¥1999
    荣耀Play(4GB RAM)
    ·
  8. ¥1598
    vivo Y85
    ·
  9. ¥3499
    坚果R1(6GB RAM)
    ·
  10. ¥3599
    一加6(8GB RAM)
    ·
为您推荐
  • 相关阅读
  • 业界资讯
  • 手机通讯
  • 电脑办公
  • 新奇数码
  • 软件游戏
  • 科学探索