官方微信号

详细信息
当前位置: 首页 > 业务发展 > 电子科技
利来国际最老:产业丨CPU、GPU、N究竟谁才是[AI PC
发布日期:2024-04-20 09:44:39 来源:利来资源站首页 作者:利来资源首页入口
  通用 CPU和GPU服务平台在功耗和散热受限的终端上的运用,其差异性需求难以应对AI用例严苛且多样化...

  通用 CPU和GPU服务平台在功耗和散热受限的终端上的运用,其差异性需求难以应对AI用例严苛且多样化的计算要求。

  算力是实现 AI PC各项功能的前提,终端异构混合(CPU+NPU+GPU)算力或许是AI规模化落地的要求。

  CPU擅长顺序控制,适用于需要低延时的场景,同时也能够处理较小的传统模型,如卷积神经网络(CNN)或特定的大语言模型(LLM)。

  NPU则采用数据驱动并行计算的架构,模拟人类神经元和突触,特别擅长处理视频、图像等海量多媒体数据。

  与遵循冯诺依曼架构的CPU和GPU不同,NPU通过突触权重实现存储计算一体化,运行效率更高,尤其擅长推理。

  相较于传统的中央处理器(CPU)和图形处理器(GPU),NPU在执行神经网络任务时展现出更高的效率和更低的功耗。

  虽然FPGA在灵活性和可编程性方面同样出色,但主流的FPGA芯片制程节点通常在14纳米至45纳米之间;

  而NPU的制程节点往往低于10纳米,因此更适合应用于小型、低功耗的消费级设备,如个人电脑和手机等。

  在软件层面,NPU具备与主流软件的高度兼容性。通过标准化的接口,如OpenCL、CUDA、OpenVX等,NPU能够轻松与各种人工智能框架进行交互,并顺利集成到不同的软件环境中。

  这使得开发者在模型开发和部署方面更加便捷,同时支持多种编程语言和框架,进一步降低了开发门槛。

  综上所述,NPU的高效能、低功耗、易于编程以及广泛的软件兼容性,使其成为人工智能应用中不可或缺的关键组件。

  英特尔近期发布了第14代酷睿Ultra移动处理器,该处理器内置了神经网络处理单元(NPU)。

  值得一提的是,AMD于2023年12月率先发布了锐龙8040系列处理器。这一系列处理器的核心变化之一便是新增了AI计算单元。

  这款处理器是英特尔40年来的首款内置NPU的产品,旨在在PC上提供高效能的AI加速和本地推理体验。

  此外,微软计划在Windows 12中为AI PC设定最低门槛,要求至少具备40TOPS的算力和16GB的内存。

  在GPU领域,英伟达RTX系列、AMD RX7000系列以及英特尔ARC系列独立显卡均内置独立的AI计算单元。

  然而,英伟达并不生产消费级PC CPU,因此其显卡AI功能更新主要围绕显卡本身,如AI视频超分、AI色彩强化、AI音频降噪及AI语音聊天等,似乎主张[AI PC仅需显卡算力]。

  英特尔ARC独显虽有XMX矩阵计算单元,但新一代集成于CPU的ARC核显已取消此设计,使其MTL架构CPU仅依赖内置NPU作为独立AI计算单元。

  AMD在CPU中采用源自其企业级计算卡的XDNA成熟架构作为NPU单元,理论上具有软件适配优势。

  然而,在RDNA 3独显架构中,AMD似乎采用了不同的AI单元设计,导致尚未实现基于AI代码的游戏画面超分功能。

  此前许多显卡AI用例主要依赖GPU本身的浮点算力,相较于仅使用显卡内置AI单元的处理方式,功耗更高。

  理论上,CPU、GPU和NPU均可参与AI运算,并根据代码类型和任务负载实现自动分配的[异构协同]设计,如高通即将上市的骁龙X Elite系列所示。

  英特尔和AMD未来可能通过架构修正解决[算力不统一]问题,而英伟达虽无消费级x86 CPU产品线,但仍有可能通过ARM CPU进入Windows on ARM生态。

  根据现有证据,NPU因其对神经网络计算的独特优化,在端侧和边缘侧处理复杂神经网络算法时展现出卓越的效率与节能特性。

  这一现象正推动AI手机、AI PC及端侧AI市场的快速发展,预示着NPU的大规模商用时代即将到来。

  部分资料参考:三易生活:《CPU、GPU、NPU,究竟谁才是[AI PC]的主角?》,中国电子报:《AI PC元年将至,NPU到底怎么用?》,国际电子商情:《一文看懂神经网络处理器(NPU):AI算力加速的新方向》,DeepTech深科技:《GPU之后,NPU再成标配,手机、PC如何承载AI大模型?》,半导体行业观察:《为何都盯上了NPU?》,科技行者:《为什么AI PC需要颗强大的NPU?》,与非网:《与GPU双向奔赴,NPU即将开启大规模商用时代》,电子发烧友网:《生成式AI加速向终端侧演进,NPU、异构计算提供强大算力支持》

  本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。