AI大模型“下半场”：边缘计算成为重点

如果说大模型“上半场”是技术的较量，那么“下半场”则是商业化的比拼。

无可置疑，大模型将解决掣肘AI落地的碎片化难题，并极大地削减研发成本，给AI带来质的飞跃，使其具备更大的想象空间。但这只能算是阶段性胜利，只有客户乖乖掏出钱包里的金币，并持续复购，产生价值，AI才算取得成功。

当前，国内大模型正处于“练模”阶段，需要极强的算力支撑，因此AI公司们将目光更多放在了训练芯片上，即购买大量的GPU算力来训练算法模型。这也直接成就了Nvidia的万亿市值神话，其H100、H800等芯片一骑绝尘，国内则有华为、寒武纪等厂商在努力追赶。

一旦大模型成熟，与之而来的便是落地应用，这时必然要用到边端设备，从而滋生出对推理芯片的庞大需求。

半导体.jpg

这个AI商业闭环中，还涉及到一个部署成本的问题。

AI不是消费电子，即买即用，尽管其常常被嵌入至各类电子设备中。但AI的消费大户，仍是以降本增效为目的的B/G客户。这类客户对于AI的最后一公里交付尤为重视，他们并不愿意为AI方案的部署花费任何多余的金币。

传统AI部署常见于云端一体，主要通过云端进行计算，感知端仅有微弱算力，数据在端侧采，算法在云上跑。这种模式存在几个问题：

云计算固然有大算力的好处，但对于一些需要快速响应、计算的场景，其存在的时滞现象非常致命；

云服务器费用高昂，许多企业并不需要大算力，盲目上云反而会造成算力浪费，性价比不高；

数据上云，存在一定安全风险，为此，AI公司们在云端一体之间，增加了边缘计算，来解决云端算力浪费及端侧算力不足的问题。

边缘计算的灵感得益于章鱼的八只触手。作为云端计算的协同和补充，边缘计算能够在数据源头附近的网关执行数据处理、分析，这种独特的优势可以实现各单元之间执行不同的任务并实现多任务协同，既满足碎片化场景的算力调度需求，又具备低延时、安全等特点。

并且，边缘计算设备的部署成本相对较低，客户不需要部署昂贵的云服务器就能用上AI，这一核心优势使得边缘计算备受青睐，已然成为AI落地的重要途径之一。

但要真正让算法模型在边缘计算设备上跑起来，仍有两个比较重要的难点。

第一，边缘设备的算力比云端服务器弱，而大部分的算法模型，是在服务器上训练的，算法模型要实现迁移，需要做大量的优化工作。

第二，算法模型要在边缘设备上部署、执行推理任务，需要一颗强大的AI算力芯片，并针对芯片做适配，才能保证算法模型的运行效率。也就是说，AI算力芯片的生态极其重要，但现阶段比较尴尬的是，AI算力芯片厂商较为分散。

可以预见的是，在大模型时代，第一个问题较为容易解决，因为大模型自带极强的泛化能力。至于第二个点，则要比想象中难得多，其涉及到底层芯片技术的研发和攻关，以及对应的生态协同。如何让边缘设备运行大模型，对于AI芯片厂商而言，这既是机遇，也是挑战。

本文由小熊AI网发布，不代表小熊AI网立场，转载联系作者并注明出处：https://www.xiaoxiong360.com/html/industry/1546.html