DeepSeek的普及推动了业界普遍认同算力成本下降将成为一种发展态势,然而,究竟采取何种具体策略尚未有定论。在6月13日举办的“2025红帽媒体Open讲”线下论坛中,红帽公司提出了独到的见解和切实可行的行动计划,为行业的持续发展注入了新的活力。
推理元年开启
在本次交流活动中,红帽公司的全球副总裁及大中华区首席代表曹衡康强调,今年标志着人工智能推理时代的开启。随着人工智能技术步入推理阶段,各类AI应用将全面启动,为各企业带来包括业务收入提升和内部成本降低在内的实际利益。这一转变预示着人工智能将从学术研究范畴向更广泛的实际应用领域延伸。
主流技术方向
王慧慧,担任红帽大中华区方案架构部总经理,指出当前推理技术栈领域呈现两大显著趋势;红帽公司已确定其战略倾向为“vLLM”;这一高性能大语言模型推理框架已在开源社区确立为事实标准推理服务器;同时具备多种加速器和分布式部署的能力;目前,在生产环境中已被广泛应用。中国研究者在科研领域展现出了非凡的才华,他们所做出的贡献占据了社区总贡献的35%,这一比例数据显著地揭示了中国在推理研究领域的广泛参与以及其光明的发展潜力。
技术难点待破
王慧慧指出,推理技术领域正遭遇两大核心挑战。首先,如何在有限的硬件资源和较低的经济投入条件下,达成高效的推理性能;其次,如何避免推理任务过度依赖单一服务器,转而构建一个分散式的推理系统。这两个问题的解决对推动推理技术的持续发展至关重要。
推出推理服务器
通过对相关行业和技术背景的深入研究,红帽公司在2025年发布了其新的推理服务器产品。该服务器的一大特色在于显著减少了企业的计算能力成本。特别值得关注的是,红帽公司明确指出,他们并未涉足硬件制造领域,而是致力于软件领域的发展,通过在软件层面进行优化,旨在达到降低计算能力成本的目的。
企业应用展望
算力成本正显著下滑,AI技术在多领域展现出广阔的应用前景。曹衡康指出,当前AI技术的推广受到成本门槛的制约,但随着成本逐步下降,预计使用AI技术的企业数量将大幅提升,可能从原先的1000家迅速增至1万家、10万家,甚至有可能突破100万家。同时,这一趋势也将带动GPU需求量的显著增长。
芯片需求态势
曹衡康指出,考虑到算力成本未来可能减少,芯片算力卡的市场需求可能发生转变。目前,人工智能技术的应用领域还相对狭窄。成本的降低将使更多企业能够负担AI技术,这有望推动GPU使用量的提升。红帽公司正致力于降低使用AI技术的门槛,旨在吸引更多企业投身这一领域。
人工智能行业正迎来飞速进步,红帽公司随之推出了推理服务器及相关理论阐述,其能否催生行业新的增长活力尚需进一步观察。我们诚挚地邀请各位读者在评论区发表您的见解。同时,恳请您对本文给予点赞,并积极分享至您的社交圈。