
在中美科技角力愈演愈烈的当下,中国AI企业正悄然走出一条“去美化”的技术路径。近日,刚完成港股IPO的智谱AI宣布,其新发布的图像生成模型GLM-Image完全基于华为自研技术栈训练而成——从芯片到框架,全程未使用任何美国硬件或主流开源工具。这不仅是国产算力首次支撑起一个性能领先的开源多模态模型,也被视为中国AI产业在外部封锁下寻求自主突围的一次关键验证。
据智谱介绍,GLM-Image的整个训练流程——包括数据预处理、模型训练到最终部署——全部运行在华为昇腾Atlas 800T A2服务器上,搭载昇腾AI处理器,并采用华为自研的MindSpore机器学习框架。公司表示,希望这一实践能为行业提供一个可行的参考:“证明我们确实可以在没有美国芯片的情况下,训练出有竞争力的大模型。”
多模态能力被普遍看作下一代人工智能的核心。GLM-Image采用了一种融合自回归与扩散机制的混合架构,这种设计思路最早由谷歌DeepMind在其Nano Banana Pro模型中验证,能够同时高精度生成图像与文本。智谱称,该模型在开源阵营中,尤其在中文字符渲染方面表现突出,达到了行业领先水平。不过,它也坦承,与字节跳动尚未披露训练芯片信息的专有模型Seedream 4.5相比,仍有差距。
耐人寻味的是,就在智谱发布成果前不久,美国刚刚松口,允许英伟达向中国出售其H200芯片——仅次于最强H100的型号。但路透社随即披露,北京已指示海关拦截该芯片进口,并明确告知国内科技公司:除非特殊情况,否则不会批准采购。政策信号清晰而坚定:即便“放行”,也不等于“欢迎”。
现实挑战并未因此消失。一位知情人士透露,华为昇腾芯片在训练GLM-Image这类中等规模模型时表现尚可,但能否支撑智谱下一代旗舰大模型GLM-5,仍是未知数。目前,中国绝大多数顶尖AI模型仍依赖英伟达芯片。真正公开使用国产芯片训练的案例,多来自科大讯飞等二线玩家——而这些企业,恰恰是早年就被美国列入黑名单的对象。智谱自身也在去年1月被加入同一出口管制清单。
与此同时,官方正大力推动开发者从TensorFlow、PyTorch等美系框架转向MindSpore等国产替代。但多个开源平台数据显示,MindSpore的社区活跃度和生态成熟度,与国际主流仍有不小差距。技术可以追赶,生态却需要时间沉淀。
智谱的这次尝试,或许还不能彻底改写格局,但它至少证明了一件事:在封锁之下,中国AI并非无路可走。只是这条路,注定更陡、更长,也更需要耐心。