
在美国对高端芯片出口持续收紧的背景下,中国科技公司正悄悄把人工智能大模型训练的“主战场”挪到海外。这并非仓促应变,而是在现实约束下的一种策略性迂回——既要追赶全球AI竞赛的步伐,又得绕开地缘政治设下的路障。
据两位直接知情人士透露,阿里巴巴和字节跳动如今已在东南亚多地的数据中心部署其最新大型语言模型的训练任务。他们的目标很实际:拿到英伟达最先进的芯片。毕竟,训练顶尖大模型离不开强大的算力,而目前市面上最高效的硬件,仍牢牢掌握在这家美国公司手中。
新加坡和马来西亚成了首选落脚点。过去一年,这两个国家的数据中心集群迅速扩张,背后推手正是来自中国企业的强劲需求。这些设施里,不少都配备了与美国科技巨头同级别的高端英伟达芯片。“来这里是显而易见的选择,”一位新加坡本地数据中心运营商坦言,“你要训练最前沿的模型,就得用最好的芯片,而且在这里做,完全合法合规。”
这种操作之所以行得通,还得归因于美国政策自身的反复。拜登政府曾推出“扩散规则”,试图堵住中国企业通过租赁海外算力绕过制裁的漏洞,但这项规定在今年早些时候被特朗普总统废除。于是,中国企业便通过与非中资背景的海外数据中心签订租赁协议,在形式上规避了出口管制的红线。
在这波海外布局中,阿里巴巴的通义千问(Qwen)和字节跳动的豆包模型表现亮眼,已跻身全球顶尖大模型行列。尤其是Qwen,因其开源属性,甚至在海外开发者社区中广受欢迎。不过,并非所有玩家都选择出海。深度求索(DeepSeek)就是一个例外——它在美国出口禁令生效前就囤积了大量英伟达芯片,至今仍在境内训练模型。更值得注意的是,它正与华为等国产芯片厂商紧密合作,共同打磨下一代本土AI芯片。华为甚至派工程师常驻DeepSeek位于杭州的总部,把这次合作视为推动国产软硬件在全国AI训练场景落地的关键一步。
当然,海外训练也有边界。中国法规严禁将境内用户的私有数据带出境。这意味着,一旦需要基于特定客户数据定制模型,训练就必须留在国内完成。正因如此,越来越多企业开始转向国产芯片处理“推理”任务——也就是模型响应用户请求的过程。这部分工作虽然不如训练那么吃算力,但在整体AI负载中的比重正不断上升。
除了训练模型,东南亚的数据中心还承担着服务海外客户的功能。阿里云和字节跳动正借力这些节点,加速拓展全球云计算市场。与此同时,中国企业也在中东等地布局数据中心接入能力,试图构建一张更广泛的国际算力网络。
说到底,在这场全球AI竞速中,中国科技公司一边借海外资源维持技术前沿地位,一边加速培育本土生态。外部封锁越紧,内部突围的动力反而越强。而这场博弈的真正终点,或许不只是谁拥有更强的芯片或更大的模型,而是谁能真正掌握技术自主的主动权。