这个十一黄金周,AI圈真的很热闹。
10月1日凌晨,OpenAI深夜炸场,正式官宣新一代AI视频模型Sora 2,并直接上线了一个AI版的“抖音”——一个完全由AI来生成视频的短视频平台。
就在Sora 2发布之前,这一轮的大模型发布其实已经卷起来了。
黄金周前夕,先是国内大模型公司深度求索宣布推出DeepSeek-V3.2-Exp实验版模型,紧随其后智谱AI正式发布新一代大模型GLM-4.6。
中国大模型也引起了图灵奖得主杨立昆的关注。就在9月30日,蚂蚁集团旗下百灵大模型宣布开源其思考模型Ring-1T的预览版Ring-1T-preview,参数量达1000B(1万亿)。“令人印象深刻,祝贺你们的团队。”在百灵最新思考大模型发布后,杨立昆在社交平台上也给中国大模型点了赞。
![]()
而在大洋彼岸,Claude Sonnet 4.5同期发布。谷歌Gemini 3.0也预计将在10月迎战。
显然,全球大模型进入了一个新的井喷期,各家在大模型产品和技术迭代上,都在明显加速。据不完全统计,仅9月全球就有15家主流企业/机构发布了开源大模型,数量较8月激增70%。
开源大模型的热潮,也是开发者的盛宴。有开发者都在社交媒体上感慨:一天测了3个模型,还有一个没测试,这还只是周一……
![]()
在这其中,中国大模型凭借场景化能力,正撕开半壁江山。
据光锥智能观察来看,这一波AI大模型的更新,更聚焦在细分场景中,比如智谱最新大模型在编程方面的能力更加突出,蚂蚁的百灵大模型则聚焦在自然语言推理领域。
更为重要的一点在于,当OpenAI开始学字节跳动做产品时,大模型市场的游戏规则变了。如果说,2023年讨论大模型参数天花板,那么,2025年,大模型真正的战场则在场景适配与效率革命。
从OpenAI的Sora 2到蚂蚁的万亿推理模型,新一轮的大模型“军备竞赛”已然打响,而行业共识则愈发清晰:大模型已从“通用能力比拼”迈入“细分技术突围”的深水区。
那么,在这新一轮AI大模型竞赛中,后来者又该如何在开源生态中突围?
深度盘点9月大模型,AI大模型“百花齐放”
金九银十的月份,各行各业都在持续加码,大模型赛道也同样“卷”的不行。
据不完全统计,在刚刚过去的9月,全球数十家企业共计发布了40多款大模型产品,涵盖基础通用大模型、深度思考推理大模型、编程、具身智能、翻译、视频生成等不同细分赛道。
![]()
(海外开发者统计的部分9月开源模型)
具体来看,这些模型有的侧重高效推理,如带“Flash”字样的蚂蚁集团inclusionAI的Ring-flash-linear-2.0、美团LongCat Flash Chat;有的则聚焦多模态能力,如阿里通义Qwen3-VL;也有的针对轻量化/移动端,如Meta AI发布的MobileLLM-R1-950M、蚂蚁Ling-mini-2.0、Ring-mini-2.0等。
可以很明显看到,9月份AI大模型“通用能力、专用场景、部署形态”等维度的全面发展,不同厂商、不同技术路线的大模型“百花齐放”,构成了丰富的LLM生态。
在这其中,中国大模型产品占据半壁江山,并与海外市场的大模型产品形成了技术分化。
具体来看,相比较此前各家关注的参数规模竞赛,现已经让位于效率革命,MoE(混合专家模型)架构成为绝对主流。
如蚂蚁百灵大模型最新开源的Ring-1T-preview,其底座Ring-1T是一个拥有万亿参数的深度思考模型,该开源模型延续Ling 2.0高效MoE架构,在20T高质量语料上完成预训练,结合此前公开的棒冰(icepop)方法,在自研高效强化学习系统ASystem(其中AReaL框架已开源)上进行针对推理能力的RLVR训练。
有苹果工程师在单个M3 Ultra芯片上运行Ring-1T-preview,量化的效果接近GPT-5,还能直接生成《太空侵略者》小游戏。
![]()
(苹果工程师量化后部署Ring-1T-preview,游戏模拟效果)
这种“大参数储备+小参数激活”的范式,解决了“性能与成本”的核心矛盾,使超大规模模型从实验室走向具体行业场景。
从对开发者开放角度来看,海外阵营中,谷歌EmbeddingGemma主打端侧隐私嵌入,Anthropic 开放 Claude Code API,仍停留在工具型开源。
但相比较来说,中国大模型产品更注重场景化能力,比如蚂蚁专攻自然语言推理,腾讯突破小语种翻译,形成“场景驱动型开源”。
这种差异在落地效果上立竿见影。如快手将Keye-VL 1.5嵌入审核系统,违规识别准确率达98.7%;爱诗科技的AI插画模型对接电商平台,把详情页制作成本降低80%。
事实上,中国大模型产品已经在各个细分领域全面开花,比如语音交互中,阶跃星辰Step-Audio 2 mini支持语音直接调用工具,某智能音箱厂商反馈“唤醒准确率提升至99.2%”;蚂蚁健康管家AQ产品识别报告、药盒、皮肤病等医疗图像准确率达90%以上,包括对100多种复杂多页检查报告的识别与解读。
在翻译领域,腾讯 Hunyuan-MT-7B 在 30 个语种翻译中夺冠,跨境电商卖家实测“小语种转化率提升27%”;同时,3D生成赛道中,腾讯混元Voyager可实现原生3D重建,游戏公司开发者称 “场景制作周期从 1 周缩至 4 小时”。
另外,值得关注的一点是,相比于大模型创业公司的单点输出,聚焦某一个细分行业,中国互联网大厂们正逐渐形成体系化的产品更新,覆盖基础通用大模型、深度思考大模型、编程大模型、多模态大模型、视频生成大模型等多品类大模型产品,典型的产品就是阿里巴巴旗下的通义千问、腾讯的混元大模型、字节跳动的豆包大模型等。
而这种生态优势,也正在转化为全球影响力。据Hugging Face最新数据显示,中文开源模型的fork量在9月增长180%。9月Hugging Face榜单显示,阿里通义7款模型占据全球前十开源模型席位,Qwen3-Omni 登顶榜首,标志着中国从“开源参与者”升级为“生态定义者”。
![]()
(9月28日, Hugging Face 模型榜单)
而中国大模型的“技术普惠+商业赋能”的开源模式,正在重塑全球AI产业格局。
“2023年我们追着OpenAI跑,2025年在金融推理、中文语音等领域,国外团队开始抄我们的作业。”一位深耕AI的连续创业者的调侃,道出了中国开源的新底气。
模型开源竞争激烈,新来者蓄势待发
为什么中国大模型能够如此快速实现赶超?
这背后离不开开源战略的选择。据《全球大模型开源生态报告》显示,中美开发者贡献占比超四成,尤其是中国厂商非常注重以“开放策略”抢占生态主动权。而就在今年初,始终坚持闭源路线的OpenAI也开始走开源路线。
相比较来说,中国最早且始终坚持走开源路线的阿里通义千问,已经在开源生态中占据了领导地位。那么,后来者还有机会吗?
9月,蚂蚁集团旗下百灵大模型以平均每4天一款的速度,密集发布了7款大模型:
5日推出“端侧双雄”Ling-mini-2.0与Ring-mini-2.0;12日上线MoE架构的Ling-flash-2.0,19日上线Ring-flash-2.0;26日推出2款混合架构推理优化模型Ring-flash-linear-2.0与Ring-mini-linear-2.0;30日以万亿参数的Ring-1T-preview压轴。
模型刚发布完,Ring-1T-preview就登上了开源社区Hugging Face模型趋势榜第三,第四名也是蚂蚁inclusionAI社区的Ring-flash-linear-2.0。