AI 资源之家讯,刚刚过去的 5 月,注定成为中国 AI 大模型发展史上值得铭记的一个月份。腾讯混元 3.0 蝉联 OpenRouter 三周榜首只是序章,月之暗面 Kimi K2.6、深度求索 DeepSeek V4、快手可灵、阿里千问等头部玩家密集发布重磅更新,国产大模型在性能、功能和生态层面全面跃升,令全球开发者侧目。
Kimi K2.6:300 个子智能体并行,代码开发 5 天不间断
月之暗面 5 月推出的 Kimi K2.6 成为业界焦点。这款主打智能体能力的大模型,首次将长程代码开发能力推向了工业化级别:单次任务可并行调度 300 个子智能体,完成 4000 个协作步骤,持续代码开发时间最长可达 5 天。在实测中,Kimi K2.6 仅用 1 小时就构建了一个覆盖 34 个旅行目的地的中国探索网站,包含跳转购票和预约页面,将复杂任务的执行时间压缩至传统方式的 1 / 3 以下。
DeepSeek V4:百万 Token 上下文,价格仅为 GPT-5.5 的百分之一
深度求索则从另一个维度突破了国产大模型的天花板。DeepSeek V4 正式进入百万 Token 上下文时代,一次能处理约 75 万汉字的超长文本。在实测中,V4 将整部《西游记》(约 80 万字)投入推理后,仅用 9 秒钟就准确回答了涉及全书情节的复杂问题。更令人震撼的是其定价策略:V4-Flash 版百万 Token 输出仅需 0.28 美元,约为 GPT-5.5 的百分之一,同时推理计算量降至上一代模型的 27%,真正实现了用架构创新而非算力堆叠来降本。
可灵 4K 原生直出:影视级画质告别后期处理
快手可灵视频大模型 5 月迭代了全球首个原生 4K 直出功能,帮助影视制作者省去复杂的超分辨率后处理流程。这意味着 AI 生成的视频可以直接达到电影院线画质,且能更准确还原角色面貌,避免了后期放大导致的面部失真问题。有专业动画导演已使用该功能进行动画长片创作,从手稿到动态效果的完整工作流均可由 AI 辅助完成。
千问 3.6-Plus:40 亿商品数据库赋能智能购物
阿里千问则打通了与淘宝的生态壁垒,依托淘宝 20 年积累的 40 亿商品数据库,完成了一次电商场景的精准升级。用户只需用自然语言描述需求——比如想买扫地机器人且家里有猫——千问即可自动关联防毛发缠绕、高温消毒等属性标签,精准推荐匹配商品,实现了大模型与商业场景的深度耦合。
国产大模型 5 月的集体爆发,是中国 AI 产业从追赶到并跑再到局部领跑的缩影。在 OpenRouter 平台上,截至 5 月 4 日至 10 日当周,中国主要大模型周调用量已达 7.94 万亿 Token,超出美国模型同期 3.76 万亿的两倍以上。随着 FlagOS 等基础设施持续完善、更多国产芯片适配跟进,这场大模型军备竞赛的下半场,中国玩家已经拿到了不错的起手牌。