阶跃语音模型跻身全球前三中国第一

（AI 资源之家讯）5 月 9 日，全球权威 TTS 评测榜单 Artificial Analysis Speech Arena Leaderboard 更新，阶跃星辰语音生成模型 StepAudio 2.5 TTS 跻身全球前三，成为榜单排名最高的中国大模型。同时阶跃还发布了新一代实时语音大模型 StepAudio 2.5 Realtime，已全量上线开发者平台。

## 盲测听感评分的含金量

Artificial Analysis 榜单采用盲测听感评分机制，评审者不知道听到的语音来自哪个模型，纯粹根据自然度、表现力和可懂度打分。在这种公平环境下，StepAudio 2.5 TTS 跻身全球前三，排在前面的只有两家海外模型。这一成绩证明中国 AI 语音技术已达到世界顶级水平。阶跃的开源语音推理模型 Step Audio R1.1 已连续 4 个月霸榜 Speech Reasoning 全球第一。

## 实时语音模型的突破

与 TTS 排名同步发布的还有 StepAudio 2.5 Realtime 实时语音大模型。该模型支持情绪感知、多轮对话和实时推理，开发者可通过阶跃开放平台直接接入。实时语音模型的技术门槛远高于传统 TTS——它需要在毫秒级延迟下完成语音理解、推理和生成，同时还要感知说话人的情绪和语调变化。

## 语音 AI 的入口之争

阶跃在语音 AI 领域的持续投入，反映出一个行业共识：语音是人机交互的核心入口。OpenAI 刚发布了三款实时语音模型，谷歌也在 Gemma 系列中强化语音能力。语音 AI 的竞争正在从简单的文字转语音走向端到端的语音智能，阶跃以开源策略和评测排名双线并进，在全球语音 AI 竞争中占据了一席之地。

正文完

发表至： AI大模型

2026年5月12日

0

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

全球AI大模型调用量五连涨达28.9万亿Token：国产AI连续四周碾压美国

OpenAI微软修订合作协议:分成上限380亿美元节省970亿

教宗与Anthropic创始人将联袂发布AI通谕：全球最大宗教机构直面人工智能伦理大考

昆仑芯P800万卡集群完成文心5.1训练国产算力闭环

千问AI眼镜首发空间3D显示技术

阶跃语音模型跻身全球前三中国第一

苹果iOS 27全面转向AI：Siri独立App对标ChatGPT 苹果智能生态迎来最大重构

中国AI企业注册量首破70万产业加速扩张

企业将token消耗纳入绩效考核引发管理困境

福布斯中国AI科技企业TOP 50重磅发布：具身智能与大模型成最强赛道

GAITC 2026杭州落幕全球AI最强大脑齐聚具身智能与大模型成最热议题

阶跃语音模型跻身全球前三中国第一

苹果iOS 27全面转向AI：Siri独立App对标ChatGPT 苹果智能生态迎来最大重构

中国AI企业注册量首破70万产业加速扩张

企业将token消耗纳入绩效考核引发管理困境

福布斯中国AI科技企业TOP 50重磅发布：具身智能与大模型成最强赛道

GAITC 2026杭州落幕 全球AI最强大脑齐聚 具身智能与大模型成最热议题

GAITC 2026杭州落幕全球AI最强大脑齐聚具身智能与大模型成最热议题