阶跃语音模型跻身全球前三中国第一

(AI 资源之家讯)5 月 9 日,全球权威 TTS 评测榜单 Artificial Analysis Speech Arena Leaderboard 更新,阶跃星辰语音生成模型 StepAudio 2.5 TTS 跻身全球前三,成为榜单排名最高的中国大模型。同时阶跃还发布了新一代实时语音大模型 StepAudio 2.5 Realtime,已全量上线开发者平台。

## 盲测听感评分的含金量

Artificial Analysis 榜单采用盲测听感评分机制,评审者不知道听到的语音来自哪个模型,纯粹根据自然度、表现力和可懂度打分。在这种公平环境下,StepAudio 2.5 TTS 跻身全球前三,排在前面的只有两家海外模型。这一成绩证明中国 AI 语音技术已达到世界顶级水平。阶跃的开源语音推理模型 Step Audio R1.1 已连续 4 个月霸榜 Speech Reasoning 全球第一。

## 实时语音模型的突破

与 TTS 排名同步发布的还有 StepAudio 2.5 Realtime 实时语音大模型。该模型支持情绪感知、多轮对话和实时推理,开发者可通过阶跃开放平台直接接入。实时语音模型的技术门槛远高于传统 TTS——它需要在毫秒级延迟下完成语音理解、推理和生成,同时还要感知说话人的情绪和语调变化。

## 语音 AI 的入口之争

阶跃在语音 AI 领域的持续投入,反映出一个行业共识:语音是人机交互的核心入口。OpenAI 刚发布了三款实时语音模型,谷歌也在 Gemma 系列中强化语音能力。语音 AI 的竞争正在从简单的文字转语音走向端到端的语音智能,阶跃以开源策略和评测排名双线并进,在全球语音 AI 竞争中占据了一席之地。

正文完
post-qrcode
 0
admin
版权声明:本站原创文章,由 admin 于2026-05-12发表,共计667字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。