(AI 资源之家讯)5 月 7 日,千问在 PC 端正式上线 AI 语音输入能力,用户通过快捷键即可在各类桌面应用中直接使用。千问语音输入法支持去语气词、纠错、格式化整理,能基于上下文智能回复,还可下达创作、问答、翻译等指令,展现出极强的语义解析和文本重构能力。
## 从语音到结构化文本的跨越
千问语音输入的突出能力在于将口语化表达重构为结构化文本。日常语音输入最大的痛点是口语中大量的重复、犹豫和语气词,传统语音转写只能逐字记录,输出质量堪忧。千问语音输入则能在转写的同时自动去除语气词、修正口误并整理逻辑结构,输出的文本直接可用。在测试中,一段 3 分钟的口语化语音输入,经过千问处理后生成了一段逻辑清晰、措辞规范的工作邮件,无需二次修改。
## 全局可用与深度集成
千问语音输入的另一大亮点是全局可用。通过快捷键唤起后,用户可在任何桌面应用中直接使用,包括 Word、Excel、浏览器、邮件客户端等。这意味着用户无需切换应用或窗口,就能通过语音完成数据插入、翻译、邮件回复等操作。在跨应用工作流中,千问语音输入还可以基于上下文理解用户的意图,自动选择合适的操作模式。例如,用户在浏览器中说翻译这段话,千问会自动识别当前选中内容并进行翻译。
## 免费开放推动 AI 语音普及
千问语音输入功能已全面开放,所有用户均可免费使用。这一策略与千问一贯的普惠路线一致。目前市面上的 AI 语音输入产品多为付费功能,千问的免费开放将显著降低 AI 语音输入的使用门槛。随着语音交互技术的成熟,键盘和鼠标作为人机交互主流模式的地位正在被挑战,更自然、更高效的语音交互正在成为新趋势。
正文完