当前位置：首页 / 资讯 / 正文

成本最高降90% 百度发布端到端语音语言大模型

资讯 2025-03-31 18:00:03 11

摘要：3月31日消息，百度发布业界首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型，实现超低时延与超低成本，在电话语音频道的语音问答场景中，调用成本较行业均值下降约50%-9...

3月31日消息，百度发布业界首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型，实现超低时延与超低成本，在电话语音频道的语音问答场景中，调用成本较行业均值下降约50%-90%。

据悉，接入全新的端到端语音语言大模型后，文小言不仅能支持更拟真的语聊效果，而且支持重庆、广西、河南、广东、山东等特色方言。

据介绍，语音大模型具备极低的训练和使用成本，极快的推理响应速度，语音交互时，可将用户等待时长从行业常见的3-5秒降低至1秒左右。

今日，百度还宣布文小言更新，更新后的文小言支持“多模型融合调度”，通过整合百度自研的文心X1、文心4.5等模型，并接入DeepSeek-R1等第三方优质模型，实现了多模型间的智能协同。用户可以选择“自动模式”，一键调用最优模型组合，也可根据需求灵活选择单一模型完成特定任务，大幅提升响应速度与任务处理能力。

同时，文小言还加强了图片问答功能，用户拍摄或上传图片，以文字或语音提问即可直接获取深度解析。(定西)

本文来自网易科技报道，更多资讯和深度内容，关注我们。

上一篇：译者手记｜科幻是现实对未来的期许，也是未来对现实的折射下一篇：宇树科技王兴兴的早期故事：还原天使轮投资人当年的坚定、纠结与今天的新期望

成本最高降90% 百度发布端到端语音语言大模型

[ 推荐 ] 相关文章