OpenAI开发双向语音模型:被打断也能秒回 让通话更自然顺畅
|
快科技3月7日消息,据媒体报道,OpenAI正在研发一种全新的语音模型,旨在让用户与ChatGPT的对话更加自然流畅。这项技术的核心突破在于,当用户在AI说话过程中打断系统时,AI能够实时调整回应,而不是像现在这样突然停止。 目前ChatGPT的高级语音模式采用的是回合式对话机制,用户必须先说完话,AI才会处理语音并生成回答。如果用户在AI发言时插入okay或mm-hm等简短回应,系统通常会直接停止,无法像正常对话那样继续推进交流。 为解决这一问题,OpenAI正在开发的BiDi(双向语音模型)能够持续处理说话者的语音输入,因此在被打断时可以立即调整回应。相比之下,现有的语音模型一旦开始生成回答,输出内容就基本固定,无法再根据新的输入进行变化。 这项技术目前仍处于开发阶段。据知情人士透露,原型模型在持续对话几分钟后容易出现故障,有时甚至会发出不自然的声音。OpenAI研究人员原本希望今年第一季度发布BiDi,但目前最新的发布时间可能推迟到第二季度或更晚。 OpenAI认为,如果语音模型能够在性能上接近文本模型,AI的使用范围将进一步扩大,因为大多数人更习惯与AI进行语音交流,而不是输入文字。BiDi模型在客服场景中可能尤其有价值。 例如,当顾客与零售商的AI客服通话时,如果顾客在对话过程中临时决定选择换货而非退货,BiDi模型理论上可以让AI客服顺畅调整对话,而不会突然停止或出现混乱。 知情人士还透露,BiDi模型在调用外部工具和应用方面也更灵活。OpenAI此前表示,公司计划为未来一款主要通过语音交互的AI设备改进语音模型,并考虑开发一款智能音箱,通过语音指令即可查看邮件或预订服务。 |
在线投稿
-
相关阅读
-
美议员:外星生命报告会让民众睡不着 真相或将引发轩然大波
-
疑柬埔寨失联女孩露面自称曾遭猥亵 自述因“网恋奔现”前往
-
美联储戴利:零就业增长未必意味疲软 需更全面指标评估市场健康状况
-
钢铁森林 悬案追踪真相
-
清明之际 追思公安英烈 警徽永恒闪耀
-
江南华南等地将有较强降水 局地暴雨大暴雨
-
清明之际追思公安英烈 警徽永恒闪耀
-
全球对中国认可度超过美国 领先幅度创纪录
-
精彩图片
-
严重污染!印度首都河面漂浮大量有毒泡沫
-
金饰价格突破800元/克大关
-
绝美!北京朝霞遇到平流雾
-
美国给以色列派先遣队,援助的“萨德”也将启用?
-
以总理住宅遭无人机袭击 以方反应强烈
-
美政府紧急调查以色列报复伊朗计划外泄事件
-
以军袭击加沙地带北部拜特拉希亚地区已致73人死亡
-
加沙民众:每时每刻都有屠杀发生 我们已是活死人
-
新帖速递
-
美议员:外星生命报告会让民众睡不着 真相或将引发轩然大波
-
疑柬埔寨失联女孩露面自称曾遭猥亵 自述因“网恋奔现”前往
-
美联储戴利:零就业增长未必意味疲软 需更全面指标评估市场健康状况
-
钢铁森林 悬案追踪真相
-
清明之际 追思公安英烈 警徽永恒闪耀
-
江南华南等地将有较强降水 局地暴雨大暴雨
-
清明之际追思公安英烈 警徽永恒闪耀
-
全球对中国认可度超过美国 领先幅度创纪录

精彩评论文明上网理性发言,请遵守评论服务协议
共0条评论