消息称OpenAI大力研发音频AI模型 为语音交互设备铺路
|
OpenAI 正在全面强化自身的音频人工智能能力,为未来推出一款以语音为核心的个人AI设备铺路。这款设备将以听觉交互为主要形式,而非依赖屏幕。 目前,ChatGPT的语音功能与文本回答背后所使用的模型并不相同。OpenAI内部研究人员认为,现有音频模型在准确性和响应速度上明显落后,因此公司在过去两个月内整合了工程、产品和研究力量,集中攻克音频模型短板。这一调整直接指向OpenAI的硬件目标——打造一款可通过自然语音指令操作的消费级设备。首款产品预计至少还需要一年时间才能面世。 随着新架构的引入,音频模型已能生成更自然、更富情感的语音回应,并具备与人类同时发声、应对打断的能力。OpenAI计划在2026年第一季度正式发布该模型。在硬件形态上,OpenAI与谷歌、亚马逊、Meta和苹果的看法相似:现有主流设备并非为未来的AI交互而生。OpenAI团队希望用户通过“说话”而非“看屏幕”与设备互动,认为语音才是最贴近人类交流本能的方式。 合作推进硬件项目的乔尼・艾维也强调,无屏幕设计不仅更自然,还有助于避免用户沉迷。他认为,新一代设备应当纠正以往消费电子产品带来的负面影响,并为此承担责任。然而,OpenAI目前仍面临现实挑战。不少ChatGPT用户并未习惯使用语音功能,这种情况不仅因为音频模型效果不彰,也与功能认知不足有关。在推出音频优先的AI设备之前,OpenAI必须先改变用户的使用习惯。 OpenAI已组建专门团队推进音频AI战略。来自Character.AI的语音研究员昆丹・库马尔负责整体方向,本・纽豪斯正在重构面向音频的底层架构,多模态ChatGPT的产品经理杰基・香农也参与其中。OpenAI并不仅打算推出一款设备,而是规划了一条产品线,包括智能眼镜和无屏幕智能音箱。公司内部设想这类设备将以“伴随式助手”的形态存在,主动理解环境和用户需求,并在获得授权的情况下,通过音频和视频持续提供帮助。 为支撑这一长期布局,OpenAI已在2025年初斥资近65亿美元收购乔尼・艾维联合创办的io,并同步推进供应链、工业设计与模型研发等多条工作线。 |
在线投稿
-
相关阅读
-
吹风机养生风潮兴起,这几类人群需谨慎使用!
-
张雪伯父,昔日默默无闻,今朝事业辉煌,揭秘他的成功之路
-
清明自驾出行高峰时段易拥堵,提前规划路线避堵攻略
-
洪秀柱郑丽文的十年接力,传承红色基因,共筑民族复兴梦
-
女子被骗10万不甘心,设局反钓骗子,最终成功挽回损失
-
今年蚊子为何提前出现?专家解读气候变化与蚊子繁殖的关系
-
盘点南京市民最关心的养老保险问题 从政策解读到实操指南
-
金价过山车水贝商家一夜盈亏超千万 市场情绪微妙波动
-
精彩图片
-
严重污染!印度首都河面漂浮大量有毒泡沫
-
金饰价格突破800元/克大关
-
绝美!北京朝霞遇到平流雾
-
美国给以色列派先遣队,援助的“萨德”也将启用?
-
以总理住宅遭无人机袭击 以方反应强烈
-
美政府紧急调查以色列报复伊朗计划外泄事件
-
以军袭击加沙地带北部拜特拉希亚地区已致73人死亡
-
加沙民众:每时每刻都有屠杀发生 我们已是活死人
-
新帖速递
-
吹风机养生风潮兴起,这几类人群需谨慎使用!
-
张雪伯父,昔日默默无闻,今朝事业辉煌,揭秘他的成功之路
-
清明自驾出行高峰时段易拥堵,提前规划路线避堵攻略
-
洪秀柱郑丽文的十年接力,传承红色基因,共筑民族复兴梦
-
女子被骗10万不甘心,设局反钓骗子,最终成功挽回损失
-
今年蚊子为何提前出现?专家解读气候变化与蚊子繁殖的关系
-
盘点南京市民最关心的养老保险问题 从政策解读到实操指南
-
金价过山车水贝商家一夜盈亏超千万 市场情绪微妙波动

精彩评论文明上网理性发言,请遵守评论服务协议
共0条评论