面向付费用户,ChatGPT网页版上线高级语音模式!

seekdeep1年前AI资讯353

日前 OpenAI 方面宣布,ChatGPT 网页版已正式上线高级语音模式(Advanced Voice Mode),并同样将面向 ChatGPT Plus、Team、Enterprise 和 Edu 的付费用户开放。据悉,目前付费用户在 ChatGPT 网页版中点击窗口右下角的语音图标,即可启动这一模式。

据官方介绍,ChatGPT 的高级语音模式是基于多模态大模型 GPT-4o 打造,可提供自然的实时对话、允许用户随时打断,并且还能感知或响应用户的情绪语调,包括悲伤、兴奋等。同时用户可以通过设置自定义指令来定制 ChatGPT 的说话方式,例如让其以特定的节奏说话、发音清晰、慢速说话,以及定期使用用户的名字等。

6742fed58e9f0940ba3eb07a_1024.jpg

此外,ChatGPT 高级语音模式还具备 Arbor、Maple、Sol、Breeze、Juniper、Cove 等九种不同风格的声音,用户可按照喜好自行选择。不仅如此,ChatGPT 还可使用 50 种语言说 " 对不起,我迟到了 ",并能根据谈话的语气调整声音,而在不需要交谈时就会保持安静。

值得一提的是,据 OpenAI 首席产品官 Kevin Weil 透露,目前正在优化 ChatGPT 高级语音模式的交互方式,以减少其 " 打断感 ",但在此之前还是建议用户在开口前先梳理清楚自己的语言。此外他还表示,该功能未来也将面向免费用户开放。

事实上此前在 7 月底,OpenAI 方面就向部分 ChatGPT Plus 订阅用户开放了高级语音模式,并宣布布将在今年秋季逐步向所有订阅用户开放该模式。随后在 9 月,这一功能正式在 ChatGPT 的 iOS 和 Android 端应用上线,并逐步覆盖了所有订阅用户。

据了解,不久前 ChatGPT 还新增了搜索功能,可根据网络上搜索的实时信息生成回答,并且用户可以在回答下方点击 "Sources" 按钮、打开侧边栏查看相关信息的来源链接,从而更便利地追溯源头。此外 OpenAI 方面还透露,计划在未来将新的搜索体验引入 ChatGPT 高级语音模式和画布界面(Canvas)。

相关文章

UC伯克利仅使用当前模型检查点预测未来模型,GPT-5涌现能力可预测?!

LLM 规模扩展的一个根本性挑战是缺乏对涌现能力的理解。特别是,语言模型预训练损失是高度可预测的。然而,下游能力的可预测性要差得多,有时甚至会出现涌现跳跃(emergent jump),这使得预测未来...

Canvas来了,可辅助完成编程、写作,ChatGPT史诗级大更新!

OpenAI重磅更新了ChatGPT新增功能——Canvas。据悉,Canvas是基于GPT-4o模型开发而成,它提供了一个单独的窗口,可以与ChatGPT一起执行编程、写作任务,会帮你提供意见、审核...

又一次GPT式创业的Sora!

Sora让整个行业又兴奋起来。字节辟谣中国版Sora,周鸿祎火速“追星”,李一舟趁热卖课,一众上市公司夹杂着“颠覆性、里程碑、加速器”等关键词舞动资本市场。又一次创业机会,还是新一轮赶超焦虑,是看待S...

时间延迟且成本高昂,数据短缺,OpenAI的GPT-5训练遇阻!

OpenAI的新一代人工智能项目GPT-5(代号Orion)正面临重重困难。该项目已开发超过18个月,成本花费巨大,却仍未取得预期成果。有知情人士透露称,OpenAI的最大“金主”微软原本预计能在20...

GPT-5红队测试邮件曝光,数十亿美元超算26年启动。

陆续有网友晒出OpenAI发给自己的红队邀请邮件,看起来,GPT-5已经进入红队测试了?网友们纷纷展开畅想,对Sam Altman在线「催更」。另有消息曝出,OpenAI的一个mini版数十亿「星际之...

成功率从1%暴涨至88%-过去时态让GPT-4o防线崩塌

最高端的大模型,往往需要最朴实的语言破解。来自EPFL机构研究人员发现,仅将一句有害请求,改写成过去时态,包括GPT-4o、Llama 3等大模型纷纷沦陷了。将一句话从「现在时」变为「过去时」,就能让...