面向付费用户,ChatGPT网页版上线高级语音模式!

seekdeep5个月前AI资讯180

日前 OpenAI 方面宣布,ChatGPT 网页版已正式上线高级语音模式(Advanced Voice Mode),并同样将面向 ChatGPT Plus、Team、Enterprise 和 Edu 的付费用户开放。据悉,目前付费用户在 ChatGPT 网页版中点击窗口右下角的语音图标,即可启动这一模式。

据官方介绍,ChatGPT 的高级语音模式是基于多模态大模型 GPT-4o 打造,可提供自然的实时对话、允许用户随时打断,并且还能感知或响应用户的情绪语调,包括悲伤、兴奋等。同时用户可以通过设置自定义指令来定制 ChatGPT 的说话方式,例如让其以特定的节奏说话、发音清晰、慢速说话,以及定期使用用户的名字等。

6742fed58e9f0940ba3eb07a_1024.jpg

此外,ChatGPT 高级语音模式还具备 Arbor、Maple、Sol、Breeze、Juniper、Cove 等九种不同风格的声音,用户可按照喜好自行选择。不仅如此,ChatGPT 还可使用 50 种语言说 " 对不起,我迟到了 ",并能根据谈话的语气调整声音,而在不需要交谈时就会保持安静。

值得一提的是,据 OpenAI 首席产品官 Kevin Weil 透露,目前正在优化 ChatGPT 高级语音模式的交互方式,以减少其 " 打断感 ",但在此之前还是建议用户在开口前先梳理清楚自己的语言。此外他还表示,该功能未来也将面向免费用户开放。

事实上此前在 7 月底,OpenAI 方面就向部分 ChatGPT Plus 订阅用户开放了高级语音模式,并宣布布将在今年秋季逐步向所有订阅用户开放该模式。随后在 9 月,这一功能正式在 ChatGPT 的 iOS 和 Android 端应用上线,并逐步覆盖了所有订阅用户。

据了解,不久前 ChatGPT 还新增了搜索功能,可根据网络上搜索的实时信息生成回答,并且用户可以在回答下方点击 "Sources" 按钮、打开侧边栏查看相关信息的来源链接,从而更便利地追溯源头。此外 OpenAI 方面还透露,计划在未来将新的搜索体验引入 ChatGPT 高级语音模式和画布界面(Canvas)。

相关文章

OpenAI推出在线商店GPT Store ,谷歌被起诉索赔16.7亿美元

OpenAI 宣布正式向 ChatGPT Plus、开发团队和企业用户推出 GPT Store,自发布 GPTs 两个月以来,用户已经创建了超过 300 万个 ChatGPT 自定义版本。奇点计算公司...

伯克利团队最新论文:用训练GPT的方法训练人形机器人

一台人形机器人在人行道、混凝土、沥青、广场和沙路上“散步”,这不是科幻电影的场景,而是已经发生在旧金山街头的真实事件。这一人形机器人项目也引起了Sora团队的注意。“不可思议的成果!”Sora负责人之...

GPT-4o语音模式部分开放,秋季覆盖所有付费用户

继此前 OpenAI 方面在今年 5 月发布多模态大模型 GPT-4o,原计划今年 6 月开放语音模式的测试,随后以 " 需要改进模型检测和拒绝某些内容的能力 " 为由推迟后。当地...

蚂蚁首次公布AI应用矩阵;OpenAI已启动开发“GPT-5”;百度智能云推出“千帆行业增强版”

今日AI daily早新闻主要内容有:OpenAI宣布已启动下一代前沿模型训练,传言已久的“GPT-5”已经开始了;蚂蚁首次公布AI应用矩阵;百度智能云推出“千帆行业增强版”,加速行业大模型应用落地。...

OpenAI该放出“GPT-5”了,对手相继突破GPT-4!

终于,GPT-4独霸时代终结了!过去一个月里,四款大模型横空出世,在各项关键基准测试中与GPT-4相匹敌,甚至更胜一筹。谷歌Gemini 1.5突破100万个tokens,是GPT-4的近8倍,此外能...

除了编程能力大幅提升,还有更宽松的开源协议:DeepSeek 发布 V3 模型更新!

除了编程能力大幅提升,还有更宽松的开源协议:DeepSeek 发布 V3 模型更新!

和上周不少朋友期待的一样,新一周第一天的北京时间 3 月 24 日晚,DeepSeek 果然「突然」发布了模型更新。但暂时还不是 DeepSeek V4 或 R2,而是 DeepSeek V3 模型的...