面向付费用户,ChatGPT网页版上线高级语音模式!

seekdeep8个月前AI资讯291

日前 OpenAI 方面宣布,ChatGPT 网页版已正式上线高级语音模式(Advanced Voice Mode),并同样将面向 ChatGPT Plus、Team、Enterprise 和 Edu 的付费用户开放。据悉,目前付费用户在 ChatGPT 网页版中点击窗口右下角的语音图标,即可启动这一模式。

据官方介绍,ChatGPT 的高级语音模式是基于多模态大模型 GPT-4o 打造,可提供自然的实时对话、允许用户随时打断,并且还能感知或响应用户的情绪语调,包括悲伤、兴奋等。同时用户可以通过设置自定义指令来定制 ChatGPT 的说话方式,例如让其以特定的节奏说话、发音清晰、慢速说话,以及定期使用用户的名字等。

6742fed58e9f0940ba3eb07a_1024.jpg

此外,ChatGPT 高级语音模式还具备 Arbor、Maple、Sol、Breeze、Juniper、Cove 等九种不同风格的声音,用户可按照喜好自行选择。不仅如此,ChatGPT 还可使用 50 种语言说 " 对不起,我迟到了 ",并能根据谈话的语气调整声音,而在不需要交谈时就会保持安静。

值得一提的是,据 OpenAI 首席产品官 Kevin Weil 透露,目前正在优化 ChatGPT 高级语音模式的交互方式,以减少其 " 打断感 ",但在此之前还是建议用户在开口前先梳理清楚自己的语言。此外他还表示,该功能未来也将面向免费用户开放。

事实上此前在 7 月底,OpenAI 方面就向部分 ChatGPT Plus 订阅用户开放了高级语音模式,并宣布布将在今年秋季逐步向所有订阅用户开放该模式。随后在 9 月,这一功能正式在 ChatGPT 的 iOS 和 Android 端应用上线,并逐步覆盖了所有订阅用户。

据了解,不久前 ChatGPT 还新增了搜索功能,可根据网络上搜索的实时信息生成回答,并且用户可以在回答下方点击 "Sources" 按钮、打开侧边栏查看相关信息的来源链接,从而更便利地追溯源头。此外 OpenAI 方面还透露,计划在未来将新的搜索体验引入 ChatGPT 高级语音模式和画布界面(Canvas)。

相关文章

这个工业“GPT”有何不同:向“新”发力!

当工业互联网遇到人工智能,会产生怎样的化学反应?“过去我们的生产线发生故障时,处理流程是人员接到设备报警信息后赶到现场,查找是哪台设备发生了故障,然后出维修方案,整个处理周期基本在四小时以上。应用我们...

设计行业变革,如何让GPT变身设计界黑马?

最近不少修图软件都开始推出生成式AI功能了,比如这两周大火的Remini、Lensa可以根据照片内容生成其他风格的图片,老牌的Canva也接入了AI实现图像生成功能。不过想要不受限制的使用这些工具,用...

解锁大模型时代的无限可能,从GPT-3到Sora

从2020年OpenAI的GPT-3到2023年的GPT-4再到2024年的文生视频模型Sora,我们见证了大模型领域创新速度之快。从百度、阿里和360等为代表的头部科技企业率先入局到互联网公司、AI...

AI视频生成迎来“GPT时刻”,Sora火爆全球

继Runway、Pika、字节PixelDance、万兴“天幕”发布,2月16日凌晨,“王炸”模型Sora横空出世,AI视频生成迎来“GPT时刻”。在Open AI公布的48个样片中,Sora展现出令...

又一次GPT式创业的Sora!

Sora让整个行业又兴奋起来。字节辟谣中国版Sora,周鸿祎火速“追星”,李一舟趁热卖课,一众上市公司夹杂着“颠覆性、里程碑、加速器”等关键词舞动资本市场。又一次创业机会,还是新一轮赶超焦虑,是看待S...

让六大科技巨头市值狂飙8万亿。ChatGPT迎来“两岁生日”,自己却官司缠身,或面临数十亿索赔!

两年前的11月30日,OpenAI推出的生成式聊天模型ChatGPT横空出世,并迅速成为史上用户增长速度最快的应用程序之一。据美国国家广播公司2023年11月30日报道,在推出一年的时间里,从撰写电子...