ChatGPT全新语音模式:在聊天界面内实现无缝语音交互

OpenAI宣布ChatGPT应用已更新,语音模式现在可以直接在聊天界面内使用,无需切换至独立界面。用户可以边听语音回复边查看实时文字转录,并浏览包含图片、网页等视觉内容的完整对话历史。

OpenAI宣布,用户现在无需离开对话界面即可在ChatGPT中使用语音模式。这一功能增强已随应用更新推出。

此前,如果你想使用语音与聊天机器人互动,必须点击波形图标。这将使你离开聊天界面,跳转至一个独立的语音交互界面。在该界面中,ChatGPT会聆听你的语音指令,生成回复并朗读出来。 (图片来源:ChatGPT/OpenAI) 最新的更新改变了这一流程。现在,当你点击ChatGPT应用中的波形按钮时,它不再切换到单独的模式,而是继续在当前聊天中进行互动。你将在屏幕上看到机器人回复的实时文字转录。OpenAI表示,这种内联语音模式非常有用,因为它允许用户回顾聊天中的先前消息。回复内容还会根据需要包含图像、网页、地图等视觉内容。

在对话过程中,用户可以随时切换回文本输入模式。值得注意的是,即使你输入了文本,只要语音模式处于激活状态,AI仍会使用语音进行回复。要结束语音输出,只需点击“结束”按钮。我对此进行了简单测试。双引号内的句子代表用户对其说的话,而另一句(没有引号)则是同一聊天中的文本输入。

你可以查看OpenAI在X平台发布的帖子,观看该功能的演示视频。

聊天中的ChatGPT语音模式现已面向所有用户开放,前提是用户已安装Android和iOS平台上的最新版本应用。目前尚不清楚这种整合界面何时会在网页版、桌面应用或其Atlas网络浏览器上推出。

新的语音模式体验默认启用。如果你不喜欢它,可以切换回之前的样式。为此,请进入应用设置 > 语音模式,并切换标有“独立模式”的选项。

你在ChatGPT中使用语音模式吗?

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计