博链财经获悉,9月26日,据TechCrunch,OpenAI宣布旗下产品ChatGPT将迎来重大升级,新增语音和图像交互功能。
用户现在可以与ChatGPT进行语音对话,并使用图像进行搜索。
语音功能由一个新的文本到语音模型提供支持,该模型可以从文本和几秒钟的采样语音中生成类似人类的声音。
OpenAI表示,它与知名配音演员合作,创造了五种不同的声音,其开源的Whisper语音识别系统用于将口头话语转录成文本。
此外,Spotify作为启动合作伙伴,推出了一项新功能,允许播客主播将其节目从英语翻译成其他语言,同时保留原始语音。
新功能将在接下来的两周内开始面向付费Plus和Enterprise订阅用户推出。