首页 >  AI教程资讯 > ChatGPT免费开放Voice语音交互功能丨Stable Video Diffusion视频生成大模型发布丨联发科发布天玑8300:支持AI生成

ChatGPT免费开放Voice语音交互功能丨Stable Video Diffusion视频生成大模型发布丨联发科发布天玑8300:支持AI生成

2025-05-09 10:53:19 | 来源: AICG工具箱

2023年11月22日报道丨AI资讯早报

ChatGPT向全体用户开放Voice语音交互功能,人人都可以在手机APP上使用

OpenAI作为ChatGPT母公司的控制权“宫斗”大戏还没有结束,但是产品开发仍在继续。北京时间11月22日凌晨,OpenAI对外发布了ChatGPT Voice语音交互聊天服务,并且将这项此前由ChatGPT Plus(GPT-4)独占的功能,下放到全体ChatGPT APP用户。

虽然身处人事风波当中,当时刚刚宣布从OpenAI离职的前总裁Greg Brockman依然关注该公司的最新动态。他在OpenAI的官方推文下方跟帖表示:“ChatGPT Voice面向所有免费用户推出。尝试一下,彻底改变ChatGPT体验”。

OpenAI 于今年 9 月发布了基于 ChatGPT 的文本转语音功能,基于GPT的神经网络模型,从生成的文本内容转成类似人类的语音。该功能此前仅面向 ChatGPT Plus 订阅用户提供,现在向所有没有订阅付费的用户推出。该系统通过采样配音演员录制的几秒钟音频,能够创建具有不同口音和风格的自定义声音。

Stability AI发布旗下首个视频生成大模型Stable Video Diffusion

当地时间11月21日,Stable Diffusion的开发商Stability AI正式发布稳定视频扩散大模型Stable Video Diffusion,这是该公司首个基于图像模型稳定扩散模型Stable Diffusion推出的第一个视频生成基础模型。

Stable Video Diffusion

Stable Video Diffusion它的主要功能是通过对自然视频的大量实验,实现视频的编辑,同时保持几何形状和时间连续性,以产生优越的编辑结果。相较于其他基于扩散的方法,Stable Video Diffusion能更好地处理时间一致性问题。