OpenAI 今日在 X 发布了最新的文字转视频模型 Sora,只需要简单的描述性文字,就可以生成长达 60 秒的视频,其中包含高度详细的场景、正在运动的镜头,以及充满活力的多个角色。@Appinn 从生成文字、图片、声音,到生成视频,这是一条必然的路,虽然之前也有一些模型可以实现文字转视频,但 O …
Gemini 是 Google 今天发布的一个多模态的 AI 模型,它能够归纳并流畅地理解、操作处理包括文本、代码、音频、图像和视频在内的信息。另外,Gemini 的最小版本。Nano 可以直接部署在手机上。@Appinn 先不要去研究它是怎么实现的,也不需要去搞清楚如何训练的,看了下面这段视频之后 …