
欧洲杯体育最大1024*1024永别率-开云(中国大陆)Kaiyun·体育官方网站-登录入口
新闻动态
新浪科技讯 12月17日上昼音尘,当天,图森往日追究发布图生视频大模子“Ruyi”,并将Ruyi-Mini-7B版块追究开源,用户不错从huggingface险峻载使用。“Ruyi”专为在虚耗级显卡(举例 RTX 4090)上启动而贪图, 并提供刺见解部署评释和 ComfyUI 职责流,以便用户约略快速上手。 Ruyi支柱最小384*384,最大1024*1024永别率,狂妄长宽比,最长120帧/5秒的视频生成。同期,不错支柱最多5个肇始帧、最多5个杀青帧基础上的视频生成,通过轮回重迭不错生成
详情

新浪科技讯 12月17日上昼音尘,当天,图森往日追究发布图生视频大模子“Ruyi”,并将Ruyi-Mini-7B版块追究开源,用户不错从huggingface险峻载使用。“Ruyi”专为在虚耗级显卡(举例 RTX 4090)上启动而贪图, 并提供刺见解部署评释和 ComfyUI 职责流,以便用户约略快速上手。
Ruyi支柱最小384*384,最大1024*1024永别率,狂妄长宽比,最长120帧/5秒的视频生成。同期,不错支柱最多5个肇始帧、最多5个杀青帧基础上的视频生成,通过轮回重迭不错生成狂妄长度的视频。在通顺幅度铁心方面,Ruyi提供了4档通顺幅度铁心,浮浅用户对全体画面的变化流程进行铁心。在镜头铁心方面,Ruyi提供了上、下、左、右、静止共5种镜头铁心。
据先容,Ruyi是一个基于DiT架构的图生视频模子,它由两部分组成:一个Casual VAE模块负责视频数据的压缩妥协压,一个Diffusion Transformer负责压缩后的视频生成。其中Casual VAE模块会将空间永别率压缩至1/8,时分永别率压缩至1/4,压缩后每个像素由16位的BF16进行暗意。DiT部分使用3D full attention,在空间上使用2D RoPE进行位置编码,时分上使用sin_cos进行位置编码,最终的loss采选了DDPM进行教训。模子的总参数目约为7.1B,使用了约200M视频片断进行教训。
图森往日暗意,“Ruyi当今仍然存在手部猖獗、多东谈主时面部细节崩坏、弗成控转场等问题,咱们正在检阅这些瑕疵,在日后的更新中对它们进行设备。”
海量资讯、精确解读,尽在新浪财经APP
职守剪辑:郝欣煜 欧洲杯体育
