您的位置：首页 > 动态 >

英伟达推出VideoLDM，根据文本可生成4.7秒视频

[04月20日 15:18] 来源：IT之家阅读量：18094

，英伟达和康奈尔大学的研究团队合作，近日推出了名为 VideoLDM 模型，可以根据文本描述，自动生成最高分辨率 2048*1280、24 帧、最长 4.7 秒的视频。

英伟达表示该模型配有 41 亿个参数，其中 27 亿个经过视频训练，这符合现代生成式 AI 的标准。IT之家从博文中获悉，英伟达表示通过高效的潜在扩散模型，能够创建多样化、高质量、高清晰度的视频。

该模型还能创建驾驶场景的视频，视频分辨率为 1024 × 512 像素，最长 5 分钟。英伟达表示目前该项目处于研究阶段，暂时不会向公众开放。

声明：本网转发此文章，旨在为读者提供更多信息资讯，所涉内容不构成投资、消费建议。文章事实如有疑问，请与有关方核实，文章观点非本网观点，仅供读者参考。

分享到微信