Vidu-生数科技

1天前更新 444 0 0

Vidu是北京生数科技有限公司联合清华大学于2024年4月27日发布的中国首个长时长、高一致性、高动态性视频大模型,采用全球首个Diffusion与Transformer融合的U-ViT架构 (早于Sora的DiT方案),初始版本支持生成4秒、8秒的高动态性视频(分辨率达1080P),首批功能包括文生视频、图生视频及参考生视频 。该模型...

收录时间:
2026-03-08
Vidu-生数科技Vidu-生数科技
      Vidu是北京生数科技有限公司联合清华大学于2024年4月27日发布的中国首个长时长、高一致性、高动态性视频大模型,采用全球首个Diffusion与Transformer融合的U-ViT架构 (早于Sora的DiT方案),初始版本支持生成4秒、8秒的高动态性视频(分辨率达1080P),首批功能包括文生视频、图生视频及参考生视频 。该模型可精确模拟物理规律生成光影、人物表情等细节,支持多镜头切换及中国元素融合,2024年7月作为纯自研视频大模型全球上线后百日内用户突破千万,2025年1月发布的2.0版本将视频生成速度提升至10秒内并支持错峰免费生成,同期成为全球增速最快的AI视频模型 。截至2025年1月,平台累计生成视频数突破亿条 ,2025年10月升级为AI视频创作与分发一体化平台
     Vidu核心技术U-ViT架构由团队于2022年9月提出,2023年3月开源验证可扩展性。2024年6月支持32秒视频生成、音视频合成及4D生成功能,同年9月发布1.5版本新增“多主体一致性”功能实现多角色交互控制,并正式开放API接口。2025年1月30日推出面向专业影视制作的Q3模型,支持16秒声画同出、多语言文字渲染,在国际AI基准测试中位列中国第一、全球第二。2026年2月与万兴科技达成战略合作,共建AI漫剧工业化生产体系
模型迭代过程中,2024年7月30日全球上线时新增角色一致性、动漫风格等能力 ,2025年7月通过阿里云基础设施实现B端客户及调用量环比增长300% 。技术路线持续突破长视频处理能力,构建起涵盖视频生成、编辑到分发的全链路生态

社会影响与争议

2025年10月中下旬,视频制作者使用Vidu等AI工具生成标注为“虐向”的视频,内容涉及虐待拟人化角色anon犬、soyo狸和天素罗。
抖音哔哩哔哩平台已对相关违规内容下架处置,并加强管控。
专家指出此类视频对未成年人身心健康有害,可能扭曲价值观并违反《未成年人网络保护条例》等法律法规。

发展历程

Vidu的快速突破源自于团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果。其核心技术U-ViT架构由团队于2022年9月提出,早于Sora采用的DiT架构,是全球首个Diffusion与Transformer融合的架构。2023年3月,团队开源了全球首个基于U-ViT融合架构的多模态扩散模型UniDiffuser,率先完成了U-ViT架构的大规模可扩展性验证。

2024年4月27日,在中关村论坛未来人工智能先锋论坛上,生数科技联合清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。Vidu是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,并在加速迭代提升中。 

2024年6月6日,Vidu模型能力迭代更新,支持一键生成达32秒的视频、支持音视频生成、支持Vidu4D生成。
2024年7月30日,生数科技自研视频大模型Vidu上线。
2024年9月11日,Vidu全球首发“主体参照”功能,一张照片实现主体可控。
2024年9月25日,Vidu正式开放API。
2024年11月13日,Vidu1.5上线 ,全球首发“多主体一致性”能力,标志着视觉模型进入全新的“上下文”时代。
2025年1月15日,Vidu2.0上线,推动视频生成走向人人可用的奇点时刻。3月17日晚间,生数科技宣布,旗下视频大模型产品Vidu正式与美国知名动漫制作工作室Aura Productions达成战略合作。

主要功能

  • 参考生视频:全球首个参考生视频功能,让创作的角色、物体、场景等始终保持一致
  • 图生视频:基于任意图片描述您想象的画面,即刻动态呈现,让您的创意栩栩如生
  • 文生视频:用文字描述您想象的画面,自由表达创意,即刻创作视频

功能特色

Vidu开放了参考生视频、文生视频、图生视频三大核心功能,提供4s和8s两种时长选择,分辨率最高达1080P。
Vidu在生成速度、一致性、动态性等方面具备领先优势,生成一段4秒视频仅需10秒。
  • 参考生视频
通过上传1-3张参考图,Vidu 1.5可实现对单主体100%的精确控制,同时实现多主体交互控制、主体与场景融合控制,能够无缝集成人物、道具和场景等元素。
  • 动画风格
Vidu 可以生成效果优异的动画视频 
  • 错峰模式
Vidu支持闲时免费生成视频

图像生成功能

Vidu支持参考生图功能,可通过模板控制生成效果。文生图功能允许用户通过文字描述生成图像。图像编辑功能提供精细化修改能力。 

数据统计

相关导航

暂无评论

none
暂无评论...