首次实现中文文字生成,消息称阿里通义万相 2.1 视频生成模型今晚开源
xxn
阅读:55416
2025-02-25 18:02:01
评论:0
IT之家 2 月 25 日报道,据新浪科技的消息来源透露,阿里巴巴将在今晚正式开源其视频生成模型万相 2.1。
今年 1 月,阿里通义万相发布了其2.1版本,并进行了相关能力的显著增强,覆盖视频和图像生成两个领域。
在视频生成技术上,通义万相 2.1 通过自主研发的高效VAE和DiT架构,提升了时空上下文建模的能力,支持无限长度的1080P视频高效编解码,这一版本首次实现了中文版文字视频生成,并登上VBench榜单的首位。
据介绍,通义万相 2.1能够同时支持中英文视频内容,并且可一键生成艺术字体,还提供多种视频特效选项,例如过渡、粒子效果和模拟等,以提升视觉效果。该模型亦支持复杂的运动过程,能够模拟现实物理现象,如滴水落在伞上时的水花飞溅效果。
官方曾表示,通义万相 2.1具备中英文一键生成艺术字体的功能,并提供多种特效选项,增强视频表现力。
根据IT之家之前的报道,通义万相在去年9月份宣布了其支持文生视频、图生视频等功能,并覆盖了插画设计、涂鸦绘画、局部重绘、短片创作以及配乐生成等多种应用场景。
广告声明:文中包含的外部链接(包括但不限于超链接、二维码和口令等形式)旨在提供详细信息,节省信息筛选时间,结果仅供参考。
声明
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。