首次实现中文文字生成，消息称阿里通义万相 2.1 视频生成模型今晚开源

xxn 阅读：55416 2025-02-25 18:02:01 评论：0

IT之家 2 月 25 日报道，据新浪科技的消息来源透露，阿里巴巴将在今晚正式开源其视频生成模型万相 2.1。

今年 1 月，阿里通义万相发布了其2.1版本，并进行了相关能力的显著增强，覆盖视频和图像生成两个领域。

在视频生成技术上，通义万相 2.1 通过自主研发的高效VAE和DiT架构，提升了时空上下文建模的能力，支持无限长度的1080P视频高效编解码，这一版本首次实现了中文版文字视频生成，并登上VBench榜单的首位。

据介绍，通义万相 2.1能够同时支持中英文视频内容，并且可一键生成艺术字体，还提供多种视频特效选项，例如过渡、粒子效果和模拟等，以提升视觉效果。该模型亦支持复杂的运动过程，能够模拟现实物理现象，如滴水落在伞上时的水花飞溅效果。

官方曾表示，通义万相 2.1具备中英文一键生成艺术字体的功能，并提供多种特效选项，增强视频表现力。

根据IT之家之前的报道，通义万相在去年9月份宣布了其支持文生视频、图生视频等功能，并覆盖了插画设计、涂鸦绘画、局部重绘、短片创作以及配乐生成等多种应用场景。

广告声明：文中包含的外部链接（包括但不限于超链接、二维码和口令等形式）旨在提供详细信息，节省信息筛选时间，结果仅供参考。

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。