阿里万相视觉生成大模型正式开源

阿里万相视觉生成大模型正式开源

2025.02.25 23:00

钛媒体App 2月25日消息，阿里云旗下视觉生成基座模型万相2.1（Wan）正式开源，此次开源采用最宽松的Apache2.0协议，14B和1.3B两个参数规格的全部推理代码和权重全部开源，同时支持文生视频和图生视频任务。据介绍，14B万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出，在权威评测集VBench中，万相2.1以总分86.22%的成绩大幅超越Sora、Luma、Pika等国内外模型，稳居榜首。1.3B版本测试结果超过了更大尺寸的开源模型，甚至还接近部分闭源模型，同时能在消费级显卡运行，仅需8.2GB显存就可以生成高质量视频，适用于二次模型开发和学术研究。

HK阿里巴巴-W

US阿里巴巴

本文内容仅供参考，不构成投资建议，请谨慎对待。

0 / 300

根据《网络安全法》实名制要求，请绑定手机号后发表评论

请登录后输入评论内容

投资日历