Alibaba открыла доступ к бесплатной передовой модели искусственного интеллекта, которая позволяет генерировать изображения и видео из текстовых описаний или фото, сообщается в официальном блоге китайской компании.
Модель Wan 2.1 можно установить локально, скачав с GitHub или HuggingFace. Облегченная версия T2V-1.3B требует 8,19 ГБ видеопамяти и совместима почти со всеми потребительскими графическими процессорами, сообщает компания.
Разработчики отметили, что «младшая» модель может сгенерировать пятисекундный ролик в разрешении 480р на GeForce RTX 4090 примерно за 4 минуты. Также доступны модели T2V-14B, I2V-14B-720P и I2V-14B-480P, однако для них требуется профессиональное оборудование.
Нейросеть Wan уже получила высокую оценку в тестах Vbench, предназначенных для генераторов видео — так, она стала лидером по критерию взаимодействия объектов.
В отличие от конкурентов, она также полностью бесплатная.
Разработка Alibaba усиливает конкуренцию с OpenAI Sora и недавними моделями DeepSeek, предлагая бесплатную альтернативу с открытым исходным кодом дорогостоящим проприетарным решениям.