Българо-Китайска Търговско-промишлена палaта

Sand.ai с отворен код Основен стек за генериране на аудио-видео за три дни

Byadmin

Mar 26, 2026

AI стартиращата компания Sand.ai отвори своя основен стек от технологии за генериране на аудио-видео в продължение на три последователни дни в GitHub.

Изданията включват: • daVinci-MagiHuman, мултимодален генериращ модел с 15B параметър • MagiAttention v1.1.0, модул за разпределено внимание • MagiCompiler, унифицирана рамка за компилиране на обучение и изводи

Sand.ai е основан от бившия учен от Microsoft Research Asia Cao Yue, като членовете на екипа преди това са допринесли за разработването на Swin Transformer.

Компанията се фокусира върху авторегресивни модели на света и вече е пуснала модели като Magi-1 (видео генериране) и GAGA-1 (аудио-визуално поколение).

Инициативата с отворен код има за цел да сподели напредъка в архитектурата на модела, изчислителната инфраструктура и рамките за компилиране, допринасяйки за основната инфраструктура за генериране на видео.

Източник: Minds in AI

Source link

Like this:

Like Loading…

Източник https://bccci.net/bg/feed/

By admin

Българо-Китайска Търговско-промишлена палaта

Sand.ai с отворен код Основен стек за генериране на аудио-видео за три дни

Byadmin

Like this:

By admin

Related Post

Фестивалът на науката в Шанхай 2026 обещава вълнуващи научно-технологични иновации

Тръмп подкрепя Пакстън над Корнин за сенатор от Тексас в шокираща подкрепа

САЩ ще оттеглят данъчните искове срещу Тръмп „завинаги“ в сделката за съдебно дело с IRS

You missed

Фестивалът на науката в Шанхай 2026 обещава вълнуващи научно-технологични иновации

Тръмп подкрепя Пакстън над Корнин за сенатор от Тексас в шокираща подкрепа

САЩ ще оттеглят данъчните искове срещу Тръмп „завинаги“ в сделката за съдебно дело с IRS

Проливът Малака може да бъде следващата точка, ако Азия не внимава