AI стартиращата компания Sand.ai отвори своя основен стек от технологии за генериране на аудио-видео в продължение на три последователни дни в GitHub.

Изданията включват: • daVinci-MagiHuman, мултимодален генериращ модел с 15B параметър • MagiAttention v1.1.0, модул за разпределено внимание • MagiCompiler, унифицирана рамка за компилиране на обучение и изводи

Sand.ai е основан от бившия учен от Microsoft Research Asia Cao Yue, като членовете на екипа преди това са допринесли за разработването на Swin Transformer.

Компанията се фокусира върху авторегресивни модели на света и вече е пуснала модели като Magi-1 (видео генериране) и GAGA-1 (аудио-визуално поколение).

Инициативата с отворен код има за цел да сподели напредъка в архитектурата на модела, изчислителната инфраструктура и рамките за компилиране, допринасяйки за основната инфраструктура за генериране на видео.

Източник: Minds in AI

Source link

Like this:

Like Loading…

Източник https://bccci.net/bg/feed/

By admin