Tongyi Lab на Alibaba има MAI-UI с отворен код, GUI агентна рамка, пускаща хартиен носител, код и модели в пълен размер (2B/8B/32B/235B-A22B), покриващи внедряване от край към облак, позволявайки сътрудничество между приложения и защитени с поверителност взаимодействия за AI терминали.
MAI-UI преодолява ограниченията на традиционните агенти на GUI чрез активно запитване към потребителите за липсващи подробности и извикване на външни API за рационализиране на операциите – като интегриране на API на Amap за сравнения на пътуване до работа или API на GitHub за извличане на ангажименти и изпращане по имейл – без ръчно превключване на приложения. Неговата иновативна система за краен облак динамично възлага задачи: чувствителните към поверителността операции остават локални, сложните отиват в облака, повишавайки степента на успех на 2B крайния модел с 33% и намалявайки обажданията в облака с над 40%, като повече от 40% от задачите се обработват локално за ефективност и сигурност.
Акценти в производителността поставят рекорди в индустрията: 76,7% успеваемост при телефонна навигация на AndroidWorld (надминавайки Gemini-2.5-Pro), 91,3% при точност на GUI L2 на MMBench и 73,5% при позициониране на елементи на ScreenSpot-Pro, далеч превъзхождайки конкурентите. Дори най-малкият 2B edge модел постига 49,1% успех при навигация, 75% подобрение спрямо традиционните edge модели.
MAI-UI вече е напълно отворен в GitHub и arXiv, като дава възможност на разработчиците да разгръщат и ускоряват човешките взаимодействия на телефони с изкуствен интелект и смарт устройства.
Източник: QbitAI
Source link
Like this:
Like Loading…
Източник https://bccci.net/bg/feed/