Az AgiBot nevű cég olyan rendszert fejlesztett a humanoid robotjához, ami minden korábbi hasonló eszköz teljesítményét felülmúlta.
A humanoid robotok fejlesztésével foglalkozó kínai AgiBot egy olyan új mesterségesintelligencia-modellt mutatott be, melynek célja, hogy a humanoid robotok minél hatékonyabban tudják elvégezni a valós feladatokat. A Genie Operator–1 (GO–1) nevű rendszer hatalmas kép- és videóadatokat dolgoz fel, hogy segítse a robotokat az emberi cselekvések jobb értelmezésében – írja a Interesting Engineering.
A GO–1 az úgynevezett látásnyelvi modelleket használja a nagy mennyiségű kép és videó feldolgozására. A Vision-Language-Latent-Action (ViLLA) nevű keretrendszer a látás, a nyelv és a cselekvés modellezésének kombinálásával javítja a robotok tanulását – állítja a cég. A rendszer betanításához kiváló minőségű adatokat, valamint az interneten található videókat használták fel a mérnökök.
A keretrendszer két kulcselemből áll: az egyik a Vision-Language Model (VLM), a másik pedig a Mixture of Experts (MoE). A VLM hatalmas mennyiségű multimodális adatot dolgoz fel az internetről a jelenetek megértése, valamint a nyelvi megértés fejlesztése érdekében. A MoE két részből áll: egyfelől különféle forrásokból tanul meg általános cselekvési mintákat, másfelől pedig több mint egymillió valós robotmozgáson kiképezve finomítja a mozdulatokat és a feladat végrehajtásának módját.
A VLM először elemzi a bemeneti adatokat, majd a MoE egy tervet készít a műveleti sorrend előrejelzésével. A MoE második eleme ezt alakítja át valós mozdulatokká.
Az eszközt öt különböző feladattal tesztelték. A cég szerint a GO–1 ezekben felülmúlta a legmodernebb modelleket, az elvégzés sikerességének arányát pedig 46 százalékról 78 százalékra javította. Jelentős előrelépést mutatott például az olyan feladatok terén, mint az italok kitöltése és a víz öntése.
Az AgiBot szerint a GO–1 azon képessége, hogy mind az emberi, mind a robotadatokból tanulni tud, lehetővé teszi, hogy alkalmazkodjon az újszerű feladatokhoz, együttműködjön más feladatokkal, valamint folyamatosan képes legyen adaptálódni a valós helyzetekhez.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.