Olyan eszközt mutatott be az OpenAI, mely parancsok mentén, a felhasználó szeme előtt képes véghez vinni a feladatokat – mintha valaki más irányítaná a számítógépét.
Bemutatta régóta rebesgetett eszközét az OpenAI, az Operator pedig pontosan arra képes, amiről a hírek is szóltak: a felhasználó helyett pörgetni a böngészőt. Egyelőre még csak egy fejlesztői előzetes az eszköz, amit Computer-Using Agentként (CUA), azaz egyfajta „számítógép-használó ügynökként” hivatkoznak – derül ki az Engadget cikkéből.
Az újdonságot a ChatGPT Pro előfizetői próbálgathatják, tehát azok, akik nem sajnálnak havi körülbelül 80 000 forintot az OpenAI legfejlettebb technológiáira. Mint a cég kifejti, a CUA-t kimondottan a grafikus interfészekkel történő interakcióra fejlesztették, tehát a gombok, menük, szövegmezők között tud navigálni a böngészőben. Úgy, ahogy az emberek is.
Az Operator nevű ügynök az OpenAI GPT-4o nyelvi modelljére épül, és a „látási” készségeket vegyíti a „fejlett érveléssel”. Az eszköz képes többlépcsős tervekre bontani a feladatokat, és adaptívan korrigálni, ha kihívásokkal szembesül. A cég úgy véli, ez a képesség az MI fejlődésének következő szintje.
Fontos azonban az OpenAI szerint figyelembe venni, hogy az Operator még korai változatában fut, és elég korlátozottak a képességei. Ennek következtében nem minden esetben működik tökéletesen. A The Verge kiemeli: ha elakad, az Operator egyelőre még visszaadja az irányítást a felhasználó kezébe. Hasonlóan cselekszik akkor is, ha az épp megnyitott weboldal érzékeny adatokhoz kér hozzáférést.

A cég szerint úgy tervezték az eszközt, hogy a „kártékony” kéréseket elutasítsa – de a tiltott tartalmakat is blokkolja, bármit is értsen a vállalat ezalatt.
A tesztelés először az amerikai felhasználóknál indul meg, de csak a már említett ChatGPT Pro részeként. Hogy mikor juthat el több országba az újítás, az egyelőre nem ismert.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.