PG agentai imasi kontrolės: kompiuterinių agentų tyrimas

Praėjus dvejiems metams po to, kai generatyvus AI bumas iš tikrųjų prasidėjo nuo „ChatGpt“ paleidimo, nebeatrodo, kad įdomu turėti fenomenaliai naudingą AI asistentą, kabantį jūsų interneto naršyklėje ar telefone, tiesiog laukiu, kol užduosite klausimus. Kitas didelis PG postūmis yra AI agentams, kurie gali imtis veiksmų jūsų vardu. Nors agentinė AI jau atvyko į energijos vartotojus, tokius kaip koderiai, kasdieniai vartotojai dar neturi tokio tipo AI padėjėjų.

Tai netrukus pasikeis. „Anthropic“, „Google Deepmind“ ir „Openai“ neseniai pristatė eksperimentinius modelius, kurie gali naudoti kompiuterius taip, kaip žmonės daro – interneto paieška informacijos, formų užpildymo ir mygtukų spustelėjimo. Turėdami šiek tiek žmonių vartotojo patarimų, jie gali mąstyti, pavyzdžiui, užsisakyti maisto prekių, paskambinti „Uber“, medžioti už geriausią produkto kainą arba rasti skrydį kitoms atostogoms. Ir nors šie ankstyvieji modeliai turi ribotus sugebėjimus ir dar nėra plačiai prieinami, jie parodo kryptį, kuria eina AI.

„Tai tik AI paspaudimas“, – sakė „Openai“ generalinis direktorius Samas Altmanas demonstraciniame vaizdo įraše, žiūrėdamas „Openai“ agentą, vadinamą operatoriumi, eikite į „OpenTable“, ieškokite San Fransisko restorano ir patikrinkite, ar nėra stalo, skirtą dviem 19 val.

Carnegie Mellon universiteto mašinų mokymosi docentas Zachary Lipton pažymi, kad AI agentai jau yra įterpti į specializuotą programinę įrangą įvairių tipų įmonių klientams, tokiems kaip pardavėjai, gydytojai ir teisininkai. Tačiau iki šiol mes nematėme AI agentų, kurie gali „daryti įprastus dalykus jūsų nešiojamajame kompiuteryje“, – sako jis. „Kas čia intriguojažmonių galimybė, kad žmonės pradės perduoti raktus. “

Turinys:

AI agentai iš „Anthropic“, „Google Deepmind“ ir „Openai“

„Anthropic“ pirmasis atidengė šią naują funkcionalumą, spalio mėnesį paskelbęs, kad jo „Claude Chatbot“ dabar gali „naudoti kompiuterius taip, kaip daro žmonės“. Bendrovė pabrėžė, kad ji modeliams suteikė šią galimybę kaip viešą beta versijos testą ir kad tai prieinama tik kūrėjams, kurie stato įrankius ir produktus ant „Anthropic“ didelių kalbų modelių. Claude naršo peržiūrėdamas ekrano kopijas to, ką vartotojas mato, ir skaičiuodamas taškus, reikalingus žymekliui perkelti į tam tikrą vietą spustelėjimui. „Anthropic“ atstovas sako, kad Claude’as gali atlikti šį darbą bet kuriame kompiuteryje ir bet kurioje darbalaukio programoje.

Kitas iš vartų buvo „Google Deepmind“ su savo „Project Mariner“, pastatytu ant „Google“ „Gemini 2“ kalbos modelio. Bendrovė gruodžio mėnesį parodė „Mariner“, tačiau pavadino jį „ankstyvu tyrimų prototipu“ ir teigė, kad šiuo metu įrankį suteikia tik „patikimiems bandytojams“. Kaip dar viena atsargumo priemonė, „Mariner“ šiuo metu veikia tik „Chrome“ naršyklėje ir tik aktyviame skirtuke, tai reiškia, kad jis neveiks fone, kol dirbate su kitomis užduotimis. Nors atrodo, kad šis reikalavimas šiek tiek paneigia laiko taupymo AI pagalbininko tikslą, greičiausiai tai tik laikina šios ankstyvosios vystymosi stadijos sąlyga.

Galiausiai sausį „Openai“ paleido savo kompiuterio naudojimo agentą (CUA), vadinamą operatoriumi. „Openai“ tai pavadino „tyrimų peržiūra“ ir leido jį naudotis tik vartotojams, kurie moka 200 USD per mėnesį už „Openai“ aukščiausios kokybės paslaugą, nors bendrovė teigė, kad ji siekia platesnio paleidimo. Operatoriaus komandos inžinierius Yashas Kumaras sako, kad įrankis gali veikti iš esmės bet kurioje svetainėje. „Mes pradedame nuo naršyklės, nes būtent čia atsitinka didžioji dalis darbų“, – sako Kumaras. Tačiau jis pažymi, kad „CUA modelis taip pat yra mokomas naudoti kompiuterį, todėl įmanoma, kad galėtume jį išplėsti“, kad dirbtume su kitomis darbalaukio programomis.

Kaip ir kiti, operatorius pasikliauja Mąstymo grandinės samprotavimai imtis instrukcijų ir suskaidyti juos į daugybę užduočių, kurias ji gali atlikti. Jei jai reikia daugiau informacijos, kad atliktumėte užduotį, pavyzdžiui,, pavyzdžiui, jei norite pirkti raudonus ar geltonus svogūnus, ji pristabdys ir paprašys įvesties. Prieš žengiant paskutinį žingsnį, taip pat prašoma patvirtinti, pavyzdžiui, rezervuoti restorano stalą ar pateikti maisto prekių užsakymą.

Kompiuterių naudojimo agentų saugos rūpesčiai

Štai keletas dalykų, kurių dar negali padaryti kompiuterių naudojimo agentai: prisijunkite prie svetainių, sutikite su paslaugų teikimo sąlygomis, išspręsite „Captchas“ ir įveskite kreditinės kortelės ar kitos mokėjimo informaciją. Jei agentas prieina prie vieno iš šių kliūčių, jis perduoda vairą atgal į žmogaus vartotoją. „Openai“ pažymi, kad operatorius nevartoja naršyklės ekrano kopijų, kol vartotojas įveda prisijungimo ar mokėjimo informaciją.

Visos trys kompanijos pažymėjo, kad už jūsų kompiuterio atsakingą PG paskyrimą gali kelti pavojų saugai. „Anthropic“ konkrečiai iškėlė nerimą dėl greitų injekcijų atakų ar būdų, kuriais kenksmingi veikėjai gali ką nors pridėti prie vartotojo raginimo, kad modelis imtųsi netikėto veiksmo. „Kadangi Claude’as gali interpretuoti ekrano kopijas iš kompiuterių, sujungtų su internetu, gali būti, kad jis gali būti veikiamas turinio, apimančio greitas injekcijų atakas“, – rašė Antropicas tinklaraščio įraše.

CMU „Lipton“ sako, kad įmonės neatskleidė daug informacijos apie kompiuterio naudojimo agentus ir kaip jos veikia, todėl sunku įvertinti riziką. „Jei kas nors verčia jūsų kompiuterio operatorių padaryti ką nors nemalonaus, ar tai reiškia, kad jie jau turi prieigą prie jūsų kompiuterio?“ Jis stebisi, ir jei taip, kodėl klaidingai tariant, tiesiog nesiimtų veiksmų tiesiogiai?

Vis dėlto Liptonas sako, kad atlikdamas visus veiksmus, kuriuos imame ir perkame internetu, „Norint įsivaizduoti veiksmus, kurie paliks vartotoją marinuotoje, nereikia laukinio vaizduotės šuolio“. Pavyzdžiui, jis sako: „Kas bus pirmasis asmuo, kuris atsibunda ir sako:„ Mano (agentas) nusipirko man automobilių parką? “

Kompiuterinių agentų ateitis

Nors nė viena iš bendrovių neatskleidė laiko, kad jų kompiuterių vartojimo agentai būtų plačiai prieinami, panašu, kad vartotojai šiais metais pradės prieigą prie jų-per dideles AI kompanijas arba per startuolius sukurdami pigesnius numušimus.

„Openai“ „Kumar“ sako, kad tai įdomus laikas, ir tas operatorius žymi žingsnį link labiau bendradarbiavimo žmonių ir AI ateičiai. „Tai žingsnis į mūsų kelią į Agi“,-sako jis, kalbėdamas apie ilgalaikį dirbtinio bendrojo intelekto svajonę/košmarą. „Gebėjimas naudoti tas pačias sąsajas ir įrankius, su kuriais žmonės bendrauja kasdien, praplečia AI naudingumą ir padeda žmonėms sutaupyti laiko kasdienėms užduotims.“

Jei prisimenate filmą „Prescient 2013“ Jospanašu, kad mes einame link pasaulio, kuris egzistavo filmo pradžioje, prieš tai, kai niūrus balsas Samantha pradėjo kalbėti į veikėjo ausį. Tai pasaulis, kuriame visi turi nuobodų ir neutralų AI, kad padėtų jiems perskaityti ir reaguoti į žinutes bei pasirūpinti kitomis kasdieniškomis užduotimis. Kai AI kompanijos tvirtai pasieks šį tikslą, jos, be abejo, pradės dirbti su Samantha.

Iš jūsų svetainės straipsnių

Susiję straipsniai visame internete

Source link

Navigacija tarp įrašų

IEEE pristato 2025–2030 strateginį planą.
Robotų vaizdo įrašai: „Meta AI“ ir „Žmogaus roboto“ sąveika ir dar daugiau

PG agentai imasi kontrolės: kompiuterinių agentų tyrimas

AI agentai iš „Anthropic“, „Google Deepmind“ ir „Openai“

Kompiuterių naudojimo agentų saugos rūpesčiai

Kompiuterinių agentų ateitis

By admin

Related Post

Inžinerija yra labai svarbi maisto saugumui didinti

Shadow Walker buvo „pasidaryk pats“ dvikojis humanoidinis robotas

Atkurti prarasti vaizdai iš 1945 m. Trejybės branduolinio bandymo

Praleistos naujienos

Inžinerija yra labai svarbi maisto saugumui didinti

Kredito unijų sektorius pirmąjį ketvirtį – pelno daugiau nei prieš metus

Jūsų prieigą prie šios svetainės apribojo svetainės savininkas

Shadow Walker buvo „pasidaryk pats“ dvikojis humanoidinis robotas