Dėl pokalbių robotų revoliucijos mūsų pasaulis buvo užlietas dirbtinio intelekto sukurtu tekstu: jis įsiskverbė į mūsų naujienų kanalus, kursinius darbus ir gautuosius. Jo taip absurdiškai gausu, kad atsirado pramonės šakos, siūlančios judesius ir priešingus veiksmus. Kai kurios įmonės siūlo DI sukurto teksto atpažinimo paslaugas analizuodamos medžiagą, o kitos teigia, kad jų įrankiai „sužmogins“ jūsų dirbtinio intelekto sukurtą tekstą ir padarys jį neaptinkamą. Abiejų tipų įrankių našumas yra abejotinas, o pokalbių robotams tobulėjant ir tobulėjant, bus tik sunkiau atskirti, ar žodžius sujungė žmogus, ar algoritmas.

Kitas būdas: nuo pat pradžių prie teksto pridedamas vandenženklis arba turinio kredencialas, leidžiantis žmonėms lengvai patikrinti, ar tekstas buvo sukurtas dirbtinio intelekto. Naujas „Google DeepMind“ tyrimas, aprašytas šiandien žurnale Gamtasiūlo būdą tai padaryti. Sistema, vadinama SynthID-Text, nekenkia „teksto generavimo kokybei, tikslumui, kūrybiškumui ar greičiui“, – sako Pushmeetas Kohli, „Google DeepMind“ tyrimų viceprezidentas ir šio straipsnio bendraautoris. Tačiau mokslininkai pripažįsta, kad jų sistema toli gražu nėra patikima ir dar ne visiems prieinama – tai daugiau demonstravimas, o ne keičiamas sprendimas.

„Google“ jau integravo šią naują vandens ženklų sistemą į savo „Gemini“ pokalbių robotą, šiandien paskelbė bendrovė. Jis taip pat sukūrė įrankį atviruoju šaltiniu ir padarė jį prieinamą kūrėjams ir įmonėms, leisdamas jiems naudoti įrankį, kad nustatytų, ar teksto išvestis gaunama iš jų pačių didelių kalbų modelių (LLM), AI sistemų, kurios maitina pokalbių robotus. Tačiau šiuo metu tik „Google“ ir tie kūrėjai turi prieigą prie detektoriaus, kuris tikrina, ar nėra vandens ženklo. Kaip sako Kohli: „Nors SynthID nėra sidabrinė kulka, skirta AI sukurtam turiniui identifikuoti, ji yra svarbi statybinė medžiaga kuriant patikimesnius AI identifikavimo įrankius“.

Turinio kredencialų kilimas

Turinio kredencialai buvo karšta vaizdų ir vaizdo įrašų tema, ir jie buvo laikomi vienu iš būdų kovoti su giliųjų klastotėmis. Technologijų įmonės ir pagrindinės žiniasklaidos priemonės susivienijo į iniciatyvą, pavadintą C2PA, kuri sukūrė užšifruotų metaduomenų prijungimo prie vaizdo ir vaizdo failų sistemą, nurodant, ar jie tikri, ar sukurti dirbtinio intelekto. Tačiau tekstas yra daug sunkesnė problema, nes tekstą galima taip lengvai pakeisti, kad vandens ženklas būtų užtemdytas arba pašalintas. Nors „SynthID-Text“ nėra pirmasis bandymas sukurti teksto vandens ženklų sistemą, jis yra pirmasis, kuris buvo išbandytas 20 milijonų raginimų.

Išoriniai ekspertai, dirbantys su turinio kredencialais, mano, kad „DeepMind“ tyrimas yra geras žingsnis. Tai „žada pagerinti ilgalaikio C2PA turinio kredencialų naudojimą dokumentams ir neapdorotam tekstui“, – sako Andrew Jenksas, „Microsoft“ žiniasklaidos kilmės direktorius ir C2PA vykdomasis vadovas. „Tai sunkiai išsprendžiama problema, ir malonu matyti tam tikrą pažangą“, – sako Bruce’as MacCormackas, C2PA valdymo komiteto narys.

Kaip veikia „Google“ teksto vandens ženklai

„SynthID-Text“ veikia diskretiškai kišdamasis į generavimo procesą: jis pakeičia kai kuriuos žodžius, kuriuos pokalbių robotas išveda vartotojui tokiu būdu, kuris žmonėms yra nematomas, bet aiškus „SynthID“ detektoriui. „Tokios modifikacijos įveda statistinį parašą į sukurtą tekstą”, – rašo mokslininkai. „Vandenženklio aptikimo fazės metu parašas gali būti išmatuotas, siekiant nustatyti, ar tekstas tikrai buvo sukurtas vandens ženklu pažymėto LLM.

LLM, kurios valdo pokalbių robotus, generuoja sakinius žodis po žodžio, atsižvelgdami į tai, kas buvo anksčiau, ir pasirenka galimą kitą žodį. Iš esmės „SynthID-Text“ trukdo atsitiktinai priskirdamas balus kandidatiniams žodžiams ir turėdamas aukštesnius balus LLM išvesties žodžius. Vėliau detektorius gali paimti teksto fragmentą ir apskaičiuoti jo bendrą balą; Vandens ženklu pažymėtas tekstas bus įvertintas aukštesniu balu nei tekstas be vandens ženklų. „DeepMind“ komanda patikrino savo sistemos veikimą, palyginti su kitais teksto vandens ženklų kūrimo įrankiais, kurie keičia generavimo procesą, ir nustatė, kad ji geriau aptiko vandens ženklu pažymėtą tekstą.

Tačiau mokslininkai savo darbe pripažįsta, kad vis tiek lengva pakeisti Dvynių sukurtą tekstą ir apgauti detektorių. Net jei vartotojai nežinotų, kuriuos žodžius keisti, jei jie reikšmingai redaguotų tekstą ar net paprašytų kito pokalbių roboto apibendrinti tekstą, vandens ženklas greičiausiai būtų užmaskuotas.

Teksto vandens ženklų testavimas mastu

Siekdama įsitikinti, kad „SynthID-Text“ tikrai neprivertė pokalbių robotų pateikti blogesnių atsakymų, komanda jį išbandė 20 milijonų raginimų, pateiktų Dvyniams. Pusė šių raginimų buvo nukreipta į „SynthID-Text“ sistemą ir gavo vandens ženklu pažymėtą atsakymą, o kita pusė gavo standartinį „Gemini“ atsakymą. Sprendžiant iš vartotojų atsiliepimų „nykščiai aukštyn“ ir „nykščiai žemyn“, vandens ženklais pažymėti atsakymai vartotojus tenkino taip pat, kaip ir standartiniai.

Tai puikiai tinka „Google“ ir kūrėjams, kurie kuria „Gemini“. Tačiau norint išspręsti visą DI sukurto teksto (kuris kai kas vadina DI nenaudojimą) identifikavimo problemą, reikės daug daugiau AI įmonių įdiegti vandenženklio technologijas – idealiu atveju sąveikiai, kad vienas detektorius galėtų atpažinti tekstą iš daugelio skirtingų LLM. Ir net tuo atveju, kai visos pagrindinės dirbtinio intelekto įmonės pasirašys kokį nors susitarimą, išliktų atvirojo kodo LLM problema, kurią būtų galima lengvai pakeisti, kad būtų pašalintos bet kokios vandenženklio funkcijos.

MacCormack iš C2PA pažymi, kad aptikimas yra ypatinga problema, kai pradedate praktiškai galvoti apie įgyvendinimą. „Yra iššūkių, susijusių su teksto peržiūra laukinėje gamtoje, – sako jis, – kai jūs turėtumėte žinoti, kuris vandens ženklų modelis buvo pritaikytas, kad žinotumėte, kaip ir kur ieškoti signalo.” Apskritai, sako jis, mokslininkai vis dar turi savo darbo. Šios pastangos „nėra aklavietė“, sako MacCormack, „bet tai pirmas žingsnis ilgame kelyje“.



Source link

By admin

Draugai: - Marketingo paslaugos - Teisinės konsultacijos - Skaidrių skenavimas - Fotofilmų kūrimas - Karščiausios naujienos - Ultragarsinis tyrimas - Saulius Narbutas - Įvaizdžio kūrimas - Veidoskaita - Nuotekų valymo įrenginiai -  Padelio treniruotės - Pranešimai spaudai -