Iki šiol jūs tikėtina matė trumpus vaizdo įrašus, sukurtus naudojant AI vaizdo įrašų generavimo įrankius, kurie leidžia iš paprasto tekstinio raginimo sukurti fotorealistinius kelių sekundžių trukmės klipus. Indijos startuolis dabar stumia technologiją iki savo galimybių: iki 2025 m. pabaigos planuoja išleisti ilgametražį filmą, sukurtą beveik vien naudojant generatyvius AI įrankius.
„Intelliflicks Studios“, įsikūrusi Čandigare, yra autoriaus Khushwant Singh ir Gurdeep Pall, „Qualtrics“ AI strategijos prezidento Sietle ir buvusio „Microsoft“ AI inkubacijų viceprezidento, idėja. Studija kuria 2014 m. Singho romano ekranizaciją Maharadžas džinsuosekuriame pasakojama apie šių dienų jaunuolį, kuris tiki, kad jis yra XIX amžiaus sikhų imperijos įkūrėjo Maharadžos Randžito Singho reinkarnacija.
Singhas sako, kad studijos bosai Bolivude du kartus įsigijo knygos filmavimo teises, tačiau istorijos, apimančios kelis laikotarpius, sudėtingumas ir kaina lėmė, kad filmas taip ir nebuvo sukurtas. Taigi, kai Singho vaikystės draugas Pall papasakojo jam apie sparčiai tobulėjančias AI vaizdo generatorių galimybes, pora nusprendė suvienyti jėgas ir sukurti, anot jų, pirmąjį pilnametražį generatyvų dirbtinio intelekto filmą. „Stengiamės žengti laužantį žingsnį, kad parodytume technologijos galimybes“, – sako Singhas.
Kokius generatyvius AI įrankius jie naudoja?
Pasak Pallo, bendrovė naudoja komercinių ir atvirojo kodo AI įrankių rinkinį, kad sukurtų filmą, ir kuria savo programinę įrangą naujoms darbo eigoms valdyti. Jis naudoja vaizdų generavimo modelius, kad sukurtų personažų dizainą, scenas ir objektus, kurie vėliau įtraukiami į vaizdo įrašų kartos modelius. Kiti AI įrankiai naudojami garsui kurti, lūpų sinchronizavimui ir vaizdams paryškinti. Pall sako, kad jo komanda taip pat naudoja įprastus vaizdo įrašų gamybos įrankius paprastesniems darbams, pavyzdžiui, suderinti apšvietimą ir spalvas tarp scenų.
Kūrėjai pirmiausia naudoja iš anksto paruoštus modelius, o Pall teigia, kad jie taip pat patikslino kai kuriuos modelius pagal Indijai būdingus duomenis. Tačiau kai kuriais atvejais tikslaus derinimo nepakanka. Vienoje scenoje moteris atlieka šiaurės Indijoje tradicinį šokį, vadinamą Kathak šokiu, o Pall sako, kad surinkti pakankamai duomenų modeliui parengti būtų nepraktiška. Vietoj to, jie planuoja įrašyti tikrą Kathak pasirodymą ir naudoti AI, kad apsikeistų dirbtinio intelekto sukurto veikėjo akivaizdoje.
„Intelliflicks Studios“ išleido šį AI sukurto vaidybinio filmo, kurį planuoja išleisti šiais metais, anonsą. „Intelliflicks Studios“.
Pasak Pallo, didžiausias iššūkis, su kuriuo susidūrė komanda, yra nuoseklumas. Generatyvusis AI iš esmės yra tikimybinis, todėl modelio atsakas į tam tikrą raginimą kaskart skirsis. Dėl to viskas gali būti sudėtinga, kai personažas turi atrodyti vienodai visame ilgametražiame filme.
Praėjusiais metais šis iššūkis tapo daug lengviau valdomas, nes dabar daugelis modelių gali pridėti skaitmeninę žymą prie kiekvienos išvesties. Šią žymą galima pridėti prie būsimų raginimų, siekiant užtikrinti, kad modelis, generuodamas naują klipą, laikytųsi panašaus stiliaus. Tačiau pakartotiniai kūriniai niekada nėra tobuli, sako Pall ir priduria, kad jo komanda prisitaiko prie technologijos suvaržymų. „Turite į tai žiūrėti kaip į naują terpę“, – aiškina jis. „Negalite nudažyti akvarele to paties, kaip aliejumi“.
Ką mano išorės ekspertai?
Jamie UmphersonasAI vaizdo įrašų paleidimo kūrybos vadovas Kilimo ir tūpimo takasNiujorke, teigia, kad sėkmingiausi AI vaizdo projektai yra tie, kurie supranta technologijos apribojimus ir remiasi jais, kad pagerintų pasakojimą. Tačiau technologija nuolat tobulėja, priduria jis, todėl kai kurie iš šių apribojimų gali būti trumpalaikiai.
Vis dėlto, sukurti ilgametražį filmą šiuolaikinėmis technologijomis yra šiek tiek pertemptas. Umphersonas teigia, kad dauguma „Runway“ klientų, tarp kurių yra kino studijos, reklamos agentūros ir nepriklausomi menininkai, naudoja technologiją, norėdami greitai kartoti idėjas kūrybinio proceso pradžioje arba sukurti vaizdo efektus, papildančius tiesioginį veiksmą. „Sukurti visiškai sukurtą filmą tikrai įmanoma“, – pareiškia jis, tačiau tam reikės „neįtikėtino meniškumo“.
Daugelis šiuolaikinių vaizdo įrašų generatorių prie kiekvieno sugeneruoto klipo pateikia žymą, kurią galima pridėti prie kito raginimo, kad būtų pagerintas tęstinumas.
„Intelliflicks Studios“.
Abe Davis, Kornelio universiteto kompiuterių mokslų docentas, vienas iš iššūkių yra tai, kad šie įrankiai yra skirti sukurti aukštos kokybės vaizdo įrašus su minimaliu vartotojo indėliu – jie kontroliuoja detales, kurioms paprastai reikia žmogaus sprendimo. – gaminimas. Ši automatizacija leidžia neprofesionalui greitai sukurti klipą, tačiau tai gali sugadinti žmogų, turintį patirties ir vizijos. „Žmonės neįvertina svarbių ar svarbių sprendimų, kuriuos iš tikrųjų nori priimti filmo kūrėjas, skaičių“, – sako Davisas.
Dirbtinio intelekto sukurtas filmas vyksta tiek šiuolaikiniame pasaulyje, tiek XIX a. „Intelliflicks Studios“.
Paimkite, pavyzdžiui, sprendimą, kaip aktorius turėtų pateikti eilutę; šią kryptį gali būti sunku išreikšti teksto raginimu. Vis dėlto visos šios detalės turi išlikti nuoseklios visame vaizdo įraše, priduria Davisas, o ilgėjant tampa vis sunkiau.
Singhas pripažįsta, kad pirmasis dirbtinio intelekto sukurtas vaidybinis filmas greičiausiai labai skirsis nuo tų, kurie buvo sukurti įprastai. Tačiau jis tikisi, kad ši technologija panaikins struktūrines kliūtis, trukdančias žmonėms išreikšti savo kūrybiškumą. AI yra žaidimų keitiklis, Singhas sako: „Manau, kad tai labai demokratizuosis filmų kūrimą“.