

Egy vicces AI videó kapcsán beszélgettünk (vitatkoztunk) az alkotás jövőjéről Babos Tamás, Balázs Béla-díjas operatőrrel. Milyen változások állnak be az alkotás folyamatában, mennyiben, s hogyan áll be változás a Mesterséges Intelligencia által generált mozgóképekkel.
dr. Zeke László: A minap szembe jött velem egy vicces AI videó, amelyen GorilLali és YetiPeti mesél kalandjairól változatos helyszíneken, humoros szituációkban, tökéletes magyarsággal, pontos száj szinkronnal, élethű mimikával és gesztusokkal. Az jól látható, hogy az AI brutális teljesítményre képes már most is. Ez a vicces kis filmecske előre vetíti, hogy nem is olyan soká (az AI esetében ez a "soká" pár hónapban mérhető) akár a tömegfilmek késztésének értelme szűnik meg a hagyományos eszközökkel. Igen nagy százalékban értelmét veszíti a hagyományos filmkészítés eszköztárának használata. Az objektívek fényérzékenysége, a záridő és a rekesz beállítások a kamerákon, a bluebox technika, a számítógéppel "kikulcsolt hátterek", de akár már a hús vér szereplők fontossága eltörpül a forgatókönyv írók, rendezők, látványtervezők fantáziája mellett.
Olyan változás kapujában állunk, mint amilyen az írás feltalálása, vagy a világháló elterjedése volt. Megtanuljuk a töltőtoll használatát, tudunk a római kori viaszostáblákról, az egyiptomi hieroglifákról, a kódex másolók iniciáléiról, s ismerjük Petőfi tintába mártott lúd tollát, de ma már terrabájtokat hordunk a zsebünkben, s az okostealefonunkban ott van a világ csaknem összes információja. Most az alkotás forradalmát éljük...
Az alkotás hangsúlya átkerül a teremtő képzelet síkjára. Mindent az ötlet, a gondolat szülőjének, a képi világot megálmodó embernek a kifejezésmódján múlik: hogy hogyan tud instruálni egy olyan Mesterséges Intelligenciát, aki megvalósítja az álmokat. Nem a kameraállásokat, a záridőket, a mélység élességet, a fényeket kell majd kiszámolni, beállítani, hanem azt kell megtanulni, hogy hogyan lehet az érzéseket, hangulatokat, szituációkat "elmagyarázni" egy olyan elmének, ami nem emberi, viszont olyan elképesztő dolgok megvalósítására képes, amire egy ember nem.
Az alkotó gondolkodás szintjén érkeztünk el oda, ahova az élet más területein már réges régen. A saját erőből 30-40 km/h sebességgel futni, 7-8 m távolságra ugrani képes ember olyan gépeket, járműveket alkotott, amelyek ezt a teljesítményt játszva, sokszorosan felülmúlták. Aztán csak azon kellett gondolkodni, hogy az egyre gyorsabban futó és egyre magasabbra ugró alkalmatosságokat mire és hogyan lehet felhasználni, így aztán a hús vér ember kikötött a Holdon, járműveket küldött millió kilométerekre idegen égitestekre...

Babos Tamás: “Megtanulni, hogy hogyan lehet az érzéseket, hangulatokat, szituációkat elmagyarázni egy olyan elmének, ami nem emberi” – szerintem nem művészet. Ez lenne az alkotás forradalma? Az AI teljesítményét látva először mindenki ámulatba esik, és ez még sokáig így lesz. Egészen addig, amíg el nem jutunk a valósághű ábrázolás lehetőségéhez idő és minőségi korlát nélkül. És akkor majd nagyon meglepődünk, mert értelmét veszti mindez. Miközben most is tudjuk, hogy az AI színtiszta lopás. A művészethez mindig is tehetség kellett. Tehetség ahhoz, hogy a gondolatokat különböző módon, írásban, képben, zenében ki tudjuk fejezni. Bach nem muzsikált, hanem a hitéről vallott. A gyülekezet, majd később a nagyközönség kevésbé tehetséges tagjai számára hozta, hozhatta közelebb Istent.
Most egy zenélni nem tudó tehetségtelen ember promtokat ad a gépnek, szerezzen zenét Bach stílusában… És a gép összelopja. És a tehetségtelen ember örül, magáénak érzi a művet. Az AI-nek természetesen lehetne helye alkotói folyamatokban, de attól tartok, az ember hitványabb annál, mint, hogy önmérsékletet tanúsítson.
dr. Zeke László: Nem osztom a véleményed arról, hogy az AI „színtiszta lopás”. Egy primitívebb szinten álló algoritmus persze lehet, hogy nem tesz mást, mint összelopkod jellemző frázisokat az alkotó életművéből és ezeket az elemeket ügyesen összeillesztgeti (mintha csak egy plagizáló ember igyekezne elleplezni csalását), de azt gondolom, hogy mára megváltozott a helyzet.
Éppen Bach példáját hozod, annak a zseninek a példáját, akivel kapcsolatban olvashattunk Harrari Homo Deus című könyvében egy érdekes történetet a számítógépes alkotói folyamatról. Arról, hogy amint a gépet nem ügyesen „lopni” tanítja meg az ember, hanem alkotni, a komponálás stiláris törvényszerűségeit alkalmazni, akkor minőségi ugrás áll be.
Ez már nem az a szint, amikor egy primitív algoritmus mechanikusan rak össze mintákat! Olyasmi történik, mint amikor a sakkozó számítógépet nem a rengeteg játszma lehetséges lépés sorozataira tanítják meg és a kombinációk, a lépés lehetőségek számát annál gyorsabban tudja „átgondolni”, minél erősebb a processzora, illetve minél több időt hagyunk a lépése előtt. Ehelyett a gép sakkozni tanul meg és nem az embertől, hanem saját magától tanul.
Nem az emberek lépéseit jegyzi meg és alkalmazza, hanem a sakk törvényszerűségeit megismerve játszani tanul magától, egy olyan géptől, aki másodpercenként egyébként millió lépésnyi eshetőséget képes elemezni. A fordulat valahol ott van, amikor Garri Kaszparovot, az akkor regnáló sakk világbajnokot legyőzte a Deep Blue számítógép. Ma ott tartunk, hogy a legkomolyabb sakk gépeket nincs ember, aki legyőzze. (Ugyanez a folyamat sakknál több intuíciót, kizárólag emberinek tulajdonított képességet igényló go játékban is megismétlődött.)
Egy egyszerű szótár program másodpercek alatt egy idegen nyelv összes szavát, annak helyes kiejtését „meg tudja tanulni”, de nem képes a nyelvet használni. Az első primitív fordító programok megmosolyogtatóan idétlenül tolmácsolták a nyelvet. A minőségi változás a Chat GPT-vel köszöntött be, amikor az átlag ember nyelvkészségét, íráskészségét, nyelvtani ismereteit jóval meghaladó szinten kommunikáló rendszer lépett a mechanikus nyersfordító programok helyébe.
Olyasmit alkotott az ember, ami az emberi képességeket meghaladja. Ezúttal nem csupán fizikai teljesítményben (mint amilyenre képes az autó, a repülőgép, a távcső, a mikroszkóp stb.), hanem a kreatív képi alkotás területén is. Ezért gondolom, hogy az embernek maradt, egyébként valóban legfontosabb eleme az alkotásnak előbb-utóbb az marad, hogy a mi fejünkből, fantáziánkból pattan ki az ötlet, s nekünk lesz lehetőségünk „elmagyarázni” a gépnek, hogy mit szeretnénk látni, éreztetni, mivel és hogyan szeretnénk hatást kelteni a befogadókban.
Babos Tamás: Ez a kérdés rettenetesen összetett, a minap olvastam ebben a témában három szakdolgozatot, és bírálatokat, valamint voltam egy előadássorozaton is.
A Disney és azt hiszem a Paramount - lopás ide vagy oda - mégis beperelte a Midjurney-t, mert bizonyítottnak vélik, hogy az általuk alkotott karaktereket jogtalanul használta.
A gép, amit megtanítunk tanulni, és önmaga komponál, Bachabb még Bachnál is. Nézzük kicsit szélsőségesen: ahhoz, hogy valaki zeneszerző legyen, kell zenei érdeklődés, mondjuk meg kell tanulnia kottát olvasni, kell ismerni a szolfézst, összhangzattant, karvezetést, miegyéb mást, és kell persze tehetség is. Ez rengeteg ismeret. A gép mindezt fölöslegessé teszi. Az a világ jön, ahol nehezen tudsz mit mondani, amikor jön a kamasz gyereked, lelkesedve, áthatva az alkotás vágyától, hogy ő bizony zeneszerző lesz, te pedig azt tanácsolod neki, hogy írjon inkább promtokat, azzal sikeresebb lesz. Jobb, mint Bach. Valahogy ennek még nem tudok örülni.

A minap láttam a közösségi médiában egy hirdetést, egy ismert orvossal, aki – valószínűleg tudta nélkül – a saját hangján, a saját képmásával győzködött arról, hogy milyen csodaszert kell megvennem az egészségem érdekében. A kép, a hang meggyőző volt, egyedül a kontextus, valamint a gesztusok és a hang monotonitása volt árulkodó, mintha az egész AI video lenne. Én ebben nem az alkotás forradalmát látom.
A közösségi médiából látjuk, hogy az a folyamat, amit a képkészítés demokratizálódásaként emlegetünk, vagyis, hogy ma már hihetetlen tömegek számára vált elérhetővé és kezelhetővé a képkészítés (foto, video), nem hozott semmiféle minőségi javulást, sőt, brutálisan rombolja a fiatalok képi látását, gondolkozását, rossz beidegződéseket fixál, és relativizálja a minőséget, emellett komoly, generációkat érintő mentális problémák forrása.
Nincs kétségem afelől, hogy a befektetők (tőke) azonnal beveti az AI által generált képeket a filmezésben is, amint kifizetődővé válik, és nem kell drága stúdió, díszlet, világítás, technikai felszerelés, nyersanyag, utómunka, jelmez, kellékek, színészek. Gondolkozás nélkül cserélik majd le az alkotókat a gépre, amint megéri. Ha a műfaji filmeket nézem, még érthető is, vagy legalábbis megszokott ez a szemlélet. Előbb-utőbb nyilván nagyságrendekkel lesz olcsóbb történelmi környezetben játszódó filmet készíteni generatív képek segítségével. De mi van a szerzői filmekkel? A Bach problematika ott merül fel igazán. Ma már az alkotói munkafolyamatok egyes részeihez sokan használják az AI-t, de mi van, ha mindent az AI csinál?
Azon gondolkodom, mi végre is ez? A hivatkozásban látható focimeccs most még vicces, de csak idő kérdése, hogy az AI vezérelt robotok jobban játszanak, mint Messi.
Ekkor már nem csak a robotika iránt érdeklődők nézik majd a meccset, hanem hatalmas tömegek, akik fogadnak is arra, hogy ki győz.
dr. Zeke László: Bárhogyan lesz is, a fejlődés exponenciális. Tenni ellene emberi mivoltunkban vajmi kevés esély van, egyetlen lehetőség felülni erre a „vonatra” és kihasználni. Kísérletképp magam is összebütyköltem egy klipet – telefonommal, meg Final Cuttal vágva – régi zenekarunk (Zexattt Band) még egy 2005-ben készült felvételére: „Nincsen pénzem, melózni muszáj”.
A klip a Grok AI alkalmazással létrehozott snittekből áll. Dal a NER bukását követő oligarcha sorsról. Szólóének: "Orbán Viktor", gitárszóló: "Gajdics Ottó", szaxofon szóló: "Kövér László", a doboknál: "Fásy Ádám". Közreműködnek még: "Bayer Zsolt", "Bohár Dániel", "Deák Dániel", Nagy Feró", "Győzike", "Hont András", "Huth Gergely", Lánczi Tamás", "Lázár János", Mészáros Lőrinc" és még sokan mások…
dr. Zeke László - Nyitókép: dr. Zeke László - AI illusztráció