Sora är här. En industri dör och en annan föds. Människor skakar i existentiell kris och fruktar för sina jobb. Men snart vänjer vi oss. Det måste vi.
Vad exakt är Sora?
Sora, vilket betyder himmel på japanska, är mångmiljardföretaget OpenAI:s nya AI-modell, företaget bakom ChatGPT. Sora är en videogenererande AI som kan skapa minutlånga videofilmer utifrån textinstruktioner, så kallade ”prompts”.
Dessa textinstruktioner kan vara lite vad som helst och är inte alls begränsade till enkla scener. Sora kan arbeta med flera karaktärer i interaktion med varandra, specifika kroppsrörelser, finkorniga detaljer, belysning, väder, olika upplösningar och kamerarörelser. Sora förstår hur olika material rör sig i vinden, hur näshåren på en förkyld människa ser ut, hur snön i en hundpäls fastnar och rör sig.
Sora befinner sig just nu i ett teststadie, ”red teaming” i teknisk tunga, där man arbetar med att identifiera riskområden och brister i produkten. Mycket nödvändigt, så klart. Man behöver inte fundera särskilt länge för att komma på hur denna revolutionerande produkt skulle kunna användas för ondska. Vid sidan om säkerhetstesterna har tillgång också givits till betrodda designers och filmskapare i syfte att ytterligare förbättra Sora.
Hur bra är Sora?
Innan vi belyser Soras påverkan på filmindustrin, måste vi undersöka hur bra Sora faktiskt är. Svaret är att Sora är så sinnessjukt, skrämmande bra. Så bra att man knappt tror sina ögon. Det är faktiskt inte klokt.
Uppgraderingen från tidigare videogenererande AI-modeller till Sora går att jämföra med skillnaden mellan hästen och bilen. Tidigare AI-modeller producerade förvridna människor och hoppiga bildrutor som var så pass dåliga att en fem-åring hade kunnat identifiera dem som oäkta. Men Sora producerar ansträngningslöst fotorealistisk film som i princip är identisk med det dina ögon ser utanför dörren. Sora kan också animera filmer i kvalitet med Pixar- och Disney produktioner. Eller skapa enligt någon helt annan stil. Det beror på textinstruktionen.
För att du ska förstå hur sinnessjukt bra Sora är – och hur fort det har gått framåt – kan du kolla på dessa filmer. Den första filmen visar var vi var för ett år sedan. Den andra videon visar var vi är idag.
Sora är inte perfekt (ännu)
Med det sagt finns det vissa små detaljer hos Sora som inte riktigt fungerar till hundra procent. Till exempel kroppsspråk, mimik och andra fysiska aspekter. Även aktion-reaktion ter sig svårsmält för Sora. Ber du till exempel om en video på en person som äter en banan kan Sora missa att lägga till bitmärken på bananen efter tuggan. Sparkas en fotboll in i en plåtvägg kanske väggen inte bucklas. I längre klipp kan höger och vänster bli fel och vissa komplexa kamerarörelser leder lätt till förvirring. Det finns också något abstrakt jag inte riktigt kan beskriva, någon aspekt i Sora-filmerna som inte känns på riktigt.
Men – och det är ett stort MEN – kom ihåg att vi befinner oss i en tidig fas. Sora är sin sämsta version någonsin just nu. Jag vågar knappt spå hur långt fram vi är om något år. Det är så lätt att nu sitta och peka på det som inte fungerar. Kanske är det en mänsklig försvarsmekanism att skapa distans mellan AI och oss.
Tänk efter: om någon skulle sagt till dig för tio år sedan att vi snart kommer ha en AI som kan skapa film och skriva akademiska texter – skulle du då trott på det?
En industri dör och en annan föds
Är Sora slutet för filmindustrin? Dör den mänskliga kreativiteten med AI?
Nej, nej och nej. Andas ut. Den mänskliga kreativiteten är idag – och förhoppningsvis för alltid – oersättlig. Det är trots allt mänsklig kreativitet som skapat Sora, och mänsklig kreativitet som Sora skapar sina fantastiska filmer utifrån. I någon mån rör det sig om ett hundraårigt upphovsrättsbrott som sker på sekunder. Märkligt och eggande och lite ballt.
Så hur kommer Sora påverka filmindustrin?
Jag tror Sora kommer implementeras som en standard i förproduktioner – man kommer använda AI för att visualisera vinklar, ljussättningar och annat. Det blir ett totalt ersättande av bildmanuset på sikt. Även i postproduktioner tror jag Sora kommer bidra stort. I stället för att måla bort oönskade objekt i bakgrunden konsulterar man Sora. Vill man testa hur det skulle se ut ifall det regnade under biljaktscenen konsulterar man Sora. Kanske tycker man att ett par tårar på Tom Hanks kind skulle förstärka scenen? Då konsulterar man Sora.
Allt detta går redan att göra idag. Men med Sora blir det mycket enklare. Sora kommer bli ett komplimenterande, förenklande verktyg för filmskaparen. Inte en ersättare.
Med detta kommer förutsättningarna givetvis att förändras drastiskt, vilket är helt naturligt, inte alls någonting nytt. Teknologin har alltid påverkat hur film produceras, distribueras och visas. Teknologin har alltid målat om arbetslandskapet, ersatt vissa yrkesroller med nya. Förr klippte man film fysiskt, idag gör man det digitalt. Förr behövdes filmprojektionister, idag visas film mestadels digitalt. För länge sedan var det stumfilm, idag har vi ljudtekniker och Dolby Atmos. Idag har vi animatörer, snart kanske vi inte har det på samma sätt.
Teknologin ger jobb och den tar jobb. Den förändrar och skrämmer. Och så har det alltid varit. Vi kan tala om en industris död, men då måste vi tala om en annans födsel. Och vi människor hänger med.
Den största fördelen med Sora
Den kanske största fördelen med Sora – och på sikt med andra videogenererande AI-modeller (för ni kan ge er på att Google med flera jobbar dygnet runt nu) – är att filmskapandet blir tillgängligt för alla.
Filmbranschen är och har alltid varit brutalt hänsynslös, elitisk och omöjlig för många. Det finns garanterat helt otroliga berättelser där ute i världen som aldrig kommer få möta en publik – för då krävs det ett produktionsbolag, massa pengar, människor som tror på dig (eller känner dig), massa medvind och både det ena och det tredje. Men med Soras i skrivande stund oupplåsta potential har vem som helst snart möjligheten att uttrycka sig och skapa. Vad kommer din regidebut belysa? Blir det en animerad kort film à la Pixar? En live-action thriller? Något helt annat?
Om professionellt filmskapande tillgängliggörs i högre grad, tror jag filmen som medium blir rikare. Det största hotet med Sora tror jag inte återfinns i filmbranschen, utan i verkligheten. Spridande av propaganda, falska nyheter, deepfakes, hatbrott, falskt bevisningsmaterial och så vidare är nog det vi ska vara livrädda för.
Framtiden: Anpassas eller förpassas
Om du tänker dig en igelkott på väg genom ett trångt rör så finns det bara en väg för den att gå – framåt. Samma gäller för teknologin. Vi kan inte stoppa den. Se bara till människans historia för bevis på denna tes.
Först sker någon typ av revolutionerande genombrott, internet, elektricitet, krut, vad som helst, och sen går det snabbare och snabbare och snabbare. Som en växande snöboll i nedförsbacke; den kan inte stanna och blir bara större och större i tilltagande takt.
Och varje gång en sådan teknologisk snöboll sätts i rullning reagerar människor olika. Vissa prisar, andra skyr. Oavsett reaktion tror jag vi alla enas i att vi just nu är något existentiellt förvirrade, något rädda. Det är inte så konstigt; teknologiska kliv, framför allt i magnitud med dem som vi nu tar, innebär osäkerhet och risk. Vi människor gillar inte osäkerhet och risk, för det är evolutionärt ofördelaktigt. Men det spelar ingen roll. Snöbollen kommer fortsätta rulla.
Därför rekommenderar jag att man försöker se AI, inte minst Sora, som en kreativ kollega, en möjlighet till förbättring och förenkling. Inte som en hotfull, taggig sak, för då blir tillvaron snabbt mörkt och dyster.
Sora är här för att stanna. Vi vänjer oss snart. Det måste vi.