Hva er et bilde?

Kurator og forsker Antonio Somaini mener kunstnere er avgjørende for å forstå hvordan kunstig intelligens påvirker kulturen.

Gregory Chatonsky, The Fourth Memory, 2025. Installasjonsbilde, The World According to AI, Jeu de Paume, Paris, 2025. Foto: Antoine Quittet.

Antonio Somainis utstilling The World Through AI på Jeu de Paume i Paris favnet et tiår med kunstneriske tilnærminger til maskinsyn, ansiktsgjenkjenning og generative modeller, og skilte seg ut blant fjorårets mange KI-relaterte utstillinger. I det følgende intervjuet, som fant sted i forkant av forelesningen «Latent Spaces: AI, Art and the Archive» ved Estetisk seminar på Universitetet i Oslo, argumenterer Somaini for hvorfor kunstnere er avgjørende for å forstå hvordan KI påvirker kulturen.

Somaini er professor i film, medier og kulturteori ved Université Sorbonne Nouvelle i Paris, og hans forskning på KI og visuell kultur er tett knyttet til det kuratoriske arbeidet. For Somaini er samtidskunsten et felt der KIs politiske, infrastrukturelle og perseptuelle dimensjoner blir lesbare, noe teorien ikke kan oppnå alene.

Ditt tidligere arbeid kretset rundt montasjeteori, redigering som tenkning og kunnskapsproduksjon gjennom sammenstilling. Hva gjorde at du fattet interesse for KI?

Min interesse for KI, og mer spesifikt for påvirkningen KI-algoritmer og -modeller har på bilder og visuell kultur, begynte i 2017 da jeg leste en artikkel av Trevor Paglen med tittelen Invisible Images: Your Pictures Are Looking at You. Han skrev om maskinsyn og diskuterte dette ikke-menneskelige, maskinelle blikket som gjennomsyrer den visuelle kulturen, med en hel rekke anvendelser knyttet til overvåkning, kontroll og så videre. I en av passasjene skrev han at «hvis vi vil forstå hvordan maskinsyn fungerer, må vi avlære oss å se som mennesker».

Den setningen traff meg, for på det tidspunktet arbeidet jeg med den franske utgaven av Dziga Vertovs tekster fra 1920- og 30-tallet om hvordan fotografiet og filmmediet introduserte en form for ikke-menneskelig syn som forskjøv og reposisjonerte det menneskelige blikket. Vi finner det i Vertovs «kino-øye» [tittelen på en film fra 1924 som er blitt et filmteoretisk begrep], kameraet som et mekanisk øye mer fullkomment enn det menneskelige, i Siegfried Kracauers tekster om fotografiet fra 1927, i László Moholy-Nagys idé om fotografiet som et likegyldig blikk løsrevet fra menneskelige affekter, og i Walter Benjamins begrep om det optisk ubevisste. Paglens formulering åpnet en direkte linje mellom denne eldre historien og nåtiden. Det har nå vært mitt hovedfokus i forskningen i snart ti år.

Antonio Somaini.

Jeg ble oppmerksom på arbeidet ditt med KI-modeller da du var med å organisere konferansen Cut/Generate i Paris. Tittelen navngir to ganske forskjellige operasjoner. Hva står på spill i den distinksjonen?

Ideen var å forsøke å forstå den nye typologien av bevegelige bilder som generative KI-modeller har introdusert – enten det dreier seg om generative motstandernettverk [GAN] på slutten av 2010-tallet eller diffusjonsmodellene som brukes nå. Hvordan produseres disse bevegelige bildene teknisk, hva slags temporalitet formidler de, og hvilke nye former for montasje benytter kunstnere og filmskapere? Cut/Generate pekte på en vesentlig forskjell mellom klippets operasjon i analog film eller en digital videofil, og bildegenerering, som ikke springer ut av noen form for optisk opptak, men av instrukser, av å kombinere tekst og bilder. 

Jeg har sett mange nyere kunstverk som bruker generativ KI, men mange av dem – som lydverk eller filmer som endrer seg for hver visning – kunne vært laget med langt enklere algoritmer. Disse formene finner vi allerede i Fluxus og hos kunstnere som John Cage og Brian Eno. Når du kuraterer, hva slags KI-verk interesserer deg, og hvordan skiller du det fra disse eldre algoritmiske praksisene?

Det som interesserer meg, er kunstnere som forholder seg til KI fra svært ulike perspektiver og medier, men med en kritisk holdning. Da mener jeg kritisk ikke bare i betydningen negativ, men også reflektert, konseptuell og bevisst på de sosiale og politiske implikasjonene av disse teknologiene. I utstillingen på Jeu de Paume hadde jeg med verk fra de siste ti årene, fra 2015 til i dag. I tillegg inkluderte jeg en serie «tidskapsler», vitrinemontre med gjenstander, tekniske apparater, bøker og fotografier fra andre historiske perioder som ga et genealogisk perspektiv på samtiden.

Hito Steyerl, Mechanical Turks, 2025. Installasjonsbilde, The World According to AI, Jeu de Paume, Paris, 2025. Foto: Antoine Quittet.

I Jeu de Paume-utstillingen inkluderte du verk som tar for seg den materielle infrastrukturen til KI, som Hito Steyerls Mechanical Kurds [2025] eller Agnieszka Kurants Aggregated Ghosts [2020], som begge retter oppmerksomheten mot det menneskelige arbeidet bak KI, sammen med mer spekulative verk. Hvordan tenkte du kuratorisk om disse ulike registrene?

Kurant og Steyerl, men også Paglens Behold These Glorious Times! [2017] og Kate Crawford og Vladan Jolers Anatomy of an AI System [2018], behandlet forskjellige lag i KI-infrastrukturen, den svært komplekse sammensetningen av prosesser og arbeidskraft – utvinning, energi, mikroarbeid, treningssett. Men det var også verk med en mer spekulativ dimensjon, som reflekterer over hvordan KI endrer vår opplevelse av tid, av fortid, fremtid og nåtid. Disse handler ikke om KI-infrastruktur, men om KI som mulighetsrom. Holly Herndon og Mat Dryhursts xhairymutantx [2024], for eksempel.

Vi hadde også en seksjon som utforsket krysningspunktene mellom store språkmodeller og litteratur. Gregory Chatonskys installasjon The Fourth Memory [2024] er et godt eksempel, en generativ video som ble produsert på nytt for hver avspilling uten noen gang å gjenta seg. Hvert bilde ble beskrevet av en bilde-til-tekst-modell, og teksten så lest opp av en KI-generert stemme – en hel loop mellom ord og bilder. KI omstrukturerer virkelig relasjonen mellom ord og bilder.

Det har vært mange KI-utstillinger i det siste, men jeg ser også mange utstillinger som går i motsatt retning, som fremhever håndverk og håndfaste prosesser. Er det også en form for kritikk?

Absolutt, det kan være en form for kritikk. Men det er en kritikk som velger å overse KI, eller å behandle det gjennom fravær, mens utstillingene jeg forsøker å utvikle konfronterer KI direkte. De prøver å gjøre KIs operasjoner mer transparente, men også noen ganger å foreslå andre former for KI, som vi ser i hele Holly Herndon og Mat Dryhursts praksis de siste årene. Akkurat nå domineres det kommersielle KI-feltet av en håndfull amerikanske storselskaper, alle mer eller mindre alliert med Trump-administrasjonen. Det er enormt mye som står på spill politisk. Og disse kunstneriske forsøkene på å vise at KI kunne vært tenkt og utviklet annerledes, er svært viktige.

Begrepet «latent rom», den komprimerte matematiske representasjonen av alt av data en modell har blitt trent på, er sentralt i din tenkning om KI. Etter hvert som mer av vår kulturelle hukommelse organiseres av disse prosessene, hvordan påvirker de hva som blir synlig og hva som utelates?

Vi er nå i en situasjon der alle kulturelle objekter som eksisterer i digital form på internett til slutt ender opp i treningssett for KI-modeller. Og det finnes ikke bare ett slags latent rom, men mange ulike typer avhengig av modellen. Det de har til felles, er at når de har fått de digitale dataene i treningssettene, komprimerer de alt dette materialet til vektorer. Et latent rom er altså en form for komprimert vektorrepresentasjon som bare fanger opp det som allerede fantes i treningsdataene. Men komprimeringen filtrerer også bort data som var mer marginale, mindre representert. Latente rom er dermed et system som inkluderer og ekskluderer, og som slik forlenger den maktdynamikken arkiver historisk har hatt. Forskjellen er at det ikke ligger menneskelige eller institusjonelle intensjoner bak disse avgjørelsene, de tas matematisk. Derfor er det helt avgjørende å forstå dem, slik at disse operasjonene som bestemmer hva som tas med og hva som utelates, blir mer transparente.

Holly Herndon and Mat Dryhurst, xhairymutantx, 2024.

I Paglen og Crawfords Excavating AI [2019] viste de hvordan ImageNets treningsdatasett sorterte bilder av mennesker i rasistiske og dehumaniserende kategorier. Der blir skjevhetene lesbare, man kan se hvordan kategoriene ble konstruert. Men et latent rom er langt mer abstrakt, og det blir tilsvarende vanskeligere å forstå hvordan historien bearbeides.

Ja, men vi må fortsatt jobbe for å forstå latente rom bedre, for å gjøre dem mer lesbare. For å gjøre det, må vi i humaniora lære oss å være i dialog med informatikere. Akkurat nå er det lite dialog mellom de to feltene, og det er ikke bare humanioras feil. Informatikere ser ofte på disse modellene bare med tanke på hvordan de kan forbedres, og er ikke like interessert i de kulturelle implikasjonene. Det er et reelt behov for tverrfaglig dialog, og et behov for å innlemme begreper som vektorer, latente rom, alignment, trening og hallusinasjoner i humanioras vokabular.

Dette er begreper med historier som går langt forut for KI. Hallusinasjonsbegrepet er mye eldre enn KI, og begrepet «latent» er full av konnotasjoner knyttet til psykoanalyse, medisin og analogt fotografi, som i det «latente bildet». Vi må arbeide med disse begrepene. Samtidig, som jeg argumenterer for i essayet Algorithmic Images: Artificial Intelligence and Visual Culture, fører disse nye fenomenene til at vi må tenke nytt om terminologi, som selve begrepene bilde og syn. I dag kan vi med rette spørre oss selv hva et bilde er, når et bilde kan analyseres av maskinsynssystemer selv når det ikke er synlig for det menneskelige øyet, når det bare eksisterer som en digital fil.

Er det spørsmål fra utstillingen på Jeu de Paume du føler du trenger å utdype, eller har landskapet endret seg så mye siden da at du nå har gått løs på helt nye problemstillinger?

Utstillingen fra Jeu de Paume vil bli vist i nye versjoner i Frankfurt [på Schirn Kunsthalle, åpner 10. juni] og São Paulo [på SESC 24 de Maio, åpner 5. august], og jeg benyttet muligheten til å ta opp nye temaer, som fremveksten av AI-slop og fenomenet «AI-slopaganda», og til å gi mer synlighet til temaer som også var med i Jeu de Paume, som dekoloniale tilnærminger til AI. Den neste utstillingen åpner i september 2027 i Lisboa på Museum of Art, Architecture and Technology (MAAT). Deler av museet holder til i det som var byens hovedkraftverk, så jeg bestemte meg for å fokusere på spørsmålet om energi. Den kommer til å hete Energies of AI og vil inkludere et stort nytt prosjekt av Crawford og Joler kalt Metabolic Machines, som behandler KI-teknologier som metabolske teknologier som absorberer enorme mengder energi, naturressurser og data.

Det blir en helt annen utstilling enn den på Jeu de Paume, den vil handle mindre om representasjonen av fortiden og være mer rettet mot fremtiden. Jeg kommer også til å vise nye verk som forsøker å si noe om hvor KI-teknologiene kan være på vei. Ett eksempel er et prosjekt av Herndon og Dryhurst kalt Kinder Scout, som handler om KI-agenter, modeller som baserer seg på spørsmål og svar, men som har høyere grad av autonomi. Publikum vil kunne se KI-agenter som forsøker å lage genuint nye bilder, ikke variasjoner over allerede eksisterende, samtidig som andre agenter presser dem mot stadig mer originale resultater.

Kate Crawford og Vladan Joler, Anatomy of an AI System, 2018, detalj.

Oversatt fra engelsk