En litt dårlig tekst

Robert Seymour, *The March of Intellect*, 1828.

Mens folk jeg møter fra andre yrker ikke får nok av å fortelle om de lure måtene de bruker kunstig intelligens (KI) på, er det så langt kun én kritiker jeg kjenner som har betrodd meg noe om egen KI-bruk til skriving – og den var rimelig påholden. Selv om dette bare er en anekdote, tror jeg den er talende for en forskjell som er definerende for kritikken i relasjon til mye annet kognitivt arbeid. Kritikere har behov for å verne om sin «intellektuelle subjektivitet», det personlige eierskapet til teksten, og KI anses å være antitesen til et slik program. Samtidig innebærer også jobben som kritiker en rekke oppgaver som KI synes egnet til å løse. For en hypotetisk, teknologisk foroverlent kritiker, er dette et dilemma.

Jeg er ikke den første som stiller spørsmålet om KI kan skrive kunstkritikk. I fjor fikk tabloiden London Standard en KI til å etterligne den avdøde kunstkritikeren deres Brian Sewell (kjent for sin syrlige penn, misogyni og sitt utrettelige korstog mot YBA-generasjonen). I en kommentar i The Guardian konkluderer kritiker Jonathan Jones med at KI-iterasjonen av Sewell ikke klarte å tilfredsstillende simulere stemmen hans, og følgelig at KI derfor ikke kan erstatte den menneskelige kritikeren. Slutningen høres intuitivt sann ut, men den er også åpenbart forutinntatt. Eksperimentet til London Standard var en gimmick som ikke egentlig beviser noen ting. Og selv om dagens språkmodeller kanskje er ute av stand til å skape prosa med en estetisk finesse tilsvarende den til Sewell, eller gjøre like originale observasjoner, utelukker det ikke at den kan ta over mye av skrivearbeidet for den gjengse kritiker.

Så jeg må ut i felten. Eller ut og ut; jeg nøyer meg med å laste opp et foto fra Jannik Abels inneværende utstilling på Kunstnernes Hus i ChatGPT. Jeg passer på å velge en utstilling vi allerede har anmeldt, så ikke vedkommende skal føle de blir avspist med en KI-anmeldelse. Dessuten er Abels installasjon egnet fordi informasjonsinnholdet er relativt lavt. Det er også noe forlokkende upassende i å sette GPT i gang med å tolke en kunstner med et så til de grader lavteknologisk prosjekt. Jeg velger et oversiktsbilde fra et av rommene der trestokker med forskjellige utskjæringer står plassert langs veggene og henger fra taket. Jeg opplyser GPT om at bildet er fra en samtidskunstutstilling, ingenting mer, og ber om en beskrivelse og analyse. Den henter overraskende mye ut av bildet, men nivået på tolkningen er skuffende. Her går det i overfladiske og blødmefulle tapninger av temaer som natur vs. kultur, sårbarhet og forgjengelighet, miljøvern osv. Jeg ber den tone ned sentimentaliteten, uten at det hjelper nevneverdig. Lesningen blir bare tørrere og mer formalistisk, men minst like uinspirert: «Dette arbeidet kan forstås som en refleksjon over hva en skulptur er og kan være».

Skyldes det treningsdataen, at den har gulpet i seg for mange dårlige pressemeldinger? Frustrert hopper jeg i det og spør hvordan kunstkritikeren Stian Gabrielsen ville analysert utstillingen. «Han kunne lekt med tanken om at kunstverket, med sine hengende greiner, også har en viss «tragikomikk» i hvordan det prøver å skape noe monumentalt ut av noe så enkelt som stokker», opplyser den, til min bestyrtelse. Jeg får mistanke om at underprestasjonen kan ha å gjøre med at jeg prompter på norsk. Trolig har GPT lest mer egnet kunstfaglig tekst på engelsk. Jeg bytter til engelsk, og ber den i tillegg etterligne David Joselit, fordi jeg tenker stilen og perspektivene hans er distinkte nok til å gi utslag på resultatet. Og ganske riktig, nå nærmer vi oss noe mindre demonstrativt ubegavet, både hva gjelder prosa og tolkning:

Joda, teksten lider fortsatt av høy sjargong- og klisjétoleranse, men om jeg vurderer den med kompromissvillige redaktørøyne, er det en tydelig forbedring fra de første forsøkene, og ikke milevis unna noe man kunne snublet over i kunstpressen, vil jeg påstå. Det er ikke vanskelig å se for seg at den med en porsjon redigeringshjelp – kanskje fra GPT selv? – kunne løftes til noe som passerte en slags kunstkritikkens Turing-test, altså unngikk å heve altfor mange øyenbryn blant lesere.

Nok empiri, tilbake til skrivebordet for å fortsette spekulasjonen – nå med GPT i rollen som sparringspartner. En etablert oppfatning er at kunstkritikken forutsetter en sanselig nærhet til fysiske objekter; den rapporterer det som oppstår i møtet mellom betrakter og verk. Svarene jeg får fra GPT når jeg ber den vurdere implikasjoner av KI-generert kritikk, er farget av denne oppfatningen. Det er ventet, all den tid den er trent på menneskelig kommunikasjon, som naturlig nok er gjennomsyret av slike antagelser. Sin egen utilstrekkelighet som kritiker begrunner den med påstander som at KI-kritikk ikke vil klare å engasjere lesere på samme måte som menneskeskapt kritikk. KI vil også være mindre idiosynkratisk og risikovillig, mener GPT, fordi den bare reproduserer mønstrene den kjenner fra treningsdataen. Felles for disse argumentene er en idealistisk holdning til kritikken. Men i realiteten er det jo langt fra alltid at menneskeskapte anmeldelser innfrir slike krav. Den jevne leser finner etter alt å dømme det meste av kunstkritikk så å si kategorisk uengasjerende. Og risikovilje og originalitet er knapt dominerende trekk ved kunstkritikken i samtiden. Spørsmålet mitt er altså, helt nøkternt, om KI kan erstatte, ikke overgå kritikeren. Middelmådig er bra nok.

I den utstrekning kunstkritikere i dag tillater seg å bruke KI er de insentivert til ikke å snakke høyt om det, fordi det risikerer å svekke legitimiteten ved de de skriver. Jeg tror det skyldes at bedømmelsen vår av kritikkens kvalitet er betinget av faktorer utenfor teksten. Ulikt for eksempel en forskningsartikkel, som vurderes så å si utelukkende på kunnskapsverdi, tilskriver vi kritikken verdi basert på en funksjon den fyller som til sist er mer sosial enn epistemisk. Mens individuelle kritikere kan bedømmes etter den litterære og argumentative kvaliteten på tekstene deres, er kritikkens samfunnsverdi bestemt av praksisen disse tekstene springer ut av, heller enn det tekstinterne resultatet. Talende er en annen viktig egenskap GPT tiltror den menneskeskapte kritikken i sin forsvarstale, at den viser tilbake på «en subjektiv og situert opplevelse – en tenkning i møte med kunst som involverer persepsjon, følelser, kulturell bakgrunn og kroppslig erfaring». Men den medgir samtidig at KI godt kan simulere en slik «situerthet».

Gitt at det som hindrer en mer utstrakt og åpenlys bruk av KI i kritikken er forpliktelsen vår på normer som vektlegger en kontinuitet mellom sanseerfaring og tekst, som fort kan endre seg med en tettere integrering av virtuelle og fysiske arenaer, er det rimelig å se for seg en gradvis normalisering av KI-bruk også blant kritikere. Jeg forestiller meg tre scenarioer. I det første, som jeg kaller «konservativt», vil kritikeren fortsette å skrive uten å bruke KI til annet enn elementære assistentoppgaver som å hente inn og organisere informasjon og lese korrektur. I det andre, «optimaliserende», scenarioet, er kritikeren fortsatt forfatter av teksten, men bruken er mer foroverlent. I praksis vil dette sikkert bety at KI-en er trent opp til å skrive med den personlige stemmen til kritikeren, og at kritikeren begrenser seg til å prompte, redigere og gjøre kosmetiske justeringer av tekstflaten. I det tredje, «late», scenarioet, overlater kritikeren nærmest alt skrivearbeidet til KI, men figurerer fortsatt som tekstens offisielle avsender og betjener rollene en kritiker ellers har i kunstfeltet.

Joseph Racknitz, illustrasjon fra boken The Turk, 1789.

GPT holder den optimaliserende modellen for å være det mest sannsynlige utfallet «fordi den bevarer kritikernes sosiale og intellektuelle funksjon samtidig som den øker produktiviteten». Den tar imidlertid ikke høyde for problemer knyttet til overproduksjon når den vektlegger produktivitet som kriterium. Å skalere opp mengden kritikk ved å redusere arbeidsinnsatsen, er jo ikke et rasjonelt mål dersom det ikke fins et marked for mer kunstkritikk. Det gjør det for så vidt på et vis, men zoomer vi ut fra sfæren av profesjonelle interessenter som trenger dekning, er kunstkritikkens utfordring i dag noe nærmere det motsatte, nemlig å bli lest overhodet. I en situasjon der informasjon er metervare, virker det utilrådelig for en truet sjanger som kritikk å svekke den allerede skjøre kontrakten med leseren ved å senke verdien på produktet. I stedet bør den antagelig konsentrere seg om å garanterer sin egen knapphet, foreslår jeg. Én opplagt måte å gjøre det på i et miljø mettet med KI-generert innhold, er å få kritikkens form til tydelig å attestere et menneskelig opphav.

GPT mener den optimaliserende kritikeren lett vil kunne fingere disse kvalitetene i teksten med KI. Men er det ikke overflødig for en kritiker å bruke KI til å simulere en tekst som primært skal se ut som den ikke er skrevet av KI, når det å øke produktiviteten heller ikke lenger er et mål, jevnfør knapphetsargumentet mitt? spør jeg. GPT medgir at en slik utvikling hypotetisk kan ende med å parkere KI på sidelinjen som redskap for kunstkritikken og kulminere i en ny vår for menneskeskapt kritikk. Men selv om dette hadde vært en vakker konklusjon, innser jeg at det er naivt å tro at opplsutningen om et slikt, mer estetisk, tekstkriterium i kritikken vil eliminere mistanken om simulering, selv om insentivene til å bruke KI svekkes.

Den kroniske mistanken om KI-generert tekst har antagelig ikke bare konsekvenser for hvordan kritikken skrives; den ville også kunne føre til at leseren begynner å forholde seg til kritikk på en mer kynisk måte, interessere seg mindre for hva avsenderen forsøker å si, fordi hen er opptatt av å redusere leseinnsatsen for å unngå å kaste bort tid på automatisk generert innhold. En slik reforhandling av leserkontrakten kunne igjen tenkes å forsterke tendensen til en generell estetisering av kritikken, det vil si dyrking av tekstens tekstens umiddelbare overflatekarakter heller enn kompleks diskurs, men av motsatte grunner enn i scenarioet skissert over: fordi kritikken ikke lenger forventer å bli lest.