MidJourneylla tuotettu maisemakuva

Arkiv

Vad är AI-konst?

19. september 2022

Tilläggsanmärkning 1/2024: Utvecklingstakten för generativa AI-applikationer har varit extremt snabb under de senaste åren, vänligen och beakta publiceringsdatumet för denna artikel. Artikeln kan innehålla mycket föråldrad information.

Min avsikt med texten är att förenklat beskriva artificiell intelligens på ett sätt som är begripligt för alla. Det handlar alltså inte om en vetenskaplig definition utan snarast ett försök att förklara en mycket mångfacetterad sak. Ni som har haft mer att göra med artificiell intelligens – ta gärna kontakt, så kan vi göra texten ännu lättare att förstå och korrigera mina fel.

I den här artikeln behandlar vi s.k. svag eller snäv artificiell intelligens, som enbart kan utföra på förhand fastställda uppgifter enligt användarens instruktioner. Med stark artificiell intelligens avses människolik artificiell intelligens som försöker imitera hjärnans funktion och matematiska logik. Vi fokuserar särskilt på hur datorseende och text-till-bild-generatorer fungerar. 

AI vadå?

Vad menar vi egentligen med termen AI, artificiell intelligens? Enkelt sagt är artificiell intelligens ett datorprogram. Den vanligaste användningen för artificiell intelligens är att behandla stora mängder data. Dylik artificiell intelligens har utvecklats för att identifiera mönster som upprepar sig (eng. pattern) eller för att hitta data som avviker från genomsnittet och använda det för att skapa analyser. Den här processen kallas artificiell intelligens eftersom den på sätt och vis påminner om människans förmåga att dra slutsatser, kombinera information och skapa något nytt.

Innan artificiell intelligens för konst fanns, utvecklade forskare datorseende som kunde användas för att identifiera föremål och saker i fotografier eller video, till exempel människor eller om det är natt eller dag. Man måste alltid träna artificiell intelligens för varje enskild uppgift. För att t.ex. träna artificiell intelligens i datorseende kan man ge den 1 000 bilder på människoansikten. Datorn analyserar bilderna genom att leta efter upprepade mönster. Efteråt använder datorn dessa upprepade mönster för att hitta likheter mellan bilderna, som datorns användare ger namnet ”ansikte”. Nu kan vi använda artificiell intelligens för hitta samma mönster i nya bilder, och sedan instruera programmet att kalla dem ansikten. När vi talar om maskininlärning menar vi att artificiell intelligens själv lägger till informationen från en ny bild den analyserat i sin egen databas. På så sätt lär sig datorn att nästa gång identifiera ett människoansikte lite bättre. Den här slags artificiell intelligens kan man redan hitta i kameran på nästan varje mobiltelefon, i funktionen där kameran ritar en fyrkant kring ansikten den hittat. Motsvarande teknik kan användas för att skapa algoritmer för olika föremål och saker och sedan kombinera dem till ett massivt datorprogram som kan identifiera olika saker. 

Låt oss ta ett annat exempel. Artificiell intelligens fungerar inte utan att datorns användare skapar regler för den att följa. Det debatteras om man istället för termen artificiell intelligens borde använda termen förstärkt intelligens (augmented intelligence). Vi måste lära oss att ställa rätt frågor till datorn – på så sätt kan vi få både noggrannare och snabbare information än vad vi kan uppnå genom våra egna observationer. Man kan till exempel mata in ett schackdrag i en dator, tillsammans med regler och spelets mål, och sedan uppmana datorn att efter varje drag analysera det bästa sättet att uppnå målet och vinna spelet. Datorn ser spelet som en slags ombytlig labyrint som den letar efter den kortaste vägen ut ur. Datorn testar efter varje drag alla tänkbara gångar i labyrinten och fattar ett beslut enligt det mål som maskinens användare bestämt. En dylik direkt taktik lämnar hål i försvaret och gör det möjligt för en mänsklig spelare utnyttja misstagen. Mänsklig kreativitet och anpassningsförmåga i olika situationer är inte något som man ännu riktigt lyckats koda. 

Låt oss ta ett tredje exempel. Medan jag skrivit den här texten har jag flera gånger stött på röda vågiga streck under det jag skrivit. I det här fallet har artificiell intelligens lärt sig svenska grammatikregler som den använder för att granska texten för eventuella skriv- och grammatikfel. Artificiell intelligens i mitt ordbehandlingsprogram kan föreslå korrigeringar och förbättringar i texten jag skrivit. Tyvärr kan programmet jag använder inte ännu producera begriplig text med instruktionen: ”Förklara enkelt artificiell intelligens åt ungdomsarbetare”. Men det finns redan artificiell intelligens som kan göra det. Faktum är att artificiell intelligens som genererar text och bild är redan så långt utvecklad att man inte längre kan särskilja material som skapats av artificiell intelligens eller människor. Även dessa modeller behöver alltid parametrar, det vill säga ramar som användaren ger maskinen för text- eller bildproduktionen. Artificiell intelligens saknar fortfarande kreativitet och intuition, men även dessa egenskaper försöker man hela tiden utveckla och skapa modeller för.

En bild skapad med AI-programmet MidJourney med textparametern: Two children lying on a grassy hill watching clouds.

Artificiell intelligens som bildkonstverktyg

Artificiell intelligens som används för att analysera bild eller video kallas för datorseende (CV eller Computer Vision). Datorseende analyserar fotografier eller videor utgående från de parametrar användaren gett. Datorseende används på fabriker för att räkna styckegods, identifiera olika föremål eller genomföra kvalitetskontroll. Polisen använder sig också av datorseende för att läsa registreringsskyltar på bilar och jämföra dem med polisen databas. Datorseende kan också användas för att arrangera bilder. Med den kan man sortera bilder i olika mappar, till exempel om bilden innehåller en katt eller en fågel. Dylik artificiell intelligens utnyttjas till exempel i Googles bildsöktjänst för att förbättra sökresultaten. Som jag nämnde använder sig artificiell intelligens av de mönster som den tidigare tränats med för att sluta sig till vad bilden innehåller.

Så hur ser datorn egentligen bilderna som visas? Jag har läst en träffande jämförelse, där man likaställde datorseende med en person som letar efter igenkännbara figurer i molnen på himlen. Det är mycket osannolikt att dylika mönster faktiskt förekommer, men människans tilltro till sina egna sinnen är stark och därför upplever hen verkligen att det finns ett ansikte i molnen. Googles ingenjörer testade det här med artificiell intelligens. De började använda datorseendet i motsatt riktning, och bad den att ändra ett fotografi för att förstärka de mönster den ser i dem. Om man gör om processen 5-10 gånger börjar även människoögat se de mönster som datorseendet har plockat från bilderna. Dessa repetitioner kallas för iterationer. Ju fler iterationer som genomförs, desto mer synlig blir den artificiella intelligensens påverkan i bilden. Med den här metoden kunde man få till stånd bilder som ofta var både skrämmande och vackert drömlika. Google kallade fenomenet DeepDream. Varför blev bilderna skrämmande då? Eftersom datorseendet behöver ett filter som bestämmer varifrån bilderna tas som används för mönstren som den letar efter och försöker förstärka i bilderna. Den vanligaste versionen av DeepDream var en version som letar efter hundar i bilderna.

Mona Lisa bearbetad av DeepDreams artificiella intelligens Källa: Wikimedia.

Vanligen startas en bild som den artificiella intelligensen gör med s.k. snö eller brus. Det här bruset fungerar för den artificiella intelligensen lite som ett moln på himlen, i vilket den börjar leta efter de mönster den fått som parametrar. Man kan också använda ett färdigt foto, en teckning eller ett konstverk som botten för bilden.

I de flesta fallen blir inte bilden som skapas genom en text-till-bild-generator helt sådana som man skulle ha önskat eller velat ha. Det kan finnas många orsaker till det här. En av de vanligaste orsakerna är antagligen att den artificiella intelligens du använder inte ännu kan tolka dina önskemål tillräckligt noggrant. Den kan förstå vad det handlar om, men den är inte ännu tillräckligt noggrann för att kunna skapa en fotorealistisk bild. En annan vanlig orsak kan vara att ditt önskemål, det vill säga de parametrar du gett den, inte var tillräckligt precisa.

En bild på ett tivoli från 30-talet skapad med DiscoDiffusion.

Forskning i artificiell intelligens och användning av den för att skapa konst har ökat explosionsartat sedan Googles DeepDream. Flera olika universitet, företag och privatpersoner har börjat skapa sina egna versioner av metoder för att skapa bilder med artificiell intelligens. Dall-E2, en artificiell intelligens utvecklad av OpenAI-forskningsgruppen, är så långt utvecklad att allmänheten inte ännu (augusti 2022) har fått tillgång till den. Utvecklarna av den artificiella intelligensen är rädda för missbruk. Den artificiella intelligensen i fråga kan skapa fullkomligt fotorealistiska bilder utgående från text skriven av en människa. Nedan finns en bild som genererats av vår praktikant Pii med parametrarna “A photo of cats riding a rollercoaster”. Google har en egen motsvarande artificiell intelligens som heter Imagen, Facebooks moderföretag Meta har Make-A-Scene och den mest betydande AI:n som använder öppen källkod är för ögonblicket Stable Diffusion. Google har inte publicerat sin artificiella intelligens av samma orsak som OpenAI, men Stable Diffusion kan redan testas av vem som helst. Forskarna är antagligen oroade av en god orsak. En dylik teknologi kan lätt missbrukas. I Kalifornien har man redan stiftat lagar om vad som får produceras genom artificiell intelligens. Det är till exempel förbjudet att skapa pornografiskt material av verkliga personer och 6 månader innan ett val får man inte skapa material av något som helst slag av kandidaterna. På så sätt försöker man stävja missbruket av artificiell intelligens. Även inom EU förbereds en förordning om regleringen av artificiell intelligens.

En bild genererad av Dall-E2 med parametrarna: A photo of cats riding a rollercoaster

Det är bra att man förbereder sig på artificiell intelligens och dess följder. Personligen tror jag dock inte att man med enbart förbud och lagar helt kan förebygga missbruk. I kriget i Ukraina har motsvarande teknologi redan använts för att skapa propaganda om motståndaren. Inom ungdomsarbetet är det viktigt att man är medveten om riskerna kring den här slags teknologi och tillsammans med de unga fundera på olika sätt att särskilja AI-genererade bilder från riktiga bilder.

Även om Dall-E2 och Imagen fortfarande inte är tillgänglig för allmänheten har många fått möjligheten att testa teknologi som omvandlar text till bild. Midjourney är redan i öppen beta-testning, och snart kommer den fulla versionen att ges ut. Disco Diffusion är en artificiell intelligens som grundar sig på öppen källkod och som man till och med kan installera på sin egen dator. Stable Diffusion kan testas bl.a. i DreamStudio. Midjourney fungerar på Discord-plattformen, och är därför säkert lätt att närma sig för ungdomsarbetare och unga. Disco Diffusion fungerar på Googles Colaboratory-plattform, och kan till en början kännas mer utmanande. Disco Diffusion låter oss dock ta oss en titt under motorhuven för att se vilka slags processer och kod behövs för konstskapande artificiell intelligens. En app med öppen källkod som skapats i samarbete hjälper oss att förstår och studera redan existerande artificiella intelligenser.

AI-konst i ungdomsarbetet och i konstfostran

Målet med digitalt ungdomsarbete är att bekanta ungdomar med digitala teknologier och verksamhetsmiljöer i en icke-formell inlärningsmiljö, samt att lära dem att förhålla sig öppet, men kritiskt, till dem. Man kan ha många åsikter om AI-konst, men en sak är säker: Pandoras ask har öppnats, och AI-konst kommer inte att försvinna. Det är viktigt att man inom ungdomsarbetet försöker följa med den allra nyaste utvecklingen och att man med låg tröskel börjar använda dessa nya teknologier som en del av det dagliga arbetet. Det kan hända att de unga själva inte märkt att sådan teknologi existerar, och i den mer hierarkiska skolvärlden kan det gå många år innan man börjar undervisa i det här ämnet. 

En ungdomsarbetare behöver dock inte vara expert på artificiell intelligens. Det räcker att hen är en yrkeskunnig ungdomsarbetare som kan handleda gruppen i att tillsammans bekanta sig med dessa nya möjligheter. Ofta räcker det i dessa situationer att man ger de unga en webbplats, visar ett exempel, och sedan låter det gå. En ungdomsarbetare behöver aldrig kunna allt. Hen måste dock kunna svara ”jag vet inte ännu, men låt oss ta reda på tillsammans”.

Nästa fråga är i vilka slags situationer ungdomsarbetet kan utnyttja bildgeneratorer som grundar sig på artificiell intelligens? Inom ungdomsarbetet används ofta diverse slags kort som berättar om hur man mår i början av en grupp. Tänk om var och en kunde generera en bild av sina tankar i ögonblicket, och genom den kunna berätta om sina egna känslor? Eller om man under morgonsamlingen kunde generera en bild av en dröm man haft natten innan, och sedan kan de andra gissa vad som hände i drömmen? 

Inom konstfostran kan det här vara en bra metod för att skapa en snabb skiss, utgående från vilken den slutliga bilden görs. Eller om någon ung upplever att hen inte har konstnärlig talang eller kreativitet, kan det här mer tekniska tillvägagångssättet ge hen helt nya möjligheter att uttrycka sig själv. Nedan ett exempel på hur man från en enkel bild med artificiell intelligens kan få till stånd en fin målning.

En landskapsbild skapad med MidJourney utgående från en dålig teckning.

Artificiell intelligens som genererar konst kan i princip aldrig skapa något nytt. Alla bilder den producerar grundar sig på redan skapade konstverk och fotografier. Artificiella intelligens är till exempel duktig på att imitera världens mest berömda målare. Genom att ge artificiell intelligens en konstnärs namn eller en konstnärlig inriktning får man bekanta sig med konst i större utsträckning. Man kan visa de unga olika konstnärer och stilar, bland vilka de kan välja sina egna favoriter. Det här kan eventuellt motivera unga att lära sig mer om konsthistoria.

Många har gjort försök med hur olika faktorer, såsom olika konststilar och olika konstnärer, påverkar den slutliga genererade bilden. Dessa kan vara behändiga när ungdomen börjar bekanta sig med konsthistoria eller börjar leta efter en stilinriktning som passar hen. Exemplen är avsedda för arbete med Disco Diffusion, men jag har märkt att även andra artificiella intelligenser kan identifiera olika konstnärer och stilinriktningar.

https://weirdwonderfulai.art/resources/disco-diffusion-70-plus-artist-studies 

https://weirdwonderfulai.art/resources/disco-diffusion-modifiers/ 

AI-konst kunde också användas för ungdomsarbete som sker i virtuell verklighet. Till exempel i ungdomslokalen i AltspaceVR kan man länka olika webbplatser som skärmar av ett slag. På så sätt kunde man i det virtuella utrymmet tillsammans producera olika bilder och skapa en gemensam konstutställning av de bästa AI-genererade bilderna i Altspace.

Potentialen är nästan obegränsad – var kreativa och tillämpa det ni kan! Verke kan hjälpa till med att komma på nya sätt att tillämpa AI-konst. Vi är intresserade av alla tips ni har om hur artificiell intelligens kan utnyttjas i ert arbete.

Upphovsrätter

Ur en upphovsrättslig synvinkel är artificiell intelligens som vilken annan apparat eller verktyg som helst, och har därför ingen upphovsrätt till de verk den genererar. Artificiell intelligens kan alltså jämföras med en kamera som konstnären ställer in och sedan trycker på knappen. På samma sätt ställer konstnären in den artificiella intelligensen och trycker på enter för att skapa en bild. Immaterialrätten kring detta kommer dock troligtvis att förnyas inom kort. Särskilt vad beträffar upphovsrätten kommer man att granska om man med hjälp av artificiell intelligens, alltså ett datorprogram som baserar sig på bilder skapade av andra, kan producera unika verk. 

Sedan måste man också fundera på upphovsrätten för konstnärer vars bilder har använts för att träna den artificiella intelligensen. En konstnär kan ha använt flera år på att finslipa sin egen teknik och skapa en egen identifierbar stil, och nu kan hens banbrytande verk kopieras med orden ”by artist name”. Är det rättvist att man kopierar och gör modeller utgående från någons hela livsverk? Konst har å andra sidan alltid grundat sig på att låna och att utveckla andras idéer vidare. Kan artificiell intelligens ses som en slags kulturell inkubator, där den utvecklas snabbare än i en vanlig omgivning? Man kommer troligen att fundera på och granska dessa frågor ännu i framtiden, men än så länge i alla fall följer vi lagar och förordningar.

AI-konst får kritik

AI-konst har stött på mycket kritik och rädsla. Ofta har kritiken handlat om hur trångsynt artificiell intelligens är och hur den kan missbrukas. Missbruk under vår tidsålder av bottar och fake news är en alldeles realistisk rädsla. Med teknologi av det här slaget kan man göra skada genom att till exempel förfalska historiska bilder och på så sätt försöka legitimera falska narrativ. Det finns egentligen inga andra botemedel mot missbruk än mediefostran för unga, där de kan lära sig att identifiera falska bilder och nyheter. Jag är relativt säker på att metadata snart kommer att bli obligatoriska i bilder, varefter man snabbt kan hitta bilder som genererats med artificiell intelligens ur bildens hemliga uppgifter. Skaparna av artificiell intelligens har redan gjort det omöjligt att använda vissa ord som textparametrar. 

En annan vanlig kritik är de artificiella intelligensernas trångsynthet. Det här beror på att artificiell intelligens enbart gör det som människor kodat den att göra. Eftersom majoriteten av kodarna är män, har det lett till situationer där den artificiella intelligensen inte programmets för att omfatta livets hela brokiga mångfald. En lösning till detta anses vara att man lär alla jämlikt att koda artificiell intelligens, vilket är något som ungdomsarbetet igen spelar en central roll i. Världen behöver mångsidiga kodare för mångsidiga uppgifter. Särskilt när man utveckla artificiell intelligens är mångsidighet och mångfald en styrka. Det behövs människor som ser världen på olika sätt för att träna artificiell intelligens att förstå helheter.

En tredje fråga som ofta lyfts fram är om huruvida artificiell intelligens nu kommer att ersätta alla konstnärer. Nej, det kommer den inte att göra. Artificiell intelligens producerar fortfarande bilder utgående från det material som använts för att träna den. Allt detta träningsmaterial är skapat av människor och det krävs hela tiden mer av det, för att undvika situationer där artificiell intelligens börjar upprepa samma teman. På sätt och vis skapar artificiell intelligens inte ännu något ”verkligt”, även om den visst kan skapa fina saker. Artificiell intelligens kan självklart göra det snabbare och lättare att skapa skisser, och kan därmed fungera som hjälpmedel för konstnärer och grafiker. Artificiell intelligens har dock begränsade möjligheter att skapa nytt, eftersom dess kreativitet är begränsad till de uppgifter som matats in i den och utgående från vilka bilderna skapas. Redan efter några månaders bruk börjar man se repetitioner i bilderna och teman som fungerar bättre än andra.

En fjärde fråga som måste lyftas fram är miljöfrågan. AI-konst kräver stora mängder processorkraft och minne. Det lönar sig inte att ens försöka med en vanlig hemdator. Det här betyder förstås också att AI-konst har sitt eget koldioxidavtryck. Det lönar sig alltså att fortsätta samtalet kring klimatpåverkan även i den här frågan.

Om du vill lära dig mer om artificiell intelligens erbjuder Helsingfors universitet en gratis kurs i ämnet: https://www.elementsofai.com/fi (finns även på svenska) 

Om du letar efter mer tips för att arbeta med AI-konst kan vi ordna utbildningar i Verke i ämnet. Nedan hittar du anvisningar för några olika AI-konstgeneratorer som du kan använda för en snabbstart med den nya teknologin.

Hur skapar jag AI-genererad konst?
Visa alla blogginlägg

Arkiv