Tilläggsanmärkning 1/2024: Utvecklingstakten för generativa AI-applikationer har varit extremt snabb under de senaste åren, vänligen och beakta publiceringsdatumet för denna artikel. Artikeln kan innehålla mycket föråldrad information.
Här finns några korta anvisningar för hur olika AI-konsttjänster används. Internet börjar vara ganska fylld med dylika tjänster, men jag har försökt välja de som i mitt tycke är värda att bekanta sig närmare med. Anvisningarna är ganska generella, men säkert tillräckliga för att komma i gång. Mer anvisningar hittas på tjänsternas webbplatser på engelska. Vid behov kan Verke ordna utbildning i hur AI-konst kan utnyttjas i konstfostran.
Vad grundar sig allt på?
Mycket förenklat fungerar AI-konstgeneratorer som inverterat datorseende. Datorseende är en slags snäv artificiell intelligens som kan identifiera olika saker som finns i en bild. För varje skild sak som ska identifieras måste den artificiella intelligensen tränas med hundratals eller tusentals bilder, som används för att skapa en mall som används av artificiell intelligens för att ta reda på om saken förekommer i bilden eller inte. I text-till-bild-generatorer har den här metoden inverterats.
Den artificiella intelligensen ges istället en bild av brus och en textparameter som säger vad som borde synas i bilden. Efteråt börjar två olika modeller bearbeta bilden. En modell är en genererande modell, som lager efter lager lägger till olika allt starkare drag på bilden. Den andra modellen kontrollerar bilden och berättar för den andra modellen om den lyckats skapa något som kan identifieras. Utgående från feedbacken försöker den andra modellen förbättra det den genererat den föregående gången. En sådan runda av generering-kontroll kallas för en iteration. Ju fler iterationer bilden får, desto noggrannare bilder kan den artificiella intelligensen skapa. Nu har man lyckats utveckla dessa modeller så långt att det börjar vara möjligt att generera bilder redan på kraftiga hemdatorer, och kvaliteten på bilderna börjar närma sig fotografier.
I många artificiella intelligenser kan man mata in ett färdigt foto istället för brusbilden, som den artificiella intelligensen sedan börjar bearbeta. Man kan ändra på tyngden som den inmatade bilden har, vilket gör det möjligt att till exempel använda ett skarpt fotografi som små detaljer lagts till på, eller alternativt ett verk där allt som blivit kvar är liknande färgtoner.
För brusbilden används ofta också termen ”seed”, eller frö. Varje brusbild har ett eget ID, som använts för att generera det. Om en bild till exempel lyckas särskilt väl med ansikten, lönar det sig att spara bildens ”seed”, då den senare kan användas på nytt för att generera porträtt.