Miten teen tekoälytaidetta?

Mies ottaa puhelimella kuvaa ulkona talvimaisemissa selkä kameraan päin.

Huomiolisäys 1/2024: Generatiivisten tekoälysovellusten kehityksen tahti on ollut äärimmäisen nopeaa viimeisien vuosien aikana, joten huomioittehan tämän artikkelin julkaisupäivän. Artikkeli saattaa sisältää hyvinkin vanhentunutta tietoa.

Tässä on lyhyet ohjeet erilaisten tekoälytaidepalveluiden käyttöön. Internet alkaa olla vastaavia pullollaan, mutta olen pyrkinyt valitsemaan tähän omasta mielestäni parhaimmat tutustumisen arvoiset. Ohjeet ovat  aika suurpiirteiset, mutta näillä pääset varmasti alkuun. Lisää ohjeita löytyy palveluiden sivuilta englanniksi. Tarvittaessa Verke voi järjestää koulutusta tekoälytaiteen hyödyntämisestä taidekasvatuksessa.

Mihin homma perustuu?

Hyvin yksinkertaistettuna tekoälytaidegeneraattorit toimivat käänteisenä konenäkönä. Konenäkö on heikkotekoäly, joka pystyy tunnistamaan kuvasta siinä esiintyviä asioita. Jokaista erillistä tunnistettavaa asiaa varten tekoälylle pitää syöttää satoja tai tuhansia kuvia, joista rakentuu malli auttamaan tekoälyä tunnistamaan, esiintyykö kuvassa jokin asia vai ei. Tekstistä kuvaksi -generaattoreissa asia onkin käännetty ympäri.

Tekoälylle annetaan usein kuva kohinasta sekä tekstisyöte mitä kuvassa pitäisi näkyä. Tähän kuvaan alkaa sen jälkeen toimimaan kaksi erilaista mallia. Toinen malli on generoiva malli, joka lisää kuvaan kerros kerrokselta vahvemmin näkyviä piirteitä. Toinen malli tarkistaa kuvan ja kertoo toiselle, onko se onnistunut luomaan tunnistettavan asian. Palautteen avulla toinen malli yrittää parantaa edelliskerralla tekemäänsä jälkeä. Yksi tällainen generointi-tarkistuskierros on nimeltään iteraatio. Mitä useampia iteraatioita kuvalle tehdään, sitä tarkempaan kuvaan tekoäly pystyy. Nyt näitä malleja on onnistuttu kehittämään niin pitkälle, että kuvan generointi alkaa onnistumaan jo tehokkaalla kotitietokoneella ja kuvissa aletaan paikoitellen lähestymään valokuvan tasoa. 

Useissa tekoälyissä on mahdollista syöttää kohinakuvan tilalle valmis valokuva, johon tekoäly alkaa tekemään muutoksia päälle. Syötekuvan painoarvoa voidaan muuttaa, jolloin siitä saadaan vaikka tarkka valokuva, johon on lisätty pieniä yksityiskohtia, tai vaihtoehtoisesti jää jäljelle pelkät samankaltaiset värisävyt. 

Kohinakuvasta käytetään myös termiä “seed” eli siemen. Jokaiselle kohinakuvalle on olemassa oma tunniste, jolla se on generoitu. Jos jossain kuvassa onnistuu erittäin hyvin esim. kasvot, kannattaa kuvan “seed” ottaa talteen, sillä sitä voi käyttää myöhemmin uudelleen kasvokuvan generointiin.

Kuvakaappaus NightCafé-palvelusta
NightCafé on yksi helpoiten lähestyttävimmistä sovelluksista. Palvelulla voidaan päivässä generoida 5 kuvaa ilmaiseksi.

Nightcafé

https://nightcafe.studio/ 

NightCafé tarjoaa päivittäin viisi ilmaista polettia rekisteröityneille käyttäjille. Poletteja voidaan käyttää kuvien tuotantoon. Yksi kuva perusasetuksilla maksaa yhden poletin. Jos kuvaan haluaa enemmän tarkkuutta tai kuvasta haluaa vähän isomman, kuva maksaa enemmän.

NightCafén kanssa pääsee helposti alkuun. Valitse palvelun etusivulta “Start creating”. Seuraavalta sivulta pääset valitsemaan haluamasi tyylin. Voisin suositella näistä Stable-versiota, jolla päästään lähimmäksi valokuvalaatua. Avautuvalla sivulla kirjoita “Your text prompt” -tekstikenttään syöte, eli prompt, ja paina alalaidassa olevaa “Create”-painiketta. Sivustolla kestää hetken aikaa generoida kuva. 

Millainen on hyvä syöte

Syötteen kirjoittaminen on se, mikä tekee tekstistä kuvaksi -generaattoreiden käytöstä taidetta. Tekstisyöte, eli prompt, voidaan kirjoittaa toistaiseksi vain englanniksi. Tekstisyöte voidaan jakaa pariin eri osaan. Ensin on kuvailtava sisältö. Sisältö tulee kuvailla hyvin tarkkaan väärinkäsitysten välttämiseksi, sillä tekoäly ei tulkitse mitään vaan toimii ehdottomasti. Vältä asioiden kirjoittamista esimerkiksi monikkomuodossa, sillä tekoäly ei pysty tekemään päätöstä kuinka monta kohdetta sen tulisi piirtää. Älä siis kirjoita “Stormtroopers fighting with wookies”, vaan ole täsmällisempi “Two stormtroopers fighting with three wookies”. Tekoäly ei ole luova, joten sille tulee kirjoittaa minkä tyylinen kuvasta tulisi tulla. Tekoälylle voidaan antaa syötteeseen esimerkiksi joku taiteilija tai taiteen tyylisuunta, esimerkiksi voitte käyttää scifiin erikoistunutta taiteilijaa esimerkkinä kirjoittamalla syötteeseen “by Simon Stålenhag”. Lisäksi voimme kertoa jotain ympäröivästä maailmasta lisäämällä muuttujia kuten “Star Wars” tai “sci-fi”. Eri syötteitä kannattaa testailla rauhassa. Pyri olemaan mahdollisimman tarkka. Syötteeseen olisi hyvä kuvata esimerkiksi millä aseilla taistelu tapahtuu tai onko kyseessä mikä vuorokauden/vuoden aika. Tekstikentän alapuolella olevasta “modifiers”-painikkeesta avautuu valikko, josta voit valita mieleisiä muuttujia, jos sinulla on vaikeuksia keksiä omia.

MidJourneyllä generoitu kuva kristallipallosta
Tekoäly saattaa tehdä välillä omituisia assosiaatioita annatusta syötteestä. Tässä kuva sosiaalisen median tulevaisuudesta, jossa tekoäly yhdisti tulevaisuuden kristallipallosta ennustamiseen.

Midjourney

http://midjourney.com

Midjourney on kaupallinen taidetuotantoon tehty tekoäly. Taidetuotannossa tämä sovellus yltää miltei Dall-E 2:n tasolle, joissakin ominaisuuksissa ehkä jopa sen edelle. Helppokäyttöisyydessään kyseinen tekoäly on erinomainen aloittelijalle. Midjourney on tällä hetkellä avoimessa beta-testausvaiheessa. Testitunnukset saa halutessaan Midjourneyn nettisivujen kautta. Muista tekoälysovelluksista poiketen tämä ei toimi selainpohjaisena, vaan Discord-bottina (botti toimii myös Verken Discordissa). Tarvitset siis tämän käyttöön henkilökohtaiset Discord-tunnukset. Aloittelija ohjautuu MidJourneyn Discord -serverillä ohjesivulle. Lue annetut ohjeet huolellisesti. Jokaiselle uudelle käyttäjälle määritellään oma kanava, jota heidän tulisi käyttää. Botille syötetään ohje kirjoittamalla:  /imagine prompt: “tähän tulee sinun oma kuvitelmasi”.

Promptia kirjoittaessa ota huomioon seuraavat asiat:

  • voit käyttää mitä tahansa kuvaa syötteen tekemiseen kopioimalla sen osoitteen promptin alkuun
  • linkin jälkeen tulee varsinainen syöte: “Two stormtroopers fighting with three wookies by Simon Stålenhag”
  • jos haluat lisätä kuvaan erityisiä ehtoja voit kirjoittaa ne syötteeseen “::” jälkeen näin: “Two stormtroopers fighting with three wookies by Simon Stålenhag scifi :: On the moon of endor”
  • voit myös lisätä tässä vaiheessa ehtoja kuvan tyylistä kuten photorealistic, monochrome, vivid tai cinematic
  • Midjourney tekee automaattisesti kuvista neliöitä eli mittasuhteella 1:1. Kuvan mittasuhteita voi muuttaa kirjoittamalla syötteen loppuun –ar ja haluamasi mittasuhteen, esim –ar 4:3 tai –9:16. Jos haluat kuvasta FullHD-kuvan, voit kirjoittaa suoraan –wallpaper.
  • jos haluat varmistaa, että tekoäly ymmärtää varmasti mitä haluat, voit käyttää ajatuksen rajaamiseen “–no”-parametria, eli –no ewoks tai –no jedi
  • “–q”-parametrilla voit päättää kuinka paljon Midjourney käyttää aikaa kuvan tuottamiseen. Oletusarvo on 1. Laittamalla arvoksi 0.5 kuva valmistuu puolet nopeammin. Vastaavasti laittamalla arvoksi 2, Midjourney käyttää kuvan valmistukseen tupla ajan. Tämä vastaavasti kuluttaa sinulta kahden kuvan verran resursseja. Vaikka q-parametri tulee sanasta quality (laatu), ei sillä ole aina laadun kanssa tekemistä. Pidempi aika kuvan muodostumiseen voi tehdä kuvasta myös entistä sekavamman tai oudon. Monissa ohjeissa törmää vinkkiin ”Don´t overcook”, älä kypsennä liikaa.
  • “–s”-parametrilla määritellään kuinka luovasti tekoäly saa suhtautua annettuun tehtävään. Oletusarvo tässä on 2500. Lisäämällä arvoa tekoäly yrittää tehdä kuvaan enemmän yksityiskohtia ja tuomalla kuvaan elementtejä, joita on vastaavissa kuvissa. Esim. auringonkukkien kanssa se yrittäisi tehdä isolla arvolla maljakon ja pöydän. Maksimiarvo on 50000. Hommat alkavat siinä vaiheessa mennä jo kohtuu sekavaksi, mutta sieltä saattaa tulla ihan hauskojakin sattumia.

Botti antaa sinulle 4 vaihtoehtoa kuvaksi. Tämän jälkeen sinun tulee valita, mistä kuvasta haluat tehdä isomman version klikkaamalla kuvan alla olevaa U-kirjainta (Upscale). Klikkaa V-kirjainta (Variations), jos haluat nähdä samasta kuvasta vielä useamman variaation.

MidJouneyn syötteestä tuottama kuva, jossa näkyy 4 eri versiota.
MidJourney tuottaa jokaisesta syötteestä aluksi 4 erillistä kuvaa, joista käyttäjä voi valita parhaan jatkokäsittelyä varten.

Voit tallentaa kuvan klikkaamalla kuvaa ja vielä uudestaan hiiren oikealla näppäimellä. Valitse valikosta “Tallenna kuva”.

MidJourneyta varten on tehty syöte-generaattori. Sen avulla pystyt helposti hyödyntämään palvelun erilaisia ominaisuuksia osana syötettäsi. https://www.thedreamingstate.com/portfolio/art/prompter/ 

Midjourneytä voit testata ilmaiseksi muutamia kertoja, joten kannattaa ensin harjoitella syötteen kirjoittamista ilmaisilla versioilla. Kuukausimaksullinen versio maksaa 12 €/kk.

Kuvakaappaus Disco Diffusionin asetuksista
Disco Diffusion toimii Googlen Colab alustalla ja saattaa aluksi näyttää hankalalta. Käyttäjän ei kuitenkaan tarvitse aluksi välittää kuin muutamasta eri asetuksesta.

Disco Diffusion

https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb 

Disco Diffusion on eräänlainen frankensteinin hirviö näissä tekstistä kuvaksi generaattoreissa. Se toimii avoimeen koodiin perustuvalla Googlen Colaboratory, lyhyesti Colab-alustalla, jossa voidaan koodata python-kielellä tehtyjä tekoälysovelluksia. Tällä alustalla tehtyjä ohjelmia kutsutaan notebookeiksi. Alusta on luotu yhteisölliseen koodaamiseen ja sen avulla päästään käyttämään Googlen grafiikkasuorittimien tehoja (GPU = graphics processing unit). Disco Diffusioniin on yhdistetty useita erilaisia avoimeen lähdekoodiin perustuvia tekstistä-kuvaksi generoivia tekoälyjä. Vastaavia notebookeja on useita, ja ne kehittyvät koko ajan kun käyttäjät yhdistelevät omia versioitaan ja parantelevat toistensa koodia.

Disco Diffusion näyttää aluksi hyvin sekavalta, mutta siellä on vain muutama muuttuja, jotka tulee muuttaa päästäkseen alkuun. 

  1. Klikkaa tästä päästäksesi Disco Diffusion 5.61 -versioon ja kirjaudu Google -tunnuksillasi sisään oikeasta yläkulmasta.
  2. Älä säikähdä sekavaa näkymää. Sinun ei tarvitse osata koodata riviäkään.
  3. Vieritä sivua alaspäin kohtaan 3. “Settings”.
  4. Disco Diffusion tallentaa tekemänsä kuva automaattisesti Google Driveen. Kirjoita “Batch name” -kohtaan kansion nimi, minne haluat tallentaa generoimasi kuvat.
  5. Vieritä alaspäin kohtaan “Prompt”. Etsi tekstistä kohta: ”A beautiful painting of a singular lighthouse…” ja kirjoita sen tilalle oma tekstisyötteesi. 
  6. Kohdassa 4. “Diffuse” laita “Batch size” kohtaan 3. Tällä määrittelet kuinka monta eri variaatiota kuvasta tuotetaan. (“Display rate” määrittelee kuinka monen iteraation välein näkyvä kuva päivittyy.)
  7. Create a video -kohdassa laita ruksi kohtaan: “skip_video_run_for_all”. Disco Diffusionilla voi tehdä myös videoita, mutta tämä vaatii paljon harjoittelua ja suoritinaikaa. Suosittelen harjoittelemaan ensin hyvän syötteen kirjoittamista ennen kuin lähdet tekemään videoita.
  8. Aja ohjelma valitsemalla ylhäällä olevasta “Runtime”-valikosta “Run all”.
  9. Ohjelma kysyy sinulta lupaa kirjautua Google Driveen ja varmistaa, että haluat varmasti ajaa runsaasti suoritinresursseja kuluttavan ohjelman. Vastaa näihin kyllä.
  10. Odota ja seuraa kuvan kehittymistä.

Googlen Colaboratory tarjoaa käyttäjilleen rajoitetun määrän suorittimien käyttöaikaa vuorokaudessa. Sovelluksesta voi hankkia myös maksullisen version, jolloin käyttäjä saa loputtomasti käyttöaikaa sekä käyttöoikeuden parhaimpiin grafiikkasuorittimiin.  Käyttäjät tarvitsevat vain omat Google-tunnukset, jotka melkein kaikilta löytyvät ennestään. Suoritin aika ei varmasti ehdi koskaan tulla täyteen lyhyessä ryhmämuotoisessa toiminnassa.

Kuvakaappaus DreamStationin näkymästä
DreamStationissa on hyvin yksinkertainen käyttöliittymä. Palvelun ilmaisversiolla voidaan tehdä n. 200 kuvaa.

DreamStation

DreamStation käyttää Stable Diffusion -algoritmia, kuten NightCafé. Sivustolle pääseminen vaatii kirjautumisen esim. Google-tunnuksilla. 

Yksinkertaisimmillaan palvelu toimii kirjoittamalla sivun alalaitaan syötteen ja painamalla “Dream”-painiketta. Tekstisyöte toimii tässä hyvin samalla tavalla kuin muissakin, mutta parametrit syötetään liukuvalinnoilla. 

  • Width = Leveys pikseleinä
  • Height = Korkeus pikseleinä
  • Cfg Scale = Tällä määritellään kuinka tarkkaan tekoäly seuraa annettua syötettä (0 = tekoäly keksii itse sisältöä, 20 tekee syötteen mahdollisimman tarkkaan. Oletuksena 7 (vrt. MidJourneyn –s-parametri).
  • Steps = Iteraatioiden määrä. Oletuksena 50 (vrt. MidJoudneyn –q-parametri).
  • Sampler vaikuttaa hyvin vähän lopputulokseen. Samplerin vaikutukset tulevat näkyviksi vasta Cfg Scalen isoilla arvolla. Toinen piirtää ehkä paremmin ihmisen kasvoja ja toinen tekee ehkä vähän hienompia pilviä taivaalle. Samplerin vaikutuksia kannattaa testailla kun olet tehnyt useamman kuvan. Samplerin vaikutuksista on tehty erilaisia vertailuja esim. täällä.

Gaugan

Gaugan 2 ja NVIDIA Canvas ovat käytännössä sama asia ja ne toimivat hyvin pitkälti samalla tavoin. NVIDIA Canvas on julkaistu ainoastaan Windows-käyttöjärjestelmälle. Tässä tulen esittelemään kaikilla koneilla selaimessa toimivaa Gaugan 2 -tekoälyä.

Gaugan 2 on erinomainen työkalu maisemakuvien tekemiseen. Tekoälyssä on useita erilaisia mahdollisuuksia syötteen luomiseen. Olennaisimmat ovat tekstisyöte ja hahmotelmapiirros Windowsista tutun Paint-ohjelman tapaan.

Kuvakaappaus GauGAN 2 palvelusta
Toistaiseksi kaikkien palveluiden syötteet tulee kirjoittaa englanniksi. Moni nuori voi tarvita apua ohjaajalta syötteen kirjoittamiseen.

Tekstisyötteen tekeminen

  1. Vieritä sivun alareunaan ja hyväksy käyttöehdot.
  2. Tekstisyötettä tehdessä valitse “Input utilization” -valikosta pelkästään kohta “Text”
  3. Tekstisyötettä tehdessä muista, että tämä tekoäly ei osaa tehdä ihmisiä, rakennuksia tai eläimiä juuri ollenkaan. Keskity kuvailemaan ympäristöä, kuten “mountains lake”.
  4. ÄLÄ PAINA ENTERIÄ, koska silloin sivu nollautuu ja joudut aloittamaan alusta. 
  5. Saadaksesi kuvan näkyviin paina tekstikentän alapuolella olevaa nuolta oikealle, tai arpakuutioita. Nuolta painamalla voit valita itse mieleisen taustakuvan ohjaamaan tekoälyä, arpakuutio valitsee satunnaisen taustan.
  6. Kuva ilmestyy oikeanpuoleiseen laatikkoon.
  7. Jos haluat lisätä kuvaan jotain elementtiä lisää, voit kirjoittaa sen perään mountains:+500 ja painaa nuolta uudelleen.
  8. Kuvan voi myös sijoittaa helposti johonkin tiettyyn ympäristöön lisäämällä siihen esimerkiksi jonkin maan tai alueen.
Kuvakaappaus GauGAN 2 palvelusta

Syöte piirtämällä

  1. Vieritä sivun alareunaan ja hyväksy käyttöehdot.
  2. Valitse “input utilization” -valikosta “segmentation”.
  3. Valitse “Brush”-työkalu. Voit muuttaa siveltimen muotoa (brush shape) ja kokoa (brush size).
  4. Valitse vasemmanpuoleisesta valikosta haluamasi elementti ja piirrä sille alue kuvassa. Turkoosi väri tarkoittaa taivasta, joten sitä ei tarvitse erikseen piirtää.
  5. Paina nuolta oikealle ja kuva generoituu. Voit edelleen tehdä muutoksia kuvaan. Päivitä muutokset painamalla uudelleen nuolta.

Kuvat voi tallentaa alareunassa olevasta disket-kuvakkeesta. 

Tällä ohjelmalla kuka tahansa nuorista voi piirtää oman unelmiensa maiseman fotorealistisesti. Tätä voidaan helposti hyödyntää nuorten kanssa esimerkiksi haave- ja mielikuvatyöskentelyyn. 

Katso kaikki vinkit