MidJourneylla tuotettu maisemakuva

Arkisto

Mitä on tekoälytaide?

29. elokuun 2022

Huomiolisäys 1/2024: Generatiivisten tekoälysovellusten kehityksen tahti on ollut äärimmäisen nopeaa viimeisien vuosien aikana, joten huomioittehan tämän artikkelin julkaisupäivän. Artikkeli saattaa sisältää hyvinkin vanhentunutta tietoa.

Pyrin yksinkertaistamaan tekoälyn seuraavassa kuvauksessa niin, että se on kaikkien ymmärrettävissä. Tämä ei ole kuitenkaan käsitteen tieteellinen kuvaus vaan pyrkimys auttaa hahmottamaan monisyistä asiaa. Te, jotka olette enemmän olleet tekoälyn kanssa tekemisissä, ottakaa minuun yhteyttä niin koitetaan saada tekstistä vielä helpommin ymmärrettävä ja korjataan minun tekemät virheet.

Tässä artikkelissa käsittelemme nk. heikkoa tekoälyä, joka suorittaa vain ennalta määrättyjä tehtäviä käyttäjän toiveiden mukaan. Vahvalla tekoälyllä tarkoitetaan ihmisen kaltaista tekoälyä, joka pyrkii matkimaan ihmisaivojen toimintaa ja matemaattista logiikkaa. Aivan erityisesti tässä keskitytään siihen, kuinka konenäkö toimii ja kuinka tekstistä kuvaksi -generaattorit toimivat. 

AI ihmettä!?

Mistä oikein puhumme kun käytämme termiä AI eli artificial intelligence, suomeksi tekoäly? Tekoäly on yksinkertaistettuna tietokoneohjelma. Yleisimmin tekoälyä käytetään käsittelemään suuria määriä tietoa. Tällaisissa tekoälyissä se yleensä on  tehty tunnistamaan toistuvia kuvioita (eng. pattern), tai etsimään keskiarvosta poikkeavaa dataa ja luomaan niiden pohjalta analyysejä. Tätä prosessia kutsutaan tekoälyksi, koska se muistuttaa tietyllä tapaa ihmisen kykyä päätellä, yhdistää tietoa ja luoda jotain uutta.

Ennen taidetekoälyä tutkijat kehittivät konenäön, jolla voidaan tunnistaa valo- tai videokuvasta esineitä ja asioita, kuten ihmisiä tai onko kuvassa yö vai päivä. Tekoäly tulee aina erikseen kouluttaa jokaista erillistä tehtävää varten. Konenäkö-tekoälylle voidaan esimerkiksi syöttää 1000 valokuvaa ihmiskasvoista. Tietokone analysoi kuvat etsimällä kuvista toistuvia kuvioita. Näiden toistuvien kuvioiden perusteella kone löytää kuvista yhtäläisyyksiä, joille koneen käyttäjä antaa nimen “kasvot”. Nyt voimme käyttää tekoälyä etsimään uusista kuvista näitä toistuvia kuvioita ja pyytää ohjelmaa nimeämään ne kasvoiksi. Kun puhumme koneoppimisesta, tarkoittaa se sitä, että tekoäly lisää uuden analysoimansa kuvan tiedot osaksi omaa tietokantaansa. Näin kone tunnistaa seuraavalla kerralla taas ihmiskasvot hieman paremmin. Tällainen tekoäly on jo miltei jokaisessa matkapuhelimen kamerassa, jolloin kamera osaa piirtää neliön löytämiensä kasvojen ympärille. Vastaavalla tekniikalla voimme luoda algoritmeja eri esineille ja asioille ja yhdistää nämä jättimäiseksi asioita tunnistavaksi tietokoneohjelmaksi. 

Otetaan toinen esimerkki. Tekoäly ei toimi ilman koneen käyttäjää, joka luo sille säännöt joiden mukaan toimia. Onkin herännyt pohdintaa tulisiko tekoälystä (artificial intelligence) käyttää termiä lisätty älykkyys (augmented intelligence). Meidän on osattava kysyä tietokoneelta oikeita kysymyksiä – vasta silloin se voi antaa meille jopa tarkempaa tietoa ja nopeammin, mitä me pystyisimme omilla havainnoillamme tekemään. Tietokoneeseen voidaan syöttää esimerkiksi jokainen shakki-pelin siirto, sääntö ja tavoite, laittaa tietokone analysoimaan jokaisen pelin siirron jälkeen, mikä olisi parhain tapa päästä lopputulokseen ja voittaa peli. Tietokone näkee pelin eräänlaisena muuttuvana labyrinttina, jossa se etsii lyhintä reittiä ulos. Kone testaa jokaisen siirron jälkeen kaikki mahdolliset labyrintin sokkelot ja tekee päätöksen koneen käyttäjän asettaman tavoitteen mukaisesti. Tämänkaltainen suoraviivainen toiminta jättää aukkoja puolustukseen ja ihmispelaajille mahdollisuuden hyödyntää näitä virheitä. Ihmisen luovuutta ja mukautumiskykyä erilaisiin tilanteisiin ei ole vielä kunnolla onnistuttu koodaamaan. 

Otetaan vielä kolmas esimerkki. Tätä tekstiä kirjoittaessa olen saanut toistuvasti punaista aaltoviivaa kirjoittamani tekstin alle. Tässä tapauksessa tekoälyyn on annettu kaikki suomen kielen kielioppisäännöt, ja tekoäly pyrkii tarkistamaan tekstiä pilkkuvirheiden sekä kirjoitusvirheiden varalta. Tekstinkäsittelyohjelman tekoäly osaa ehdottaa minulle korjauksia ja parannuksia kirjoittamaani tekstiin. Harmikseni täytyy todeta, ettei käyttämäni ohjelma vielä osaa itse tuottaa järkevää tekstiä asiasanoilla: “Selitä yksinkertaistetusti tekoäly nuorisotyöntekijöille”. Tällaisiakin tekoälyjä on kuitenkin jo olemassa. Itse asiassa tekstiä ja valokuvia generoivat tekoälyt ovat jo niin pitkällä, ettei niistä pystytä erottamaan, ovatko materiaalit tekoälyn vai ihmisen tuottamia. Nämäkin mallit tarvitsevat aina syötteen, eli koneen käyttäjän antamaan reunaehdot tekstin tai kuvan tuotannolle. Tekoälyltä puuttuu vielä luovuus ja intuitio, vaikka näitäkin ominaisuuksia pyritään koko ajan kehittämään ja mallintamaan.

Tekoälyllä tuotettu kuva taivaalla leijailevasta pilvestä
MidJourney tekoälyllä tuotettu kuva tekstisyötteellä: Two children lying on a grassy hill watching clouds.

Tekoäly kuvataiteen välineenä

Tekoälyä, joka analysoi kuvia tai videota, kutsutaan konenäöksi (CV tai Computer Vision). Konenäkö analysoi valokuvista tai videosta näkemäänsä annettujen tehtävien mukaan. Konenäköä käytetään tehtailla laskemaan kappaleita, tunnistamaan eri esineitä tai toteuttamaan laadunvalvontaa. Poliisilla on käytössä konenäkö, joka lukee autojen rekisterikilvet ja vertaa niitä poliisin tietokantaan. Konenäköä voidaan myös käyttää kuvien järjestelyyn. Sillä voidaan jakaa erillisiin kansioihin kuvat, joista se tunnistaa vaikkapa kissan ja linnun. Tällaista tekoälyä hyödynnetään esimerkiksi Googlen kuvahakupalvelussa hakutulosten parantamiseen. Kuten aikaisemmin esittelin, tässä tekoäly etsii sille ennalta opetettuja kuvioita, joiden perusteella se voi päätellä mitä kuvassa esiintyy.

No miten konenäkö näkee sille esitetyt kuvat? Eräässä tekstissä konenäköä verrattiin osuvasti ihmiseen, joka tuijottaa taivaalle ja etsii pilvistä erilaisia tunnistettavia kuvioita. Nämä kuviot ovat hyvinkin pienellä todennäköisyydellä oikean kappaleen muotoisia, mutta ihminen vahvistaa omaa uskoaan aisteihin ja saa kokemuksen, että todellakin näkee taivaalla leijailevassa pilvessä kasvot. Googlen insinöörit testasivat tätä tekoälyyn. He käänsivät konenäön toimimaan toiseen suuntaan, eli pyysivät konenäköä muuttamaan valokuvaa ja vahvistamaan siinä näkyviä kuvioita. Jos prosessi toistetaan 5-10 kertaa, alkaa ihmissilmälläkin näkemään kuvioita, joita konenäkö poimii kuvista. Näistä toistoista puhutaan tässä yhteydessä iteraatioina. Mitä useampi iteraatio suoritetaan, sitä enemmän tekoälyn vaikutus näkyy kuvassa. Tällä menetelmällä saavutettiin osittain vähän pelottaviakin kuvia, mutta osittain kauniita unenomaisia kuvia. Google alkoi kutsumaan ilmiötä nimellä DeepDream. No miksi kuvista tuli pelottavia? No siksi, että konenäölle tulee asettaa joku suodatin, mitä se lähtee kuvista etsimään ja vahvistamaan. Yleisin versio DeepDreamista on kuvista koiria etsivä versio.

Mona Lisa ajettuna DeepDream tekoälyn läpi
Mona Lisa ajettuna DeepDream tekoälyn läpi Lähde: Wikimedia

Yleisimmin tekoälyn toteuttama kuva saa alkunsa nk. lumisateesta, eli kohinasta. Tämä kohina toimii tekoälylle eräänlaisena taivaalla olevana pilvenä, josta se alkaa etsiä sille syötteeseen asetettuja tavoitteita. Kuvia voidaan toteuttaa myös jonkin valmiin valokuvan, piirroksen tai taideteoksen pohjalta.

Suurimmassa osassa tekstistä kuvaksi -generaattoreista kuvasta ei tule täysin sellaista, kuin olisit toivonut tai halunnut. Tähän voi olla monia syitä. Yksi yleisin on varmasti se, että käyttämäsi tekoäly ei osaa vielä tulkita toivettasi tarpeeksi tarkkaan. Se saattaa ymmärtää mistä on kyse, mutta se ei ole kuitenkaan vielä tarpeeksi tarkka tehdäkseen fotorealistista kuvaa. Toinen yleinen syy voi olla se, että toiveesi, eli antamasi syöte, ei ole ollut riittävän tarkka.

DiscoDiffusion tekoälyllä tuotettu kuva 30-luvun tivolista
DiscoDiffusion tekoälyllä tuotettu kuva 30-luvun tivolista

Tekoälyn tutkimus ja valjastaminen taidetuotantoon on räjähtänyt Googlen DeepDreamin jälkeen. Useat eri yliopistot, yritykset ja yksityiset henkilöt ovat lähteneet luomaan omia versioitaan, miten tuottaa kuvia tekoälyn avulla. OpenAI-tutkimusryhmän tekoäly Dall-E 2 on niin pitkälle kehittynyt, ettei sitä olla vielä (Elokuu 2022)  julkaistu julkiseen käyttöön. Tekoälyn kehittäjät pelkäävät ihmisten käyttävän sitä väärin. Kyseinen tekoäly pystyy tuottamaan ihmisen kirjoittamasta tekstistä täysin fotorealistisia valokuvia. Ohessa on harjoittelijamme Piin generoima kuva syötteellä: “A photo of cats riding a rollercoaster”. Googlella on oma vastaava tekoäly nimeltä Imagen, Facebookin emoyhtiöllä Metalla on Make-a-Scene ja avoimen lähdekoodin puolella merkittävin tällä hetkellä on Stable Diffusion. Google ei ole julkaissut tekoälyään julkiseksi samoista syistä kuin OpenAI, mutta Stable Diffusionia pääsee jo kaikki testaamaan. Tutkijat ovat ehkä syystäkin huolissaan. Tällaista teknologiaa voidaan käyttää helposti väärin. Kaliforniassa ollaankin jo luotu lakeja, mitä tekoälyllä saa tuottaa. Siellä mm. ei saa tuottaa pornografista materiaalia oikeista henkilöistä ja 6 kuukautta ennen vaaleja ei saa tuottaa minkäänlaista materiaalia ehdokkaista. Tällä yritetään lietsoa tekoälyn väärinkäyttöä. Myös EU:ssa valmistellaan asetusta tekoälyn sääntelyyn.

Dall-e 2 tekoälyllä tuotettu kuva kissoista ajamassa vuoristoradalla
Dall-e 2 tekoälyllä tuotettu kuva syötteellä: A photo of cats riding a rollercoaster

On hyvä, että tekoälyyn ja sen lieveilmiöihin varaudutaan. Henkilökohtaisesti en kuitenkaan usko, että pelkät kiellot ja lait pystyvät väärinkäyttöä täysin ehkäisemään. Ukrainan sodassa vastaavaa teknologiaa on jo käytetty propagandan tuottamiseksi vastustajasta. Nuorisotyössä onkin tärkeää tiedostaa tämänkaltaisen teknologian riskit ja pohtia nuorten kanssa mahdollisuuksia erottaa näitä tekoälyn avulla tuotettuja kuvia aidoista.

Vaikka Dall-E 2 ja Imagen ei ole kaikkien saatavilla, meillä on silti useita mahdollisuuksia päästä testaamaan tekstiä kuvaksi muuttavaa teknologiaa. Midjourney on jo avoimessa beta-testauksessa ja siitä julkaistaan pian kokoversio. Disco Diffusion on avoimeen lähdekoodiin perustuva tekoäly, jonka voi asentaa jopa omalle koneelle. Stable Diffusionia pääsee testaamaan mm. DreamStudiossa. Midjourney toimii Discord-alustalla, ja on varmasti nuorisotyöntekijöille ja nuorille  helposti lähestyttävä. Disco Diffusion toimii Googlen Colaboratory-alustalla ja voi tuntua aluksi hieman haastavalta. Disco Diffusion päästää meidät kuitenkin kurkistamaan konepellin alle, millaisia prosesseja ja millaista koodia taidetekoälyyn tarvitaan. Tämänkaltainen yhteistyössä tehty avoimen lähdekoodin sovellus auttaa meitä ymmärtämään ja opiskelemaan olemassa olevia tekoälyjä paremmin.

Tekoälytaide nuorisotyössä ja taidekasvatuksessa

Digitaalisen nuorisotyön tavoitteena on tutustuttaa nuoret non-formaalissa oppimisympäristössä digitaalisiin teknologioihin ja toimintaympäristöihin sekä opettaa heitä suhtautumaan niihin avoimesti, mutta kriittisesti. Vaikka tekoälytaiteesta voi olla montaa mieltä on se kuitenkin varmaa, että se ei ole häviämässä mihinkään nyt kun Pandoran lipas on aukaistu. Onkin olennaista, että nuorisotyössä pysytään kehityksen aallonharjalla ja poimitaan näitä uusia teknologian sovelluksia herkästi osaksi päivittäistä työtä. Voi olla, että nuorilta tällainen teknologia on jäänyt huomaamatta ja toisaalta voi olla, että hieman hierarkisemmassa koulumaailmassa tämän opettaminen tulee vasta pitkän ajan päästä. 

Nuorisotyöntekijän ei tarvitse olla kuitenkaan tekoälyn ammattilainen. Riittää kun hän on nuorisotyön ammattilainen ja osaa ohjata ryhmän tutustumaan näihin uusiin mahdollisuuksiin yhdessä. Usein näissä tilanteissa riittää, että vie nuoret oikealle sivustolle, näyttää yhden esimerkin ja homma vie mukanaan. Nuorisotyöntekijän ei tarvitse koskaan osata kaikkea. Hänen tulee kuitenkin osata vastata “en vielä tiedä, mutta otetaan yhdessä selvää”.

No millaisessa tilanteessa nuorisotyössä tällaisia tekoälyyn pohjautuvia kuvageneraattoreita voidaan hyödyntää? Nuorisotyössä käytetään usein monenlaisia fiiliskortteja ryhmien alussa. Mitä, jos jokainen generoisi kuvan sen hetken ajatuksistaan ja voisi kertoa sitä kautta omista tunteistaan? Tai voitaisiinko aamunavauksessa generoida kuva edellisen yön unesta, ja muut arvaavat, mitä unessa on tapahtunut? 

Taidekasvatuksessa tämä voi olla hieno mahdollisuus tehdä nopeasti hahmotelmia, joiden pohjalta tehdään lopullinen kuva. Tai jos joku nuori kokee, ettei ole taiteellisesti luova tai lahjakas, voi tämänkaltainen tekninen lähestyminen tuoda hänelle aivan uusia mahdollisuuksia ilmaista itseään. Alla esimerkki, miten yksinkertaisesta kuvasta voidaan saada tekoälyllä näyttävä maalaus.

MidJourney tekoälyllä tuotettu maisemakuva huonon piirroksen pohjalta
MidJourney tekoälyllä tuotettu maisemakuva huonon piirroksen pohjalta.

Taidetekoäly ei periaatteessa koskaan tee mitään uutta. Kaikki sen tuottamat kuvat pohjautuvat jo tehtyihin taideteoksiin ja valokuviin. Tekoäly pystyykin hienosti mallintamaan kuuluisimpien maalareiden kädenjälkeä. Koska tekoälylle voidaan kertoa jonkun taiteilijan nimi tai taidesuuntaus, tämä mahdollistaa taiteeseen tutustumisen laajemmin. Nuorille voidaan esitellä erilaisia taiteilijoita ja tyylisuuntia, joista pääsevät valitsemaan mieluisimman. Tämä saattaa motivoida nuoria perehtymään taidehistoriaan laajemminkin.

Useat ihmiset ovat tehneet testejä, miten eri muuttujat, kuten taiteen tyylisuunnat ja eri taiteilijat vaikuttavat lopulliseen kuvaan. Nämä voivat toimia hyvänä apuna, kun nuori lähtee tutustumaan taidehistoriaan ja etsimään itselleen mieluista tyylisuuntaa. Esimerkit ovat tarkoitettu Disco Diffusionilla työskentelyä varten, mutta olen huomannut, että myös muut tekoälyt osaavat yhtä lailla tunnistaa erilaisia taiteilijoita ja taiteen tyylisuuntia.

https://weirdwonderfulai.art/resources/disco-diffusion-70-plus-artist-studies 

https://weirdwonderfulai.art/resources/disco-diffusion-modifiers/ 

Tekoälytaide voisi olla myös hieno sisältö virtuaalitodellisuudessa tehtävään nuorisotyöhön. Esimerkiksi AltspaceVR:ssa olevaan nuorisotilaan voidaan linkittää erilaisia sivustoja eräänlaisiksi näytöiksi. Näin virtuaalitilassa voitaisiin yhdessä tuottaa erilaisia kuvia ja toteuttaa parhaimmista tekoälyllä tuotetuista kuvista yhteinen taidenäyttely Altspaceen.

Mahdollisuudet ovat miltei rajattomat – käyttäkää luovuutta ja soveltakaa! Verke voi toimia apuna miettimässä uusia soveltamiskohteita. Olemme kiinnostuneet kaikista vinkeistä, miten tekoälyä on hyödynnetty teidän työssänne.

Tekijänoikeudet

Tekijänoikeuksien näkökulmasta tekoäly on kuin mikä tahansa laite tai väline, eikä sillä ole oikeuksia sen generoimiin töihin. Tekoäly on siis verrattavissa kameraan, johon taiteilija määrittelee asetukset ja painaa laukaisinta. Samalla tavalla taiteilija laittaa tekoälylle asetukset ja painaa enteriä tuottaakseen kuvan. Näitä immateriaalioikeuksia tullaan kuitenkin varmasti uudistamaan lähiaikoina. Etenkin tekijänoikeuksissa tullaan tarkastelemaan sitä, että pystytäänkö tekoälyllä, muiden tuottamiin kuviin perustuvalla tietokoneohjelmalla,  tuottamaan uniikkeja teoksia. 

On vielä eri asia pohtia millaiset tekijänoikeudet taiteilijoilla on, joiden kuvia on käytetty tekoälyn kouluttamiseen? Taiteilija on saattanut käyttää vuosia oman tekniikan hiomiseen ja oman tunnistettavan tyylin luomiseen, ja nyt hänen uraauurtava työ on kopioitavissa sanoilla “by artist name”. Onko tällainen koko elämäntyön kopioiminen ja mallintaminen oikeudenmukaista? Taide on toisaalta aina perustunut lainaamiseen ja toisen idean jatkokäsittelyyn ja edistämiseen. Voiko tekoälyn nähdä kulttuurin inkubaattorina, jossa se kehittyy nopeammin kuin tavallisessa ympäristössä? Näitä kysymyksiä tullaan varmasti pohtimaan ja tarkastelemaan vielä tulevaisuudessa, mutta ainakin toistaiseksi tässä mennään lakien ja asetusten mukaisesti.

Soraääniä tekoälytaidetta kohtaan

Tekoälytaide on kohdannut hyvin paljon pelkoja ja kritiikkiä. Yleisimmät teemat ovat tekoälyjen kapeakatseisuus ja väärinkäyttö. Väärinkäyttö bottitilien ja valeuutisten aikana on realistinen pelko. Tämänkaltaisella teknologialla voidaan saada pahaa jälkeä aikaiseksi esimerkiksi vääristämällä historiallisia kuvia ja sillä tavoin saada aikaiseksi painoarvoa valheelliselle narratiiville. Väärinkäyttöön ei oikein vastalääkkeeksi vielä ole kuin nuorten mediakasvatus tunnistamaan näitä vääriä kuvia ja uutisia. Olen melko varma, että kuviin tulee melko nopeasti oma metatiedot pakollisiksi, jolloin niihin piilotetuista tiedoista voidaan nopeasti poimia tekoälyllä generoidut. Tekoälyn kehittäjät ovat jo tehneet myös joitain sanoja mahdottomiksi käyttää syötteissä. 

Toinen kritiikki, mitä yleensä nousee esiin, on tekoälyjen kapeakatseisuus. Tämä johtuu siitä, että tekoäly tekee ainoastaan sen, mitä ihmiset ovat koodanneet sen tekemään. Koska suurin osa koodareista on miehiä, tämä on johtanut tilanteeseen, jossa tekoälyä ei ole ohjelmoitu käsittämään koko elämänkirjoa. Tähän yhtenä ratkaisuna pidetään sitä, että tekoälyn käsittelyä opetettaisiin tasapuolisesti kaikille ja tässä nuorisotyö on taas olennaisessa osassa. Maailma tarvitsee monipuolisia koodareita monipuolisiin tehtäviin. Varsinkin tekoälyä kehittäessä monipuolisuus ja moninaisuus on valttia. Mukaan tarvitaan ihmisiä, jotka katsovat maailmaa eri kanteilta, jotta tekoäly oppii hahmottamaan kokonaisuuden.

Kolmas teema, mistä usein näkee keskusteluja on korvaako tekoäly nyt kaikki taiteilijat. Ei korvaa. Tekoäly edelleen tuottaa kuvia sen materiaalin pohjalta, millä se on koulutettu. Tämä koulutusmateriaali on kaikki ihmisen tekemää ja tuottamaa ja sitä tarvitaan jatkuvasti lisää, ettei tekoäly alkaisi toistamaan vanhoja samoja teemoja. Tietyllä tapaa tekoäly ei vielä tee mitään “aitoa” vaikka hienoja asioita se tekeekin. Tekoäly voi tietenkin nopeuttaa hahmotelmien tekoa ja siten toimia taiteilijoiden ja graafikoiden apuvälineenä. Tekoälyllä on kuitenkin rajalliset mahdollisuudet tehdä uutta, koska sen luovuus on rajattu siihen syötettyyn tietoon minkä pohjalta kuvia tehdään. Jo parin kuukauden käytön jälkeen kuvissa alkaa nähdä toistoa ja teemoja jotka toimivat paremmin kuin toiset.

Neljäntenä asiana on pakko nostaa esille vielä ympäristötekijät. Tekoälytaide vie todella paljon suoritintehoa ja muistia. Millään heppoisella kotitietokoneella ei kannata lähteä edes yrittämään. Tämä tietenkin tarkoittaa, että tekoälytaiteella on myös oma hiilijalanjälkensä. Kannattaa siis ylläpitää keskustelua ympäristön kuormituksesta myös tämän aihepiirin yhteydessä.

Jos haluat oppia tekoälystä enemmän, Helsingin yliopisto tarjoaa ilmaista koulutusta aiheesta: https://www.elementsofai.com/fi/ 

Jos kaipaat vinkkejä työskentelyyn taidetekoälyn parissa, voimme Verkessä järjestää aiheesta koulutusta. Alla vielä ohjeet muutamaan eri tekoälytaidegeneraattoriin, joilla pääset nopeasti alkuun uuden teknologian kanssa.

Verken vinkit tekoälytaiteen työkaluihin
Katso kaikki blogikirjoitukset

Arkisto