Blogi Tekoälyn hyödyntäminen visuaalisessa suunnittelussa
Tekoäly (artificial intelligence, AI) on tällä hetkellä kuuma puheenaihe, eikä viimeisen vuoden aikana varmasti kukaan ole voinut välttyä meneillään olevalta tekoälyhypeltä. Tässä blogissa Visual & Motion designerimme kertoo työssään käyttämistä tekoälyavusteisista työkaluista ja niiden tuomista mahdollisuuksista Hurjan tuottamissa design-palveluissa.
Käytän päivittäin työssäni Adobe Creative Cloudin ohjelmia, joihin on jo usean vuoden ajan kuulunut Adoben omaa Sensei-tekoälyä käyttäviä työkaluja. Ensimmäinen muistikuvani Adoben AI-teknologian voimasta lienee Photoshopin Content Aware -työkalut, joilla voi helposti esimerkiksi poistaa ihmisen valokuvasta ilman aikaa vievää Clone Stamp -käsinsutimista. Tekoäly (AI) osaa siis täyttää ihmisen mentävän aukon automaattisesti ympäröivällä kuva-aineksella.
Nykyisin työkalu on arkipäiväistynyt ja lisätty myös Adoben videonkäsittelyohjelmaan. Adobella vaikuttaa olevan tapana lanseerata uusia muokkausominaisuuksia yleensä ensin still-kuvien muokkaamiseen ja siirtää ne vasta myöhemmin liikkuvan kuvan puolelle. Suoraan video-ohjelmiin (After Effects ja Premiere) lisättyjä Sensei-toiminnallisuuksia ovat kuitenkin esimerkiksi Color Match, jolla saa automaattisesti eri kohtaukset värimääriteltyä yhteneväiseksi keskenään, sekä valmiin videon uudelleen editoinnissa kätevä automaattinen kohtauksiin pilkkominen. Odotan kovasti että tekoälyyn pohjautuva automaattinen tekstityksen luonti videon ääniraidasta tulisi myös suomen kielellä toimivaksi.
Lisäksi CC-ohjelmiin on tullut lukuisia AI-ominaisuuksia, jotka toimivat taustalla, tai joita ei välttämättä heti hoksaa tekoälyn avustamiksi, kuten fonttien ehdotukset, tekstin valinta ja kopiointi kuvatiedostosta, fiksu resurssien (assets) haku sekä objektien valintatyökalut. Tulevaisuuteen Adobe lupailee kiihtyvällä vauhdilla lisää huikeita ominaisuuksia, joista osa varmasti päätyy osaksi päivittäistä suunnittelutyötä. Nämä työkalut nopeuttavat työskentelyä ja siten tekevät työstä kilpailukykyisempää.
Lue myös: GitHub Copilot – tekoälyn hyödyntäminen ohjelmistokehityksessä
Olen testaillut tekoälyn käyttöä myös Adoben Character Studiossa. Character Studio on hahmojen animointiohjelma, jonka tärkein ominaisuus on kasvojen ja vartalon tosiaikainen liikkeenseuranta pelkästään web-kameran avulla. Vielä muutama vuosi sitten tällaista animointityökalua pystyi tarjoamaan vain toimijat, jolla oli kalliit liikesensorit, kamerat ja studiotila käytössä. Character Studiossa tämä toiminnallisuus on toteutettu tekoälyn avulla. Ohjelmalla voi siis animoida hahmojen liikkeitä itse “näyttelemällä” ja hahmo seuraa liikettä. Lisäksi ohjelma kuuntelee näyttelijän puhetta ja animoi suun liikkeet analysoimalla puheen tavuja.
Character Studiolla pystyy lähinnä animoimaan piirrosmaisia hahmoja, joka rajoittaa hieman käyttöä, mutta teknologiana tämä on erittäin kiinnostava. Varmasti näemme lähitulevaisuudessa AI body trackingin tulevan myös suoraan 3D-ohjelmiin, joka avaa vielä lisämahdollisuuksia animoinnin saralla.
Lähiaikoina olen tutustunut Stability.ai:n kehittämään Stable Diffusion -kuvageneraattoriin selvittääkseni voisiko tekoälypohjaisesta kuvageneroinnista olla mahdollisesti hyötyä asiakkaillemme.
Stable Diffusionissa kuva generoidaan kirjoittamalla tekstisyöte (prompt) englanniksi ohjelmalle, jonka perusteella tekoälymalli luo kuvan sen pohjalta. Stable Diffusionin etu verrattaessa esim. DALL-E 2:n tai Midjourneyn ohjelmiin on sen perustuminen avoimeen lähdekoodiin, parametrien hyvä säädettävyys ja se, että sen voi asentaa myös lokaalisti omalle tietokoneelle. Toisin kun pilvipohjaisissa kilpailijoissa, kuvat generoidaan omalla raudalla näytönohjainta käyttäen, jolloin voidaan poissulkea hieman hähmäinen kysymys kenelle tekoälyllä generoidun kuvan käyttöoikeudet lopulta kuuluvat. Lisäksi omia kuvia käytettäessä, etenkin henkilöiden kuvia, on turvallisempaa ettei kuvadata päädy ulkopuolisten käsiin.
Tekoälyn kuvagenerointiin liittyviä taiteellisia, laillisia, eettisiä ja moraalisia kysymyksiä voit lukea esimerkiksi tästä.
Tekoälypohjainen kuvagenerointi voi olla hyödylllinen esimerkiksi kuvitusten luomiseen, vaikkapa markkinoinnin tarpeisiin. Erityisesti maisemien ja taiteellisempien kuvien tuotossa se on jo hyvinkin toimiva, mutta ihmisten, esineiden tai rakennusten kanssa sillä on vielä haasteita. Usein jälkimmäisenä mainittuihin generoituu jotain outoa ja vääristynyttä, jota voi olla vaikea korjata jälkikäteen. Monesti tästä syystä esimerkiksi kuvapankkikuva voi olla hyvä ratkaisu joko sellaisenaan tai AI-jatkomuokattuna, verrattuna siihen, että kuva generoidaan tekoälyllä alusta lähtien.
Näkisin tekoälyn erittäin hyödyllisenä tällä hetkellä esimerkiksi konseptointiin, ideointiin ja projektin tyylin etsimiseen. Tekoäly toimii tässä tarkoituksessa kuin kehittynyt Googlen kuvahaku, josta voi hakea inspiraatiota ilmeeseen ja mahdollisesti jopa saada sopiva kuva projektiin pelkän idean pohjalta. Kuva saattaa olla sisällöltään hieman kummallinen, mutta esimerkiksi värit ja tunnelma halutunlainen, joilla voidaan päästä ideoinnissa jo pitkälle.
Edellisten lisäksi olen todennut tekoälyn toimivan erityisen hyvin asioiden poistamiseen kuvista (paremmin kuin Photoshopissa), kuvien skaalaamiseen ylöspäin (upscale) sekä kuvien rajausten laajentamiseen. Tekoäly osaa siis jo melko hyvin muokata tai luoda tiettyjä saumattomia yksittäisiä kohtia kuvaan, kunhan tekstisyöte on tarpeeksi tarkka. Lisäksi Lensa-sovelluksen tyyppiset tyylitellyt kuvat onnistuvat hyvin, eli esimerkiksi valokuvan voi muuttaa taiteilijan maalauksen näköiseksi.
Tekoälypohjaiset kuvan generoinnit ja muokkaukset toimivat melko hyvin jo still-kuvissa, mutta liikkuvaan kuvaan on vielä matkaa. Suurin ongelma tällä hetkellä on, ettei tekoäly ymmärrä tehdä jatkuvuutta aikaisempiin kuvaruutuihin eikä se osaa ennustaa seuraavaksi tulevia ruutuja. Tästä johtuen jokainen kuvaruutu näyttää hieman erilaiselta ja video vilkkuu häiritsevästi, vaikka still-kuvat näyttäisivät hyviltä. Tämäkin osa-alue kuitenkin kehittyy jatkuvasti, ja luulen että muutamassa vuodessa tähän on löytynyt toimivia ratkaisuja. Lisää tietoa videon/animaation tulevaisuudesta voit lukea tästä artikkelista.
Myös 3D-mallinnuksen saralla on ollut mielenkiintoista kehitystä tekoälyn saralla, ja karkeita sovelluksia löytyy jo nyt ja on kehitteillä jatkuvasti.
Tekoäly on parissa vuodessa kehittynyt hurjaa vauhtia, eikä hidastumisen merkkejä ole. Kuvan generointi ja muokkaus on ollut suuri yksittäinen osa-alue, joka on tuonut AI-teknologiaa suuren yleisön tietoisuuteen. Suuren potentiaalin vastapainona on pinnalla ollut myös huoli tekijänoikeuksista sekä taiteilijoiden ja luovan työn tekijöiden elannon hupenemisesta. Lisäksi esimerkiksi deepfake-videot voivat olla turvallisuusriski jopa yhteiskuntatasolla, sillä niitä on nykyisin jo hyvin vaikea tunnistaa muokatuiksi. Tekoälyn nopean kehityksen vastapainoksi mielestäni tarvittaisiin myös nopeaa reagointia pelisääntöihin kansainvälisesti.
Olen kuitenkin huomannut konkreettisesti tekoälyä testaillessani, että edelleen tarvitaan ihminen tekemään taiteelliset ja sisällölliset päätökset. Tekoäly on vain eräänlainen mylly, joka jauhaa loputtomasti ulos tavaraa tietyillä parametreilla ilman, että todella ymmärtää niiden merkityksiä. Tarvitaan edelleen paljon yritys- ja erehdys -metodia sekä taiteilijan silmää erottamaan jyvät akanoista ja käyttökelpoinen hälyisän roskan seasta. Joskus sokea AI-kana saattaa tosin tietämättään löytää jyväsen, josta on ihmisellekin iloa.
Olemme Hurjalla ohjelmistokehityksen lisäksi apunasi myös yrityksesi visuaalisissa tarpeissa tekoälyllä tai ilman. Kun siis tarvitset digitaalisten palveluiden kehittämiseen kumppanin, jolta löytyy sekä tekninen että visuaalinen osaaminen, ota yhteyttä!
GitHub Copilot on GitHubin, OpenAI:n ja Microsoftin kehittämä generatiivista tekoälyä hyödyntävä tekoälyavustin ohjelmointiin.
Prototyypin hyödyntäminen ohjelmistoprojektissa säästää aikaa ja rahaa, kun lopputuotteen käytettävyyttä ja toimintoja voidaan testata jo varhaisessa vaiheessa.
Käyttöliittymäsuunnittelun tavoitteena on, että käyttöliittymää on mahdollisimman yksinkertaista käyttää, jolloin myös ohjelmiston tavoitteet täyttyvät.