Tutustu uuteen Al Generative Artiin

Al Generative Art on taiteen laji, useimmiten visuaalinen, joka perustuu ihmisen ja autonomisen järjestelmän yhteistyöhön. "Autonominen järjestelmä" määritellään Tekoäly ohjelmisto, algoritmi tai malli, joka pystyy suorittamaan monimutkaisia toimintoja ilman ohjelmoijan väliintuloa.

Luomien kuvien omituisista vastakkauksista Dall-E Mini että NFT markkinoilla tekoälyalgoritmien luomat kuvat tulevat yhä enemmän valtavirran mielikuvitukseen. Itse asiassa kaksi tärkeää hanketta aiheesta, jotka ansaitsevat analysoinnin, ovat: Keskimatka ja DALL-E2.

Tietysti uutinen on päässyt myös Twitteriin. Sitä kommentoi muun muassa Charles Hoskinson, joka kirjoitti:

Tekoälyn tuottamaa taidetta. Pystyin tekemään tämän kuvan muutamassa minuutissa. En voi kuvitella kuinka merkittävää tämä tekniikka on 3 vuoden kuluttua pic.twitter.com/jOToCZj7ki
- Charles Hoskinson (@IOHK_Charles) Helmikuu 1, 2023

Al Generative Art: varhaiset kokeilut ja ominaisuudet

Kun olet ymmärtänyt, mitä generatiivinen taide on, on tärkeää korostaa yhtä sen perusperiaatteista: satunnaisuuden. Mikä on generatiivisen taiteen perusominaisuus.

Itse asiassa, ohjelmistotyypistä riippuen autonominen järjestelmä pystyy käsittelemään tuloksia, jotka ovat aina erilaisia ja ainutlaatuisia joka kerta, kun generointikomento suoritetaan, tai se voi palauttaa vaihtelevan määrän tuloksia käyttäjän syötteen perusteella.

Ensimmäiset generatiivisen taiteen kokeilut juontavat juurensa 1960-luvulle kokeilla Harold Cohen ja hänen AARON ohjelmoida. Cohen käytti ensin itsenäistä ohjelmistoa luodakseen abstrakteja taideteoksia, jotka olivat saaneet vaikutteita pop-taiteen silkkipainokuvista. Cohenin teokset ovat nyt esillä Tate Galleryssä Lontoossa.

Toinen Generative Artin ominaisuus, mutta joka on yhä vähemmän etuoikeus, on ohjelmoijan tarjoamien ja ohjelmistokoodin sisällä toteutettujen kuvioiden tai abstraktien elementtien toistaminen.

Lisäksi teksti-kuva-assosiaatiolla toimivien yhä monimutkaisempien neuroverkkojen kehittyminen on mahdollistanut sellaisten generatiivisten mallien kehittämisen, jotka pystyvät luomaan yhä realistisempia ja tarkempia kuvia. Tunnetuin esimerkki tästä generatiivisen taiteen kategoriasta on Laatta.

Dall-E on multimodaalinen hermoverkko, joka perustuu GPT-3 syväoppimismalli OpenAI, sama yritys, joka myös äskettäin kehitti ChatGPT, chatbot julkaistiin marraskuussa 2022 ja optimoitiin "valvottu" ja vahvistavat oppimistekniikat.

Palataksemme Dall-E:hen, näemme, että tämä järjestelmä pystyy luomaan kuvia tekstin kuvauksesta, ns. "kehottaa", perustuu teksti-kuva-parien tietojoukkoon.

Ensimmäinen Dall-E:n versio, joka esiteltiin yleisölle tammikuussa 2021 ja jäi harvojen alan ammattilaisten etuoikeuteen, edusti todellista vallankumousta tämän tyyppisen generatiivisen mallin suhteen, ylittäen GPT-innovaatiot. 3 itse.

Merkittävää on myös se, että Dall-E:n käsittelemien tulosten tarkkuus osoittautui täydelliseksi mahdolliseksi toiselle OpenAI-ratkaisulle: CLIP (Contrasttive Language-Image Pre-training).

Teksti-kuva-assosiaatioiden, kuten Internetistä löydettyjen kuvatekstien, perusteella koulutettu kuvien luokittelu ja ranking-hermoverkko. CLIPin toimenpiteen ansiosta, joka vähentää käyttäjälle ehdotettujen tulosten määrän kehotteessa 32:een, Dall-E:n havaittiin palauttavan tyydyttävät kuvat useimmissa tapauksissa.

Midjourney: suunnittelu, inhimillinen infrastruktuuri ja tekoäly

Kuten odotettiin, Keskimatka on tärkeä projekti, joka on osa nousevaa Al Generative Art -konseptia. Erityisesti Midjourney on itsenäinen tutkimuslaboratorio, joka tutkii uusia ajattelutapoja ja laajentaa ihmislajin mielikuvitusvoimia.

Sen käyttö on yksinkertaista: ensin on luotava tili Epäsopu, alusta, joka isännöi useita yhteisöjä, joista Midjourney on yksi niistä. Sovelluksen sisällä on erilaisia keskustelupalstoja, joissa keskusteluihin voi osallistua aktiivisesti tai ei.

On tärkeää huomauttaa, että jos haluat yrittää käyttää tekoälyä ensimmäistä kertaa, sinun on mentävä "aloittelijat" kanavat, missä 25 ilmaista renderöintiä ovat käytettävissä.

Yksi renderöinti vastaa neljän eri muunnelman luomista samasta tekstisyötteestä.

Siten 25 renderöintiä viittaavat Midjourney-botin suorittamaan 25 käsittelytyöhön. Näin ollen kuvan luominen vaatii vuorovaikutusta Midjourney-botin kanssa tekstiviestillä, jota kutsutaan "kehoteeksi", jossa on avainsanoja, jotka kuvaavat käyttäjän mielessään olevaa kuvaa.

Voit lisätä niin paljon yksityiskohtia kuin haluat, tärkeintä on jakaa avainsanat pilkulla. Kun renderöinti on valmis, tietokone palauttaa neljä erilaista kuvaa valittavien kuvausten perusteella.

Lisäksi, kun ohjelman renderöinti on valmis, voit kertoa mieltymyksistäsi kuvien perusteella ja halutessasi luoda vielä neljä versiota uudelleen.

DALL-E 2: uusi tekoälyjärjestelmä taideteoksille

Midjourneyn lisäksi DALL-E 2 on myös uusi tekoälyjärjestelmä, joka voi luoda realistisia kuvia ja taideteoksia luonnollisen kielen kuvauksesta. Sen lisäksi, että DALL-E 2 voi myös yhdistää konsepteja, ominaisuuksia ja tyylejä.

Uuden tekoälyjärjestelmän vahvuus on myös siinä, että se pystyy laajentamaan kuvia alkuperäisen kankaan laajemmalle luoden uusia laajoja sävellyksiä. Lisäksi se voi tehdä realistisia muutoksia olemassa oleviin kuviin luonnollisen kielen kuvatekstistä ja voi lisätä ja poistaa elementtejä ottaen huomioon varjot, heijastukset ja tekstuurit.

DALL-E 2:n ominaisuuksiin kuuluu myös kuvan ottaminen ja siitä useiden muunnelmien luominen alkuperäisen inspiroimana. DALL-E 2 on oppinut kuvien ja niitä kuvaavan tekstin välisen suhteen.

Se käyttää prosessia ns "diffuusio", joka alkaa satunnaisten pisteiden kuviosta ja muuttaa sitä vähitellen kuvaa kohti, kun se tunnistaa kuvan tietyt puolet.

Joten sen jälkeen, kun OpenAI esitteli DALL-E:n tammikuussa 2021, nyt uusin järjestelmä, DALL-E 2, tuottaa realistisempia ja tarkempia kuvia nelinkertaisella resoluutiolla.

DALL-E 2 aloitti tutkimusprojektina ja on nyt saatavilla a beta-versio. Järjestelmän kehittämiä ja edelleen parantamia suojauskevennyksiä ovat: järjestelmän kyvyn rajoittaminen luoda väkivaltaisia, vihamielisiä tai aikuisille tarkoitettuja kuvia ja oppimiseen perustuva vaiheittainen käyttöönotto.

Lähde: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/