Mitä Nvidian uusi Text-to-3D tarkoittaa suunnittelussa ja tuotesuunnittelussa

TL, dr: Generatiivinen tekoäly kehittyy innostavaa vauhtia. Nvidian uusin algoritmi muuntaa tekstin 3D-verkkoon kaksi kertaa nopeammin kuin tuskin kaksi kuukautta sitten julkaistut projektit. Tämä tarkoittaa, että tekniset valmiudet ylittävät jo nyt kykymme työskennellä niiden kanssa.

Viime viikon paperi Nvidian tutkijat osoittivat eksponentiaalisen nopeuden, jolla generatiivinen tekoälyavaruus kehittyy. Tämä toiminnan räjähdysmäinen kasvu – erityisesti viimeisen 9 kuukauden aikana – tulee vaikuttamaan kaikkiin elämän osa-alueisiin, ei vähiten tuotesuunnitteluun, suunnitteluun ja tuotantoon. Muutokset vapauttavat alan rakenteellisista rajoituksista, jotka liittyvät ideoiden kommunikointiin, nopeuttavat innovaatiosyklejä ja antavat viime kädessä luvan täyttää kestävyyslupauksensa.

Esimerkkiverkot Nvidia Researchin Magic 3D -algoritmeista ja niiden luomiseen käytetyt kehotteet.

Nvidia Deep Imagination Research

Koska on vuosia kerrottu, että tekoäly mullistaisi toimintatapojamme perusteellisesti, harvat odottivat luovan sektorin olevan ensimmäisten uhriensa joukossa. GPT-3:n ihmismäisen tekstigeneraattorin ilmestyminen vuonna 2020 toi mahdollisuudet entistä terävämmäksi. Siitä lähtien se on ollut villi matka: DALL-E (teksti-kuvaksi), Whisper (puheentunnistus) ja viimeksi Stable Diffusion (teksti-kuvaksi) ovat lisänneet puheen ja visuaalisen AI-työkalujen ominaisuuksia, mutta myös vähensi niiden käyttöön tarvittavia resursseja (GPT-175:n 3 miljardista parametrista 900 miljoonaan Stable Diffusioniin).

Stable Diffusionin koko tarkoittaa alle 5 Gt:n levytilaa – voidaan käyttää millä tahansa kannettavalla tietokoneella. Eikä vain se; toisin kuin OpenAI (jota pääasiassa rahoittaa Microsoft ja joka julkaisee GPT-3:n, DALL-E:n ja Whisperin), Stable Diffusion on avoimen lähdekoodin, mikä tarkoittaa, että muut voivat hyödyntää sen oppimista paljon helpommin. Tämä tarkoittaa, että näemme vasta innovatiivisen syklin alun – paljon muuta on tulossa, kuten Nvidian paperi nyt osoittaa.

Stable Diffusionin tukijat (stability.ai) turboavat tätä trendiä edelleen tarjoamalla teknisiä ja taloudellisia apurahoja muille tiimeille, jotka vievät tutkimusta uusiin suuntiin. Lisäksi lukuisat projektit tuovat työkalut yhä laajemman käyttäjäkunnan saataville. Niiden joukossa ovat laajennukset Blenderille, avoimen lähdekoodin suunnittelutyökalulle, ja Adoben kehittämä Photoshop-vastine. Täysi API-pääsy työkaluihin rahoitetaan suurilla Venture Capital -dollareilla, mikä tarkoittaa, että sadat miljoonat ohjelmistokehittäjät, ei vain muutama satatuhatta tietoinsinööriä, luovat nyt omia työkalujaan näille algoritmeille.

Puhe, kuvat ja teksti ovat ensimmäisiä vertikaaleja, joita nämä tekniikat häiritsevät. Mutta 3D ei ole paljon jäljessä. Kappaleen generatiivisen taiteen lisäksi sarjakuvat ovat ilmeinen ensimmäinen käyttökohde. Stable Diffusioniin perustuva Pokémon-generaattori on jo olemassa. Visuaaliset tehosteet ja elokuvat ovat seuraavaksi. Mutta monilla muilla aloilla on todennäköisesti häiriöitä – muun muassa sisustussuunnittelua Interiorai.comin johdolla.

Kaikessa tässä jännityksessä innovaatioiden soveltaminen Design & Engineeringiin tuntuu jälkikäteen. Silti se on todennäköisesti alue, johon viime kädessä vaikuttaa eniten. Alussa on tietysti haasteita: Ensinnäkin Stable Diffusion ja sen maanmiehet eivät ole vielä kovin tarkkoja. Se ei ole ongelma sarjakuvissa, mutta se on suuri haaste kaikille yrityksille muuttaa tekstiä teollisissa yhteyksissä käytettäviksi täysiksi 3D-geometrioiksi. Se on alue, joka on herättänyt kiinnostusta (Bits101-niminen projekti käynnistettiin Israelissa vuonna 2015). Tämä saattaa olla alan pyhä malja, mutta on monia välihaasteita, jotka voivat olla paljon helpompi ratkaista. Näitä ovat muun muassa parannettu objektin tunnistus (Yolo-algoritmia käytetään jo erittäin tehokkaasti), mikä johtaa parempaan lainaukseen ja huomautuksiin – parantaa laatua ja vähentää virheitä. Lisäosien pitäisi myös helpottaa Generative AI:n käyttöä perussuunnitelmien (Primitives) kehittämiseen, joita voidaan sitten muokata edelleen suunnittelutyökaluissa toleranssin parantamiseksi vaatimusten mukaisesti. Tämä on lähestymistapa, jota käytettiin jo Altairin Inspiressa, joka käytti Finite Element Analysis -analyysiä tehdäkseen saman. Nämä primitiivit voivat toimia myös synteettisenä tietokannana merkityistä malleista, joista on pulaa 3D CAD -teollisuudessa. Physnan toimitusjohtaja ja perustaja huomauttaa tästä artikkelissa yksityiskohtaisesti omia yrityksiään käyttää näitä uusia menetelmiä yksityiskohtaisten 3D-suunnitelmien luomiseen, mikä korostaa myös useita synteettisten tietojen käyttämisen sudenkuoppia näiden algoritmien ohjaamiseen. 3D-suunnitelmien luominen 2D-piirustuksista on toinen mahdollinen sovellusalue, kuten älykäs CAM – ruokkii työkalun kulumisen kirjasto parhaan koneistusstrategian määrittämiseksi.

Nämä haasteet ovat tärkeitä ja kannattavia käsitellä itsekseen ja itselleen. Niiden tärkein vaikutus on kuitenkin auttaa kehittämään polkua ideasta suunnitteluun vähentämällä lopulta riippuvuutta 3D-suunnitelmista aikomusten viestimisessä. Suunnittelut, olivatpa ne sitten 2D- tai 3D-muotoisia, ovat olleet ensisijainen keino kääntää asiakkaiden tarpeet lopputuotteiksi. Tämä rajoittaa alaa, koska nämä mallit toimivat mustana laatikona, johon kaikki arvokkaat asiakkaiden näkemykset, tuotantorajoitteet ja yrityksen tavoitteet tallennetaan, joita ei voida erottaa, mutta silti ne tunnistetaan yksin. Tämä tarkoittaa, että kun jokin muuttuu, on lähes mahdotonta yksinkertaisesti muuttaa suunnittelua. Tästä syystä valmistusinnovaatioiden, kuten 3D-tulostuksen, käyttöönotto kestää niin kauan ja tuottaa jatkuvan pettymyksen lyhytaikaisille sijoittajille. Komponentit, joista lentokone muodostuu, "asetetaan" suunnitteluhetkestä lähtien huolimatta yli 20 vuoden tuottavasta käyttöiästä. Innovaatioiden ulottuvuutta ei juuri ole – niiden on odotettava seuraavan sukupolven lanseerausta.

Mahdollisuus muuttaa yhtä rajoitusta ja sallia Stable Diffusionin kaltaisen algoritmin muodostaa uudelleen suunnittelu- ja tuotantoparametrit nopeuttaa merkittävästi uusien innovaatioiden käyttöönottoa ja antaa meille mahdollisuuden rakentaa kevyempiä, tehokkaampia tuotteita nopeammin. Kuten he tekevät Formula 1:ssä tai Systems Designissa, tulevat insinöörit toimivat rajoitteiden johtajina, jotka voivat ilmaista sanoin ja tietolähteisiin viitaten, mikä on tuotteen tavoite ja rajoitukset.

Ilman uusien ja olemassa olevien tuotteiden suunnitteluprosessia tällä tavalla meillä ei ole juuri mitään keinoja saavuttaa kunnianhimoisia kestävyystavoitteita, jotka meidän on asetettava. Tätä varten meidän on ensin sovittava kielestä, jolla voimme kommunikoida suunnittelun ulkopuolella. Tämä uusi semanttinen malli on ilmeinen aukko edellä kuvatuissa innovaatioissa. Useat yritykset ovat jo alkaneet kokeilla sitä, mm nTopologia kenttikäsitteineen. Ja silti muutoksen vauhti on hidas, toisin kuin semanttisen mallin syöttämät algoritmit. Nvidian uuden algoritmin kerrotaan olevan yli kaksi kertaa nopeampi DreamFusion, julkaistu alle 2 kuukautta sitten. Tuote- ja suunnitteluyritysten on nyt työstettävä ideoidensa vangitsemista uusilla, tulevaisuuden kestävillä tavoilla voidakseen hyödyntää tämän generatiivisen tekoälyn räjähdysmäisen kasvun tarjoamia mahdollisuuksia. Algoritmien muutosnopeus on osoittanut jälleen kerran, että Morsen lakia sovelletaan kaikkialla, missä työkaluja digitalisoidaan. Haasteena on edelleen inhimillinen kyvyttömyys omaksua tämä muutos ja ottaa käyttöön uusia viestintämenetelmiä, jotka pystyvät vapauttamaan potentiaalinsa tehtävän kiireellisyydestä huolimatta.

Lähde: https://www.forbes.com/sites/andrewegner/2022/11/24/what-nvidias-new-text-to-3d-means-for-engineering–product-design/