Paljon huomiota herättäneen ChatGPT:n takana oleva tekoäly-yritys OpenAI on Engadgetin mukaan julkistanut uusimman tekoälytyökalunsa Point-E:n, joka pystyy luomaan 3D-pistepilviä tekstikomennoista muutamassa minuutissa.
Engadgetin arvion mukaan tämä kehitys tulee jatkossa mullistamaan 3D-mallinnuksen, ja sitä tullaan käyttämään monissa eri sovelluksissa virtuaalitodellisuudesta NASAn tehtäviin.
Point-E on viimeisin OpenAI:n kehittämien tekstistä kuvaan -generaattoreiden, kuten DALL-E:n, Craiyonin ja DeepAI:n, joukossa. Toisin kuin muut järjestelmät, Point-E pystyy tuottamaan fotorealistisia 3D-kuvia murto-osassa ajasta. Se tekee tämän hyödyntämällä laajaa (teksti, kuva) -parien korpusta, jonka avulla se voi seurata monimutkaisia kehotuksia, kun taas sen kuvasta 3D:ksi -malli on koulutettu pienemmällä (kuva, 3D) -parien tietokokonaisuudella.
Käytännössä Point-E ottaa vastaan tekstikehotteen, kuten "Koira syö hotdogia", ja luo ensin synteettisen 3D-mallinnuksen kohtauksesta. Sen jälkeen se ajaa kuvan useiden diffuusiomallien läpi luodakseen 3D-pistepilven. Prosessi alkaa 1 024 pisteen karkeasta mallista, joka tarkentuu 4 096 pisteen pilveksi, raportoi Engadget.
Point-E-järjestelmä ei ole yhtä tarkka kuin nykyiset huipputekniikat, mutta se tuottaa näytteitä paljon lyhyemmässä ajassa. OpenAI on asettanut projektin avoimen lähdekoodin saataville Githubiin, jolloin kuka tahansa voi kokeilla sitä itse.