Project Genie, Googlen tekoälyprototyyppi interaktiivisten maailmojen luomiseen

  • Project Genie yhdistää Genie 3:n, Nano Banana Pron ja Gemini-ohjelmistot luodakseen interaktiivisia virtuaalimaailmoja tekstistä tai kuvista.
  • Pääsy on rajoitettu Google AI Ultra -tilaajille Yhdysvalloissa, ja istuntojen kesto on enintään 60 sekuntia ja resoluutio noin 720p.
  • Työkalun avulla voit luonnostella, tutkia ja sekoittaa maailmoja reaaliajassa, mutta se kärsii realismi-, latenssi- ja huonosta hahmonhallinnasta.
  • Sen kyky matkia tunnettuja pelejä avaa tekijänoikeuskeskusteluja ja huolestuttaa osaa videopeliteollisuudesta.

Tekoälyprojekti interaktiivisten maailmojen luomiseksi

Google on ottanut uuden askeleen hyökkäyslinjassaan tekoälyn soveltaminen videopeleihin ja virtuaalisia maailmoja Yritys esittelee Project Genien, prototyypin, jonka avulla käyttäjät voivat luoda ja navigoida interaktiivisissa ympäristöissä muutaman tekstikehotteen tai kuvan perusteella, lanseerauksen yhteydessä kokeiluna, joka on vielä testausvaiheessa. Sen alustavat demonstraatiot ovat kuitenkin herättäneet sekä innostusta että epäilyksiä alalla.

Toistaiseksi pääsy on rajoitettu Google AI Ultra -sopimuksen tilaajat Yhdysvalloissalyhyillä istunnoilla ja esityksellä, jotka selvästi leimaavat järjestelmän kokeellisen luonteen. Silti projekti viitoittaa tulevaisuuteen, jossa kuka tahansa käyttäjä voisi luo pieni "pelattava maailma" muutamassa sekunnissa, ilman että tarvitsee tietää miten ohjelmoida tai käsitellä grafiikkamoottoreita.

Mikä on Project Genie ja mitä teknologioita se yhdistää?

Maailmangeneraattori tekoälyllä

Project Genie on Google DeepMindin ja Google AI:n kehittämä tutkimusprototyyppi joka toimii interaktiivisena maailmangeneraattorina. Sen tekninen perusta lepää kolmella pilarilla: Genie 3 -malli, joka on erikoistunut dynaamisten ympäristöjen simulointiin; Nano Banana Pro, joka vastaa visuaalisista näkökohdista ja luonnoksista; ja Gemini, multimodaalinen malli, joka tulkitsee käyttäjän ohjeita ja toimii avustajana luomisen aikana.

Järjestelmän ydin on Genie 3, "maailmamalli", joka pystyy ennustamaan ruutu ruudulta, mitä näytöllä tapahtuuToisin kuin aiemmat tekniikat, jotka tuottivat vain staattisia 3D-kohtauksia, tämä lähestymistapa mahdollistaa ympäristön reagoinnin pelaajan liikkeisiin reaaliajassa noin 720p:n resoluutiolla ja useiden minuuttien visuaalisella koherenssilla DeepMindin sisäisten kokeiden mukaan.

Se on integroitu tältä pohjalta Nano Banana Pro, joka vastaa lavan alkuperäisen kuvan luomisesta Kuvailevasta tekstistä tai viitekuvasta alkaen tämä ensimmäinen näkymä toimii luonnoksena graafisen tyylin, maailman sommittelun ja tutkimisen aikana ohjattavan hahmon ulkonäön päättämiseksi.

Lopuksi, Gemini toimii orkestrointikerroksena ja avustajanaSe tulkitsee ohjeet luonnollisella kielellä, auttaa säätämään maailmaa lennossa ja helpottaa tehtäviä, kuten perspektiivin vaihtamista (ensimmäinen tai kolmas persoona), jo luodun ympäristön uudelleenmiksaamista tai useiden ideoiden yhdistämistä yhdeksi pelattavaksi skenaarioksi.

Miten virtuaalimaailmoja luodaan ja tutkitaan

Tekoälyn luomat interaktiiviset maailmat

Project Genien toiminta on rakentunut a:n ympärille progressiivinen prosessi kolmessa vaiheessa Google tiivistää sen maailmojen luonnosteluksi, tutkimiseksi ja yhdistämiseksi. Tavoitteena on, että kuka tahansa voi siirtyä ideasta pieneksi interaktiiviseksi kokemukseksi ilman lisätyökaluja.

Ensimmäisessä vaiheessa käyttäjä kirjoittaa kuvauksen haluamastaan ​​maailmasta tai lataa referenssikuvan. Näiden tietojen perusteella Nano Banana Pro luo staattisen esikatselun Miljöö voi olla matalapolymeraattinen metsä, futuristinen kaupunkiympäristö, historiallinen maisema tai mikä tahansa tekstissä kuvattu. Hahmon tyyppi, kameratila ja joitakin perusliikeparametreja määritellään myös tässä vaiheessa.

Kun luonnos on hyväksytty, Genie 3 astuu peliin, jotta pelaaja voi Tutki ympäristöä vapaasti käyttämällä tyypillisiä PC-ohjaimia, kuten W-, A-, S- ja D-näppäimiäMalli luo lennossa sen, mitä hahmon edessä näkyy, ennustaen jokaisen ruudun edellisten perusteella ja säilyttäen tietyn johdonmukaisuuden, kun kamera käännetään tai palaa jo vierailtuun alueelle.

Kolmas keskeinen ominaisuus on maailmojen yhdistäminen ja uudelleenmiksaaminenJärjestelmä antaa käyttäjille mahdollisuuden palata aiemmin luotuihin skenaarioihin, muokata niitä uusilla parametreilla, yhdistää ne yhteen tai jopa käyttää Googlen valmiiksi luomia maailmoja pohjana variaatioiden rakentamiseen. Lisäksi istuntojen videoita voidaan jakaa muiden käyttäjien katseltavaksi tai inspiraatioksi.

Kaikki tämä toimii verkkosovelluksesta, joka on samanlainen kuin muut Googlen tekoälypalvelut, joten Mitään lisäohjelmia ei tarvitse asentaa, eikä edistynyttä teknistä tietämystä tarvita.Käytä vain työkalua, anna ohjeet ja aloita yhdistelmien testaaminen, kunnes löydät mielenkiintoisen tuloksen.

Tekniset rajoitukset: aika, suorituskyky ja realismi

Tekoälyprototyypin rajoitukset virtuaalimaailmoissa

Google vaatii määrittelemään Project Genien yhdeksi tutkimusprototyyppi, jolla on selkeä kokeellinen luonneTuo merkintä ei ole pelkkä muodollisuus: nykyinen kokemus tuo esiin useita selkeitä rajoituksia, jotka asettavat työkalun käytännön käyttöön alkuperäisen uteliaisuuden lisäksi useita ehtoja.

Ilmeisin niistä on 60 sekunnin raja luonti- ja tutkimusistuntoa kohdenTuon minuutin jälkeen maailma sammuu ja uuden kokemuksen on alettava. Yhtiö selittää, että tämä rajoitus mahdollistaa laskentaresurssien paremman jakamisen, koska jokainen istunto varaa oman sirun pelaavalle käyttäjälle.

Suorituskyvyn osalta julkiset testit kuvaavat resoluutio lähellä 720p ja taajuus 20–24 kuvaa sekunnissaNäihin ominaisuuksiin liittyy huomattava syöttöviive hahmoa liikutettaessa tai kameraa vaihdettaessa. Joidenkin varhaisten testaajien mukaan kokemus tuntuu enemmän interaktiiviselta videolta kuin täysin sujuvalta, perinteiseltä videopeliltä.

On myös huomattava, että Genie 3 Se ei ole klassinen grafiikkamoottori, vaan malli, joka ennustaa seuraavan ruudun. Yllä olevan perusteella. Tämä johtaa outoon käyttäytymiseen: polkuihin, jotka muuttavat tekstuuria ilman näkyvää syytä, elementteihin, jotka katoavat, epäuskottavaan fysiikkaan tai animaatioihin, jotka muuttavat muotoaan satunnaisesti.

Google itse varoittaa, että luodut maailmat "Ne eivät välttämättä näytä täysin todellisilta tai aina ole fysiikan lakien tai ohjeiden mukaisia."Ja hahmonohjaus voi olla epätarkkaa. Toisin sanoen teknologia näyttää lupaavalta, mutta se on vielä kaukana viimeistellystä pelikokemuksesta pelattavuuden ja visuaalisen vakauden suhteen.

Rajoitettu pääsy ja kansainvälinen tiekartta

Rajoitettu pääsy tekoälyprototyyppiin

Tässä ensimmäisessä vaiheessa Project Genie on saatavilla vain Google AI Ultran asiakkaat YhdysvalloissaYrityksen edistynein tilauspaketti on suunnattu yrityksille ja sisällöntuottajille, jotka tarvitsevat tehokkaita tekoälyominaisuuksia. Se on premium-palvelu, joka rajoittaa kokeiluun pääsyn saavien käyttäjien määrää.

Testaamisen rajoittamispäätös selittyy sekä sillä, että kunkin istunnon laskennalliset kustannukset Tämä johtuu Googlen kiinnostuksesta kerätä yksityiskohtaista palautetta ennen laajempaa käyttöönottoa. DeepMindin tutkimusjohtaja Shlomi Frutcher korosti, että on "jännittävää" voida avata nämä työkalut useammille ihmisille tosielämän käyttökokemusten keräämiseksi, mutta toistaiseksi ei ole tarkkaa päivämäärää niiden saapumiselle Eurooppaan tai muille markkinoille.

Espanjalaisten ja eurooppalaisten käyttäjien ja tutkimusten näkökulmasta tämä tarkoittaa sitä, että ainakin lyhyellä aikavälillä Realistisin rooli on tarkkailijan rooli.seuraa testejä tarkasti, analysoi sosiaalisessa mediassa jo kiertäviä videoita ja arvioi, missä määrin tätä teknologiaa voitaisiin integroida tasosuunnittelun, nopean prototyyppien valmistuksen tai ideoiden visualisoinnin työnkulkuihin.

Google on ilmoittanut aikomuksestaan laajentaa käyttöoikeutta vähitellen Edellyttäen, että suorituskyky, kustannukset ja oikeudelliset ongelmat sen sallivat. Laajentumisen vauhti riippuu kuitenkin myös yhteisön reaktiosta ja siitä, miten tekijänoikeuksiin ja kolmansien osapuolten sisällön vastuulliseen käyttöön liittyvät keskustelut kehittyvät.

Kyky matkia tunnettuja pelejä ja tekijänoikeuskeskustelua

Yksi Project Genien herkimmistä kohdista on ollut sen kyky luoda vaihtelevalla menestyksellä maailmoja, jotka ovat selvästi peräisin olemassa olevista videopeleistäJotkut erikoistuneet toimittajat ovat onnistuneet luomaan skenaarioita, jotka muistuttivat selvästi pelejä, kuten Super Mario 64, Metroid Prime tai The Legend of Zelda: Breath of the Wild.

Zeldan tapauksessa niitä on jopa nähty hahmot, jotka hypätessään laukaisevat varjoliitimenTämä ele liittyy läheisesti Nintendon peliin. Nämä yhteensattumat viittaavat siihen, että mallia on koulutettu käyttämällä suurta määrää julkisesti saatavilla olevia pelivideoita, mikä herättää kysymyksiä immateriaalioikeuksien kohtelusta tekoälyn koulutuksessa.

Useiden testien jälkeen, joissa luotiin uudelleen helposti tunnistettavien pelisarjojen inspiroimia maailmoja, Google on alkanut estää tiettyjen skenaarioiden ja hahmojen syntymisenvarsinkin kun mainitaan tiettyjä nimiä tai tavaramerkkejä. Joissakin tapauksissa työkalu estää suoraan tiettyihin saagoihin perustuvien maailmojen luomisen vedoten "kolmansien osapuolten sisällöntuottajien etuihin".

Yhtiö selittää, että Project Genie on "koulutettu pääasiassa julkisesti saatavilla olevalla verkkodatalla"Muista kuitenkin, että tämä sisältö on edelleen tekijänoikeuslakien alaista. Tuloksena on edelleen rakenteilla oleva moderointijärjestelmä, jossa jotkin yritykset kopioida tekijänoikeuksin suojattuja teoksia estetään nimenomaisesti, kun taas toiset pääsevät läpi, kunhan vältetään liian suoria viittauksia.

Tämä epätavallinen käytös ruokkii keskustelua mm. Missä määrin tekoälyn tulisi tai voi ottaa inspiraatiota olemassa olevista peleistä? Ja missä kulkee raja kunnianosoituksen, jäljittelyn ja kopioinnin välille? Tämän keskustelun odotetaan olevan erityisen merkityksellistä esimerkiksi Euroopan unionin kaltaisilla alueilla, joilla tekoälyn koulutusdataa ja tekijänoikeuksia koskevia sääntelykehyksiä vielä määritellään.

Mahdollinen vaikutus videopeliteollisuuteen

Median vetovoiman ulkopuolella katsominen sekunneissa luodut "Marion kaltaiset" tai "Zeldan kaltaiset" maailmatProject Genie on osa laajempaa kilpailua suurten teknologiayritysten välillä generatiivisen tekoälyn soveltamiseksi pelikehitykseen. Esimerkiksi Microsoft on julkistanut projekteja, kuten Musen, automatisoidakseen osia suunnittelu- ja tuotantoprosessista, ja muut yritykset tutkivat vastaavia ratkaisuja kustannusten vähentämiseksi ja kehityksen nopeuttamiseksi.

Tässä yhteydessä Googlen ehdotuksen tavoitteena on tulla nopea prototyyppien ja kokeilujen työkalu Tämä voisi kiinnostaa sekä itsenäisiä studioita että suuria kustantajia. Mahdollisuus rakentaa pelattava skenaario luonnoksesta tai tekstikappaleesta voi helpottaa ideoiden varhaista validointia, sisäisten demojen luomista tai mekaniikkojen testaamista ilman kuukausien työn panostamista.

Tällaisten ratkaisujen lisääntyminen aiheuttaa kuitenkin huolta alan toimijoiden keskuudessa. Yhtäältä Mahdollisista vaikutuksista tiettyihin ammattiprofiileihin on huolta. Jos osa sisällöstä luodaan automaattisesti. Toisaalta monet kehittäjät suhtautuvat varauksella liiketoimintamalleihin, joissa tekoälyä koulutetaan jo julkaistujen teosten perusteella ilman selkeää korvausta niiden tekijöille.

Euroopan ja Espanjan markkinoilla, joilla keskustelu kulttuuriluonnon suojaamisesta on erityisen kiivasta, on ratkaisevan tärkeää nähdä, miten Project Genien kaltaiset työkalut sopivat tuleviin säännöksiin. Näkökohdat, kuten koulutusdatan läpinäkyvyys, oikeudenhaltijoiden kieltäytymisjärjestelmät ja luodun sisällön attribuutio, voivat ratkaista, onko niiden käyttöönotto harkittua vai jatkuvaa konfliktia kehittäjien ja julkaisijoiden kanssa.

Project Genie on toistaiseksi alkuvaiheessa, jossa Se toimii enemmän julkisena laboratoriona kuin valmiina tuotteena.Sen kehitys ja se, miten Google käsittelee siihen liittyviä oikeudellisia ja eettisiä kysymyksiä, määräävät, integroituuko se lopulta studioiden työnkulkuihin vai jääkö se näyttäväksi mutta rajoitetuksi kokeiluksi.

Tämän prototyypin ulkonäkö kuitenkin tekee selväksi, että suuret teknologiayritykset näkevät siinä Interaktiivisten maailmojen automaattinen luominen ensiluokkainen strateginen alue. Vaikka sen todellinen käyttö on nykyään rajoitettua ja teknisistä epätäydellisyyksistä vaivattua, suunta on selvä: mallit, jotka yhä paremmin pystyvät muuttamaan tekstiä ja kuvia pelattaviksi kokemuksiksi, ja teollisuudenalan, jonka on päätettävä, miten se haluaa toimia näiden uusien työkalujen rinnalla.

Aiheeseen liittyvä artikkeli:
Virtuaalitodellisuuden määritelmä Mitä sinun pitäisi tietää!