Google on julkistanut Gemini-nimisen multimodaalisen tekoälymalliperheen, jonka se toivoo kilpailevan OpenAI:n GPT-4:n kanssa, joka on ChatGPT:n maksullisen version taustalla.
Google väittää, että Geminin suurin versio ylittää "nykyiset huipputulokset 30:ssa 32:sta laajasti käytetystä akateemisesta vertailukohdasta, joita käytetään suurten kielimallien (LLM) tutkimuksessa ja kehityksessä". Tämä on jatkoa aiemmalle PaLM 2 -mallille, jonka Google uskoi vastaavan GPT-4:n kyvykkyyksiä.
Erityisesti englanninkielinen versio Geminin keskitason mallista on saatavilla nyt yli 170 maassa osana Google Bard -keskustelurobottia, mutta Ars Technican mukaan ei EU:ssa tai Isossa-Britanniassa potentiaalisten sääntelyongelmien vuoksi.
Gemini kykenee käsittelemään useita erityyppisiä syötteitä, mikä tekee siitä multimodaalisen. Se tarkoittaa, että se voi prosessoida tekstiä, koodia, kuvia ja jopa ääntä. Tavoitteena on luoda tekoäly, joka voi tarkasti ratkaista ongelmia, antaa neuvoja ja vastata kysymyksiin eri aloilta – arkipäiväisistä tieteellisiin. Google sanoo, että tämä voima tuo uuden aikakauden tietotekniikassa, ja se toivoo integroivansa teknologian tiiviisti tuotteisiinsa.
Google kertoo, että Gemini tulee olemaan saatavilla kolmessa koossa: Gemini Ultra ("erittäin monimutkaisiin tehtäviin"), Gemini Pro ("laajamittaiseen käyttöön monenlaisissa tehtävissä") ja Gemini Nano ("laitteistopohjaisiin tehtäviin"). Jokainen niistä erottuu monimutkaisuudessa parametrien määrällä. Enemmän parametreja tarkoittaa yleensä suurempaa ja kyvykkäämpää neuroverkkoa, mutta vaatii enemmän laskentatehoa toimiakseen. Tämä tarkoittaa, että Nano, pienin malli, on suunniteltu toimimaan paikallisesti kuluttajalaitteissa, kun taas Ultra vaatii datakeskuksen laitteiston.
Gemini-esittelyvideo
AI Bard ChatGPT Gemini Gemini AI Google Google Bard Google Gemini GPT-4 OpenAI tech tekoäly
