Google julkaisee Gemma 4:n, joka on sen suuri panostus avoimeen ja paikalliseen tekoälyyn

  • Gemma 4 on neljän Gemini 3 -teknologiaan perustuvan avoimen tekoälymallin perhe, jonka parametrit vaihtelevat E2B:stä 31B:hen.
  • Mallit yhdistävät korkean "parametriälykkyyden" paikalliseen suoritukseen mobiili-, reuna- ja suljetuissa infrastruktuureissa jopa 256 000 tokenin konteksti-ikkunoiden ansiosta.
  • Apache 2.0 -lisenssi sallii rajoittamattoman kaupallisen käytön, vahvistaa digitaalista itsemääräämisoikeutta ja helpottaa käyttöönottoa säännellyissä ympäristöissä Euroopassa.
  • Gemma 4 on multimodaalinen (teksti, kuva, video ja ääni pienissä malleissa), tukee yli 140 kieltä ja on saatavilla Google AI Studiossa, Hugging Facessa, Kagglessa ja Ollamassa.

Gemma 4 -tekoälymalli

Google on ottanut tärkeän askeleen strategiassaan avoin tekoäly Gemma 4:n lanseerauksen myötä uusi malliperhe pyrkii yhdistämään korkeatasoisen päättelykyvyn huomattavasti vaatimattomampiin laitteistovaatimuksiin. Yritys esittelee tämän sukupolven vakavasti otettavana vaihtoehtona niille, jotka tarvitsevat edistynyttä tekoälyä omassa infrastruktuurissaan, mobiililaitteista datakeskuksiin.

Kaukana yhdestä ainoasta mallista, Gemma 4 on täydellinen valikoima, joka sisältää neljä avointa varianttiaEhdotus on suunniteltu kehittäjille, yrityksille ja julkisille yhteisöille, jotka haluavat enemmän hallintaa tietoihinsa ja käyttöönottoihinsa, ja se sopii erityisen hyvin seuraavien tahojen vaatimuksiin: Digitaalinen suvereniteetti ja sääntelyn noudattaminen Euroopassajossa valta päättää, missä toteutus tapahtuu ja mihin tiedot tallennetaan, on yhä tärkeämpää.

Neljän mallin perhe, joka keskittyy "parametripohjaiseen älykkyyteen"

Gemma 4 -malliperhe

Gemma 4 on rakennettu samalle teknologiselle perustalle kuin Gemini 3Mutta selkeällä tavoitteella: maksimoida Googlen puhelut "parametripohjainen älykkyys"Sen sijaan, että yritys kilpailisi pelkästään koosta, se ylpeilee saavuttaneensa paljon suurempiin järjestelmiin verrattavissa olevan suorituskyvyn suhteellisen kompakteissa malleissa.

Perhe koostuu neljä eri kokoaTehokas 2B (E2B), tehokas 4B (E4B), malli 26B ja Mixture of Experts (MoE) -arkkitehtuuri ja tiheä muunnelma 31B parametritJälkimmäinen sijaitsee jo paikassa kolmen parhaan joukossa Arena AI:n avoimien mallien rankingissa, ohittaen vaihtoehdot, jotka kertovat parametrien määrän kahdellakymmenellä, mikä on erityisen tärkeää niille, jotka haluavat vähentää näytönohjaimen kustannuksia laadusta tinkimättä.

Mallin malli 26B Opetusministeriö Se on optimoitu aktivoimaan vain murto-osan parametreistaan ​​(noin 3,8 miljardia) päättelyssä, mikä parantaa tokenien generointinopeutta ja energiatehokkuutta. Sitä vastoin versio 31B tiheä Se on ensisijaisesti valittu vaihtoehto vaativiin hienosäätötehtäviin, monimutkaiseen orkestrointiin ja intensiiviseen käyttöön liike- tai institutionaalisissa ympäristöissä.

Google korostaa, että julkisten vertailuarvojen osalta nämä variantit kilpailevat suoraan muiden toimittajien raskaampien mallien kanssa, mukaan lukien kiinalaisten valmistajien, kuten DeepSeekin tai Qwenin, mallit, jotka ovat viime vuosina vahvistuneet avoimen lähdekoodin ekosysteemissä. Gemma 4:n 31B on listattu Arena AI:n kolmanneksi parhaaksi avoimeksi malliksi, kun taas 26B:n opetusministeriö on myös korkealla sijalla.

Liiketoiminnan näkökulmasta koon ja suorituskyvyn välinen suhde tarkoittaa pienemmät laitteistokulut, pienempi latenssi ja kyky ajaa rajamalleja yhdessä NVIDIA H100 80GB näytönohjainTämä avaa keskisuurille eurooppalaisille yrityksille oven työskennellä edistyneen tekoälyn kanssa investoimatta suhteettoman suuriin infrastruktuurihankkeisiin.

Taskukokoinen tekoäly: mobiili, IoT ja reunalaskenta

Gemma 4 mobiililaitteilla

Pienemmät mallit, E2B ja E4BNe on nimenomaisesti suunniteltu toimimaan verkon reunalla, ts. mobiililaitteet, IoT ja paikallinen laitteistoGoogle huomauttaa, että nämä variantit on optimoitu toimimaan Android-älypuhelimet, Raspberry PiJetson Nano ja muut vähän virtaa kuluttavat järjestelmät, erittäin pienellä viiveellä ja jopa ilman internetyhteyttä.

Tässä segmentissä prioriteetti ei ole pelkkä raaka voima, vaan kyky tarjota multimodaaliset toiminnot ja nopea reagointi resurssirajoitteisissa ympäristöissä. Gemma 4 -reunamallit pystyvät käsittelemään tekstiä, kuvia ja videoita, ja E2B:n ja E4B:n tapauksessa ne lisäävät natiivin tuen kohteelle audio-Tämä mahdollistaa käyttötapauksia, kuten paikalliset ääniavustajat, kenttäkuvien tunnistuksen tai reaaliaikaisen videoanalytiikan ilman, että tietoja tarvitsee lähettää pilveen.

Näiden kevyiden mallien konteksti-ikkuna saavuttaa 128.000-tokenitTämä riittää pitkien dokumenttien, laajojen keskustelujen tai asiaankuuluvien koodinpätkien käsittelyyn yhdessä kehotteessa. Googlen mukaan tämä laajan kontekstin ja paikallisen suorituksen yhdistelmä auttaa poistamaan kitkaa. yksityisyys, yhdistettävyys ja viiveTämä on erittäin tärkeää eurooppalaisissa teollisuus-, terveydenhuolto- tai koulutushankkeissa, joissa tietojenkäsittelyn rajoitukset tiukentuvat.

Laitevalmistajien näkökulmasta Gemma 4 avaa oven integraatiolle Edistynyt tekoäly suoraan kuluttajatuotteisiinÄlypuhelimista ja tableteista lääkinnällisiin laitteisiin ja teollisuusantureihin, yritys on korostanut, että nämä mallit on suunniteltu toimimaan yleisten Android-ekosysteemin tarjoajien, kuten Qualcommin ja MediaTekin, sirujen kanssa, mikä helpottaa niiden laajaa käyttöönottoa.

Lisäksi reunamallien arkkitehtuuri hyödyntää tekniikoita, kuten Tasokohtaiset upotukset (PLE) maksimoida parametrien käytön tehokkuuden, mikä mahdollistaa päättelyn ja kontekstin ymmärtämisen paljon pienemmillä laskentakustannuksilla kuin yleiskäyttöisissä malleissa yleensä.

Multimodaalisuus, agentit ja edistynyt kehittäjätuki

Gemma 4:n multimodaaliset ominaisuudet

Yksi Gemma 4:n vahvuuksista on sen selkeä sitoutuminen agenttityönkulutMallit eivät rajoitu tekstin generointiin: ne integroituvat natiivisti funktiokutsu, strukturoitu JSON-tuloste ja järjestelmäohjeetTämä mahdollistaa autonomisten agenttien rakentamisen, jotka orkestroivat erilaisia ​​vaiheita, kutsuvat ulkoisia API-rajapintoja ja palauttavat tuloksia muodoissa, jotka on helppo integroida yrityssovelluksiin.

Google väittää, että kaikki Gemma 4 -perheen mallit on suunniteltu... korkean tason päättelijätkonfiguroitavilla ajattelutiloilla, joilla voi säätää päättelyn syvyyttä tehtävän mukaan. Tämä johtaa parempiin tuloksiin monivaiheinen päättely, offline-koodin generointi ja monimutkainen ongelmanratkaisu, jotka ovat keskeisiä osa-alueita yritys- ja julkishallinnon ympäristöissä, joissa vaaditaan luotettavuutta.

Multimodaalisella tasolla neljä mallia voivat käsitellä Tekstiä ja kuvia eri resoluutioilla ja kuvasuhteilla, kun taas E2B- ja E4B-variantit laajentavat tätä kapasiteettia video ja ääniTämä yhdistelmä mahdollistaa esimerkiksi järjestelmät, jotka analysoivat dokumentteja grafiikan, teollisuuden valvontavideoiden tai rikkaan koulutussisällön avulla ja tuottavat kontekstuaalisia vastauksia reaaliajassa.

Konteksti-ikkuna saavuttaa 256 000 tokenia suurimmissa malleissaTämä mahdollistaa käyttäjien ladata kokonaisia ​​koodirepositorioita, pitkiä oikeudellisia sopimuksia tai suuria määriä teknistä dokumentaatiota yhdellä kyselyllä. Tuki-, konsultointi- tai IT-tarkastustiimeille tämä helpottaa sellaisten tehtävien automatisointia, jotka aiemmin vaativat tuntikausia manuaalista tarkistusta.

Kielien osalta Gemma 4 tukee natiivisti yli 140 kieltäEuroopalle ja erityisesti Espanjalle tämä tarkoittaa, että voidaan kehittää monikielisiä ratkaisuja, jotka kattavat kaiken EU:n pääkielistä vähemmän edustettuihin kieliin, mikä auttaa saavuttamaan esteettömyys- ja osallisuustavoitteet julkisissa ja yksityisissä palveluissa.

Pilvipalveluiden integrointi, digitaalinen suvereniteetti ja käyttöönotto Euroopassa

Gemma 4:n käyttöönotto ei rajoitu paikalliseen laitteistoon. Google on integroinut nämä mallit pilvitarjontaansa seuraavien kautta: Vertex AI y Google Kubernetes Engine (GKE)jonka avulla organisaatiot voivat konfiguroida dedikoituja laskentaresursseja ja skaalata päättelykuormia tarpeen mukaan. Säännellyillä eurooppalaisilla sektoreilla tämä yhdistetään vaihtoehtoihin, jotka koskevat Suvereeni pilvi ja ilmarakoisia tai paikallisia käyttöönottoja, mukautettuna tietojen säilytysvaatimuksiin ja yleisen tietosuoja-asetuksen (GDPR) noudattamiseen.

Yritys korostaa, että suurempien mallien bfloat16-tarkkuuspainoja voidaan käyttää tehokkaasti a yksi 80 Gt:n NVIDIA H100 -näytönohjainvähentäen keskisuurten yritysten tai julkisten laitosten markkinoille pääsyn kynnystä, jotka haluavat säilyttää infrastruktuurinsa hallinnan. Kvantifioiduissa versioissa mallit voivat toimia myös kuluttajalaitteisto tai työasemat, laajentaen mahdollisten käyttöönottojen valikoimaa.

Teknologiapäälliköille Espanjassa ja muualla Euroopassa tämä yhdistelmä avoin malli, hallittu käyttöönotto ja itsenäinen pilvituki Se mahdollistaa hybridiarkkitehtuurien suunnittelun: osa älykkyydestä voi sijaita paikallisissa datakeskuksissa, kun taas muut, vähemmän arkaluontoiset työkuormat voidaan suorittaa julkisessa pilvessä, samalla säilyttäen yhteisen teknologisen perustan.

Lisäksi Google tarjoaa mm. Agent Development Kit (ADK)Modulaarinen kehys, joka yksinkertaistaa Gemma 4 -pohjaisten agenttien luomista, testaamista ja käyttöönottoa. Se nojaa myös palveluihin, kuten Pilvipalvelu NVIDIA RTX PRO 6000 -näytönohjaimilla (Blackwell) palvelimettomassa tilassa, mikä mahdollistaa tehokkaiden pilottiprojektien käynnistämisen ilman oman laitteiston hankintaa alusta alkaen.

Eurooppalaisessa kontekstissa, jossa tekoälykeskustelu yleensä pyörii valvonnan, läpinäkyvyyden ja auditoitavuuden ympärillä, mahdollisuus Ota käyttöön avoimet mallit Apache 2.0:ssa kontrolloiduissa infrastruktuureissa Se on erityisen houkuttelevaa hallinnoille, pankeille, vakuutusyhtiöille tai terveydenhuoltoalan yrityksille, joiden on sovitettava yhteen innovaatiot tiukkojen sääntelykehysten kanssa.

Apache-lisenssi 2.0, avoin ekosysteemi ja yhteisön vetovoima

Jos jokin seikka on herättänyt yhteisössä erityistä kiinnostusta, se on päätös lisensoida Gemma 4:n Apache 2.0Gemman aiemmissa versioissa käytettiin mukautettuja lisenssejä, jotka herättivät kaupallisten tuotteiden kohdalla oikeudellisia kysymyksiä; nyt käytössä on standardi avoimen lähdekoodin lisenssi, Kehittäjät ja yritykset voivat muokata, jakaa ja ansaita rahaa malleja paljon vähemmällä kitkalla.

Tämä avaus tulee aikana, jolloin Google yrittää takaisin jalansijaa avoimen mallin ekosysteemissäTämä tapahtuu ajanjakson jälkeen, jolloin vaihtoehdot, kuten Metan Llama tai kiinalaiset mallit (DeepSeek, Qwen, GLM, Minimax), olivat kasvattaneet käyttöönottoa. Alan vaikutusvaltaiset tahot, kuten Hugging Facen perustajajäsen, ovat kuvailleet muutosta "valtavaksi virstanpylvääksi" paikalliselle tekoälylle ja korostaneet, että lakitiimeillä on nyt paljon selkeämpi kehys Gemma 4:ään perustuvien projektien hyväksymiselle.

Gemman perhettä ympäröivä ekosysteemi osoitti vahvuutta jo ennen tätä versiota. Google huomauttaa, että aiemmat sukupolvet ylittävät... 400 miljoonaa latausta ja että yhteisö on luonut enemmän kuin 100.000 vaihtoehtoa mukautettu eri kielille ja käyttötapauksiin. Silmiinpistävimpiä esimerkkejä ovat mallit, jotka ovat erikoistuneet bulgarialainen tai syöpätutkimustyökaluja, kuten Cell2Sentence-skaala kehitetty Yalen yliopistossa.

Gemma 4:n myötä yritys toivoo, että "Gemmaverse" laajenee entisestään ja kutsuu... Eurooppalaiset startupit, yliopistot ja tutkimuskeskukset luoda omia johdannaisiaan. Sallivan lisenssin ja avointen painojen yhdistelmä mahdollistaa tiettyihin sektoreihin, kuten terveydenhuoltoon, oikeuslaitokseen, Teollisuus 4.0:aan tai koulutukseen, keskittyvien versioiden kehittämisen, joita voidaan sitten jakaa tai markkinoida ilman liiallisia rajoituksia.

Espanjalaisille yrityksille tämä tilanne tarkoittaa, että Gemma 4:lle on mahdollista rakentaa omia ratkaisuja – kuten sisäisiä avustajia, yritysten hakukoneita tai edistyneitä analytiikkajärjestelmiä – säilyttäen samalla koodin, datan ja infrastruktuurin hallinnan. Tämä sopii hyvin yhteen trendin kanssa vahvistaa Euroopan teknologinen suvereniteetti.

Käyttötapaukset: startup-yrityksistä suuryrityksiin

Gemma 4:lle on esitelty laaja valikoima mahdollisia sovelluksiaLiike-elämässä malleja voidaan käyttää luomaan monikieliset virtuaaliassistentit kykenevä käsittelemään monimutkaisia ​​kyselyitä edistyneen päättelyn avulla tai automatisoimaan koodin luomisen ja tarkistamisen kehitystiimeissä.

Suuremmat mallit on tarkoitettu tehtäviin, kuten agenttien orkestrointi, suurten dokumenttimäärien analysointiTämä sisältää teknisten raporttien luomisen tai laki- ja vaatimustenmukaisuusosastojen avustamisen. Laajojen konteksti-ikkunoiden ja multimodaalisen tuen yhdistelmä helpottaa yhden agentin työskentelyä sopimusten, sähköpostien, kaavioiden, valvontajärjestelmän kuvien ja äänitallenteiden kanssa samassa työnkulussa.

Koulutuksessa ja julkisella sektorilla tekstin, kuvien ja joissakin tapauksissa videon ja äänen käsittelykyky mahdollistaa oppimisen tukialustat jotka tuottavat yhteenvetoja, vaiheittaisia ​​selityksiä tai eri tasoille mukautettuja materiaaleja. Paikallinen toteutus auttaa myös kunnioittamaan yksityisyyden suojaa koskevia vaatimuksia työskenneltäessä alaikäisten tai haavoittuvien ryhmien arkaluonteisten tietojen kanssa.

Startup-maailmassa Gemma 4 voi olla perusta vertikaaliset tuotteet Fintechissä, digitaalisessa terveydenhuollossa, logistiikassa tai B2B SaaS-palveluissa tiimit voivat Apache 2.0:n tarjoaman joustavuuden ansiosta tehdä seuraavaa: hienosäätö mallin osia omasta datastaan, ottaa sen käyttöön paikallisesti tai pilvessä ja markkinoida tulosta ilman tiukkoja omistusoikeudellisia lisenssejä.

Erityisen kiinnostavaa Euroopalle on mahdollisuus kehittää paikalliset tekoälyratkaisut jotka kunnioittavat kansallisia ja yhteisön määräyksiä, esimerkiksi tallentamalla tietoja Euroopan alueella sijaitseviin datakeskuksiin ja pitämällä mallit organisaation suorassa hallinnassa, mikä voi olla avainasemassa tulevaan EU:n tekoälyasetukseen liittyvissä hankkeissa.

Missä ja miten Gemma 4:ään pääsee käsiksi

Google on asettanut Gemma 4 -painot saataville useiden kanavien kautta helpottaakseen niiden käyttöönottoa kehittäjien ja tutkijoiden keskuudessa. Avoimet painot voi ladata osoitteesta Halaaminen kasvot y GitHub, kun taas käyttö rajapinnan ja API-rajapintojen kautta on saatavilla Google AI StudioIntegraatioita tarjotaan myös seuraavien kanssa: OllamaDocker, Kaggle ja työkalut, kuten LM Studio.

Yhtiön mukaan Gemma 4:ää voidaan ajaa paikallisesti «miljardeja Android-laitteita» ja laajaan valikoimaan laitteistoja: alkaen Kannettavien tietokoneiden näytönohjaimet ja työasemista aina erillisiin kehittäjäkiihdyttämöihin asti. Tämä on linjassa strategian kanssa, jolla laajennetaan edistynyttä tekoälyä suurten datakeskusten ulkopuolelle loppukäyttäjien laitteisiin ja reunalaskentaympäristöihin.

Niille, jotka haluavat aloittaa nopeilla testeillä, suorin vaihtoehto on käyttää Google AI Studio 26B- ja 31B-malleille tai Google AI Edge -galleria E2B- ja E4B-varianttien tapauksessa. Samaan aikaan Hugging Facen kaltaisten alustojen kehittäjäyhteisöt julkaisevat jo mukautuksia ja käyttövalmiita kokoonpanoja eri ympäristöihin.

Espanjassa ja muissa Euroopan maissa odotetaan, että paikalliset integraattorit ja hallinnoitujen palvelujen tarjoajat alkavat tarjota Gemma 4:ään perustuvat avaimet käteen -ratkaisut, yhdistäen itsenäiset pilvipalvelujen käyttöönotot, espanjankielisen tuen ja mukautumisen tiettyjen toimialojen, kuten rahoituspalveluiden tai terveydenhuollon, sääntelyyn.

Kaiken kaikkiaan Gemma 4:n julkaisu asettaa Googlen yhdeksi alan merkittävimmistä toimijoista. avoimet ja paikallisesti suoritettavat tekoälymallitTämä tapahtuu aikana, jolloin eurooppalainen teollisuus vaatii työkaluja, jotka yhdistävät korkean suorituskyvyn, datan hallinnan ja selkeät lisensointikehykset pitkäaikaisten kaupallisten tuotteiden rakentamiseksi.

reuna-AI lisää yksityisyyttä
Aiheeseen liittyvä artikkeli:
Edge-tekoäly ja yksityisyys: Tehokas tekoäly ilman datan luovuttamista