Google Gemini: il modello di AI multimodale

Disponibile su Bard in tre diverse versioni

La prima settimana di dicembre Google ha ufficialmente annunciato Gemini, il suo modello di AI multimodale più avanzato. Scopriamolo insieme.

Gemini Pro su Bard

Il modello di intelligenza artificiale multimodale Gemini è disponibile integrato su Bard, il chatbot generativo di casa Google.

Google Gemini

Tuttavia, al momento il modello non è ancora disponibile per gli utenti in Europa, ma solo per quelli americani. È possibile, comunque, provarlo avvalendosi di un buon VPN.

Inoltre, il modello è integrato anche sui modelli di smartphone Pixel 8 Pro. Si tratta di una versione base in grado di fornire risposte suggerite dall’intelligenza artificiale su WhatsApp. La versione disponibile su smartphone è Gemini Nano.

Infine, sempre al momento, Gemini è disponibile solo in lingua inglese. Tuttavia, così come per tutti gli aggiornamenti precedenti del chatbot, bisognerà solo attenderà affinché Google introduce altre lingue e altre parti del mondo.

Gemini Pro è gratuito

C’è anche da sottolineare il fatto che Gemini Pro è gratuito per tutti. Non bisogna farsi ingannare, infatti, dal nome, che riporta la dicitura Pro.

Quel Pro sta solo a indicare che si tratta di un modello di intelligenza artificiale avanzato e non che è a pagamento.

Anche perché, come abbiamo detto, la versione attualmente disponibile è solamente quella base, che non integra ancora tutte le funzioni che Google ha annunciato.

Una versione ulteriormente migliorata, infatti, dovrebbe arrivare già nel corso del prossimo anno (2024) e dovrebbe prendere il nome di Gemini Ultra. Questa versione migliorata di Gemini dovrebbe essere integrata nel chatbot anch’esso aggiornato. Quest’ultimo potrebbe prendere il nome di Bard Advanced.

Un modello di AI multimodale

Google ha presentato Gemini come un modello di AI multimodale, ma cosa significa? Vuol dire che il modello di intelligenza artificiale sarà in grado di elaborare diverse tipologie di input, come testo, immagini, suoni e video. E da questi produrre diverse tipologie di output.

Google Gemini

Al momento, il chatbot di Big G, Bard, non è in grado di elaborare diverse tipologie di input e output, ma è basato solamente sul testo.

Gemini Ultra, Pro e Nano

Abbiamo parlato di Gemini Pro e abbiamo menzionato Gemini Ultra e Nano.

Google, infatti, ha annunciato tre diverse versioni di Gemini: Ultra, Pro e Nano. La versione Pro è quella che sta nel mezzo tra le altre due e quella che punta a raggiungere la quantità di pubblico maggiore.

La differenza tra le tre versioni sta nella dimensione del modello di apprendimento. Gemini Nano è il più piccolo, con appena 10 miliardi di parametri. Di seguito c’è Pro, con 100 miliardi di parametri, e, infine, Ultra, il più grande, con 1,6 trilioni di parametri.

Versione Pro: caratteristiche

La versione di Gemini Pro, che sembra essere quella che vuole arrivare a una maggiore fetta di mercato, è accessibile a sviluppatori e imprese.

Le caratteristiche principali di questa versione sono una finestra da 32 k per il testo, che verrà ulteriormente espansa nel prossimo futuro, e il fatto che sia molto più semplice da utilizzare rispetto ad altri competitor.

L’AI può chiamare a funzione esterne e supporterà 38 lingue, oltre ad avere un ambiente di sviluppo interfacciabile con i principali IDE.

Google ha reso disponibili SDK per diversi linguaggi di programmazione, come Python, Kotlin, Node.sj, Swift e JavaScript, per facilitare la creazione di applicazioni e per renderle versatili e adattabili.

Per la realizzazione di applicazioni e progetti basati su Gemini si può utilizzare Google AI Studio, pensato per creare prompt e per ottenere chiavi API. È perfetto per creare applicazioni basate sull’AI e sperimentarle.

Per progetti più avanzati, invece, è possibile utilizzare Vertex AI, disponibile sul Cloud di Google, che ci da la possibilità di personalizzare al massimo le funzioni di Gemini.

bardchatbotgoogleintelligenza artificialemultimodale