Crescono le App AI, ma gli agenti diventano più "aggressivi"

mag 05, 2025

Devo essere onesto: inizio a stancarmi di questi "miglioramenti marginali" nei modelli linguistici. Ormai fanno un sacco di cose che mi servono, e vedere che un nuovo modello è "leggermente meglio a programmare" o "leggermente meglio in matematica" non mi “emoziona” più come prima.

Probabilmente ne parlerò sempre meno, a meno che non ci siano passi avanti davvero grandi. Ci sono altre newsletter o altri creator che sanno esser molto più specifici se volete i dettagli tecnici su ogni singolo modello che esce.

Qui la versione #podcast automatica della newsletter.

L’App di AI che farà tutto

Altman e Musk si contendono la creazione di una super app "per fare tutto" che raggruppi le varie App, dal browser ai social media, gaming e altro. La corsa ovviamente occupa tantissimi player. Una moda o una tendenza?

Meta: Llamacon, App AI e Occhiali che ascoltano (e forse spiato?)

Meta ha fatto un evento dedicato all'AI, il primo Llamacon! Solitamente parlavano di tutto al Meta Connect, ma ora l'AI si merita un palco a parte.

La novità più grossa? L'app Meta AI, che oltretutto ha rimpiazzato anche la vecchia Meta View per chi ha gli occhiali Ray-Ban Meta.

Adesso l'app è quindi uno standalone, tipo ChatGPT o Claude, dove puoi chattare direttamente con Llama. Ho provato a chiedere che modello usa e mi ha detto Llama 4 per la voce. Il modello è buono, è disponibile per essere distillato, ma questa versione, diciamolo, non è ancora molto precisa.

La cosa interessante di questa app è che vuole essere "social". C'è un pulsante di condivisione che ti permette di postare le tue chat su un feed, un po' come su Instagram o Facebook, dove altri possono commentare e mettere like. Utile se cerchi ispirazione per i prompt. Genera anche immagini con il modello Emu di Meta. Ho provato a generare cose semplici e piuttosto standard e il risultato non è stato affatto male.

Ovviamente per chi vive negli USA, e i Ray-Ban c’è la continuità delle conversazioni: inizi a parlare con l'AI dagli occhiali, ti togli gli occhiali e continui la chat sull'app o sul web. Comodo.

Ma veniamo alle note dolenti (o almeno, che fanno discutere): Meta ha aggiornato la privacy policy per gli occhiali. L'uso della fotocamera con Meta AI è sempre attivo a meno che non lo disattivi tu (strano, di solito è il contrario!). Le foto e i video che fai non vengono usati per addestrare Meta (meno male!). Ma, e qui c’è la magagna, non puoi più disattivare la memorizzazione delle registrazioni vocali nel cloud. Puoi cancellarle dopo, ma rimangono lì fino a un anno per "migliorare i prodotti Meta". Quindi sì, le tue conversazioni vocali serviranno ad addestrare i loro modelli.

E non è finita: l'app Meta AI avrà le pubblicità. Mark Zuckerberg ne ha parlato durante la call con gli analisti del primo trimestre 2025. Per ora è gratis, ma in futuro sarà supportata dalla pubblicità. Non è chiaro se saranno i classici banner o se l'AI stessa farà raccomandazioni sponsorizzate nelle risposte (tipo: "Cerchi una macchina da caffè? Ti consiglio questa!"). Vedremo. L'obiettivo per ora è far crescere l'utenza, le ads verranno dopo (tra circa un anno, pare).

Google: ricerca AI per tutti (negli USA)

Anche Google si muove parecchio. Hanno reso disponibile la "AI Mode" nella Ricerca per tutti gli utenti Labs negli USA. È un po' la risposta a Perplexity e alle funzioni Search di ChatGPT. Mostra riassunti AI, link e info per l'acquisto direttamente nei risultati. A breve arriverà anche per una piccola percentuale di utenti fuori da Labs, sempre negli USA. Se sei in Italia, per ora, ciccia.

L'app Gemini su Android ora ti permette di caricare e modificare immagini direttamente al suo interno. Potevi già farlo da AI Studio, ma averlo sull'app è molto più comodo. Tipo: chiedi a Gemini di aggiungere occhiali da sole o un cappello a una foto e lui lo fa.

NotebookLM parla italiano

OK, per gli iscritti ai miei podcast non è una novità, “hackeravo” l’algoritmo, ma ora NotebookLM, che giusto per ricordarvelo, io adoro, adesso può generare gli "audio overview" (i mini-podcast dei tuoi documenti) in oltre 50 lingue!

(video di Gianluigi Bonanomi).

Little Language Lessons

E a proposito di lingue, Google ha lanciato una piccola app sperimentale chiamata "Little Language Lessons". Pensata per chi non parla una lingua ma deve cavarsela in viaggio. Ha tre funzioni: "Tiny Lesson" per vocabolario e frasi base (utile per andare al ristorante in Giappone, come nell'esempio), "Slang Hang" per espressioni e slang, e "Word Cam" per puntare la fotocamera su qualcosa e imparare come si dice. Un'idea carina e pratica.

OpenAI: GPT-4o un po' "ruffiano" e shopping migliorato

Questa settimana OpenAI ha fatto un passo indietro con GPT-4o. Pare che Sam Altman non fosse contento dell'ultima versione perché era diventata "troppo ruffiana" (psychopanty, dice lui), esagerando con i complimenti invece di rispondere. Quindi hanno semplicemente rimosso l'aggiornamento e siamo tornati alla versione di un paio di settimane fa. Stanno rivedendo come raccolgono i feedback per evitare che succeda di nuovo.

Ci sono stati anche piccoli aggiornamenti: miglioramenti nella funzione di ricerca di ChatGPT e un'esperienza di shopping più efficace. Puoi chiedere tipo "miglior macchina da caffè sotto i 200€ che si avvicina al sapore italiano" e ti mostra un carosello di prodotti, un po' come Google Shopping. Dicono che i risultati non sono legati alla pubblicità ma scelti in modo indipendente. Interessante il contrasto con Meta, eh?

Hanno anche aggiunto la funzione di ricerca web su ChatGPT in WhatsApp. E ci sono miglioramenti nelle citazioni e l'aggiunta di "trending" e autocompletamento nella chat. Insomma, ritocchi che rendono l'uso quotidiano un po' più fluido.

xAI/Grok: arriva il 3.5? Forse in settimana (se Musk non cambia idea)

Elon Musk ha detto che Grok 3.5 (ma anche Grok 3.5 Mini) arriverà "questa settimana" per gli abbonati Super Grok (il piano più costoso, con prezzi un po' strani tipo 57$ al mese). Grok 3.5 Mini è la versione "leggera" ed economica, confrontabile con i migliori modelli di ragionamento ma fino a 20 volte meno costosa. Ottima notizia per gli sviluppatori.

Musk sostiene che sarà la prima AI in grado di rispondere accuratamente a domande tecniche su motori a razzo o elettrochimica, ragionando "dai principi di base" e trovando risposte che non esistono su internet. Dichiarazioni forti! Tenendo conto che Elon tende a essere un po' ottimista con le tempistiche, potrebbe arrivare in settimana, ma anche più avanti a maggio. Staremo a vedere.

Altri modelli: Claude Integrations, e Qwen 3

Anthropic ha annunciato le "integrations" per Claude. Usano gli MCPs (Model Context Protocols) che permettono ai modelli di comunicare più facilmente con altre app. Per ora, queste integrazioni sono disponibili solo per i piani Max, Team ed Enterprise (quelli costosi), non per il piano da 20$/mese.

Alibaba ha svelato Qwen 3, un modello definito "ibrido" nel ragionamento. In pratica, puoi decidere se farlo "pensare" (mostrando il suo processo logico) o dare una risposta più veloce ma potenzialmente meno precisa. Dai benchmark sembra molto promette.

Gli agenti di Microsoft stanno facendo sul serio

Lo sviluppo dei Copilot per Microsoft è diventato un elemento differenziate, ne ho parlato anche con Floriano Masoero di Siemens nella puntata del Late (e cover story di Business Community).

Gli agenti di intelligenza artificiale stanno rivoluzionando il modo in cui le industrie operano, consentendo alle squadre di prendere decisioni più rapide e informate e ottenere risultati Migliorini. Un altro esempio di questo è PromoGenius di T-Mobile, sviluppato con Microsoft Power Apps e Copilot Studio, che fornisce ai team di prima linea accesso in tempo reale alle informazioni più aggiornate. Un agente integrato visualizza automaticamente dettagli e genera viste pronte per i clienti, evitando lunghe ricerche manuali.

Agenti AI: VY che usa il PC (in lista d'attesa)

Una novità interessante nel mondo degli agenti AI è Vy di Vercept. L'idea è un'AI che "vede" e usa il tuo computer come fai tu, interagendo con app e account a cui sei già loggato. Puoi scaricarlo, ma per ora finisci in una lista d'attesa. Io l'ho scaricato e sto aspettando.

AI Creativa: stili infiniti, polaroid animate e …

La creatività AI continua a fare passi da gigante, e questo mi entusiasma molto di più!

Recraft ha lanciato una enorme libreria di stili. Praticamente uno scroll infinito di stili per le tue immagini. Puoi applicarli e persino salvare i tuoi preferiti. Ma la vera novità è che puoi creare nuovi stili miscelando quelli esistenti. Ho provato a mescolare un po' di stili "retro pop" e il risultato era... particolare! È pazzesco per trovare uno stile unico o mantenere la consistenza di un brand.

Kling AI ha tirato fuori l'effetto "Instant Film". Carichi una foto, e lui la trasforma in una specie di immagine stile Polaroid che poi si anima leggermente. Funziona anche con più persone o animali. Ho provato con una mia foto, ci ha messo 5 minuti (tempo stimato) e l'animazione è sottile ma carina.

Higgsfield ha lanciato "Iconic Scenes". Carichi un selfie e ti metti dentro scene di film famosi. Divertente, ma armatevi di pazienza se usate il piano free.

Krea, che esce con novità ogni settimana, ha rilasciato "GPT Paint". Un modo per guidare l'AI visivamente. Puoi caricare un'immagine (tipo un gattino) e poi usare segni, forme, note scritte a mano o altre immagini per indicare cosa vuoi modificare o aggiungere e dove. Simile a quello che si faceva un po' con le prime versioni di GPT-4o disegnando con il prompt.

Amazon fa sul serio con i modelli AI

Il modello Amazon Nova Premier è un potente sistema multimodale che supporta testo, immagini e video. È progettato per compiti complessi come la comprensione documentale e le interazioni agentiche multi-turno. Performa benissimo nei benchmark, avvicinandosi o superando GPT-4.5 e Claude 3.7 in diverse aree chiave. È inoltre molto veloce, con un tempo di 0,9 secondi per il primo token e una generazione di 63 token al secondo. È costruito con criteri di Responsabile AI e validato tramite red teaming multilivello.

Il computer quantistico di Fujitsu

Fujitsu e RIKEN hanno annunciato la creazione di un computer quantistico da 256 qubit, un sistema che quadruplica la potenza di calcolo rispetto al precedente modello. Questo incremento di capacità apre nuove frontiere per la ricerca e consente di affrontare problemi di complessità decisamente maggiore, come la simulazione di molecole più grandi e la sperimentazione di algoritmi avanzati. Il potente computer sarà integrato nella piattaforma di calcolo quantistico ibrida di Fujitsu e Riken e messo a disposizione di aziende e istituti di ricerca a livello globale a partire dal prossimo anno fiscale giapponese.

La robotica e l’AI di UPS

UPS sfrutta l'intelligenza artificiale per ottimizzare le operazioni, inclusa la pianificazione dei percorsi (ORION), la manutenzione e il servizio clienti. La notizia principale riguarda le discussioni avanzate tra UPS e Figure AI per l'integrazione di robot umanoidi. L'obiettivo è implementare i robot di Figure AI nella logistica per aumentare l'efficienza, ridurre i costi e gestire la carenza di personale. Questi robot, come il modello Figure 02, sono progettati per svolgere compiti fisici ripetitivi in ambienti creati per gli umani, come il sollevamento e lo smistamento di pacchi. Questa potenziale collaborazione rappresenta un passo strategico per UPS nell'adozione di robotica avanzata.

La puntata di questa settimana del Late Tech Show

In questa puntata del #LateTechShow:

➡️ Come l'Industria sta superando la 4.0 per entrare in una nuova dimensione (Industria 5.0 e oltre!), esplorando l'AI applicata, gli Industrial Copilot, il Digital Twin e la Software Defined Automation. Con Floriano Masoero di Siemens Italia.

➡️ Le sfide attuali della Trasformazione Digitale, l'accelerazione imposta dall'AI (anche generativa) e l'importanza fondamentale della governance e dei Digital Workers. Con Fabio Spoletini di ServiceNow.

➡️ L'evoluzione del Retail da Omnichannel a #Multiretail: come gestire la complessità tra canali, marketplace e dati, sfruttando l'AI per il vantaggio competitivo, con Angelo Ferrera di Witailer - Gruppo Retex

Gli SmartBreak

Ecco l’ultimo appuntamento Live.

I miei libri

LASCIAMI UN MESSAGGIO

Fammi sapere cosa ti ha colpito delle cose che faccio o racconto nei vari eventi, o di quello che ascolti al Late Tech Show, piuttosto che negli SmartBreak (e dal podcast "Vita da ufficio") o che leggi nella newsletter Techy.
Ti prego di farmi conoscere cosa pensi possa essere migliorato, aiutami con le critiche, e soprattutto quali temi vorresti che venissero approfonditi o trattati.
GRAZIE

fammi sapere cosa ne pensi

Se non vi siete ancora iscritti, fatelo, mi permettete di comprendere che apprezzate il mio lavoro.

Iscritto

Più persone la leggono, meglio è, quindi, per favore, condividilo con la tua famiglia, amici e colleghi per far sì che gli effetti di rete si diffondano.

Assicurati di aggiungere gigibeltrame@substack.com ai tuoi contatti. In Gmail, trascina questa newsletter nella tua scheda principale.

Grazie per aver letto questa newsletter, le trovi tutte a questo link.

💻sito del Late Tech Show

💁‍♂️ La Bio

📚 Scopri i miei libri

Newsletter #Techy

👍 Seguimi su:
Magazine • LinkedIn • Instagram • Facebook • Youtube

Grazie per aver letto Techy di Gigi Beltrame!

Techy di Gigi Beltrame