Il futuro dell'agentic AI e dei modelli multimodali e tanto altro

giu 16, 2025

Come sempre sono un po’ selettivo sulle news, molte di quelle che non cito lo faccio solo perché sono già molto presenti nei media mainstream (penso a agli annunci durante Vivatech).

Vi lascio la versione podcast automatica(per i più pigri).

AI generativa multimodale

Parto con qualche considerazione sull’AI generativa multimodale, sebbene non richieste.

Lo sviluppo di modelli capaci di gestire immagini, video, testi e documenti in generale è un elemento che è stato molto sottovalutato in questi ultimi mesi, a mio avviso.

Tutti concentrati sulle evoluzioni dei modelli e delle performance degli stessi, ci si è dimenticati di quanto la funzionalità multimodale possa fare la differenza nei modi più disparati.

Un esempio evidente è quanto hanno scritto al MIT, le macchine saranno in grado di riconoscere e risolvere rapidamente problemi di funzionamento, grazie all'agente AI che analizzerà i dati in tempo reale, ma fin qui non ci sarebbe niente di strano. Ma, secondo Mat Honan della MIT Technology Review, non sarà più necessario capire da dove proviene il rumore strano della macchina perché l'agente AI ci assisterà nel risolvere il problema grazie alle capacità multimodali.

Non è quindi un caso che tutte le principali big tech si stiano concentrando sui modelli multimodali per renderli disponibili agli utenti in vario modo, non ultimo Microsoft Copilot Vision. Ma tra le tante funzioni per Windows, può creare tutorial interattivi in un lampo. Infatti, Copilot può vedere cosa c'è sullo schermo e guidare l’utente passo dopo passo nell'uso di un App, evidenziando i pulsanti da premere.

Questa evoluzione rappresenterà un cambio di passo per tante operatività, non solo nella manutenzione preventiva, sarà un cambio culturale molto significativo.

L’AI agentica ci ruberà il lavoro

Ho fatto uno SmartBreak venerdì che ha destato un interesse clamoroso, forse a causa del titolo che, vale la pena dirlo, non è così provocatorio.

Se vi va, lo trovate qui sotto.

Google Cloud e OpenAI e i down che preoccupano

Martedì scorso ero a CX Now Cross Industry, dove, grazie a Reply Triplesense erano stati messi a disposizione dei computer per lavorare con l’AI su alcuni progetti. Le applicazioni utilizzavano l’API di OpenAI e ad un certo punto hanno iniziato a dare risposte a caso, spesso sbagliate. In realtà, OpenAI aveva i servizi fuori uso, ma l’AI comunque forniva delle risposte, o ripetitive o proprio sbagliate.

Giovedì, mentre a Milano si celebrava l’evento annuale della piattaforma cloud di Google, i sistemi sono andanti in tilt in tutto il mondo. In questo caso, risposte dai sistemi zero. Oltre a Google, erano inaccessibili servizi come AWS, Spotify, YouTube e persino strumenti AI come Claude e, di nuovo OpenAI.

Abbiamo un evidente problema di dipendenza da questi servizi e sebbene sia attivi per oltre il 99% e oltre dei casi, quando non funzionano bloccano l’economia di tante imprese e di tanti privati.

Anche di questo tema se ne discute troppo poco, si parla tanto di etica, ma se dipendiamo dalle macchine, anche questo fa parte dell’etica.

Iscriviti alla newsletter

L’apertura di HPE e il cloud industriale di Nvidia

Tra le notizie che mi hanno stupito, certamente c’è il cambio di HPE, che ha annunciato, oltre al nuovo logo, una serie di aperture sulla piattaforma di calcolo per rispondere alle nuove esigenze delle imprese (e dei cloud provider). Nel frattempo, l’Europa ci riprova con il cloud AI industriale per far fronte all’avanzare USA e Cinese. A dare fiato alla cosa ci ha pensato Jensen Huang, CEO di NVIDIA, che dal palco di Parigi ha lanciato la visione di un’Europa non più colonia tecnologica, ma culla autonoma dell’intelligenza artificiale grazie alle regolamentazioni.

Se l’AI su Wikipidia crea imbarazzo

Una notizia che non ho visto emergere con l’enfasi che merita è che Wikipedia ha provato i sommari fatti con l’AI, ma ha ricevuto un numero di critiche enorme e quindi l’esperimento è stato messo via, almeno momentaneamente. In pratica, misura il gradimento delle persone su qualcosa che è stato creato dalle persone rispetto all’AI: poco.

Il mondo digitale va verso l’uso dei riassunti molto generalizzato, ma non è sempre gradito: vogliamo la semplificazione, ma forse siamo all’eccesso (riassunto di un video, di un podcast, di un documento)…

Meta e l’acquisizione da 15 Miliardi di Scale AI

La notizia più dirompente della settimana è senza dubbio quella che riguarda Meta. Secondo fonti confermate, l'azienda di Zuckerberg starebbe per acquisire una quota del 49% di Scale AI per la cifra sbalorditiva di 15 miliardi di dollari.

Perché è così importante? Scale AI non è un'azienda AI qualsiasi. È il fornitore leader di dati di addestramento etichettati, un servizio cruciale utilizzato da quasi tutti i giganti del settore, inclusi OpenAI, Microsoft, Nvidia e la stessa Meta.

Con questa mossa, Meta non solo si assicura una risorsa fondamentale, ma crea un legame simile a quello tra Microsoft e OpenAI. Inoltre, Alexander Wang, CEO di Scale AI, si unirà a Meta per guidare una nuova divisione dedicata alla ricerca della super-intelligenza, portando la competizione con i suoi ex clienti (come Sam Altman di OpenAI) a un nuovo livello.

La domanda che tutti si pongono: cosa succederà ora ai clienti di Scale, che di fatto si troveranno a collaborare con un'azienda strettamente legata a un loro diretto concorrente? Questo potrebbe essere un momento cruciale che ridefinirà gli equilibri dell'intero settore, anche perché Scale, fino ad ora, ha anche altri investitori storici.

Harvard pensa ad un indice sulle tecnologie critiche

Il Critical and Emerging Technology Index di Harvard confronta i progressi di 25 paesi nell' Intelligenza Artificiale (Al), Biotecnologie, Semiconduttori, Spazio e Tecnologie Quantistiche.

In un mondo sempre più plasmato dall'innovazione, le tecnologie critiche ed emergenti sono parte integrante del potere nazionale ossia della loro capacità i raggiungere i propri interessi nazionali.

L'America gode di un solido vantaggio grazie ai suoi successi iniziali, all'anticipo nella costruzione di potenza di calcolo e al predominio di aziende come OpenAl e Nvidia.

L’impatto dell’AI sui bambini

La ricerca sull’AI generativa e i suoi impatti sulla vita dei bambini è ancora ad uno stadio embrionale. Ma la tecnologia è già presente in molti prodotti e piattaforme che i bambini utilizzano regolarmente, dal gioco ai servizi educativi. È necessario considerare le specifiche esigenze e i diritti dei bambini quando si sviluppano nuove tecnologie.

La ricerca del The Alan Turing Institute vuole comprendere gli impatti sulla salute dei bambini, utilizzando lo schema delle esigenze dei bambini online stabilito dal progetto UNICEF "Responsible Innovation in Technology for Children". Sono state condotte indagini con bambini, adulti e insegnanti per valutare le opzioni positive e negative dei generativi AI.

La tecnologia dell'intelligenza artificiale sta cambiando il modo in cui i bambini crescono e imparano. Uno su quattro bambini tra gli 8 e i 12 anni usa già strumenti di intelligenza artificiale senza filtri e guida. Questo può avere sia effetti positivi che negativi: da uno strumento utile per esprimersi per i bambini neurodivergenti, a una nuova forma di esclusione digitale per quelli che non hanno accesso a questi strumenti. Inoltre, molti bambini scelgono di non usare l'AI per motivi ambientali.

I genitori sono ottimisti e sostenitori dell'uso dell'AI, ma anche terrorizzati dalla possibilità di contenuti inappropriati. Gli insegnanti, invece, hanno una visione più positiva e pensano che l'AI possa migliorare la produttività e essere un'opportunità per gli studenti.

Ciò che è fondamentale, tuttavia, è insegnare ai bambini a pensare criticamente e a non dipendere esclusivamente dalle risposte fornite dall'AI. "La vera sfida non è preparare i bambini al mondo dell'AI. È preparare l'AI al mondo dei bambini."

AI e pubblica amministrazione

L'intelligenza artificiale in Italia: un'inchiesta sulla PA che rivela burocrazia, inefficienze digitali e ignoranza dei dati. La maggior parte dei progetti di AI sono ancora impantanati nei comitati e nelle richieste di pareri legali.

Il 60% dei casi è concentrato sui chatbot, una tecnologia già in circolazione da oltre un decennio, definita da alcuni con l'etichetta lucidata di AI generativa.

La qualità della struttura dati è inadeguata, con basi dati interne obsolete, rumorose o incomplete che alimentano algoritmi chiamati a prendere decisioni su welfare, giustizia amministrativa o gestione del personale. La cura etica dei dati è scarsa, con i dati personali che fanno capolino nei dataset senza una visione solida sul fronte della privacy.

Il procurement è ancora basato su meccanismi estesi, come gli Accordi Quadro e le convenzioni Consip, pensati per l'acquisto di stampanti e toner, e non per l'innovazione algoritmica.

La PA italiana non forma le competenze interne, ma le esternalizza, e non sa come misurare un progetto pilota o dichiararlo fallito. Il fallimento è un tabù, e i progetti languono senza essere dichiarati pubblicamente falliti.

La PA italiana non ha ancora sviluppato il metabolismo per digerire l'IA, e i dati pubblici sono spesso sporchi, i modelli opachi e le competenze esogene.

Il grande dibattito sui modelli di ragionamento: l'AI sa davvero "pensare"?

Ok, qui il discorso si fa filosofico, ma è troppo interessante per non parlarne. C'è stato un momento in cui sembrava che i modelli linguistici tradizionali avessero raggiunto un limite. Poi sono arrivati i "modelli di ragionamento" (tipo o1 e ora o4 di OpenAI), capaci di scomporre problemi complessi. Si pensava che bastasse dar loro più potenza di calcolo e avrebbero continuato a migliorare, persino facendo nuove scoperte.

Lo Studio di Apple: i ricercatori di Apple hanno messo alla prova questa teoria con una serie di puzzle. Sui più semplici, i modelli "non di ragionamento" hanno vinto, essendo meno inclini a "strapensare". Sui puzzle di media difficoltà, come previsto, i modelli di ragionamento hanno fatto meglio. Ma la sorpresa è arrivata con i puzzle più difficili: la capacità di "pensare" dei modelli di ragionamento è crollata completamente, arrendendosi prima del solito. Questo suggerisce che, invece di essere fondamentalmente unici, questi modelli funzionano ancora trovando schemi nei dati su cui sono stati addestrati.
La risposta di Epoch AI (e dei matematici): pochi giorni dopo, un altro studio di Epoch AI ha mescolato di nuovo le carte. Durante un incontro segreto a maggio, 30 matematici di alto livello hanno provato a mettere in difficoltà il modello o4-mini di OpenAI, e hanno trovato la cosa molto più difficile del previsto! In un caso, o4-mini è riuscito a risolvere un "problema aperto nella teoria dei numeri — un problema da buon PhD" in circa 10 minuti. Il metodo? Ha studiato problemi simili e ha risolto una versione "giocattolo" semplificata prima di affrontare la questione completa. La loro conclusione è che o4-mini ora risolve circa il 20% delle domande più difficili. Un partecipante l'ha definita una "forte collaboratrice". Insomma, il dibattito è aperto e la cosa va monitorata.

Apple Intelligence: bene ma non benissimo

La conferenza annuale di Apple è stata un po' "sottotono" rispetto alle aspettative di innovazioni dirompenti. Si sono concentrati su miglioramenti pratici: "Apple Intelligence" ora capisce il tuo schermo, permettendoti di fare domande sui risultati di Google Immagini, iOS ha un restyling "trasparente" (che a molti ricorda Windows Vista del 2007!), c'è un AI-powered Workout Buddy per Apple Watch, traduzioni istantanee, e persino Apple Maps che impara i tuoi percorsi preferiti. ChatGPT è stato integrato in Image Playground.

Però, la Siri AI-infused tanto attesa dal 2024 è ancora MIA, e molti critici sono rimasti un po' delusi, visto che i rivali si muovono già su modelli di ragionamento di frontiera. Però, è un passo avanti.

Apple comunque è al lavoro.

Il video AI avanza:

Il settore della generazione video continua a evolversi rapidamente.

Midjourney si prepara al video: Midjourney ha lanciato una "video rating party". Gli utenti abbonati possono votare tra due clip video generate dal nuovo modello, aiutando così a perfezionarlo. Sebbene non sia ancora possibile generare i propri video, questa fase di solito precede di poco il rilascio pubblico.

Meta aggiunge l'editing video AI: ora è possibile modificare i propri video su Meta AI, applicando stili predefiniti come "pelliccia", "strega malvagia" o "anime" per trasformare l'aspetto di persone e ambienti.

Google V3 arriva su Leonardo AI: il modello di generazione video V3 di Google è ora disponibile anche sulla piattaforma Leonardo AI. Questo lo rende accessibile a un costo molto inferiore rispetto al piano Ultra di Google, democratizzando l'accesso a uno dei modelli video più potenti sul mercato.

I creator superano i media tradizionali

I ricavi pubblicitari dei creator hanno superato quelli dei media tradizionali per la prima volta nella storia.

La nuova corsa allo spazio cinese contro SpaceX

Mi è capitato di imbattermi in una notizia che mi ha lasciato a bocca aperta: la startup cinese Space Epoch ha appena lanciato un guanto di sfida a SpaceX! Hanno testato con successo il loro booster riutilizzabile Yanxingzhe-1, facendolo atterrare in modo "soft" nell'oceano. Certo, poi è affondato, ma il test ha dimostrato la capacità del razzo di gestire spinta variabile, spegnimento, riavvio e manovre di hovering. Sono passi cruciali verso il volo spaziale completamente riutilizzabile. Space Epoch punta a raggiungere l'orbita entro fine anno! Ne vedremo delle belle.

Mistral lancia Magistral

L'azienda europea ha rilasciato il suo primo modello di "ragionamento", progettato per risolvere problemi complessi.

Rivoluzioni mediche AI-Powered: sangue universale e giochi anti-dolore

Questa settimana è stata ricca di novità incredibili anche sul fronte medico, roba che sembra fantascienza.

Sangue artificiale per tutti? Scienziati giapponesi hanno avviato sperimentazioni cliniche per un tipo di sangue artificiale compatibile con tutti i gruppi sanguigni! Hanno incapsulato emoglobina da sangue di donatori scaduto in "vescicole di emoglobina" senza marcatori di gruppo sanguigno. Se si diffonderà, potrebbe ridefinire le trasfusioni mondiali e salvare milioni di vite. Un vero e proprio miracolo, non c'è che dire.

Videogame contro il dolore cronico: la nuova arma contro il dolore cronico non è una pillola, ma un videogioco! Alcuni scienziati hanno sviluppato un gioco interattivo che allena le persone a modificare le proprie onde cerebrali per trattare il dolore nervoso. Usando un headset EEG, gli utenti imparano a regolare i pattern anomali delle onde cerebrali. Un approccio senza farmaci che potrebbe cambiare la gestione del dolore a casa. Mi sembra una cosa pazzesca e super innovativa.

Pubblicità AI agli NBA Finals

Tra gli spot presenti negli USA per le finali NBA c’è una pubblicità di Kalshi che ha fatto discutere. Si è scoperto che è stata creata con l'aiuto di ChatGPT e Veo 3! Il filmmaker PJ Ace ha usato Gemini e ChatGPT per trasformare uno script grezzo in una lista dettagliata di scene, ha generato i clip con Google Flow (che usa Veo 3, considerato da molti il modello video più avanzato), e poi ha montato il tutto con software convenzionale. Il costo? Una riduzione del 95% rispetto alle pubblicità tradizionali, e l'ha fatta in 2 giorni.

I robot ad America's Got Talent

Se ancora non credete che i robot stiano diventando mainstream, eccovi la prova! Cinque robot quadrupedi Spot di Boston Dynamics si sono esibiti in una coreografia sincronizzata sulle note di "Don't Stop Me Now" dei Queen sul palco di America's Got Talent. Hanno preso quattro "Sì" dai giudici, il che significa che Spot tornerà per il prossimo turno.

La vignetta

Era da un po’ che non la mettevo nella newsletter, spero che mi perdoni il creatore, mi è stata inviata da un amico, ma riassume molto bene la direzioni che stiamo prendendo nel lavoro supportato dall’AI in ufficio!

Nessuna descrizione alternativa per questa immagine

La puntata del Late Tech Show

'Intelligenza Artificiale non è più il futuro, è il presente che sta ridisegnando ogni aspetto del nostro business. Dalle strategie per le PMI alla voce dei clienti, fino al modo in cui interagiamo sui social media. Nella nuova puntata del mio podcast ho esplorato tre facce di questa rivoluzione con tre ospiti eccezionali, per capire come navigare e sfruttare al meglio questo cambiamento epocale. Abbiamo parlato di:

🚀 AI per le PMI: L'agente che lavora per te Con ⁠Giovanni Farese⁠ di ⁠Webidoo⁠, abbiamo discusso di come l'AI possa dare veri e propri "superpoteri" alle piccole e medie imprese. Non si tratta più solo di chatbot, ma di veri agenti AI proattivi che automatizzano task complessi, liberando tempo prezioso per la strategia. Come dice Giovanni: "Non è l'AI a rubarti il lavoro, ma il tuo competitor che la adotta prima di te".

🗣️ Voice of the Customer: La fiducia nell'era dell'AI ⁠Nicoletta Besio⁠ di ⁠Trustpilot⁠ Italia, ci ha svelato cosa c'è dietro la lotta alle recensioni false. Abbiamo scoperto come Trustpilot utilizzi una combinazione di AI, team specializzati e la community per proteggere l'autenticità del feedback. Un'immersione nel valore inestimabile della "voce del cliente" per migliorare il business e costruire un rapporto di fiducia.

🧠 AI, Social e Futuro: Tra rumore e nuove interazioni Infine, con il giornalista ed esperto di digitale ⁠Lino Garbellini⁠, abbiamo fatto il punto sull'impatto dell'AI sulla comunicazione. Stiamo assistendo a un aumento del "rumore" o a un innalzamento della qualità? Come cambierà il nostro modo di interagire con i device e i social? Una riflessione su come la concentrazione e la capacità di "staccare" diventeranno le nostre risorse più preziose.

Qui in versione video su youtube.

E gli Smartbreak

LASCIAMI UN MESSAGGIO

Fammi sapere cosa ti ha colpito delle cose che faccio o racconto nei vari eventi, o di quello che ascolti al Late Tech Show, piuttosto che negli SmartBreak (e dal podcast "Vita da ufficio") o che leggi nella newsletter Techy.
Ti prego di farmi conoscere cosa pensi possa essere migliorato, aiutami con le critiche, e soprattutto quali temi vorresti che venissero approfonditi o trattati.

fammi sapere cosa ne pensi

Se non vi siete ancora iscritti, fatelo, mi permettete di comprendere che apprezzate il mio lavoro.

Iscritto

Più persone la leggono, meglio è, quindi, per favore, condividilo con la tua famiglia, amici e colleghi per far sì che gli effetti di rete si diffondano.

Assicurati di aggiungere gigibeltrame@substack.com ai tuoi contatti. In Gmail, trascina questa newsletter nella tua scheda principale.

Grazie per aver letto questa newsletter, le trovi tutte a questo link.

💻sito del Late Tech Show

💁‍♂️ La Bio

📚 Scopri i miei libri

Newsletter #Techy

👍 Seguimi su:
Magazine • LinkedIn • Instagram • Facebook • Youtube

Techy di Gigi Beltrame

Discussione su questo Post