Llama 4 e WhatsApp, copyright, video e ...

apr 07, 2025

Anche questa settimana ci sono molte novità legate al digitale, qualcosa di inarrestabile.

In giornata ci saranno gli annunci di Google Next, mi aspetto molto sulla gestione degli agenti, per esempio, ma staremo a vedere.

Vi lascio, nel frattempo, un mio piccolo video celebrativo sui 50 anni di Microsoft.

Parto da una considerazione di partenza, legata proprio agli ultimi giorni e no, non mi riferirò ai dazi!

La versione aggiornata di Llama 4 è stata rilasciata da Meta, la sto provando, è un grande passo in avanti, ma credo che la notizia più interessante non è il nuovo modello, bensì i modelli Open-Weights nati da un lavoro di Post-Training su un modello di grandezza eccezionale, Llama 4 Behemoth, con 2 trilioni di parametri. Quest'ultimo è in grado di prendere in considerazione contesti da 10 milioni di token e richiederebbe tra 4 e 8 TB di VRAM per essere attivato.

Nasceranno quindi nuovi modelli distillati da Llama, che ricordo che è un modello liberamente scaricabile, e potrebbe portare una ventata di cambiamento significativa per tutti quei sistemi che richiedono di venire addestrati su compiti estremamente specifici e da fa “girare” in locale.

Nel frattempo, il mio parere personale sull'assistente di Meta all’interno di Whatsapp è molto negativo. Non per averlo inserito senza la possibilità di disabilitarlo, ma perché utilizza il motore Llama 2, veramente rimasto molto indietro. Ma il passaggio è significativo, perché ormai tutte le applicazioni inseriranno l’AI generativa e Meta ha un vantaggio, non solo perché ha tanti utenti su cui fare i test, ma perché genera modelli. Seguire le vicende di Zuckerberg in questo periodo è un mio suggerimento per capire cosa potrebbe accadere in futuro.

I modelli, comunque, assorbono sempre meno GPU e quindi meno energia, i modelli distillati potrebbero girare comodamente in locale (Ollama sta segnando la strada) e quindi i percorsi potrebbero essere molto diversi tra modelli grandi in data center potenti e modelli leggeri in localo o comunque in server limitati.

Facebook vuole riconquistarci con il tab “Amici”

Facebook ripropone il riconoscimento delle "amicizie" offrendo un nuovo tab, che restituisce l'ordine delle raccomandazioni sul nostro wall. Il tab mostrerà solo le storie, i reel, i post degli amici. In pratica, Facebook cerca di tornare alle sue origini.

Creatività, copywriting e copyright: un futuro confuso

Settimana scorsa parlavo dell’effetto Ghibli, l’eco nel frattempo non si è spenta. Direi che comunque la discussione sullo sfruttamento di contenuti protetti da diritti d'autore debba cambiare passo perché bisogna, inevitabilmente, ripensare il valore della creatività e alla libertà di espressione, che sono gli elementi alla base dell’arte. Capire quali sono i confini del diritto d’autore e dell’arte può essere complesso, ma abbiamo già fatto una parte di quel percorso normativo, non bisogna ricreare la ruota, basta collegare i raggi e spiegare cosa si può fare e cosa no.

In fondo, è quanto è accaduto con il GDPR o quanto sta accadendo con l’AI Act.

Se Photoshop lo sostituisce l’AI…

Una delle domande principali che ricevo riguarda l’uso delle immagini, o video, con l’AI.

L’evoluzione è incredibilmente rapida. Il generatore di immagini di ChatGPT non è rivoluzionario, in fondo c’erano già quelle funzionalità altrove, ma è l’integrazione in un sistema molto utilizzato che ha fatto la differenza. In fondo, Microsoft Copilot permetteva già di fare qualcosa e il sistema era il medesimo, il problema è che oggi genera immagini coerenti e fotorealistiche descrivendone semplicemente l'idea e tramite la funzionalità di modifica interattiva, è possibile cambiare dettagli all'interno di un'immagine esistente, trasformandola in una sorta di "Photoshop conversazionale".

Questa tecnologia apre nuove possibilità nel marketing, nell'istruzione e nel design, consentendo la creazione rapida di contenuti visivi su misura e velocizzando il dialogo tra team creativi.

Il tema quindi del copywriting e del copyright è centrale nella discussione.

Meta mette a punto anche la generazione dei video

Meta investe pesantemente nell’AI, tanto che ha presentato MoCha, un modello di intelligenza artificiale in grado di creare "personaggi parlanti", soggetti che possono muoversi e parlare in modo realistico, completi di espressioni facciali e movimenti delle mani molto realistici.

Ma Runway non si fa spaventare

L'aggiornamento Gen-4 di Runway si concentra sulla generazione di scene complete con un tocco cinematografico, garantendo ambientazioni coerenti, stili corrispondenti e movimenti realistici.

La coerenza di movimenti e personaggi è ormai il piano di battaglia.

Il modello è progettato per essere intuitivo e coerente, richiedendo solo una buona immagine di riferimento e un prompt per generare un video decente.

Uno studio recente ha rilevato che l'utilizzo di intelligenza artificiale potrebbe avere un impatto significativo sui posti di lavoro nell'industria dell'intrattenimento, con potenziali tagli o rimodellamenti di oltre 100.000 ruoli entro il 2026.

E lo spot di KFC

il regista David Blagojevic ha creato uno spot pubblicitario per KFC utilizzando strumenti di intelligenza artificiale come Sora, Kling AI, Veo 2 e persino Suno per la generazione di musica.

Cosa succede a Hollywood (in senso lato)

C’è una grande discussione intorno a questi sviluppi dell’AI per le immagini (ma vale anche per le voci, visto che molti film vengono editati senza ricorrere agli attori). Gli sviluppatori di modelli linguistici e AI generative dipendono da dati “umani” per creare l'illusione di intelligenza artificiale. Molte critiche arrivano per il fatto che queste tecnologie sfruttano questi dati, come evidenziato da una lettera aperta firmata da oltre 400 lavoratori e artisti di Hollywood, che chiedono al governo americano di proteggere il diritto d'autore. La lettera sottolinea che AI aziende stanno chiedendo di indebolire le protezioni copyright per film, serie TV, opere d'arte, musica e testi utilizzati per addestrare i loro modelli, a beneficio delle loro valutazioni miliardarie.

Le aziende AI stanno chiedendo eccezioni di copyright per poter utilizzare liberamente i dati protetti da copyright, senza dover negoziare con gli aventi diritto per ottenere il loro consenso. Questo significa che le aziende AI potrebbero utilizzare i dati creativi di altri senza pagamento o credito, competendo con i creativi stessi.

🍿Ho già preso i popcorn e seguirò la vicenda.

NotebookLM migliora le fonti

NotebookLM offre una nuova funzionalità chiamata "Carica fonti”, che è un po’ sviante rispetto a “Discover sources" in ingleste, consente di trovare e importare fonti rilevanti per i tuoi progetti. In pratica, con una descrizione, trova le fonti pertinenti, ogni una con un riassunto annotato. Queste fonti possono essere utilizzate per integrare le informazioni su cui interrogare il sistema. Un cambio di passo significativo

I podcast con Copilot

Siccome i podcast erano una peculiarità di NotebookLM, Microsoft Copilot ha annunciato, tra le tante novità, che sta ampliando le sue funzionalità. Arriva la possibilità di creare podcast personalizzati generati da AI su richiesta.

A promotional image showing personalized podcasts made possible with the help of the new Microsoft Copilot AI

OpenAI ha superato il test di Turing

Lo sapevamo già, era già accaduto, ma ogni volta che leggo la notizia ho un sussulto.

Gli LLM hanno superato il test di Turing in modo ufficiale, con il 75% di risposte riconosciute come umane da ricercatori della UC San Diego. Il modello GPT-4.5 è stato scambiato per un umano più di tre quarti delle volte. Intanto, OpenAI chiude un round di finanziamenti da 40 miliardi di dollari con SoftBank, portando la sua valutazione a 300 miliardi di dollari.

Ma non è tutto oro: gli LLM sbagliano alla grande!

Un recente studio mette in discussione la capacità degli LLM di ragionare in modo superiore. Nei social media è esploso il dibattito dopo che i ricercatori hanno testato l'abilità degli LLM avanzati nella risoluzione dell'US Math Olympiad, ottenendo più del 95% di risposte sbagliate.

Avete letto bene: 95%!

Nel 2030 l’intelligenza artificiale generale

DeepMind considera possibile l'arrivo di un'intelligenza artificiale generale (AGI) entro il 2030. L'azienda ha pubblicato un piano 145-pagine per la sicurezza dell'AGI, che prevede tre linee di azione principali: limitare l'accesso a chi è pericoloso, migliorare la trasparenza e "inibire" l'ambiente operativo per prevenire guasti. Tuttavia, il piano ammette che le attuali metodologie sono ancora incomplete e full di buchi.

Intanto Genspark lancia il suo super agente

Genspark ha lanciato un agente generico che può gestire compiti multi-step, come creare un itinerario di viaggio, trovare ristoranti vicini e effettuare prenotazioni con un semplice comando.

La farmacia sarà sempre più personalizzata

Isomorphic Labs, nota per l'AI AlphaFold che prevede la forma di proteine, DNA e RNA, ha ricevuto 600 milioni di dollari per sviluppare un modello di farmaci AI. Verrà utilizzato dai giganti farmaceutici per creare nuovi trattamenti, con l'obbiettivo di risolvere le malattie grazie all'uso dell'intelligenza artificiale.

Google ha rilasciato TxGemma, una famiglia di modelli open-source (basati su Gemma) specificamente addestrati per accelerare lo sviluppo terapeutico (farmaceutico), dall'identificazione di target alla previsione dei trial clinici.

Quake II con l’AI e Copilot

Microsoft ha presentato la sua Xbox Alfa, insieme al nuovo modello Muse AI che può generare azioni di gioco. Sebbene Muse sembrasse ancora un progetto di Microsoft Research in lavorazione, l'azienda ora consente agli utenti di Copilot di provare Muse tramite una versione AI generata di Quake II.

I robotaxi che volano sono realtà in Cina

Due aziende cinesi hanno ottenuto l'approvazione regolamentare per lanciare a pieno regime autovetture volanti per passeggeri nel cielo. Inizieranno con rotte turistiche a breve distanza prima di espandersi nelle reti urbane più ampie. Queste auto-eolico possono raggiungere i 130 km/h. Appartengono all'economia low-altitude cinese, da 207 miliardi di dollari entro la fine dell'anno.

Mentre Waymo prevede di lanciare il suo servizio di robotaxi a Washington D.C. nel 2026 (dovendo prima affrontare ostacoli legali sui veicoli senza conducente).

Lyft lancerà i suoi robotaxi ad Atlanta già quest'estate (2025).

Vi lascio un grafico sull’uso dell’AI

Nessuna descrizione alternativa per questa immagine

Questa settimana al Late Tech Show

Questa settimana abbiamo esplorato l'intelligenza artificiale a 360 gradi, con ospiti e argomenti super interessanti! Abbiamo parlato di:

- L'attesissimo evento AI Week (EIC) di Milano del 13 e 14 maggio, con Pasquale Viscanti, che ci ha raccontato cosa aspettarci da questo appuntamento imperdibile sull'intelligenza artificiale in Italia e in Europa. Saranno due giorni ricchi di contenuti, speaker internazionali, opportunità di business e la possibilità di toccare con mano l'IA. -

- AI applicata al retail con Enzo Tumminaro di Zebra Technologies, scoprendo come l'IA sta trasformando l'esperienza d'acquisto e ottimizzando le operazioni nei negozi.

- L'intelligenza artificiale applicata alle aziende e alla sua governance, con Andrea Cappelletti di Galene AI, approfondendo temi cruciali come la sicurezza, la privacy e la gestione degli agenti AI. Abbiamo anche scoperto la loro piattaforma Generative Shield per la governance dell'AI.

- Un'applicazione innovativa pensata per gli sportivi non professionisti che mette in contatto atleti e brand, con Andrea Croce di IdolMatch. Un'idea davvero interessante per supportare il mondo dello sport a tutti i livelli!.

Qui in versione Youtube con i video.

In ogni piattaforma Podcast, a partire da Spotify anche in video.

Gli SmartBreak e Vita da Ufficio

Gli appuntamenti live alle 11:00 sui miei profili social e quelli di alcune associazioni sono ripresi, ma vanno un po’ a rilento. Qui il podcast che parte spunto proprio dalle dirette.

I miei libri

LASCIAMI UN MESSAGGIO

Fammi sapere cosa ti ha colpito delle cose che faccio o racconto nei vari eventi, o di quello che ascolti al Late Tech Show, piuttosto che negli SmartBreak (e dal podcast "Vita da ufficio") o che leggi nella newsletter Techy.
Ti prego di farmi conoscere cosa pensi possa essere migliorato, aiutami con le critiche, e soprattutto quali temi vorresti che venissero approfonditi o trattati.
GRAZIE

fammi sapere cosa ne pensi

Se non sei ancora iscritto, fallo, mi permetti di comprendere che apprezzi il mio lavoro.

Iscritto

Più persone la leggono, meglio è, quindi, per favore, condividilo con la tua famiglia, amici e colleghi per far sì che gli effetti di rete si diffondano.

Assicurati di aggiungere gigibeltrame@substack.com ai tuoi contatti. In Gmail, trascina questa newsletter nella tua scheda principale.

Grazie per aver letto questa newsletter, le trovi tutte a questo link.

💻sito del Late Tech Show

💁‍♂️ La Bio

📚 Scopri i miei libri

Newsletter #Techy

👍 Seguimi su:
Magazine • LinkedIn • Instagram • Facebook • Youtube

Grazie per aver letto Techy di Gigi Beltrame!

Techy di Gigi Beltrame