Andare oltre DeepSeek (ma metterla nel PC) e l'evoluzione dell'AI a tutti i livelli
Si è discusso tantissimo di DeepSeek questa settimana, sono usciti un sacco di articoli informativi che hanno spaventato il mondo, ma andando ad analizzare bene, DeepSeek non è una startup, anzi, e non ha speso un centesimo rispetto alle AI Made in USA!
Passata la paura, è comunque chiaro che le aziende cinesi stanno facendo sul serio con l’AI ed è appurato che i modelli usano una decima parte dell'energia di quelli statunitensi. Pare che Meta (che ha creato i modelli Llama e il 3.3 è decisamente interessante), si sia così preoccupata da attivare un comitato d’emergenza per comprendere come poter risparmiare sulla costruzione dei modelli e sul loro uso. Non possiamo dimenticare che l’uso massiccio dell’AI generativa ha gravi implicazioni sull'impatto ambientale. I giganti tecnologici stanno affrettandosi a costruire enormi centri di dati per l'AI e i modelli potrebbero essere messi in crisi, tanto che Nvidia ha avuto delle ripercussioni importanti in Borsa. Insomma, il clima è molto fluido e le sorprese non finiscono mai, di settimana in settimana gli annunci si susseguono copiosi.
Qui ascolti la versione podcast automatica di questa newsletter…
Uno studio sui modelli conversazionali
Questa volta parto da un una ricerca dedicata alla aziende che vogliono implementare soluzioni di AI conversazionale nei propri processi. Il lavoro svolto da Memori, Lenovo e Araneum si è concentrato su quattro aspetti fondamentali: identificare pattern di ottimizzazione per massimizzare le performance dei modelli, definire metodologie scalabili per sistemi conversazionali enterprise, elaborare strategie per bilanciare qualità delle risposte ed efficienza computazionale e creare framework decisionali per la scelta dei modelli più adatti alle esigenze aziendali.
Tutto da leggere, ma non è lunghissimo ma è completo.
A mio avviso è un piccolo faro per districarsi nel mondo dei modelli, una delle principali domande che mi vengono rivolte da un anno e mezzo. In fondo, prima c’era solo ChatGPT, ora ci sono API di ogni tipo, anche Open Source.
Il garante della privacy blocca DeepSeek
Il Garante della Privacy e dei Dati Personali italiano ha avviato un'indagine su DeepSeek per violazioni del GDPR, in attesa che l'AI Act prenda forma come regolamento europeo per l'intelligenza artificiale. Sostanzialmente, si tratta di assicurare la trasparenza e l'accountability dei fornitori di tecnologie AI, in particolare per quanto riguarda la raccolta e il trattamento dei dati personali.
Ma DeepSeek la trovate già su tanti server e…
Le aziende che vogliono testare DeepSeek-R1, il modello di ragionamento cinese che ha scosso l'industria tecnologica, possono accedervi dal cloud, per esempio a partire da AWS e da Microsoft, e ovviamente dalla piattaforma online GitHub.
… potete mettere DeepSeek sul vostro PC senza regalare dati a nessuno!
Per utilizzare DeepSeek sul proprio PC, è sufficiente avere un computer di ultima generazione, non necessariamente con scheda grafica veloce. Poi bisogna aprire e installare la shell di Linux. Il comando è:
wsl --install
A questo punto è necessario eseguire i seguenti comandi
curl -fsSL https://loom.ly/4YYNocY | sh
ollama run deepseek-r1
Ma per una versione significativa, oltre ad un computer davvero potente, serve molta quantità di memoria e bisogna lanciare Ollama con:
ollama run deepseek-r1:671b
Per molte aziende potrebbe essere una soluzione sicura per la privacy e molto economica. Ma non so quante aziende abbiamo davvero bisogno di questa potenza e a che prezzo: il cloud è certamente più efficiente.
OpenAI anche questa settimana all’attacco
OpenAI rilascia due versioni della famiglia o3-mini: o3-mini e o3-mini-high. Questi modelli offrono ragionamenti più veloci e efficienti rispetto ai precedenti o1. Gli utenti possono scegliere tra tre livelli di prestazioni: basso, medio e alto, disponibili sia su ChatGPT gratuito sia su ChatGPT a pagamento. Inoltre, gli sviluppatori possono integrare facilmente questi modelli tramite l'API. Alcuni utenti hanno già notato una notifica di aggiornamento in ChatGPT, quindi attenti!
Nel frattempo, Convergence mette a disposizione Operator di OpenAI, solitamente a disposizione per chi paga 200 euro al mese. Non assicuro che funzioni nel momento in cui leggerete, ma ieri e stamattina andava!
La risposta di Google con Gemini 2.0
Google ha lanciato in modo discreto Gemini 2.0 Pro Experimental, il suo ultimo modello di intelligenza artificiale, attraverso un aggiornamento del changelog nell'app del chatbot Gemini. Realizzato per migliorare la fattualità e ottenere prestazioni migliori in codifica e matematica, questo modello è ora disponibile per gli abbonati avanzati di Google sotto il piano AI Premium. Tuttavia, Google avverte che il modello è ancora in fase di anteprima, potrebbe quindi manifestare comportamenti inaspettati e non ha accesso a informazioni in tempo reale (il grounding, giusto per capirci).
Nel frattempo, la versione 2.0 Flash è a disposizione di tutti.
Ma l’Europa non dorme
Il modello Small 3 di Mistral presenta notevoli miglioramenti con i suoi 24B parametri, raggiungendo un'accuratezza del 81% su MMLU (comprensione multilinguistica) con una latenza di 150 tokens al secondo. Si posiziona come sostituto del modello GPT-4o-mini e si confronta direttamente con Llama 3.3 (70B) e Qwen (32B), essendo 3 volte più veloce del primo. Insomma, l’azienda europea si sta dando molto da fare.
Microsoft punta a rafforzare le proprie divisioni AI
Microsoft ha creato una "Unità di pianificazione avanzata" per studiare l'intelligenza artificiale, solamente poche settimane dopo la creazione di una nuova divisione di ingegneria AI. Mustafa Suleyman, capo dell’AI di Microsoft, annuncia assunzioni per il team che esaminerà come l’AI cambierà il nostro mondo. Questo unità di pianificazione opererà nell'ufficio del CEO di Microsoft AI, combinando le ultime ricerche avanzate di Microsoft e oltre, esplorando e esprimendo scenari possibili per il futuro dell'AI, presentando raccomandazioni concrete per i prodotti e suggerendo esiti del piano di base su di essi. Un team davvero strategico.
Trump e Nvidia
Il Presidente Donald Trump e il CEO di Nvidia, Jensen Huang, si sono incontrati alla Casa Bianca per discutere della tecnologia AI e delle restrizioni di esportazione di componenti AI dagli Stati Uniti. Il presidente non ha fornito dettagli della riunione, definendo però Huang un "gentleman". L'incontro è avvenuto a seguito dell'uscita del modello AI cinese DeepSeek, che ha creato allarme per la sua capacità di ottenere risultati alti a costo ridotto.
Waymo porta la guida autonoma a Los Angeles
Waymo sta testando i suoi veicoli autonomi sulle strade di Los Angeles, un passo importante per ridurre i tempi di viaggio nella concorrenza con Uber e altri servizi a conduzione umana. Staremo a vedere i risultati.
Brutte notizie per il BitCoin: El Salvador ci ripensa
El Salvador ha abbandonato il Bitcoin come moneta legale, segnando una svolta importante per l'economia e le criptovalute. Il governo centroamericano aveva adottato il bitcoin nel 2021, sperando di aumentare l’accessibilità del denaro e stimolare lo sviluppo locale. Tuttavia, le ripercussioni economiche erano state significative, e il paese ha deciso di abbandonare l'iniziativa a causa di pesanti perdite finanziarie. Il cambio di rotta sorprende anche di fronte al fatto che poco più di due anni fa, l'allora presidente Bukele era un fervido sostenitore del Bitcoin e la notizia arriva ora che il Bitcoin è ai suoi massimi.
La puntata della settimana del Late Tech Show
Gli argomenti di questa puntata: • Rivoluzione dell'advertising online: analizzeremo l'impatto dei cookie e le nuove strategie di marketing digitale con Marcello Gruppo di Ogury. Scopriremo come le aziende si stanno adattando alla privacy e alla raccolta di dati zero-party per una pubblicità più efficace e meno invasiva. • Infrastrutture IT: Con Benjamin Jolivet di Nutanix, discuteremo del futuro delle infrastrutture IT, tra cloud ibrido, multicloud e l'impatto dell'intelligenza artificiale. Approfondiremo come le aziende possono gestire la complessità e i costi crescenti in questo panorama in rapida evoluzione. • Strumenti per l'ufficio moderno: Andrea Pierani di Logitech ci presenterà le ultime innovazioni per il lavoro ibrido, con particolare attenzione a Logitech Rally Board, una soluzione all-in-one per la videoconferenza e la collaborazione. Parleremo anche di come la tecnologia può migliorare il benessere negli spazi di lavoro.
Versione Youtube, con i capitoli. Sotto la versione Podcast, su Spotify anche video, ma presente sulle principali piattaforme.
SmartBreak
Sono ripartite le live dello SmartBreak alle 11:00, anche se ne sto facendo davvero poche.
I miei libri
LASCIAMI UN MESSAGGIO
Fammi sapere cosa ti ha colpito delle cose che faccio o racconto nei vari eventi, o di quello che ascolti al Late Tech Show, piuttosto che negli SmartBreak (e dal podcast "Vita da ufficio") o che leggi nella newsletter Techy.
Ti prego di farmi conoscere cosa pensi possa essere migliorato, aiutami con le critiche, e soprattutto quali temi vorresti che venissero approfonditi o trattati.
GRAZIE
Se non sei ancora iscritto, fallo, mi permetti di comprendere che apprezzi il mio lavoro.
Iscritto
Più persone la leggono, meglio è, quindi, per favore, condividilo con la tua famiglia, amici e colleghi per far sì che gli effetti di rete si diffondano.
Assicurati di aggiungere gigibeltrame@substack.com ai tuoi contatti. In Gmail, trascina questa newsletter nella tua scheda principale.
Grazie per aver letto questa newsletter, le trovi tutte a questo link.
💁♂️ La Bio
👍 Seguimi su:
Magazine • LinkedIn • Instagram • Facebook • Youtube
Grazie per aver letto Techy di Gigi Beltrame!