Il search nell'AI, la voce e il lavoro che cambia
Negli ultimi tempi, l’intelligenza artificiale (AI) ha fatto passi da gigante, portando innovazioni significative nel campo dei motori di ricerca e delle applicazioni AI. In questa puntata p esploreremo le ultime novità da OpenAI, Anthropic, Google e Meta, ma anche Microsoft, HuggingFace e altri, analizzando le nuove funzionalità e le implicazioni per il settore.
Novità da OpenAI: searchGPT
OpenAI ha recentemente lanciato una nuova funzionalità di ricerca all’interno di ChatGPT, simile a quella di Perplexity. Gli utenti possono ora cercare informazioni direttamente nel loro account ChatGPT, ricevendo risultati pertinenti a domande specifiche.
Un’altra novità è la possibilità di cercare nella cronologia delle chat. Questa funzionalità migliora l’esperienza utente, consentendo di accedere rapidamente a discussioni passate su argomenti di interesse.
Ma Google ha risposto subito!
Grounding con Google Search è ora disponibile in Google AI Studio e nell'API Gemini, consentendo agli sviluppatori di ottenere risposte più accurate e aggiornate grazie ai modelli Gemini supportati da Google Search. Il modello restituisce fonti di supporto (links in linea) e suggerimenti di ricerca che puntano gli utenti verso i risultati di ricerca corrispondenti alle risposte.
OpenaAI e il lancio dell’App per Windows
Dopo il rilascio su Mac, OpenAI ha reso disponibile ChatGPT anche per Windows, introducendo una modalità vocale avanzata che consente agli utenti di interagire con il sistema tramite comandi vocali.
Gli aggiornamenti da Anthropic
Anthropic ha lanciato una funzione di dettatura vocale nell’app mobile, colmando un’importante lacuna rispetto a ChatGPT. Ora gli utenti possono porre domande a Claude utilizzando la voce.
Ma non solo.
Claude e il modello Gemini di Google sono ora disponibili in GitHub Copilot, prodotto che ricordiamo appartenere a Microsoft, ampliando le opzioni per gli sviluppatori e segnando una nuova era di competizione tra modelli AI.
E quelli di Google
La più interessante, tra le tante, è l’integrazione di Gemini in Maps, Waze e Earth, potendo così dialogare in maniera più semplice con le applicazioni.
In pratica, un passaggio quasi scontato dell’integrazione, come è avvenuto per le varie App di Workspace.
Sundar Pichai ha rivelato che oltre il 25% del nuovo codice di Google è generato dall’AI, sottolineando l’importanza dell’AI nel processo di sviluppo software, cosa per cui sono stato criticato parecchio in questi ultimi mesi quando racconto che molte aziende di sviluppo verranno investite da questo cambiamento.
L’AI capitalizza 9 triliardi di dollari
Il mercato dell'intelligenza artificiale si avvicina a valori di 9 triliardi di dollari, con Nvidia e OpenAI tra i principali attori. Il rapporto annuale di State of AI identifica alcune tendenze future dell'intelligenza artificiale, partendo dall'analisi della situazione attuale.
Quest'anno il rapporto si concentra sullo sviluppo della ricerca, sull'applicazione commerciale dell'AI e sulle sue implicazioni politiche. È stato inserito un nuovo capitolo dedicato alla sicurezza: prevenire i rischi catastrofici che futuri sistemi d'AI potrebbero generare.
Le principali novità includono la convergenza delle prestazioni dei laboratori di ricerca e l'emergere di nuove strategie per migliorare i modelli. Negli Stati Uniti, la creazione di modelli di AI in modo indipendente dalla censura e sfuggendo alle sanzioni. Il valore di mercato delle aziende a base del settore è salito a 9 trilioni di dollari, con alcune aziende che cominciano a generare ricavi significativi grazie a modelli di IA e tecnologie di generazione audio e video.
Tra le tante previsioni c'è la possibilità che un'app creata senza codice diventi virale, mentre i laboratori di frontiera cambieranno le pratiche di raccolta dati, ma si pensa che alternative open-source supereranno OpenAI. Apple accelererà la sua ricerca in materia di AI sul dispositivo in maniera significativa.
Direi che molti trend sono frutto di discussioni con le aziende, non vi pare?
Predisporre la tecnologia del futuro per l’Europa
E' stata condotta un'indagine in tre anni sull'innovazione nella tecnologia profonda dell'Unione Europea, con l'aiuto della Commissione europea e di entità privatizzate, iniziata con una collaborazione tra i punti di vista del Joint Joint Research Centre e del European Innovation Council.
La "visione del futuro" consiste nel pensarlo, discuterne e predisporvisi, non nel prevedere cosa accadrà, bensì nell'esplorare diverse possibilità e scenari su ciò che potrebbe accadere. Sempre nell'ambito di questa indagine si sono identificati vari metodi per la previsione dei procedimenti innovativi per tecnologie di avanguardia, tra cui lo sfruttamento di segnali e tendenze provenienti da rapporti internazionali, think tank e così via.
Una ricerca di Microsoft per raccontare come stiamo lavorando (con l’AI)
L'AI sta rivoluzionando il modo in cui lavoriamo, e Microsoft è all'avanguardia di questa trasformazione e in questa pagina troverete una serie di spunti che reputo interessanti.
Grazie all'utilizzo di strumenti come Copilot, l'azienda sta aumentando la produttività nei vari reparti, includendo un'emergenza più rapida in customer service e maggiori entrate nei venditori. L'AI serve a rinnovare i processi aziendali, automatizzando attività quotidiane e fornendo degli insiti per prendere decisioni informate.
Generatore di Podcast di Meta
Meta ha rilasciato una versione open source del generatore di podcast, ispirato a Notebook LM. Questo strumento consente agli utenti di creare conversazioni simulate tra host virtuali.
E per la robotica…
Meta AI ha fatto un annuncio davvero interessante! Hanno deciso di condividere con tutti alcuni strumenti e dati che useranno per far progredire la ricerca sui robot. Immagina un po': c'è un sistema chiamato DROID-SLAM che aiuta i robot a capire dove si trovano e a creare mappe, e un simulatore di nome AirSim-W per testare droni e veicoli terrestri. Ma non è tutto! Hanno anche raccolto migliaia di ore di video che mostrano come le persone interagiscono con oggetti di casa e come i robot eseguono vari compiti. L'idea è quella di rendere più facile per tutti lavorare su robot più intelligenti e versatili, capaci di muoversi nel mondo reale senza problemi. Meta AI crede che condividendo queste risorse, tutta la comunità scientifica possa fare passi da gigante nel campo della robotica.
Sempre di robotica
Physical Intelligence ha presentato un modello di intelligenza artificiale per la robotica chiamato pi₀ (pi-zero). Questo modello ha raggiunto livelli never precedentemente visti nella manipolazione robotica grazie all'utilizzo di un architetura basata sulla visione e il linguaggio. Di seguito alcuni dettagli tecnici: venuto addestrato su 8 piattaforme robotiche diverse, utilizza un'architettura basata su Vision Language Model pre-addestrato e implementa la tecnica "flow matching" per generare movimenti fluidi e precisi. I risultati ottenuti sono impressionanti: la lavatrice viene scaricata autonomamente e poi piegano i vestiti, si costruisce una scatola di cartone dal foglio piatto, si sparecchia un tavolo e si distinguono rifiuti da stoviglie, e si manipola oggetti delicati come uova. Questo studio dimostra come l'architettura dei modelli linguistici possa essere un framework universale per l'IA, capace di gestire sequenze complesse di azioni nel mondo reale.
Un videogame con AI in RealTime
Decart ha annuncia Oasis, il primo modello di mondo reale in tempo reale basato su AI, sviluppato in collaborazione con Etched. Con questa tecnologia, un gioco o un video può essere generato interamente da un'intelligenza artificiale in tempo reale. Questo potrebbe cambiare il modo in cui ci divertiamo e consumiamo il contenuto digitale: immaginate un mondo in cui un modello di AI crea esperienze personalizzate in tempo reale in base alle vostre preferenze.
I mini modelli di HuggingFace
Hugging Face ha risolto un grande problema dell'intelligenza artificiale (AI) chiamato "più grande è meglio". Il nuovo modello SmolLM2 è una serie di modelli linguistici sorprendentemente potenti e piccoli che possono essere eseguiti direttamente sul dispositivo.
L’ultima puntata del Late Tech Show
Come può una soluzione cambiare drasticamente la gestione finanziaria delle PMI? E come l'intelligenza artificiale sta entrando davvero nelle aziende italiane, con una narrazione e riflessione che nasce dalla visita di Satya Nadella in Italia. Digital transformation e automazione vanno a braccetto, con gli strumenti che stanno trasformando l'operatività anche nel nostro Paese. Ospiti: Mattia Montepara di Sibill, Vincenzo Esposito e Satya Nadella di Microsoft
In versione Youtube con i capitoli.
SmartBreak e Vita da Ufficio
Faccio molta fatica a fare le live degli Smartbreak… vi lascio comunque il podcast qui sotto.
I miei libri
Vi lascio anche un link per i miei libri, caso mai vi venisse voglia di leggere, vi ricordo che Phyrtual è giunto alla seconda edizione, con nuove interviste.
LASCIAMI UN MESSAGGIO
Fammi sapere cosa ti ha colpito delle cose che faccio o racconto nei vari eventi, o di quello che ascolti al Late Tech Show, piuttosto che negli SmartBreak (e dal podcast "Vita da ufficio") o che leggi nella newsletter Techy.
Ti prego di farmi conoscere cosa pensi possa essere migliorato, aiutami con le critiche, e soprattutto quali temi vorresti che venissero approfonditi o trattati.
GRAZIE
Se non sei ancora iscritto, fallo, mi permetti di comprendere che apprezzi il mio lavoro.
Iscritto
Più persone la leggono, meglio è, quindi, per favore, condividilo con la tua famiglia, amici e colleghi per far sì che gli effetti di rete si diffondano.
Assicurati di aggiungere gigibeltrame@substack.com ai tuoi contatti. In Gmail, trascina questa newsletter nella tua scheda principale.
Grazie per aver letto questa newsletter, le trovi tutte a questo link.
💁♂️ La Bio
👍 Seguimi su:
Magazine • LinkedIn • Instagram • Facebook • Youtube
Grazie per aver letto Techy di Gigi Beltrame! Iscriviti gratuitamente per ricevere nuovi post e per supportare il mio lavoro.