ōmega #3 / AI cinesi e Spike Jonze
Le intelligenze artificiali viste da Pechino e il nuovo GPT 4o che tanto ci ricorda un film.
Benvenuti alla newsletter #3 di ōmega, un progetto a cura di Roberto Pizzato e Cesare Alemanni. Scriviamo di intelligenza artificiale e dei suoi riflessi sulla società. In questo numero vi parliamo di una conversazione tra pesi massimi dell’intelligenza artificiale cinese e dell’ultimo hype, GPT 4o.
ōmega è anche un podcast e una pagina Instagram – via email ci trovate all’indirizzo rivista.omega@gmail.com.
Il podcast/newsletter ChinaTalk è uno dei migliori canali d’informazione per capire cosa accade nell’ecosistema tecnologico cinese, specie per ciò che riguarda la sua interazione con la complessità della politica e della società locali.
Di recente i curatori hanno tradotto e pubblicato per intero la trascrizione di un panel ospitato a marzo dall'associazione no-profit 知识分子 (“L’intellettuale”). Gli ospiti del panel erano tutte personalità di spicco del mondo della tecnologia cinese – Xue Lan, veterano delle politiche tech di Pechino, Zhang Hongjiang membro fondatore dell’Accademia dell’AI di Pechino, e già CTO di Microsoft Cina e Li Huang, capo della ricerca di Bytedance (la società di TikTok) – e il tema in discussione era il futuro sviluppo delle intelligenze artificiali nel paese del Dragone.
Gli argomenti affrontati sono stati numerosi e molto interessanti, noi vi segnaliamo alcuni estratti che ci hanno particolarmente colpito.
A proposito di Sora, il software di text-to-video di OpenAI
Xue Lan: Sono rimasto scioccato quando ho visto Sora. Perché non si limita a fare comunicazione testuale, ma ha anche un certo grado di immaginazione.
Sora può generare una serie di immagini dinamiche coerenti basate su una breve descrizione testuale. Ciò non dimostra solo la comprensione del testo, ma anche la capacità di intuire e immaginare le leggi operative del mondo fisico.
Quando in passato discutevamo di intelligenza artificiale, abbiamo sempre pensato che l’immaginazione fosse una caratteristica esclusiva degli esseri umani. Ma ora Sora dimostra che anche l’intelligenza artificiale può avere tali capacità.
Quali lavori rimpiazzerà l’AI?
Xue Lan: Dipende da due aspetti. Il primo è la rapidità con cui l’intelligenza artificiale stessa migliora. Il secondo riguarda ciò che cambia nei sistemi sociali, che forniscono una protezione molto forte alle industrie tradizionali.
[...]
Zhou Zhonge: E i lavori manuali?
Zhang Hongjiang: Il motivo per cui sono così entusiasta di Sora risiede nella sua comprensione preliminare del mondo fisico.
Quando un sistema è in grado di comprendere il mondo fisico, può indirizzare i robot a svolgere attività.
Il progresso dell’intelligenza artificiale nell’hardware potrebbe essere più lento di quello nel software, ma con il progresso della tecnologia robotica, come il miglioramento delle mani abili e delle abilità meccaniche, è solo questione di tempo prima che l’intelligenza artificiale abbia un impatto sui colletti blu.
Sull’approccio cinese all’AI.
Zhou Zhonghe: Dal punto di vista del governo, come promuovere meglio l’industria cinese dell’intelligenza artificiale?
Xue Lan: Per quanto riguarda la politica governativa sull’intelligenza artificiale, una cosa è promuovere lo sviluppo e l’altra è regolare i rischi. Quindi in realtà si tratta di due ruote che girano contemporaneamente. Penso che ormai tutti abbiano pensato agli investimenti pubblici. Ma penso che un altro punto molto importante sia come creare un ecosistema che consenta alle aziende cinesi e agli istituti di ricerca, comprese le università e altri, di integrarsi organicamente tra loro. Questo è sempre stato un problema che la Cina deve risolvere.
Ciò è particolarmente importante per il settore dell’intelligenza artificiale in Cina. Come ha appena detto il signor Zhang, pubblichiamo molti articoli e abbiamo molti brevetti. Ciò che ci manca di più è un ecosistema, e questo non può essere studiato, ha bisogno che i leader creino condizioni favorevoli affinché tutti i tipi di istituzioni e talenti possano svolgere il loro ruolo in un tale ambiente.
[...]
A livello globale, dobbiamo istituire un meccanismo globale di prevenzione e controllo dei rischi. Ciò richiede lo sforzo congiunto di governi, imprese e istituti di ricerca. Allo stesso tempo, dobbiamo anche renderci conto che lo sviluppo dell’intelligenza artificiale non è solo una questione tecnica, ma anche una questione sociale. Coinvolge l’etica, il diritto, l’occupazione e molti altri aspetti. Abbiamo bisogno di ricerche e discussioni approfondite su questi aspetti per garantire un sano sviluppo dell’intelligenza artificiale.
Per quanto riguarda la gestione del rischio e la regolamentazione, vorrei aggiungere un punto. Questa è una questione a più livelli. Innanzitutto, dovremmo raggiungere quanto prima un consenso a livello globale e formulare un meccanismo globale di prevenzione e controllo dei rischi. Ciò non è solo responsabilità del governo, ma richiede anche la partecipazione delle imprese e degli istituti di ricerca a livello globale. Sebbene tutti stiano lavorando alacremente in questa direzione, non è semplice attuare concretamente queste misure. Richiede sforzi congiunti da parte di tutti.
L’hype della settimana è ovviamente il lancio della nuova intelligenza artificiale generativa di OpenAI. Nell’ultimo anno e mezzo pochi eventi sono stati capaci di catalizzare l’attenzione del mondo tech come questo, la sua eco ricorda quella dell’annuale lancio del nuovo iPhone. Le connessioni con il più celebre prodotto di Apple non si limitano al successo mediatico. Nel video di lancio c’è un ragazzo seduto alla scrivania con un iPhone in mano. Come in certi video promozionali di Apple il focus è su “cosa puoi fare” con questo nuovo prodotto. Lo scelta della modalità è però completamente diversa: niente presentazioni dal vivo sul palco , ma un semplice blogpost con video che sembra girati nel salotto di casa – anche se la voce di GPT 4o aveva riconosciuto subito che si trattava di uno studio. La ragione non è solo stilistica: si tratta di una scelta di marketing, rivolta al grande pubblico, pensata per presentare il prodotto come un compagno con cui scambiare quattro chiacchere a casa.
La scelta è anche legata all’esperienza (di Bard, direbbe qualcuno), che insegna come le presentazioni in diretta nascondano insidie, e che rimediare una brutta figura può costare fino a 100 miliardi di dollari. Meglio quindi lanciare un prodotto in un ambiente protetto, in particolare quando si tratta di tecnologie il cui utilizzo viene testato davvero solo quando vengono usate da milioni di persone.
I toni e gli ambienti utilizzati sono più domestici, verrebbe da dire più intimi. C’è un evidente allontanarsi dalla comunicazione business e legata al mondo del lavoro.
Chi si aspettava il lancio di GPT 5 è stato deluso, il nuovo GPT è solo 4o. A livello di performance ci sono miglioramenti, ma non a livello esponenziale come molti pensavano. Quello che sembra essere l’avanzamento più importante non è tanto la potenza computazionale, ma l’utilizzo della stessa per interagire con l’ambiente. Ed è questo l’aspetto più interessante: il miglioramento dell’esperienza, dell’interfaccia, l’interazione con la macchina. GPT non è diventato molto più intelligente, ma più sembra più “umano”. E per farlo OpenAI ha attinto ad un immaginario cinematografico ben definito: Samantha, l’intelligenza artificiale di cui si innamora il protagonista del film Her. Chiunque abbia visto il film di Spike Jonze l’ha notato. Ed è così evidente proprio perché è voluto, come dimostra il post su X del leader dell’azienda, Sam Altman.
Che continua sul blog aziendale dicendo:
Sembra un'IA da film e mi sorprende ancora un po' che sia reale. Arrivare a tempi di risposta ed espressività di livello umano si rivela un grande cambiamento.
Una delle ragioni di questa scelta risiede nella tradizione della tecnologia digitale, che spesso si è ispirata alla narrativa e al cinema per creare i propri prodotti. È più semplice e conveniente creare qualcosa che esiste già nella mente dei consumatori piuttosto che partire da zero nella creazione di un immaginario. Tralasciando le enormi ripercussioni sociali che l’antropoformizzazione della tecnologia può avere – a cominciare dall’uso dei termini che la descrivono, o dalle questioni di genere – la scelta di OpenAI sembra un chiaro passo verso una nuova percezione di queste macchine come enti autonomi. Come se fossero delle persone, con una loro capacità di pensare, comunicare e, presto, di agire. L’obiettivo dichiarato è usare le caratteristiche “umane” dell’AI per renderle più vicine a noi, per invitarci a fidarci di loro – concetti che vi invitiamo ad approfondire con il nostro ultimo podcast (in inglese).
In questo contesto, il fatto che le performance computazionali non siano migliorate in modo esponenziale e che sia stata solo la presentazione di GPT 4o e non di GPT 5, è solo il corollario della strategia di marketing di Open AI.
Quello che conta, per i consumatori e quindi per OpenAI che la vende, è l’interfaccia, la nostra percezione di quello che la macchina fa. In fondo anche Siri, o la vecchia Alexa, ci parlano da tempo, ma rispetto a GPT 4o, sembrano solo lontane parenti di Samantha. “Lei” ora vede quello che vediamo noi e parla davvero con noi di quello che ci circonda. Ma, come i precedenti GPT, pare ancora soffrire di allucinazioni.
Oggi introduciamo una nuova sezione che non ha bisogno di presentazioni.
Per questa settimana è tutto, alla prossima! Se volete supportare il progetto e ricevere questa newsletter direttamente nella vostra casella di posta, cliccate qui sotto ;)