- Home
- MetaHealth
- Tribe v2, il gemello digitale ...

Indice
Il nuovo modello presentato da Meta FAIR, denominato TRIBE v2 (Trimodal Brain Encoder), rappresenta un salto qualitativo nella neuroscienza computazionale. A differenza del precedente vincitore dell’Algonauts 2025, limitato a soli quattro partecipanti, questa nuova versione è stata addestrata su un dataset senza precedenti, ossia oltre 700 volontari sani, per un totale di oltre 500 ore di registrazioni fMRI (risonanza magnetica funzionale). L’architettura fonde tre potenti codificatori specializzati: V-JEPA 2 per l’elaborazione video (visione), Wav2Vec2-BERT per l’audio e Llama 3.2 (a volte ritornano…) per il linguaggio testuale.
Questi flussi convergono in un trasformatore temporale che processa la sequenzialità degli stimoli, producendo infine una mappa ad alta risoluzione dell’attività cerebrale. La risoluzione spaziale raggiunge un fattore di 70× superiore rispetto ai modelli precedenti, permettendo di visualizzare l’attivazione su circa 70.000 voxel (i pixel 3D del cervello). Il cuore dell’innovazione sta nella capacità di generalizzazione zero-shot. Il modello è in grado di prevedere la risposta neurale di individui mai visti prima, in lingue diverse da quelle del training e per compiti mai esplicitamente insegnati, senza necessità di riaddestramento. Bello vero?
Questa impresa è resa possibile anche dalla qualità dei dati di training, provenienti in larga parte dal progetto Courtois NeuroMod, un dataset di deep phenotyping che ha accumulato centinaia di ore di scansioni su singoli individui impegnati in task complessi, come guardare film, ascoltare podcast e giocare ai videogiochi. La combinazione di questi dati ha permesso al modello di apprendere non solo cosa vede il cervello, ma come processa stimoli dinamici e complessi.
Il potere della previsione
Il rilascio pubblico di modello, pesi e codice da parte di Meta FAIR sotto licenza CC BY-NC accelera la ricerca in settori cruciali. Proprio la natura predittiva di TRIBE v2 porta un pò tutti a farsi una bella domanda: cosa significa possedere un modello capace di prevedere l’impatto neurale di un contenuto? L’aspetto più delicato non è tanto la capacità di leggere la mente, quanto quella di scriverla in modo ottimizzato. Di solito, i creatori di contenuti (dai social media alla pubblicità) utilizzano il metodo A/B testing, mostrando varianti di un contenuto a campioni di utenti e misurandone il coinvolgimento (click, like, tempo di visualizzazione).
Con un modello come TRIBE v2, il paradigma cambia totalmente. Diventa teoricamente possibile simulare in silico la risposta cerebrale di una popolazione target a uno stimolo prima ancora di produrlo e di distribuirlo. Il rischio regolatorio risiede nella possibilità di rendere migliori i contenuti non più per il gradimento dichiarato (un like), ma per l’attivazione di specifiche reti neurali associate a dipendenza, attenzione forzata e risposta emotiva impulsiva. Un sistema che sa esattamente quale sequenza di immagini, suoni e parole attiverà il nucleus accumbens (centro della ricompensa) o magari l’amigdala (paura/reazione) può essere utilizzato per progettare contenuti iper-coinvolgenti con una precisione prima impossibile.
La privacy neurale
Sebbene TRIBE v2 non sia un mind reader (richiede apparecchiature fMRI massive, non un semplice caschetto EEG commerciale), la sua esistenza semina sicuramente le basi per il futuro. I dati fMRI, sebbene rumorosi e lenti (catturano il flusso sanguigno, non l’attività elettrica in tempo reale), sono estremamente ricchi. La pubblicazione dei pesi del modello sotto licenza aperta significa che la ricetta per trasformare dati grezzi cerebrali in previsioni accurate è ora nelle mani di migliaia di laboratori.
In futuro, se le interfacce cervello-computer (BCI) diventeranno più capillari, modelli come TRIBE v2 potrebbero essere utilizzati per decodificare l’intenzione e lo stato emotivo di un individuo. L’attuale rilascio accelera la difesa contro questi rischi (permettendo di studiare contromisure), ma abbassa anche la barriera d’ingresso per attori malevoli che potrebbero voler sfruttare la neurotecnologia per manipolazione.
Come governare lo strumento
Per evitare che questa innovazione degeneri in uno strumento di manipolazione dell’attenzione, è necessaria, a mio avviso, una seria analisi costruttiva che coinvolga tre attori.
La ricerca accademica e open source, in primis. La scelta di Meta di rilasciare il modello sotto CC BY-NC è lodevole perché impone un limite d’uso (non commerciale). Però il bel confine tra ricerca e applicazione commerciale è molto, ma molto labile. Sarebbe auspicabile che i repository e le piattaforme di hosting (come Hugging Face) implementassero filtri per verificare che l’uso di questi modelli rimanga entro i confini della ricerca etica e non venga integrato in pipeline di marketing neuromorfico senza supervisione. In secundis (e sempre secondo me), i regolatori è bene che inizino a considerare il concetto di privacy neurale e di trasparenza algoritmica. Così come il GDPR protegge i dati biometrici, i futuri framework dovrebbero classificare i modelli predittivi del cervello come tecnologie ad alto rischio ai sensi dell’AI Act europeo. L’uso di gemelli digitali del cervello per testare contenuti dovrebbe essere soggetto a valutazioni d’impatto etico obbligatorie.
E per ultima, ma non tale, la comunità scientifica. I ricercatori che decideranno di usare TRIBE v2 potrebbero avere la responsabilità di sviluppare anche modelli antidoto. Se esiste un modello che prevede come catturare l’attenzione, credo sia necessario sviluppare anche modelli che verifichino la manipolazione, come strumenti in grado di analizzare un video e segnalare se è stato ottimizzato per sfruttare vulnerabilità neurali note.
Conclusioni
Quindi, TRIBE v2 non è solo un avanzamento tecnico ma è una dimostrazione di come l’intelligenza artificiale stia già modellando il substrato biologico della cognizione umana. Il fatto che Meta abbia scelto di renderlo accessibile (nonostante i rischi) riflette una strategia di trasparenza che va nella giusta direzione. Ci auguriamo tutti. Il punto cruciale, secondo me, resta quello normativo. Abbiamo di fronte uno strumento potentissimo per curare l’afasia, studiare i disturbi sensoriali e accelerare la neuroscienza. Ma è anche una leva potenziale per portare ad altissimi livelli e gradi la capacità di influenzare. Questa, una volta relegata all’intuito umano e ai test A/B empirici, sta diventando praticamente una scienza predittiva esatta. Spetta alla società decidere se usare questa scienza per comprendere meglio la mente umana o per sfruttarne i meccanismi più profondi. Vedremo.






