L’altra AI

Questo articolo fa parte di una serie di approfondimenti sull’AI — il link conduce a un indice aggiornato.


L’occasione di occuparsi dell’altra AI, quella non generativa, è venuta con l’invito a contribuire a un corso di aggiornamento in medicina nucleare. La richiesta del caro amico Luigi Mansi, prof di medicina nucleare, napoletano arguto e anche parecchio burlone, era di giocare il ruolo di Grillo Parlante dell’AI generativa, quello che finisce schiacciato col martello per via delle sue irritanti verità. In effetti è andata proprio così, come è risultato dai feedback dell’evento. Buona parte del pubblico non ha gradito. Non si ama sentire ciò che non si vuole sentire, anche a fronte di eccellenti riferimenti bibliografici. Ecco le slide dell’intervento.

Effettivamente il Grillo Parlante si è espresso senza mezzi termini ma il contesto lo consentiva e gli astanti erano debitamente avvertiti: l’altro amico napoletano, Bruno Alfano, con cui quarant’anni orsono si ragionava di fotoni e voxel, si sarebbe fatto carico dell’AI buona, per così dire, bilanciando le impertinenze del Grillo.

Alfano nella sua relazione ha descritto un’applicazione interessante dell’AI nella produzione di immagini TAC e PET. Vediamo intanto un esempio di questi due tipi di esame1.

Esempi di studi cerebrali con Tomografia Assiale Computerizzata (Case courtesy of Frank Gaillard, Radiopaedia.org. From the case rID: 35508) a sinistra e Positron Emission Tomography con FDG (Case courtesy of Craig Hacking, Radiopaedia.org. From the case rID: 80429) a destra.

La TAC è una tecnica radiologica che produce ottime immagini morfologiche mentre la PET fa parte dello strumentario della medicina nucleare che fornisce mappe funzionali di grandezze fisiologiche, in questo esempio del consumo locale di glucosio nel cervello.

Le informazioni prodotte da questi apparati sono di grande valore ma non sono perfette, in quanto limitate dalle leggi della fisica, della matematica, da vincoli di ingegnerizzazione e di costo e, soprattutto, dalla necessità di ridurre i danni da radiazioni ai pazienti al minimo.

Alfano nella sua relazione ha descritto un sistema AI studiato per recuperare la qualità dell’immagine in esami PET acquisiti con dosi di radiofarmaco significativamente più basse rispetto alla norma2.

Sinistra: PET a bassa dose. Centro: bassa dose con recupero via AI. Destra: Dose piena. Le immagini sono tratte dalla pubblicazione degli autori: Fu Y. et al (2023)3. Il metodo di Fu è basato sulle Generative Adversarial Networks (Goodfellow et al, 2014)4..

Anche per noi, che medici nucleari non siamo, è facile apprezzare come la riduzione della dose al paziente causi un sostanziale degrado dell’immagine (sinistra) mentre la medesima immagine trattata con l’AI (centro) pare indistinguibile da quella a dose piena (sinistra).

Messa in questi termini non ci sono dubbi, un’innovazione da adottare subito. In realtà le cose sono più complicate. In campo scientifico una rondine non fa mai primavera. Qualsiasi ricerca, qualsiasi articolo scientifico, esplora una piccola parte di mondo, magari in maniera molto approfondita ma sempre un solo tassello di un contesto più complesso. Vediamo qualche esempio pertinente:

  • Gli apparati impiegati nella diagnostica per immagini generano ingenti quantità di dati che richiedono molto calcolo per produrre le immagini finali. Si pongono quindi problemi di sostenibilità di costi dell’hardware e di tempi di calcolo in relazione ai contesti clinici in cui le macchine sono adoperate. Un conto è mostrare che una nuova soluzione produce un vantaggio effettivo, un altro è ingegnerizzarla concretamente.
  • Il sistema di AI per funzionare deve essere addestrato in un contesto più possibile attinente a quello in cui dovrà poi operare realmente. Facile da dire ma estremamente difficile da attuare se poi ci vogliamo veramente fidare dei risultati. In questo tipo di ricerche si impiegano dati reperibili in appositi repositori di casi selezionati. Come essere sicuri che i sistemi tarati su questi dati funzionino altrettanto bene nella varietà di situazioni della vita reale?
  • Supponiamo che per qualche patologia una parte del cervello di un paziente sia inattiva. Ciò produce un’isola buia nell’immagine. Ebbene, non esiste alcuna teoria che garantisca che il sistema di AI addestrato su esempi normali o “abbastanza” normali agisca correttamente su dati marcatamente diversi, out of distribution direbbero gli specialisti.
  • Oppure, cosa succede se accade di dover confrontare esami fatti su apparati diversi? Come garantire che le risposte finali dei medici siano effettivamente confrontabili? Occorre riaddestrare il sistema? Ancora, che oneri impone ciò in termini di costi o tempi di calcolo, nel contesto clinico?
  • La valutazione di immagini di questo genere si basa su una complessa interazione fra conoscenze mediche e conoscenza dell’apparecchiatura che le produce, con tutti gli inevitabili errori e artefatti che la caratterizzano. Il medico diagnosta con il tempo impara a interpretare queste informazioni e, conoscendo il contesto, finisce col vedere oltre le imperfezioni dei dati in una certa misura. La presenza di uno strato di AI nella produzione delle immagini complica ulteriormente l’interazione uomo-macchina, in termini di riproducibilità degli esiti. Aspetto non facilitato dalla natura di black-box delle reti neurali che compongono questi sistemi. Come confrontare esami fatti su PET diverse che impiegano sistemi AI di miglioramento delle immagini differenti?

Questo genere di problemi spiega perché occorre sempre un congruo lasso di tempo prima che le soluzioni proposte in letteratura facciano la loro comparsa nelle macchine messe sul mercato, per via delle lunghe e accurate operazioni di ottimizzazione per renderle affidabili.

L’intelligenza artificiale fa parte dello strumentario del calcolo scientifico e come tutti gli altri metodi ha i suoi specifici vantaggi ma comporta anche una serie di problemi. Sono gli specialisti del settore – matematici, fisici, informatici, ingegneri – che si fanno carico di impiegare questi strumenti potenti adattandoli ai contesti e valutandone gli esiti. Un lavoro complesso e minuzioso ma irrinunciabile perché aziende che producono strumentazioni miliardarie, destinate ad incidere sui destini delle persone, non possono permettersi leggerezze. L’imponderabile è sempre in agguato ma va limitato in tutti i modi possibili.

L’AI sviluppata in questo ambito è quella che definiamo “buona” perché viene messa a punto nei laboratori in base a severi criteri di qualità dei risultati.

Di per sé anche l’AI generativa sarebbe “buona”. Bastava non darla frettolosamente in pasto al mercato in modo da avere il tempo di studiare la natura delle “qualità emergenti”, di approfondire metodi di confinamento delle allucinazioni, di compensazione dei bias e via dicendo.

Ma non è stato così. Fiutato l’affare, il Generative Pretrained Transformer è stato offerto al pubblico in forma ampiamente immatura, sfruttando il medesimo trucco applicato con i social: ve lo diamo gratis. Successo garantito in un mondo dove la velocità prevale sulla profondità e l’approssimazione sull’accuratezza. Dall’ormai antico “l’ha detto la televisione” siamo passati a “l’ha detto ChatGPT”, ma mille volte peggio perché non riguarda solo informazione e intrattenimento ma anche lavoro e studio.

Nell’AI “buona” il processo di sviluppo e eventuale implementazione in apparati e servizi è guidato da criteri di qualità, sicurezza e costi, come è norma nelle produzioni industriali che vengono offerte sul mercato. Invece nell’AI generativa il processo di sviluppo e implementazione nei servizi è guidato dalla grancassa (hype) su profitti ampiamente promessi ma ancora insufficienti a fronte di finanziamenti ciclopici e performance misurate in test sempre parziali, senza avere di fatto risolto o imparato a controllare efficacemente la serie di problemi di cui abbiamo discusso altrove: distorsione di verità fattuali (allucinazioni: panzane), distorsione della varietà di risposte possibili su questioni non semplicemente decidibili, grave incapacità di ragionamento reale (vedi problema di Alice), contaminazione delle forme linguistiche e di pensiero da parte delle lingue dominanti nei corpora adoperati per l’addestramento (>90

Il concetto l’abbiamo espresso. Per chi vuole possiamo provare a illustrarlo un po’ più precisamente dal punto di vista matematico.

Problemi del I tipo: Risolvere le equazioni

La conoscenza scientifica ha preso a volare con Galileo, fondamentalmente per avere inserito nello statuto epistemologico delle scienze la matematica, quale linguaggio per leggere la natura e poterne prevedere le manifestazioni. Si individuano le grandezze in gioco e, forti di un’interpretazione teorica, si mettono in relazione fra loro scrivendo equazioni che descrivano il fenomeno. Si tratta poi di risolvere le equazioni, manipolandole (talvolta si dice invertirle) in maniera da ricavare le grandezze sconosciute in funzione di quelle note.

Fino a tutto l’Ottocento dominava il paradigma secondo il quale risolvere un problema significa risolvere prima le equazioni. Tuttavia anche allora non tutte le equazioni potevano essere risolte ma si tendeva a considerare queste come casi particolari.

Alla fine dell’800 pareva a molti di poter risolvere così tutti i problemi del mondo, grazie alla potenza del linguaggio matematico. Ma durò poco, già dall’inizio del secolo successivo apparvero problemi e nuovi campi di studio che non potevano essere affrontati con il paradigma convenzionale. Oppure problemi che si possono risolvere in modo diretto se vengono posti nella loro forma essenziale ma che invece non si possono più risolvere se, volendo ottenere risultati migliori, si cerca di tenere conto più fedelmente dei fenomeni al contorno.

Problemi del II tipo: La rinuncia a risolvere le equazioni

Proprio negli stessi anni i “casi particolari” si sono moltiplicati e gli studiosi si sono trovati ad affrontare intere categorie di problemi impossibili da trattare con il vecchio paradigma. Insomma, le equazioni erano talmente complicate o le variabili in gioco talmente numerose da rendere impossibile la ricerca di soluzioni esplicite. Da qui la rinuncia a risolvere (invertire) le equazioni. Come ottenere la soluzione dei problemi quindi?

L’idea è stata quella di andare per tentativi, partendo da soluzioni arbitrarie da inserire nelle equazioni nella forma diretta (senza invertirle) per calcolare dati fittizi da confrontare con i dati reali; le discrepanze fra dati veri e calcolati vengono poi utilizzate per correggere la soluzione iniziale, che viene poi reinserita nella medesima equazione, ripetendo più volte il processo fino all’ottenimento di una soluzione valida. Sono moltissimi i processi di questo tipo, li possiamo radunare sotto il termine cappello di “metodi iterativi”.

Sono metodi che possiamo adoperare quando siamo in grado di scrivere le equazioni del fenomeno ma non siamo in grado di risolverle esplicitamente. Sia chiaro: non si tratta di una rinuncia all’impiego dello strumento matematico. I metodi iterativi fanno parte di domini matematici quali ad esempio l’algebra lineare e la statistica, per citare i più importanti. Sono tuttavia sistemi con i quali non sempre è possibile avere la garanzia che convergano ad una soluzione e che questa sia corretta, o che lo facciano in tempi e con costi compatibili con le applicazioni reali.

Problemi del III tipo: La rinuncia a descrivere il problema

Il rapido sviluppo delle conoscenze e la brama di tecnologie sempre più sofisticate hanno generato un’altra categoria di problemi: quelli di cui non sappiamo nemmeno scrivere le equazioni ma che ci piacerebbe tanto risolvere. Come la macchina pensante. E molti altri.

Siamo così giunti alle reti neurali, con tutti i relativi derivati, che ci esimono da scrivere le equazioni, cioè da conoscere il fenomeno, da averne una teoria. Le reti neurali fanno da sole, basta nutrirle con una messe di dati preconfezionati. La rete ci si esercita e poi può essere utilizzata per somministrarle dati reali onde ricavarne le risposte desiderate. Questa è l’intelligenza artificiale.

Se i metodi iterativi sono difficili da gestire e controllare in modo da ottenere risultati affidabili, l’intelligenza artificiale lo è ancora di più, perché può essere utilizzata per risolvere problemi relativi a fenomeni che non conosciamo o di cui sappiamo molto poco.


Fino alla metà del ‘900 ha dominato il metodo classico, il migliore ma inapplicabile a una crescente mole di problemi interessanti perché troppo complicati. Si potevano risolvere solo problemi del I tipo. Quelli del II tipo erano inaccessibili perché richiedevano quantità di calcoli impossibili da effettuare a mano. Per non parlare dei problemi del III tipo, per i quali non si sapevano nemmeno scrivere le equazioni; nessuno ci pensava, a parte i pochi visionari degli albori dell’AI. L’avvento del computer digitale, verso la metà del ‘900, ha cambiato le cose. La produzione di un insieme di immagini TAC richiede di risolvere un problema di milioni di variabili e altrettante incognite. Impossibile da affrontare a mano quando gli ausili per il calcolo erano regoli calcolatori e tavole numeriche, possibile con un computer digitale. Godfrey Newbold Hounsfield (1919 – 2004), ingegnere britannico, e Allan McLeod Cormack (1924 – 1998), fisico sudafricano, nel presero il premio Nobel nel 1979 per avere realizzato la prima TAC, Cormack per la parte teorica e Hounsfield per la parte ingegneristica.

La TAC e la PET sono due casi particolari dei “problemi mal posti” per i quali esiste una formula risolutiva, purché ci si limiti ad una descrizione semplificata del problema, la soluzione implementata in tutte le macchine fino al 2000 circa. Da lì in poi sono subentrati i metodi iterativi e da pochi anni anche soluzioni basate sull’AI.

Si aggira intorno alla decina di anni il tempo necessario per approdare all’implementazione commerciale di nuovi algoritmi di calcolo. Al sottoscritto capitò di fare un lavoro pionieristico sull’impiego di metodi iterativi nella SPECT, una tecnica simile alla PET, nel 19895. Questi algoritmi sono poi comparsi nelle produzioni intorno al 2000, dopo un lungo processo di ottimizzazione. In modo analogo, i metodi AI papabili per queste categorie di imaging medico sono apparsi intorno al 2014 e solo da qualche anno hanno iniziato ad essere proposti negli apparati TAC e PET.

Nel mondo dell’AI generativa (il mondo degli LLM e dei chatbot) questi tempi sono drasticamente ridotti. I criteri orientativi nello sviluppo dei modelli si basano sulla ragionevolezza delle risposte e sugli esiti di benchmark specifici, che sono rappresentativi di piccole parti di mondo. Ma la letteratura, sia scientifica che divulgativa, è piena di controesempi che mettono in risalto la fallacia di questi sistemi quando ci si avvicina all’applicazione in contesti complessi, dove sono richieste elevate competenze specifiche ma anche esperienza e visione d’insieme.

Note
  1. Le immagini TAC e PET hanno in comune l’impiego di radiazioni ionizzanti. Si chiamano così perché sono costituite da fotoni che hanno abbastanza energia da rompere i legami molecolari. Nello spettro delle onde elettromgnetiche sono, in ordine di energia crescente, raggi ultravioletti (causano tumori della pelle), raggi X e raggi gamma. La TAC impiega raggi X che in questi apparati vengono generati da una serie di dispositivi in modo da attraversare il corpo del paziente. Dal lato opposto si trovano dei rivelatori di radiazioni che misurano la quantità di fotoni che sono sopravissuti all’attraversamento dei tessuti corporei. Maggiore è la densità di questi e meno fotoni raggiungono i rivelatori. Quindi, la TAC, misura in sostanza la densità locale dei tessuti. Con la PET si usano invece radiofarmaci iniettati in vena. Il radiofarmaco è una molecola sintetizzata in base al suo comportamento nel corpo alla quale è stato sostituito un atomo con un suo isotopo radioattivo (l’isotopo è una variante di un elemento che può essere radioattiva). In questo modo la molecola va a tracciare certe precise funzionalità in determinate parti del corpo. Le immagini PET mostrate sono state ottenute iniettando fluorodesossiglucosio — un analogo del glucosio, nutriente fondamentale per i tessuti cerebrali — marcato con l’isotopo fluoro-18. L’F-18 fluorodesossiglucosio causa l’emissione di due fotoni di radiazione gamma che viaggiando in direzioni opposte, e attraversando in buona parte i tessuti del paziente vengono misurati da rivelatori posti in posizioni opposte. La PET misura quindi la concentrazione locale di radiofarmaco nel corpo. Poiché la presenza del desossiglucosio è strettamente legata all’attività neuronale l’esame consente di ottenere mappe di attività cerebrale.
    Le due tecniche sono quindi molto diverse ma hanno ancora una cosa importante in comune. In questa descrizione, quando abbiamo concluso tout court che in un caso si misura la densità locale e nell’altro la concentrazione locale di radioattività, abbiamo lasciato una lacuna.
    Come si fa a ottenere informazione “locale” quando, in ambedue le circostanze, effettuiamo delle misure cumulative lungo ciascuna direzione che attraversa il corpo. Detto in termini geometrici: come si fa ricavare la disribuzione locale di una quantità nel corpo (densità dei tessuti o radiofarmaco che sia) a partire dalle sue proiezioni che accumulano tutte le quantità lungo delle linee rette? Detto in termini matematici: come si fa a ricostruire la distribuzione di una quantità all’interno del corpo a partire dalla conoscenza di tutte le sue proiezioni? Ebbene, questo problema è stato risolto dal matematico Johann Radon (1887-1956) nel 1917 quando ha scritto l’equazione che descrive la relazione fra gli oggetti e le loro proiezioni, più di mezzo secolo prima che comparissero gli apparati di cui stiamo ragionando. L’equazione si chiama trasformata di Radon. Quando la trasformata di Radon viene applicata a casi concreti come quelli che stiamo considerando allora si parla di tomografia: ricostruzione di sezioni. Da cui Tomografia Assiale Computerizzata e Positron Emission Tomography (PET).
    La trasformata di Radon fa parte di un’ampia categoria di problemi matematici detti “problemi mal posti” (ill-posed problems), così definiti all’inizio del secolo dal matematico Jacques Salomon Hadamard (1865 – 1963). Questi problemi possono essere critici perché in determinate condizioni non ammettono soluzioni, o meglio ne ammettono infinite e completamente divergenti. La TAC e la PET sono casi fortunati perché, malgrado il fatto che il problema sia mal posto, i dati sono abbastanza buoni da consentire la ricostruzione delle immagini. ↩︎
  2. Approfondiremo in un apposito articolo il metodo descritto nell’articolo citato da Alfano (Fu et al, 2023) per illustrare la fantasia dei ricercatori da un lato ma anche l’estrema complessità in cui essi si debbono avventurare per creare algoritmi applicabili nella realtà. Il metodo proposto da Fu e c. si basa sulle cosiddette “reti neurali avversarie” (GAN — Generative Adversarial Networks) pubblicato da Goodfellow e c. nel 2014. L’idea di queste reti deriva dalla necessità di rendere generative le reti neurali convenzionali, che di per sé si prestano a compiti tipicamente predittivi: predizioni in base a andamenti pregressi o classificazione in categorie. Per ottenere la generatività Goodfellow e c. hanno messo in competizione due reti neurali convenzionali rendendole, appunto, avversarie. Una rete, detta discriminativa, che viene addestrata a riconoscere se un set di dati è originale oppure è stato inventato. L’altra, detta generativa, invece genera dati sintetici a partire da numeri casuali. La dialettica fra le due reti è iterativa: una genera dati finti pretendendo che siano veri, l’altra si ingegna a mostrare che invece sono falsi. La prima diventa sempre più brava a spacciare per veri i dati che va generando mentre questa impara discernere sempre meglio il vero dal falso. Scrivono gli autori:
    Il modello generativo può essere considerato analogo a una squadra di falsari che cerca di produrre valuta falsa e di utilizzarla senza essere individuata, mentre il modello discriminativo è analogo alla polizia che cerca di individuare la valuta falsa.
    Se il processo funziona alla fine ci troviamo con dati finti indistinguibili da quelli veri.
    ↩︎
  3. Fu Y. et al (2023) AIGAN: Attention–encoding Integrated Generative Adversarial Network for the reconstruction of low-dose CT and low-dose PET images, Medical Images Analysis. ↩︎
  4. Goodfellow I.J. et al (2014) Generative Adversarial Nets https://arxiv.org/pdf/1406.2661. ↩︎
  5. Formiconi A.R. et al (1989) Compensation of spatial system response in SPECT with conjugate gradient reconstruction technique, Physics in Medicine and Biology https://iopscience.iop.org/article/10.1088/0031-9155/34/4/513. ↩︎

Un commento su “L’altra AI”

  1. Che bella l’AI “buona” come nelle favole: chi vende l’abbecedario, cioè la riflessione, lo studio, l’approfondimento, la cura della qualitá, si perde nel paese dei balocchi abbagliato dalla pubblicità. Ringrazio per la storia della matematica a margine in nota, sintesi preziosa🌞

Vengono pubblicati solo commenti che recano nome e cognome

Scopri di più da Andreas Formiconi

Abbonati ora per continuare a leggere e avere accesso all'archivio completo.

Continua a leggere