Del vedere e dell’agire – Guida automatica: ma Elon Musk ci è o ci fa?

Questo articolo fa parte di una serie di approfondimenti sull’AI — il link conduce a un indice aggiornato.


Immagine prodotta con ChatGPT 4o.

Fino a qualche secolo fa ce la siamo cavata con sensi e muscoli. Oggi siamo circondati da apparati che misurano e fanno cose per noi, estendendo a dismisura percezioni e forze. Un’enorme varietà che va da piccoli dispositivi a macchinari complessi ma che si articolano in uno stesso semplice schema:

Fig. 1. Il rettangolo verde “Dati” rappresenta l’insieme dei dati (nella guida automatica questi vengono prodotti da telecamere, Radar, Lidar, ultrasuoni) raccolti in tempo reale. Il rettangolo rosso “Conoscenza” si riferisce all’insieme di conoscenze fisiche, matematiche e informatiche che servono a trasformare i vari tipi di dati rilevati dal veicolo in segnalazioni al conducente e azioni dirette sui comandi dell’automobile, nel caso di guida più o meno autonoma.

Ogni dispositivo può essere pensato come una sorta di lente magica in grado di aumentare e trasformare i dati se provvisto di adeguata conoscenza del mondo.

I dispositivi a ultrasuoni rilevano ostacoli altrimenti invisibili nella retromarcia. Funzionano perché il software che li anima esprime la fisica e la matematica che caratterizzano la trasmissione delle onde sonore nell’aria.

In una TAC i dati sono conteggi di raggi X che hanno attraversato il corpo del paziente, di per sé inintelligibili. Questi diventano straordinarie immagini degli organi interni grazie al lavoro di un matematico (Johannes Radon) del 1917 che scoprì la relazione esistente fra un oggetto e tutte le sue proiezioni. Dunque la TAC trasforma dati grezzi in dati utili grazie alla conoscenza della fisica e della matematica che sostengono il processo di acquisizione dei dati.

La qualità dei dati aumentati dipende fortemente sia dall’accuratezza con cui le conoscenze fisiche e matematiche sono espresse nei software che dalla qualità dei dati rilevati. In particolare di questi non va omesso nulla, in qualità, varietà e quantità, come ben sa chiunque abbia lavorato alla creazione di questi sistemi.

Veniamo dunque al Full Self-Driving (FSD) che dovrebbe trasformare le automobili Tesla in veicoli a guida autonoma. Diciamo dovrebbe perché sono oltre dieci anni che questa è “dietro l’angolo”. Invece non solo non c’è ma anzi si è “evoluta” da Autopilot in FSD (supervised), quindi non autonoma. Segno che non è così semplice.

In effetti la guida autonoma si è rivelata un osso duro per tutti ma Musk si è voluto distinguere con una mossa che ha lasciato allibiti gli addetti ai lavori, compresi gli ingegneri Tesla — alcuni se ne sono andati — quando ha loro imposto di rivoluzionare completamente il sistema Autopilot. Ma come?

Bisogna sapere che fino a quel momento il sistema Autopilot di Tesla aveva ricalcato lo schema adottato da tutti gli altri produttori, dove la macchina “vede” captando i dati generati da decine di sensori diversi — telecamere, Lidar, Radar, ultrasuoni [1] — mentre la conoscenza matematica e fisica di questi sistemi è contenuta nel software che a partire da tali dati assiste la guida del veicolo. Tutti produttori che sono ancora allineati nella tendenza ad aumentare numero e varietà di sensori per massimizzare la ridondanza dei dati, fino ai 40 sensori (18 telecamere, 18 radar, a 4 lidar) della Sony Vision-S!

Tutti eccetto Tesla, o per meglio dire Musk, quando nel 2021 impone di eliminare tutti i sensori lasciando solo 8 telecamere. Una mossa che detta così pare suicida ma con quali giustificazioni? Essenzialmente due. La prima, facile da capire, è la drastica riduzione dei costi. Le video camere costano molto meno degli altri sensori, soprattutto dei Lidar, che però molti identificano come l’elemento essenziale per il futuro della guida autonoma. La seconda è invece un’assunzione arbitraria, o un atto di fede: siccome gli umani guidano adoperando solo due telecamere (gli occhi) allora ce la deve poter fare anche l’AI, che più o meno funziona come il cervello.

Ecco che in breve tempo le Tesla sono state private di tutti i sensori “in più” e il sistema di calcolo, è stato riprogettato ex novo, gettando alle ortiche le oltre 300’000 righe di codice in C++ dell’Autopilot, e sostituendo il tutto con l’intelligenza artificiale. L’idea è che l’AI riesca, con adeguato addestramento, a compensare la carenza di dati acquisiti dalla macchina durante la marcia.

Fig. 2. I dati sono solo quelli prodotti dalle telecamere, schematizzate dagli spot verdi. I puntini rossi nel riquadro “conoscenza” rappresentano la moltitudine di pesi della rete neurale.

Cosa rappresentano i puntini rossi nel rettangolo “Conoscenza”? Una cosa apparentemente diversa dalla conoscenza della figura precedente, composta da principi fisici, teoremi, equazioni differenziali ecc. Qui niente di tutto questo, giusto numeri. E dov’è finita la conoscenza che era stata faticosamente acquisita in alcuni secoli di storia scientifica? In soffitta, è il caso di dire, sostituita dai pesi della rete neurale dell’AI, determinati con l’addestramento su una moltitudine di videosequenze. Al posto della conoscenza completa del mondo ora ne abbiamo una sorta di istantanea, anche un po’ difettosa. Sarà sufficiente? Nessuno può garantirlo. È un po’ un atto di fede… Come facciamo ad essere sicuri che l’addestramento dell’AI abbia coperto tutti i casi possibili? Anche quelli più rari ma letali? Come facciamo ad essere sicuri che non scambi una cosa per un’altra in presenza di abbagli, lampi, riflessi, nebbie, fumi e via dicendo? Non lo sappiamo. La risposta di Musk è semplice: addestriamo il sistema con un maggior numero di sequenze video. Che qui significa code lunghe e margini decrescenti.

Cosa sono le code lunghe? Sono le estremità dei grafici che esprimono distribuzioni di probabilità. Solitamente hanno forma di campana, con un massimo centrale e due code estese ai lati. Il grafico qui sotto mostra solo la metà destra di una simile distribuzione.

Il modello apprende da dati che includono primariamente le occorrenze più probabili, a sinistra nel grafico. Così si ottiene sì qualcosa che funziona quasi sempre ma a lungo andare può capitare un’evenienza non contemplata nei dati di addestramento e lì il modello inventa, sbagliando.

In principio nulla vieta di addestrare il modello su un maggior numero di dati, come vuole fare Musk, spingendo più a destra l’area tratteggiata nel grafico.

Sfortunatamente ciò comporta più tempo e maggiori risorse, dando luogo al fenomeno dei margini decrescenti, dove a fronte di eguali investimenti si ottengono margini di miglioramento sempre più piccoli, molto più piccoli. In questo grafico andare da B a C costa molto di più che andare da A a B. La lievitazione delle risorse necessarie per addestrare modelli sempre più grandi su dati sempre più estesi sta portando diritti all’insostenibilità energetica e economica.

E, ancora più disgraziatamente, senza mai risolvere realmente il problema perché le code sono asintotiche: per quanto si spinga la soglia a destra, rimarrà sempre una coda residua in cui si potranno annidare eventi ancora più rari.

Detto tutto ciò non meraviglia che la guida automatica si sia rivelata un obiettivo ben più ostico di quanto improvvidamente sbandierato. In pratica solo in alcuni stati americani circolano vetture interamente automatiche ma in misura limitata e sotto i riflettori della National Highway Traffic Safety Administration’s (NHTSA):

WASHINGTON, 18 ottobre 2024 (Reuters) – L’ente statunitense per la sicurezza delle auto ha aperto venerdì un’indagine su 2,4 milioni di veicoli Tesla dotati del software Full Self-Driving (FSD) dopo la segnalazione di quattro collisioni, tra cui un incidente mortale avvenuto nel 2023.

Quello della sicurezza stradale è un settore critico. Nel caso della guida autonoma controllata da reti neurali, si pone probabilmente una questione tecnico-giuridica non da poco. Per capire, si pensi alle campagne di richiamo con le quali le case automobilistiche invitano i proprietari a recarsi in officina per controllare difetti potenzialmente pericolosi per la sicurezza, con messaggi di questo tenore:

È stato accertato che su alcuni veicoli che sono stati prodotti in un determinato periodo, è possibile che — in casi eccezionali — il cavo di massa dello sterzo elettrico sia stato posizionato in modo errato con conseguente eventuale danneggiamento. In tal caso, potrebbe penetrare dell’acqua nel fascio cavi e causare un malfunzionamento o un’avaria al servosterzo elettrico. Pertanto, è necessario un controllo del suo veicolo e l’eventuale sostituzione della scatola dello sterzo e del fascio cavi.

Sembra di dire una banalità ma il costruttore per garantire un rapporto trasparente con la comunità cui vende le macchine ha necessità di poterne descrivere il funzionamento attraverso catene causa-effetto perfettamente determinate, che consentano di risalire ai difetti e individuare eventuali responsabilità. Ma che fare quando il danno deriva da una coda inesplorata dall’addestramento del sistema di guida automatico? Da questo punto di vista le reti neurali sono scatole nere. Cosa può dire una casa automobilistica a fronte di un danno causato da un difetto del pilota automatico? Ci dispiace ma lei è capitato in una coda inesplorata, forse ci arriveremo alla prossima revisione…

Insomma Musk ci è o ci fa? Per ora si è accampato in casa Trump…


[1] Radar, Lidar e sensori a ultrasuoni si basano tutti sul principio di inviare impulsi e misurare il tempo occorrente per ricevere i segnali riflessi. Mentre gli ultrasuoni impiegano, appunto, onde sonore, gli altri utilizzano onde elettromagnetiche, microonde il Radar e Laser il Lidar. Quest’ultima è la tecnologia più recente e da relativamente poco tempo ha raggiunto costi sostenibili, anche se maggiori rispetto alle altre tecnologie. Il vantaggio del Lidar è quello di produrre mappe tridimensionali accurate dell’ambiente circostante. Radar, Lidar e ultrasuoni forniscono misure delle distanze degli oggetti, le telecamere invece consentono di riconoscerne la natura. L’integrazione di queste informazioni con le immagini prodotte dalle videocamere rappresenta il meglio di quello che si può ottenere oggi.

Indietro

4 pensieri riguardo “Del vedere e dell’agire – Guida automatica: ma Elon Musk ci è o ci fa?”

  1. Musk sostituisce, penso, alla guida robotica infallibile quella abbastanza sicura, com’è del resto quella umana che implica incidenti compensati da patrimonio personali e assicurazione obbligatoria. Trump potrebbe rendere con legge indennizzabile il danno prodotto dal robot driver, né più né meno di come avviene coi driver umani. In vista di un mondo ridisegnato dalla scomparsa della maggior parte dei veicoli personali compensati da quelli robot tuttofare.

  2. “gettando alle ortiche le oltre 300’000 righe di codice in C++ dell’Autopilot, e sostituendo il tutto con l’intelligenza artificiale”.

    Bellissimo e ardito post. Un atto di fede 😉

Vengono pubblicati solo commenti che recano nome e cognome

Scopri di più da Andreas Formiconi

Abbonati ora per continuare a leggere e avere accesso all'archivio completo.

Continua a leggere