La compressione non conservativa di Michelangelo – #loptis

Clicca qui per scaricare la versione in pdf.


Questo è un complemento al post Elaborazione di immagini – tre fatti che fanno la differenza dove riprendiamo un esempio fatto qualche giorno fa nella classe di medicina per dare un’idea intuitiva della compressione non conservativa.

Ricapitolando brevemente, i metodi di compressione possono essere conservativi e non. I formati ZIP, GIF e PNG comprimono i dati in maniera rigorosamente conservativa mentre JPEG, MP3 e MP4 impiegano anche una componente di compressione non conservativa. Rammentiamo anche che ZIP serve a archiviare in forma compressa qualsiasi cosa – testi, dati, software ecc. – GIF, PNG e JPEG sono sistemi di codifica di immagini, MP3 e MP4 codificano informazioni audio e video rispettivamente.

Con i metodi conservativi si comprimono i dati sfruttando eventuali ripetizioni in essi – la decompressione in questo caso fornisce una copia perfetta dei dati originali e il fattore di compressione dipende dalla loro natura: se sono presenti molte ripetizioni allora la compressione è più efficace.

È facile comprendere come la ripetizione dei dati possa essere sfruttata ai fini della compressione. Facciamo un esempio banale. Supponiamo di avere un file di testo contenente solo una sequenza ininterrotta di caratteri “A”  e supponiamo che questi siano 1 milione. Poiché ogni carattere viene codificato in un byte, il file risulterà lungo 1 milione di byte. Ora, applichiamo una compressione “fai da te” dove assumiamo che, quando una lettera dell’alfabeto è immediatamente seguita da un numero, allora la lettera deve essere ripetuta quel preciso numero di volte, ad esempio: “A5” significa “AAAAA”. Ecco, applicando una codifica del genere, il nostro file (demenziale), una volta compresso in questo modo, conterrebbe solo il testo “A1000000”. In questo esempio la compressione sarebbe vigorosa: da 1 milione di byte saremmo scesi agli 8 byte che servono a codificare la sequenza di caratteri “A100000”! Naturalmente, questo esempio è lontano dagli schemi che vengono applicati dai sistemi di compressione conservativa reali, che sono ben più sofisticati, ma serve perfettamente per capire il concetto. Serve anche a capire come il fattore di compressione possa dipendere molto dalla natura dei dati: applicando il suddetto metodo a un testo reale lungo 1 milione di byte, probabilmente otterremmo una compressione molto ridotta, di poco inferiore a 1 milione di byte.

I metodi non conservativi invece comprimono i dati eliminando parte dell’informazione, tout court. L’idea si basa sul fatto che probabilmente non tutta l’informazione presente verrà utilizzata effettivamente. È un’idea che si può applicare ai suoni e alle immagini e sfrutta i limiti percettivi e cognitivi di chi ascolta i suoni o guarda le immagini. Non si tratta banalmente di sbarazzarsi di alcune parti delle immagini o alcune sezioni di un brano musicale – questo sarebbe davvero poco soddisfacente – ma di aspetti che si suppone i fruitori di quelle informazioni non percepiscano.

Confronto fra il volto dell'Ignudo di sinistra sopra la Sibilla Eritrea, nella Cappella Sistina e il volto della Madonna nel Tondo Doni, ambedue dipinti da Michelangelo Buonarroti.
Clicca l’immagine…

Il volto di sinistra è quello di uno dei due Ignudi che sovrastano la Sibilla Eritrea nella Cappella Sistina. Quello di destra è il volto della Madonna nel Tondo Doni.

La mano è sempre quella di Michelangelo ma le differenze sono molte: ad esempio il primo volto è un affresco mentre il secondo una tempera su tavola, la prima immagine è una scansione tratta da un libro d’arte [1] mentre la seconda è un’immagine presa da Wikipedia [2]. Ma le numerose e rilevanti differenze dipendenti dalla diversa natura delle opere e delle loro riproduzioni non nascondono il modo assai diverso con cui Michelangelo ha realizzato questi due ritratti, dove il primo sembra quasi uno schizzo preparatorio rispetto all’esecuzione completamente rifinita del volto della Madonna.

Ebbene, questa è la compressione non conservativa di Michelangelo. La volta della Cappella Sistina si trova a circa 13 metri dal pavimento e questo pone un limite alla capacità di vedere ad occhi nudo piccoli dettagli, che sono invece apprezzabili in un dipinto che può essere visto molto da vicino. Michelangelo ha quindi dipinto “meno informazione” in quelle situazioni in cui sapeva che nessuno le avrebbe potute apprezzare – in condizioni normali – ottenendo così una compressione delle informazioni fondamentale: se avesse inteso dipingere tutta la volta con la stessa accuratezza del Tondo Doni ci avrebbe messo ben più dei quattro anni che gli sono occorsi, e forse anche la salute… [3].

I' ho già fatto un gozzo in questo stento,
come fa l'acqua a' gatti in Lombardia
o ver d'altro paese che si sia,
c'a forza 'l ventre appicca sotto 'l mento.

La barba al cielo, e la memoria sento
in sullo scrigno, e 'l petto fo d'arpia,
e 'l pennel sopra 'l viso tuttavia
mel fa, gocciando, un ricco pavimento

E' lombi entrati mi son nella peccia,
e fo del cul per contrapeso groppa,
e' passi senza gli occhi muovo invano.

Dinanzi mi s'allunga la corteccia,
e per piegarsi adietro si ragroppa,
e tendomi com'arco sorïano.

Però fallace e strano
surge il iudizio che la mente porta,
ché mal si tra' per cerbottana torta.

La mia pittura morta
difendi orma', Giovanni, e 'l mio onore,
non sendo in loco bon, né io pittore.

Quindi Michelangelo ha approssimato JPEG? Semmai il contrario! Per applicare una compressione non conservativa nel migliore dei modi occorrerebbe il massimo dell’intelligenza, cosa che non si può richiedere ad un sistema automatico. Per questo si deve stare attenti a dosare la compressione di JPEG, mettendo almeno un pochino di intelligenza nel salvare un’immagine in tale formato. Si vada per tentativi, magari figurandosi l’impiego che ne dovrà esser fatto: un conto è un’immagine che deve essere vista in un piccolo formato su un monitor, un conto è inviare un’immagine da stampare in un grande formato. Chiaro che il primo è il caso di gran lunga più frequente: perfettamente inutile lasciare i setting di massima qualità nell’applicazione di fotografia del telefonino, considerato l’uso prevalente (e ridondante) di quelle foto…

Per lo stesso motivo, un musicista potrebbe non gradire la riproduzione MP3 di un brano musicale: un conto è un pezzo heavy metal e un altro una sonata per violino di Bach…

Non s’è preteso di spiegare molto. Per comprendere in maniera più approfondita il meccanismo della compressione non conservativa, occorrerebbe avventurarsi nei territori dell’analisi di Fourier. Tuttavia ci illudiamo così di avere dato un’idea anche a chi quei territori non li ha mai vistati o è tanto tempo che non vi è tornato.


[1] Michelangelo – Leben und Werk – Belser Verlag, Stuttgart, 1989, pag 86

[2] L’opera d’arte mostrata in questa immagine è nel pubblico dominio per via della data del decesso del suo autore (la norma si applica all’Unione europea, agli Stati Uniti e a tutti quei paesi in cui il copyright scade 70 anni dopo la morte dell’autore).

[3] Michelangelo Gedichte, Insel Verlag, 1992.

10 thoughts on “La compressione non conservativa di Michelangelo – #loptis

  1. Andreas says:

    Riporto qui un’osservazione di Claude – magica moltiplicatrice di suggestioni – perché questo luogo funge per me anche da archivio – così un po’ contraddicendo quanto sto per dire, o forse no – dimenticare…

    Claude, in Google+, a proposito della formazione che rincorre il sogno demente del tutto che ho menzionato in un commento precedente ci rammenta il racconto di Borges, “Funes el memorioso”: “Funes, o della memoria”, raccolta Finzioni – Artifici, p. 707, Borges tutte le opere, I Meridiani, Mondadori, 1984.

    Borges narra – da par suo – dell’affascinante fenomeno dei cosiddetti idiot savants, persone impossibilitate ad astrarre il generale, affogate come sono dalla spaventosa memoria del particolare, di tutti gli attimi e tutti i particolari dell’immagine di ogni attimo: il cane visto di fronte non è lo stesso cane visto di lato un attimo prima.

    Verrebbe da dire che chi molto ricorda poco capisce. Ma non è così semplice, la memoria è anche una componente dell’intelligenza. Ho un caro amico, uomo di grande cultura e mirabile concretezza – ha occupato in aziende nazionali posizioni di vertice, senza affezionarvisi – dotato di una memoria straordinaria. Profondo conoscitore della storia, ti colloca con sicurezza e completezza qualsiasi fatto. Gliene chiesi a riguardo:
    – Ma sei uscito dagli studi così?
    – Nemmeno per sogno, ho studiato tutta la vita, dopo.

    È la qualità della memoria che fa la differenza, la memoria continuamente nutrita dalla curiosità e sostenuta dai collegamenti. La memoria nuda e cruda è fatta per svanire.

    Hermann Hebbinghaus – psicologo tedesco (1850-1909) – studiò la propria per 30 anni imparando schemi diversi di sequenze di caratteri privi di senso comune, e annotandone la persistenza con il passare del tempo. Risultato: il 90% di ciò che viene udito in una lezione viene perso in una trentina di giorni. Gli studi successivi confermano. Certo, si studia apposta per contrastare questo fenomeno, ma è il senso percepito e il riuso effettivo delle cose studiate che sostiene veramente la memoria, quella durevole.

    Claude suggerisce anche il libro di Aleksandr Romanovich Luria: The Mind of a Mnemonist: A Little Book about a Vast Memory, che potrebbe essere interessante per gli studenti di medicina.

    Grazie!
    P.S. Ma guarda te dove siamo finiti a partire dal banale tema della compressione dei file…

    1. Francesco says:

      Molto interessante questo post sulla compressione non conservativa di Michelangelo e il parallelo tra le due immagini di volti delle sue opere con la volta della Cappella sistina è suggestivo .
      Cosa aggiungere ? Tutte nozioni che possono arricchire il bagaglio culturale in questo settore e non .

  2. antonellacolombo2013 says:

    Proprio ieri sera mi domandavo come mai in laboratorio non ci fosse apparentemente movimento.
    Ed ecco questa mattina una risposta, una sferzata di energia, e via con cose nuove da imparare! Grazie!

    Torna il binomio intelligenza e accuratezza nell’affrontare le cose, in particolare nell’approccio con le questioni tecnologiche.

    Possiamo considerare compressioni non conservative le riduzioni di grandi opere letterarie per bambini e/o ragazzi?

    1. Andreas says:

      Sì. Ci stavo giusto pensando mentre scrivevo, il concetto è lo stesso.

      Per quanto riguarda il movimento ridotto, un po’ è dovuto al fatto che in questi mesi mi devo dedicare ai corsi in presenza ma soprattutto perché devo studiare. E questo significa leggere testi di riferimento ma soprattutto andare a conoscere realtà importanti, per esempio medianti gli incontri nelle scuole o nelle università, di cui ogni tanto racconto qualcosa qui, oppure cercando di conoscere il mondo dei giovani sviluppatori software e hardware, partecipando ad alcune delle loro attività e imparando ad usare strumenti e metodi nuovi. In questi giorni sto imparando a progettare e stampare pezzi 3D.

      Devo dire che è un periodo buono per rallentare il movimento del laboratorio, perché l’anno scorso ho imparato che per gli insegnanti la fine dell’anno scolastico è il periodo peggiore per proporre cose nuove – si finisce col generare più stress che vantaggi.

  3. Claude Almansi says:

    … cioè, quando usiamo immagini o suoni compressi in modo non conservativo, dobbiamo essere consapevoli di come avviene la compressione, cioè secondo regole generali basate sulla percezione umana, non specifiche all’oggetto rappresentato.

    È un po’ simile alle traduzioni automatiche, no? Intendo quel che rispondeva Ashish Venugopal, del team di Google Traduttore, nell’intervista Google’s ‘Babel fish’ heralds future of translation, alla domanda se Google Traduttore impiegava linguisti:

    “Abbiamo un team di statistici. [Google traduttore] è meno linguisticamente orientato, anche se ci sono idee linguistiche che influenzano le nostre decisioni. Ad esempio, quando lavoravo sull’ultimo gruppo di lingue dell’India che sono state lanciate, non ho adoperato nessuna conoscenza linguistica; ho adoperato Wikipedia e mia nonna. Perciò è Wikipedia, mia nonna e statistiche: è così che costruiamo una lingua.” (traduzione mia)

    Chi saranno le nonne dietro alle compressioni .jpg e mp3 😀 ?

    Poi a proposito di compressioni effettuate dagli artisti stessi: ci sono vignette di Saul Steinberg con paesaggi urbani dove lui completava una sfilza di case o di finestre scrivendo “etc.” – peccato, non ho trovato esempi con Google. Ma era un buon modo di renderci consapevoli del processo di compressione.

    Infine, a proposito dell’analisi di Fourier: l’anno scorso avevo seguito, o piuttosto cercato di seguire vista la mia ignoranza in matematica, un corso dell’EPFL sul trattamento del segnale digitale, con diverse lezioni sull’analisi di Fourier. Il corso avveniva su Coursera, che ha la brutta abitudine di chiudere l’accesso alle risorse a fine corso. Ma poiché l’EPFL lo presentava come un MOOC, cioè qualcosa di aperto, avevo fatto segnalibri con Diigo per tutte le risorse che erano in realtà ospitate fuori dal server Coursera, e rimangono quindi disponibili. Perciò il tag Fourier raduna 18 di queste risorse, di cui 12 video di lezioni, sottotitolati in inglese (con relativa trascrizione), se può servire per chi volesse approfondire.

    1. antonellacolombo2013 says:

      …forse nonne pragmatiche e molto attente, più dei nipoti “nativi digitali”!

      Battuta a parte: grazie, dopo Andreas, arrivi sempre tu con approfondimenti molto molto interessanti e arricchenti.
      Mi hanno particolrmente colpito i tuoi riferimenti a Sual Steinberg e alle traduzioni automatiche (che ho imparato ad utilizzare con un certo criterio qua in laboratorio con le varie attività di traduzione)

    2. Andreas says:

      Sì tutto ciò risponde a un criterio del tipo “estrarre ciò che serve realmente” o “estrarre ciò che realmente significa”. Quando questo viene fatto con intelligenza… appunto, intelligenza è giusto questo. È da qui che passa tutto: arte, scienza… Ed è qui che il mondo di tanta formazione fallisce miseramente, rincorrendo il sogno demente del tutto.

      Se invece si affida ad una macchina il compito di “estrarre ciò che realmente serve”, occorre capire un po’ come funziona la macchina, ovvero serve ancora intelligenza…

  4. maupao says:

    L’esempio di Michelangelo direi che calza a pennello. La compressione non conservativa allora la applichiamo tutti i giorni, quando realizziamo schizzi o appunti o altro, quindi molto spesso in verità. Grazie come sempre per l’approfondimento.

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...