La compressione non conservativa di Michelangelo – #loptis

Clicca qui per scaricare la versione in pdf.


Questo è un complemento al post Elaborazione di immagini – tre fatti che fanno la differenza dove riprendiamo un esempio fatto qualche giorno fa nella classe di medicina per dare un’idea intuitiva della compressione non conservativa.

Ricapitolando brevemente, i metodi di compressione possono essere conservativi e non. I formati ZIP, GIF e PNG comprimono i dati in maniera rigorosamente conservativa mentre JPEG, MP3 e MP4 impiegano anche una componente di compressione non conservativa. Rammentiamo anche che ZIP serve a archiviare in forma compressa qualsiasi cosa – testi, dati, software ecc. – GIF, PNG e JPEG sono sistemi di codifica di immagini, MP3 e MP4 codificano informazioni audio e video rispettivamente.

Con i metodi conservativi si comprimono i dati sfruttando eventuali ripetizioni in essi – la decompressione in questo caso fornisce una copia perfetta dei dati originali e il fattore di compressione dipende dalla loro natura: se sono presenti molte ripetizioni allora la compressione è più efficace.

È facile comprendere come la ripetizione dei dati possa essere sfruttata ai fini della compressione. Facciamo un esempio banale. Supponiamo di avere un file di testo contenente solo una sequenza ininterrotta di caratteri “A”  e supponiamo che questi siano 1 milione. Poiché ogni carattere viene codificato in un byte, il file risulterà lungo 1 milione di byte. Ora, applichiamo una compressione “fai da te” dove assumiamo che, quando una lettera dell’alfabeto è immediatamente seguita da un numero, allora la lettera deve essere ripetuta quel preciso numero di volte, ad esempio: “A5” significa “AAAAA”. Ecco, applicando una codifica del genere, il nostro file (demenziale), una volta compresso in questo modo, conterrebbe solo il testo “A1000000”. In questo esempio la compressione sarebbe vigorosa: da 1 milione di byte saremmo scesi agli 8 byte che servono a codificare la sequenza di caratteri “A100000”! Naturalmente, questo esempio è lontano dagli schemi che vengono applicati dai sistemi di compressione conservativa reali, che sono ben più sofisticati, ma serve perfettamente per capire il concetto. Serve anche a capire come il fattore di compressione possa dipendere molto dalla natura dei dati: applicando il suddetto metodo a un testo reale lungo 1 milione di byte, probabilmente otterremmo una compressione molto ridotta, di poco inferiore a 1 milione di byte.

I metodi non conservativi invece comprimono i dati eliminando parte dell’informazione, tout court. L’idea si basa sul fatto che probabilmente non tutta l’informazione presente verrà utilizzata effettivamente. È un’idea che si può applicare ai suoni e alle immagini e sfrutta i limiti percettivi e cognitivi di chi ascolta i suoni o guarda le immagini. Non si tratta banalmente di sbarazzarsi di alcune parti delle immagini o alcune sezioni di un brano musicale – questo sarebbe davvero poco soddisfacente – ma di aspetti che si suppone i fruitori di quelle informazioni non percepiscano.

Confronto fra il volto dell'Ignudo di sinistra sopra la Sibilla Eritrea, nella Cappella Sistina e il volto della Madonna nel Tondo Doni, ambedue dipinti da Michelangelo Buonarroti.
Clicca l’immagine…

Il volto di sinistra è quello di uno dei due Ignudi che sovrastano la Sibilla Eritrea nella Cappella Sistina. Quello di destra è il volto della Madonna nel Tondo Doni.

La mano è sempre quella di Michelangelo ma le differenze sono molte: ad esempio il primo volto è un affresco mentre il secondo una tempera su tavola, la prima immagine è una scansione tratta da un libro d’arte [1] mentre la seconda è un’immagine presa da Wikipedia [2]. Ma le numerose e rilevanti differenze dipendenti dalla diversa natura delle opere e delle loro riproduzioni non nascondono il modo assai diverso con cui Michelangelo ha realizzato questi due ritratti, dove il primo sembra quasi uno schizzo preparatorio rispetto all’esecuzione completamente rifinita del volto della Madonna.

Ebbene, questa è la compressione non conservativa di Michelangelo. La volta della Cappella Sistina si trova a circa 13 metri dal pavimento e questo pone un limite alla capacità di vedere ad occhi nudo piccoli dettagli, che sono invece apprezzabili in un dipinto che può essere visto molto da vicino. Michelangelo ha quindi dipinto “meno informazione” in quelle situazioni in cui sapeva che nessuno le avrebbe potute apprezzare – in condizioni normali – ottenendo così una compressione delle informazioni fondamentale: se avesse inteso dipingere tutta la volta con la stessa accuratezza del Tondo Doni ci avrebbe messo ben più dei quattro anni che gli sono occorsi, e forse anche la salute… [3].

I' ho già fatto un gozzo in questo stento,
come fa l'acqua a' gatti in Lombardia
o ver d'altro paese che si sia,
c'a forza 'l ventre appicca sotto 'l mento.

La barba al cielo, e la memoria sento
in sullo scrigno, e 'l petto fo d'arpia,
e 'l pennel sopra 'l viso tuttavia
mel fa, gocciando, un ricco pavimento

E' lombi entrati mi son nella peccia,
e fo del cul per contrapeso groppa,
e' passi senza gli occhi muovo invano.

Dinanzi mi s'allunga la corteccia,
e per piegarsi adietro si ragroppa,
e tendomi com'arco sorïano.

Però fallace e strano
surge il iudizio che la mente porta,
ché mal si tra' per cerbottana torta.

La mia pittura morta
difendi orma', Giovanni, e 'l mio onore,
non sendo in loco bon, né io pittore.

Quindi Michelangelo ha approssimato JPEG? Semmai il contrario! Per applicare una compressione non conservativa nel migliore dei modi occorrerebbe il massimo dell’intelligenza, cosa che non si può richiedere ad un sistema automatico. Per questo si deve stare attenti a dosare la compressione di JPEG, mettendo almeno un pochino di intelligenza nel salvare un’immagine in tale formato. Si vada per tentativi, magari figurandosi l’impiego che ne dovrà esser fatto: un conto è un’immagine che deve essere vista in un piccolo formato su un monitor, un conto è inviare un’immagine da stampare in un grande formato. Chiaro che il primo è il caso di gran lunga più frequente: perfettamente inutile lasciare i setting di massima qualità nell’applicazione di fotografia del telefonino, considerato l’uso prevalente (e ridondante) di quelle foto…

Per lo stesso motivo, un musicista potrebbe non gradire la riproduzione MP3 di un brano musicale: un conto è un pezzo heavy metal e un altro una sonata per violino di Bach…

Non s’è preteso di spiegare molto. Per comprendere in maniera più approfondita il meccanismo della compressione non conservativa, occorrerebbe avventurarsi nei territori dell’analisi di Fourier. Tuttavia ci illudiamo così di avere dato un’idea anche a chi quei territori non li ha mai vistati o è tanto tempo che non vi è tornato.


[1] Michelangelo – Leben und Werk – Belser Verlag, Stuttgart, 1989, pag 86

[2] L’opera d’arte mostrata in questa immagine è nel pubblico dominio per via della data del decesso del suo autore (la norma si applica all’Unione europea, agli Stati Uniti e a tutti quei paesi in cui il copyright scade 70 anni dopo la morte dell’autore).

[3] Michelangelo Gedichte, Insel Verlag, 1992.

%d blogger hanno fatto clic su Mi Piace per questo: