‘I’m your automatic colour’
La colorazione automatica delle immagini in antropologia
Abstract Colour photographs now represent almost all the images produced with the new reality capture tools, mobile phones, which in 2020 ‘took’ 90% of all photos of that year. Black and white is relegated to artistic expression, even newspapers have converted to colour for some years. In the history of photography, although research on colour is attempted from the early stages, it is necessary to wait until 1861 with the experiences of James Clerk Maxwell who created a stable colour image. However, it is from the fifties of the twentieth century that the use of colour becomes ‘popular’ even in a more aesthetic dimension than an objective reproduction of reality. Part of the ethnographic, anthropological, archaeological and field research, on the other hand still makes use of consolidated and inexpensive black and white for a long time. On these images largely available online and open source you can conduct automatic colouring experiences. The procedure, managed with artificial intelligence algorithms with deep learning processes, is always more widely used with free applications and allows to obtain qualitatively more and more relevant results, even if some critical analysis is still necessary. This article presents the state of the art to 2021 of automatic colouring, with the comparison between algorithms developed since 2016 and showing with experimental examples both the possibilities of rendering and even the critical issues that emerged with the application in anthropological photographs, with the aim of extracting information that is not very evident in the originals in black and white.(Il titolo di questo articolo è una parafrasi da: Dee D. Jackson, Automatic Lover, 1978)
Keywords Photography. Colour. Artificial intelligence. Fashion. Anthropology.
1 Punto zero
La nascita della fotografia a colori, con risultati compiuti, si colloca circa al 1861 con le esperienze di James Clerk Maxwell e i successivi e rapidi miglioramenti e semplificazioni del processo. È tuttavia necessario attendere quasi un secolo, tra gli anni Cinquanta e Sessanta del Novecento, perché questa tecnica divenga popolare. Se in alcuni campi l’uso del colore è stato più frequente – reportage geografici, servizi di guerra, pubblicità – la ricerca etnografica, antropologica, archeologica si è avvalsa per lungo tempo solo del bianco e nero, consolidato e poco costoso. Oggi sono presenti in raccolte, musei, collezioni corpus di milioni di scatti in bianco e nero – sempre più di frequente digitalizzati e diffusi con licenze open source – che possono essere analizzati ed elaborati per ricerche originali. Lo sviluppo sempre più deciso dell’artificial intelligence con processi di deep learning, in programmi efficaci quanto semplici disponibili anche su cellulari, permetterebbe di procedere alla colorazione automatica delle raccolte, pur se molti degli approcci alla colorazione vertono sull’estetica dell’immagine. Questo articolo presenta e analizza le possibilità e i limiti della colorazione automatica delle immagini applicata all’ambito antropologico – con cenni agli aspetti tecnici e a temi legati all’estetica della fotografia a colori – mostrando risultati sperimentali e evidenziando sia le possibilità di resa sia le criticità emerse, riflettendo sull’utilizzo delle foto, una volta colorate, per l’estrazione di informazioni poco evidenti negli originali in bianco e nero.
2 Analogica
2.1 Idee
Lo sviluppo storico della fotografia non è un processo lineare. Se il principio della camera oscura era noto sin dall’antichità, ricerche sui materiali sensibili alla luce in grado teoricamente di fissare un’immagine presero il via dall’inizio del Settecento, con un’indagine accurata dei processi chimici che vi soggiacciono. Gli studi poi dell’inglese Thomas Wedgwood tra la fine del Settecento e i primissimi anni dell’Ottocento con l’uso del nitrato d’argento per la cattura di immagini (su supporto cartaceo e cuoio) aprirono la strada ad approfondimenti con la successiva circolazione di primi studi (Wedgwood, Davy 1802) che permisero ulteriori indagini. Il francese Joseph Nicéphore Niépce indagò la chimica dei materiali sensibili verificando la possibilità di ottenere immagini stabili nel tempo – aspetto che Wedgwood non aveva preso in considerazione – e sviluppò con l’eliografia un metodo di riproduzione delle immagini, derivate da incisioni o riprese dal vero. La sua prima fotografia conservata risale al 1826 e mostra ciò che l’autore vedeva dalla finestra del suo studio a Le Gras: la strada e gli edifici circostanti, in un’esposizione di almeno otto ore. I contatti a partire dal 1827 con Louis Daguerre consentirono la definizione compiuta della fotografia, con ricerche comuni interrotte nel 1833 per la morte di Niépce. Daguerre proseguì e ottenne immagini sempre migliori, sia nella definizione sia soprattutto nella stabilità, arrivando il 9 luglio 1839 a ricevere dall’Académie des sciences de l’Institut de France di Parigi il riconoscimento ufficiale del suo procedimento: la dagherrotipia. Si trattava di immagini in bianco e nero, tuttavia il dibattito sull’ottenimento di fotografie a colori, rispondenti cioè alla realtà, non venne posto in secondo piano. Nel dossier pubblicato per l’illustrazione del procedimento all’Académie (Daguerre 1839) – con interventi di altri ricercatori oltre che dello stesso autore – il tema del colore venne più volte discusso, valutando che in quel momento l’impossibilità di avere immagini rispondenti alla realtà era solo un limite tecnico considerato superabile.
Scrive Louis Arago:
Sarebbe certamente azzardato affermare che i colori naturali degli oggetti non saranno mai riprodotti in immagini fissate dalla luce. (Daguerre 1839, 28)1
1 «Il serait certainement hasardé d’affirmer que les couleurs naturelles des objets ne seront jamais reproduites dans les images photogéniques» (Daguerre 1839, 28). Le traduzioni sono di A. Bartolini.
E ancora Joseph Gay-Lussac:
L’immagine con colori naturali e ben definiti rimarrà a lungo, forse per sempre, una sfida alla sagacia umana. Ma non dobbiamo avere l’imprudenza di fissargli limiti invalicabili; i successi di Daguerre scoprono un nuovo ordine di possibilità. (Daguerre 1839, 32)2
2 «L’image a couleurs naturelles et variées restera longtemps, à jamais peut-être, un défi à la sagacité humaine. Mais n’ayons pas la témérité de lui poser des bornes infranchissables; les succès de M. Daguerre découvrent un nouvel ordre de possibilité» (Daguerre 1839, 32).
Si sottolineano infine i limiti oggettivi legati a una diversa percezione e resa del colore; ancora Gay-Lussac:
Tuttavia, non va dimenticato che gli oggetti colorati non vengono riprodotti con i propri colori e che poiché i differenti raggi di luce non agiscono allo stesso modo sul reagente del signor Daguerre, l’armonia delle ombre e delle luci negli oggetti colorati è necessariamente alterata. Questo è un punto fermo riconducibile alla natura stessa del nuovo processo. (Daguerre 1839, 33)3
3 «Cependant, il ne faut pas oublier que les objets colorés ne sont point reproduits avec leurs propres couleurs, et que les divers rayons lumineux n’agissant pas de la même manière sur le réactif de M. Daguerre, l’harmonie des ombres et des claires dans les objets colorés est nécessairement altérée. C’est là un point d’arrêt tracé par la nature elle-même au nouveau procédé».
I fisici e chimici Arago, Gay-Lussac e Davy (che si era occupato degli studi di Wedgwood) erano attenti agli aspetti formali del nuovo metodo, su come la realtà poteva essere restituita in modo oggettivo: le loro riflessioni sulla fotografia sono di rilievo, perché già in origine ne scardinavano il confronto con la pittura, che si indirizzava a muoversi sul piano del colore in modo soggettivo, aspetto che la nuova arte dell’Ottocento, come l’impressionismo, evidenzia bene. I limiti intravisti da Gay-Lussac erano legati ai metodi di restituzione dell’immagine, alla chimica, ma evidenziano un tema non marginale della fotografia a colori, oggi nella sua restituzione tramite processi di artificial intelligence, ossia la ‘verosimiglianza’, nella direzione di un colore sempre più ‘reale’.4
4 In una visione scientifica del colore non vanno dimenticati gli studi di Johann Wolfgang von Goethe che nel 1810 pubblica Zur Farbenlehre, in contrasto con le teorie di Isaac Newton, ma allo stesso tempo in un quadro più generale di dibattito nelle scienze.
Questo aspetto non è secondario in un ragionamento più ampio sull’immagine: le prime pubblicità, almeno in Italia, dei televisori a colori, sia sulla carta stampata sia sullo stesso medium, tra gli anni Settanta e Ottanta del Novecento, puntavano a sottolineare come la resa dei colori fosse totalmente fedele alla realtà, indirizzandosi, ad esempio, come la marca Seleco, su «il colore della verità»5 o come il noto slogan della Philips «colore sempre vivo» e Rex «Realcolor».6 Il tema del colore si prestò rapidamente a una diffusione popolare, al di là delle strette analisi tecniche, inquadrandosi nella possibilità di avere immagini stabili e a un costo accessibile: sin dalla seconda metà degli anni Cinquanta dell’Ottocento, riviste generaliste diedero con una certa frequenza notizie sui nuovi progressi di questa tipologia di fotografia. A titolo di esempio, anche per la precocità, vediamo dalla Rivista friulana. Scienze Arti Industrie Commercio dell’aprile 1859 un cenno in merito:
5 Per una raccolta di immagini di pubblicità di televisori a colori in Italia nel 1976, cf. https://www.youtube.com/watch?v=oCynqhsu0uc.
Se dobbiamo credere al Cosmos,7 da cui la riprodussero i nostri giornali, la scoperta della Fotografia a colori non è più un desiderio ma una realtà. Infatti, Blackshell in Inghilterra scoprì un processo per cui s’ottiene una pruova fotografica colorata perfetta. Hill ha così trovato un rivale ed un emulo in Inghilterra [corsivo nell’originale]. Il primo ha ottenuto un brevetto da quella Regina. – A dir vero è una scoperta curiosa, e su cui possiamo dubitare. («Uno sguardo» 1859, 116)
7 Chromo-photographie, rubrica Nouvelles de la semaine: «Cosmos. Revue encyclopédique hebdomadaiere des progrès des sciences et de leurs applications aux arts et a l’industrie», Tome treizième, 1858, 2° sem., p. 389.
L’articolo, che traccia un quadro degli sviluppi della fotografia, prosegue indicando criticamente come la fotografia a colori debba essere ancora lontana, stante le necessità di sistemi di lenti complessi e di nuovi e migliori materiali sensibili. Abbiamo riportato la notizia da questa fonte per due ordini di motivi. Il primo è legato alla natura del settimanale – pubblicato a Udine, in lingua italiana tra il 1859 e il 1866 come foglio ufficiale della Camera di commercio e industria del Friuli – che operava in un bacino di lettori specialistico, attento agli sviluppi tecnico-scientifici di respiro internazionale. Il secondo fa riferimento all’inventore del procedimento. La stessa notizia venne riportata in altri giornali italiani (sin dal 1858) e in Gran Bretagna, ma né il signor Blackshell né il sistema della cromo-fotografia ebbero valida diffusione. Si tratta di una sperimentazione che non ebbe risultati pratici. Non è l’unico: il citato americano Levi Hill, attorno al 1850, sviluppò un complesso processo che gli fruttò accuse di aver falsato i risultati, pur se in realtà aveva ottenuto alcune immagini ponendosi tra i primi pionieri della fotografia a colori.8
8 Si veda la voce «Levi L. Hill» (Guadagnini 2011, 94-9), con alcuni esempi di fotografie. Hill nel 1856 aveva pubblicato un saggio sulle sue ricerche: A Treatise on Heliochromy; or the production of pictures, by means of light, in natural colors.
In chiave più generale si potrebbe riflettere su come il dibattito e gli sviluppi tecnici che hanno portato all’elaborazione del colore nelle immagini analogiche siano temi di modesto significato per i fini di questo saggio, dato che le esperienze qui illustrate hanno necessità di immagini non colorate. Tuttavia, questi aspetti non sono marginali per una corretta valutazione dell’ambito in cui la colorazione automatica si può muovere, perché se le foto in bianco e nero sono la base del lavoro, la loro collocazione nel reale è il primo passo per una corretta restituzione automatizzata. La tecnica diventò matura tra la fine degli anni Cinquanta e i primi Sessanta dell’Ottocento, quando il fisico scozzese James Clerk Maxwell ne pose le basi teoriche, arrivando nel 1861, con il fotografo Thomas Sutton, alla realizzazione pratica, pur con un’immagine effimera proiettata, stampata solo negli anni Trenta del Novecento da Douglas Arthur Spencer. Daguerre nel 1839 pose come sottotitolo alla descrizione del suo metodo fotografico, una specificazione di rilievo:
Questo processo (il dagherrotipo) consiste nella riproduzione spontanea delle immagini della natura ricevute in camera oscura, non con i loro colori, ma con una gran finezza di gradazioni di tonalità. (Daguerre 1839, 57)9
9 «Ce procédé (le daguerréotype) consiste dans la reproduction spontanée des images de la nature reçues dans la chambre noire, non avec leurs couleurs, mais avec une grande finesse de dégradation de teintes».
Nel testo il francese si premura di evidenziare come la realtà non fosse mostrata nei suoi veri colori, bensì con un sistema di sfumature, di gradazioni (i toni di grigio, non la dualità bianco e nero usata per comodità linguistica) che si approssimavano all’immagine percepibile, vista dall’occhio umano. Si potrebbe considerare come, per paradosso, l’immagine fotografica in bianco e nero si avvicini alla realtà più di quella a colori, perché l’insieme delle sfumature restituisce in modo fedele la struttura dell’oggetto fotografato. Il passaggio al colore deve produrre un ulteriore salto di approssimazione, deve cioè aggiungere alla tessitura dell’immagine la colorazione, in un’integrazione che non è solo tecnica, anzi, che si proietta in un complesso modello di descrizione e analisi della realtà. Il processo di colorazione automatica deve tendere proprio a questo, a riportare l’immagine al suo contesto «naturale», evidenziando quegli aspetti che il bianco e nero ha ridotto o camuffato o per limiti tecnici escluso, come le lunghezze d’onda del rosso nel materiale sensibile ortocromatico.
2.2 Colore da manuale
Un manuale italiano sulla fotografia, uscito nel 1955, dal titolo Come fotografare a colori, di Gualtiero Castagnola (che riprende il tema in un successivo lavoro, Guida alla fotografia a colori pubblicato nel 1966) illustra in modo didattico la complessità dell’immagine a colori, evidenziando come ci sia una notevole differenza formale tra fotografare in bianco e nero e farlo a colori, proprio per i modelli di rappresentazione della realtà. Facciamo riferimento a questa pubblicazione, perché gli anni Cinquanta-Sessanta rappresentarono, in Italia, il punto di svolta della tecnica fotografica a colori, verso una trasformazione popolare, e qui questi passaggi sono illustrati in modo chiaro. Il lavoro è molto puntiglioso, sia sulla tecnica sia su un’analisi più estetica dell’uso del colore, e offre spunti di riflessione su cosa sia il colore nella fotografia e su come questo muti la visione del mondo, aspetti che possono incidere sull’analisi della colorazione automatica. L’autore, fotografo milanese e teorico della fotografia, analizzando il colore si muove su due piani: uno dato da considerazioni estetiche nell’ambito del bello e uno sui temi dell’oggettività del medium, ossia l’immagine a colori fissa la realtà tale e quale.
Si riporta il primo aspetto:
È fuori dubbio che la fotografia a colori stia diffondendosi, proprio in questi anni, nel cerchio degli appassionati e che vada sempre più raccogliendo nuovi proseliti grazie alle infinite soddisfazioni che le riproduzioni colorate, intese in senso generale, sanno dare all’occhio, alla fantasia ed al gusto dell’uomo. È ovvio che tutto ciò che è colore colpisca la nostra sensibilità percettiva: osserviamo un neonato alle prime impressioni; di fronte a tanti oggetti, egli rimane colpito inizialmente da quelli dotati di tinte più vivide e sgargianti. Ma anche noi grandi dobbiamo confessare che, indipendentemente da ogni considerazione critica, proviamo una sensazione piacevole di «bello» quando veniamo a trovarci di fronte ad una composizione colorata sia essa naturale (paesaggio, fiori, frutta ecc.) sia artificiale (stoffe, dipinti, giochi di luce policroma in spettacoli teatrali ecc.). (Castagnola 1955, 7)
Segue il secondo aspetto:
Esaminiamo ora l’effetto che ci dà una bella fotografia a colori: in essa rileviamo, come in bianco e nero, una esatta riproduzione meccanica, ma in più un altro elemento, per l’appunto il colore, che aggiunge una nuova nota estetica, una nuova dimensione, che in effetti riesce a dare un’impressione di completo e di definitivo: il soggetto riportato è «come» il nostro occhio lo vede in realtà: non v’è più nulla d’aggiungere, il ciclo, ripetiamo, è chiuso. Ed è questo in verità il lato negativo. […] A noi interessa per il momento trarre spunto da quanto abbiamo espresso qui sopra onde mettere in luce, fin dall’inizio, quello che, giustamente, deve essere considerato il più grave difetto che può avere una fotografia a colori: di apparire in tutto e per tutto una cartolina colorata, di quelle che, con trenta lire si comprano dal tabaccaio. Le quali hanno appunto la prerogativa di sfruttare il colore unicamente come elemento complementare di abbellimento (o di abbruttimento) mentre noi dovremo imparare a sfruttare il colore nelle nostre fotografie esclusivamente come elemento di composizione, fine a se stesso, come elemento interpretativo, il che significa: fotografare non il soggetto in quanto colorato ma insieme di colore in quanto soggetto. (Castagnola 1955, 9-10)
I modi legati a come la fotografia a colori possa rappresentare la realtà, che non è una semplice cartolina colorata, sono maggiormente approfonditi nel manuale del 1966:
il miglioramento tecnico e l’aumentato grado di sensibilità raggiunto dalle moderne pellicole a colori, i perfezionamenti meccanici ed ottici e gli automatismi introdotti negli apparecchi fotografici, che ne hanno facilitato l’uso, hanno enormemente contributo ad aumentare la diffusione e la popolarità della fotografia a colori in vaste masse di pubblico. (Castagnola 1966, 5)
La preoccupazione dell’autore è che il colore tout court restituisca la realtà in forma banalizzata, in una mera riproduzione di quanto osservato. Questo aspetto è significativo: la colorazione automatica deve proprio indirizzarsi verso il banale quotidiano, di non facile ottenimento. Altri manuali coevi approfondiscono in maniera più articolata il significato della fotografia a colori, in una visione più possibilista della rappresentazione del reale (Feininger 1962), pur inserendo valutazioni estetiche (Marin 1957).
2.3 Cartoline dal passato
Un passaggio che Castagnola evidenzia in entrambi i suoi manuali, espresso anche da Corrado Marin nel 1957 (La presa fotografica a colori, con un titolo già fuori dal tempo) è che il colore sia spesso un «abbellimento» dell’immagine, che nulla di artistico aggiunge alla fotografia, che riporta proprio la realtà così come è, grave smacco per il fotografo moderno. In questo contesto gli aspetti estetici si insinuano in modo deciso, nella misura in cui la foto colorata deve suscitare meraviglia per il suo stato più che per il soggetto. Tra gli strumenti di colorazione, prima del consolidamento della tecnica, il più semplice era l’aggiunta manuale del colore. Già alcune lastre del citato Levi Hill mostrano correzioni di questo tipo. Il sistema venne utilizzato in passato in gran copia per le cartoline, dove il colore era un plus atto ad aumentare il valore turistico della località. Queste immagini, nella doppia versione di bianco e nero e colore manuale sono utili per una valutazione delle procedure di colorazione automatica, perché ci mostrano con l’immagine colorata, pur artefatta, una verosimiglianza alla realtà ritratta nelle foto in bianco e nero, permettendoci una più puntuale analisi e calibrazione dei risultati, con la premessa che la colorazione manuale sia stata condotta con un’osservazione di quanto ritratto. Vediamo alcuni esempi. Le prime due immagini mostrano a Bologna il Portico dei Servi, la chiesa di Santa Maria dei Servi e Palazzo Davia Bargellini, in Strada Maggiore, una in versione bianco e nero e una colorata manualmente, identiche – salvo una modifica di taglio nella parte sinistra – risalenti circa agli anni Trenta del Novecento (una delle due, quella in bianco e nero, è spedita nel gennaio 1940) [fig. 1].





Figura 1 Da sinistra: Bologna, bianco e nero, cartolina viaggiata 1940; Bologna, colorazione manuale, non viaggiata, entrambe autore non identificato. Colorazione Antic; colorazione Image; colorazione DeOldify. Elaborazioni dell’Autore
L’immagine dipinta a mano presenta, anche per chi non conosce il luogo, colori, pur enfatizzati, ragionevoli, credibili. Ciò significa che possiamo far fede sull’immagine: la zona, il complesso dei monumenti, si presentava negli anni Trenta del Novecento proprio così. E così si presenta oggi, con poche differenze cromatiche: la colorazione condotta manualmente è reale. Questi aspetti ci permettono di usare l’immagine come campione valido per tentativi di colorazione automatica. Il soggetto si è rivelato per la colorazione molto ostico, portando, con diversi algoritmi, a risultati non soddisfacenti, con una totale uniformazione dei colori. Prove condotte su altre immagini, simili a quelle di Bologna, cartoline in bianco e nero e colorate a meno, hanno dato risultati più attendibili [fig. 2]:10
10 Ringrazio Luca Varlani per aver messo a disposizione queste immagini dalla sua collezione.




Figura 2 Da sinistra, Ronta (FI), cartolina anni Cinquanta bianco e nero; cartolina anni Cinquanta colorata a mano, entrambe autore non identificato. Colorazione Zhang; colorazione Iizuka. Elaborazioni dell’Autore
I motivi che portano a risultati così dissimili vanno ricercati in primo luogo nell’addestramento degli algoritmi. Le foto architettoniche o più in generale urbane mostrano un’uniformità cromatica che non permette scelte precise, sia nei singoli elementi sia nel contesto, per cui l’identificazione e colorazione portano a un’interpretazione ‘piatta’, come se non ci fosse differenza tra i materiali costruttivi e le decorazioni. Nelle cartoline, dove c’è invece anche il paesaggio, l’architettura è meglio contestualizzata e pur in una certa uniformità, migliorata dalle ombre, si vedono differenze. In un più ampio quadro di colorazione guidata, in questo caso manualmente, in altri più recenti tramite programmi di fotoritocco con intervento dell’operatore, si è diffusa la tendenza alla colorazione di immagini legate agli eventi bellici, sia per la Prima che la Seconda guerra mondiale, soprattutto negli Stati Uniti e in Francia, con appassionati che restituiscono il colore facendo ricerche sul periodo, le uniformi ecc., con appassionati che fanno ad esempio ricerche specifiche sulle uniformi in una restituzione iconografica non dissimile alle cartoline che abbiamo visto, immagini poi diffuse sui social (anche a pagamento) o con pubblicazioni generaliste (Manduit 2019; Jones, Amaral 2019). Ancora più recentemente sono colorate con la stessa tecnica immagini di personaggio famosi, come attori, politici, sportivi.
Questo quadro offre spunti di riflessione sulla dualità tra immagini in bianco e nero e a colori. In senso generale, anche nelle pubblicazioni citate, il colore è un’appendice, non lo si usa per aumentare il livello descrittivo dell’evento: in La Couleur du temps, ad esempio, si mostrano colorate alcune foto dell’affaire Dreyfus, con una narrazione del tutto slegata alle immagini, che mostrano Alfred Dreyfus in tribunale e un ritratto di Émile Zola che lo difese nel noto «J’accuse» su Le Figaro (1897) (Jones, Amaral 2019, 66-7). In questo caso Zola in bianco e nero e Zola a colori non spostano la questione Dreyfus, non ci danno cioè informazioni aggiuntive, nella misura in cui poi esistono già immagini colorate, pur non fotografie, di Dreyfus e del processo. Una nuova immagine di Alfred Dreyfus, colorata, nell’aula del tribunale, poco ci aiuta a dipanare la vicenda: ciò che nella foto originale è in bianco e nero è comunque noto, come i colori degli abiti e gli arredi del tribunale. È noto perché la colorazione manuale è condotta come accennato facendo ricerche sui colori originali e non automatizzando il processo, per cui in qualche modo il risultato è atteso più che supposto. La colorazione non è una sfida tra un operatore manuale e un computer.
Ciò che emerge da queste foto – dalle nuove tendenze di colorazione dei personaggi più che degli aventi bellici – è il pathos, lo stupore di fronte a una Storia in apparenza rinnovata dal colore, come se nel caso citato l’intero processo Dreyfus si fosse svolto in bianco e nero. Il fraintendimento iconografico del passato dato dall’attualizzazione delle immagini espone a un pericolo tuttavia più teorico che pratico. Il nodo interpretativo è che il grande pubblico potrebbe confondere il reale (in bianco e nero) con il ricostruito (a colori), nella misura in cui «qualunque oggetto è stato prodotto con la tecnologia che esisteva al suo tempo: le foto sono monocrome per buona parte dell’Ottocento, i film lo sono fino agli anni Trenta e quella è la loro natura» (cit. Cavanna in Signorelli 2020). Anche l’elaborazione dei filmati, e delle immagini, è in fin dei conti il frutto di un’idea del passato elaborato da un algoritmo di intelligenza artificiale basandosi sui dati forniti in fase di addestramento, fra l’altro provenienti da immagini contemporanee, così come le immagini inserite per migliorare la fluidità del video sono aggiunte da zero, anziché essere recuperate dalla pellicola. Questi ultimi aspetti sono pregnanti per una critica alla colorazione automatica delle immagini, e li vedremo nel dettaglio. Tuttavia, l’ipotesi che colorare immagini in bianco e nero non ci porti più vicini al passato, bensì ad aumentare la distanza tra allora e oggi creando differenza anziché immediatezza, può essere intesa come una forzatura, nella misura in cui in ambito storico-antropologico la colorazione va nella direzione di un aumento della quantità delle informazioni disponibili, si pone cioè, in senso generale, come la traduzione scientifica di un testo antico, magari un manoscritto egizio, che nessuno riterrebbe scritto in originale nell’italiano o inglese del 2021. Va tuttavia osservato come sempre di più appaiano in rete, non solo sui social più generalisti ma anche a corredo di articoli e saggi, immagini ricolorate senza nessuna indicazione specifica sia del loro essere state colorate sia delle tecniche utilizzate, dando oramai per acquisito il procedimento e ciò può produrre nel pubblico non specializzato false ipotesi.11
11 Si tratta di una citazione di Luke McKernan, curatore della British Library, da una sua nota sul suo blog del gennaio 2018 dal titolo «Colouring the Past», https://lukemckernan.com/2018/01/25/colouring-the-past/.
3 Digitale
3.1 Algoritmi
Prima di approfondire con esempi più puntuali alcuni aspetti della colorazione automatica si presenta in sintesi un riassunto schematico degli algoritmi utilizzati nel lavoro, indicandone la letteratura collegata e i siti sui quali è possibile fare sperimentazione, posti nell’ordine in cui sono stati resi disponibili in rete (dati aggiornanti al settembre 2021). Se in gran parte il loro sistema di funzionamento è simile, pur se non per tutti è disponibile una letteratura analitica, con prima il riconoscimento delle aree da colorare e poi la loro elaborazione cromatica, vista anche in un’identificazione generale della scena, il valore di verosimiglianza del risultato finale è legato ai modelli di addestramento, che possono essere condotti o su immagini generaliste o su ambiti specialistici.
Gli algoritmi Zhang e Iizuka sono quelli con una letteratura più ampia e meglio circostanzianti nel funzionamento, anche se si tratta di ricerche già datate e con processi di apprendimento generalizzati. Image e Antic sono frutto di sperimentazioni individuali che sfruttano codici open source senza indicazioni specifiche, con un addestramento anche qui molto ampio. DeOldify è l’algoritmo più interessante: sviluppato da ricercatori indipendenti dal 2018, è addestrato soprattutto sulla figura umana in contesti familiari, con risultati significativi. I processi precedentemente citati con addestramento ampio e generale tendono a restituire valori corretti soprattutto in contesti naturali, penalizzando le persone e l’abbigliamento. DeOldify, implementato dal 2020 su un sito di ricerche genealogiche (con algoritmi non più open source e letteratura disponibile), va sempre migliorando i risultati di colorazione, sia per aspetti culturali, abiti, arredamento ecc., sia con un riconoscimento puntuale delle caratteristiche somatiche e la successiva colorazione, anche se ovviamente non tutti i risultati appaiono ottimali.
Algoritmo |
Letteratura |
Sito |
---|---|---|
Zhang |
Zhang, R.; Isola, P.; Efros, A.A. (2016). «Colorful Image Colorization». Leibe, B.; Matas, J.; Sebe, N.; Welling, M. (eds), Computer Vision – ECCV 2016. ECCV 2016. Lecture Notes in Computer Science, no. 9907. https://arxiv.org/abs/1603.08511 |
|
Iizuka |
Iizuka, S.; Simo-Serra, E.; Ishikawa, H. (2016). «Let there be Color! Joint End-to-end Learning of Global and Local Image Priors for Automatic Image Colorization with Simultaneous Classification». ACM Transactions on Graphics (SIGGRAPH), 35(4). http://hi.cs.waseda.ac.jp/~iizuka/projects/colorization/en/ |
|
Image |
Dati generali: https://imagecolorizer.com/ |
|
Antic |
Autore Jason Antic, API e dati sommari sul procedimento: https://deepai.org/machine-learning-model/colorizer |
|
DeOldify |
Sito di riferimento: https://deoldify.ai/. Codici della prima versione: https://github.com/jantic/DeOldify |
3.2 Letteratura
La letteratura sull’elaborazione del colore nelle immagini, pur sempre più numerosa, è ancora ristretta ad ambiti specialistici, con una marcata discussione delle metodologie più che dei risultati. Un lavoro divulgativo con un significativo taglio scientifico sull’artificial intelligence, uscito di recente (Quintarelli 2020), non affronta il tema dell’elaborazione delle immagini, sia nella fase di acquisizione sia nella postproduzione automatizzata.12 L’ottenimento delle immagini non è un aspetto secondario: gran parte delle case di produzione di telefoni cellulari implementa nelle fotocamere sistemi di ‘scatto’ controllati da intelligenza artificiale. Il riferimento a questo strumento non è casuale: nel 2020 circa il 90% di tutte le foto è stato fatto con cellulari (circa 1,43 trilioni).13 Questi sistemi sono basati su modelli di machine learning e se pur i produttori siano avari di particolari si trovano disponibili alcuni paper che ne tratteggiano le linee principali, non marginali allo sviluppo poi di algoritmi dedicati alla colorazione automatica. Se le tecniche automatiche di ripresa si indirizzano ad esempio a una miglior gestione della luminosità, e non necessariamente in condizioni estreme (Runsheng et al. 2018)14 con parametri ottimizzati dal sistema, allo stesso tempo anche la gestione del colore, la sua interpretazione in un mix tra visione umana e maggior resa reale (e le due cose non sono in conflitto) si indirizza su modelli automatici, sempre sfruttando il machine learning. Quest’ultimo aspetto è significativo in merito ai risultati: i modelli di addestramento si fanno sempre più ampi e diffusi per cui la direzione è quella che può essere definita visione naturale: più informazioni e strumenti di confronto sono disponibili migliore sarà il risultato finale.15
12 Un quadro storico di riferimenti, anche se non ci sono dati analitici all’elaborazione delle immagini, è offerto da Jacobelli 1987.
14 I ricercatori operano nei Xiaomi AI Lab in Cina.
15 Sugli aspetti della visione, sia in senso fisiologico sia negli approcci dell’artificial intelligence, un quadro aggiornato è in Masland 2021.
I sistemi di colorazione automatica lavorano adesso in gran parte con le convolutional neural network (CNN), reti neurali artificiali che simulano i modelli di visione biologici, nelle quali i risultati possono essere rinforzati e migliorati nel tempo con modelli di apprendimento legati a forme di ricompense e anche con sistemi di adversarial machine learning.16 Nonostante le prime ricerche teoriche in questo campo risalgano agli anni Quaranta del Novecento, la loro applicazione pratica è recente con risultati significativi nel campo del riconoscimento facciale e del linguaggio – e con una vasta e analitica letteratura.17 Un contributo del 2016, pur obsoleto, rimane utile, perché focalizza i limiti e gli errori che gli algoritmi di colorazione possono incontrare. Il lavoro evidenzia come un addestramento massiccio – qui è stato condotto su 1,2 milioni di immagini (un quantitativo medio per questo genere di approcci) – non sempre è in grado di dare risultati accettabili. Viene citata come esempio limite un’immagine di Anne Frank del 1939 dove si vede la ragazza seduta su una sedia a sdraio all’aperto con alle spalle un cuscino. Se l’immagine è nel complesso resa cromaticamente in modo abbastanza sensato il cuscino non è interpretato in modo corretto: a prescindere dalla forma c’è una variabilità di colori che un intervento manuale potrebbe interpretare ma che un sistema neurale ha difficoltà a definire.
16 La letteratura su questi temi è sempre più ampia ed è impossibile indicare una bibliografia di riferimento esaustiva. Un quadro generale aggiornato si trova in Joseph et al. 2019.
17 Sul riconoscimento facciale una bibliografia storica (sino alla fine degli anni Novanta) è riportata in https://www.ini.rub.de/PEOPLE/wiskott/Bibliographies/FaceRecognition.html; dati più recenti in https://pythonhosted.org/facereclib/references.html. Sul linguaggio e l’artificial intelligence una bibliografia storica è disponibile qui: https://liinwww.ira.uka.de/bibliography/Ai/speech.recognition.html.
Il modello non è in grado di colorare i cuscini perché i cuscini potrebbero essere di qualsiasi colore. Anche se il set di allenamento è pieno di cuscini (cosa che non credo lo sia), saranno tutti di colori diversi e il modello probabilmente finirà per calcolarne la media in un tono seppia. Un essere umano comunque può scegliere un colore casuale e anche se si sbaglia avrà un aspetto migliore di nessun colore.18
18 «The model is unable to color cushions because cushions could be any color. Even if the training set is full of cushions (which I don’t think it is), they will all be different colors and the model will probably end up averaging them to a sepia tone. A human can choose a random color and even if they’re wrong, it will look better than no color» https://tinyclouds.org/colorize/.
La soluzione a questo problema, che non è marginale in una corretta interpretazione di tutta l’immagine di Anne Frank, non è immediata neppure con un forte addestramento dell’algoritmo, data la quasi infinita variabilità di un oggetto banale come un cuscino e l’impossibilità, una volta riconosciuto, di contestualizzarlo nel modo corretto. Arrivando tuttavia a una ragionevole colorazione solo di alcune parti – escludendo il cuscino e valorizzando la figura di Anne – il procedimento non è fallimentare, perché ci offre in ogni caso informazioni utili, legate ad esempio a una più puntuale collocazione cronologica: Anne ha un vestito a maniche corte, una corretta restituzione del colore del prato alle sue spalle ci può meglio indirizzare verso la stagione più significativa, ad esempio la primavera rispetto a una estate inoltrata.
Se la colorazione automatica delle immagini è una sfida in progress, allo stesso tempo va valutato il valore di approssimazione al risultato. Oggi, rispetto a cinque anni fa, i programmi per il riconoscimento automatico del testo scritto (OCR/HTR) danno senza dubbio risultati migliori, anzi, il riconoscimento automatico dei manoscritti dà già risultati significativi,19 tuttavia i programmi OCR/HTR ancora introducono errori nella risposta, sempre meno gravi, ma presenti: un sistema OCR/HTR molto diffuso, di una casa leader, ha evidenti difficoltà di riconoscimento delle parti in corsivo in libri stampati nell’Ottocento, aspetto marginale ma allo stesso tempo evidente e al momento certamente non di facile soluzione dato che l’errore permane da anni.
19 Si veda ad esempio il progetto Transkribus, finanziato dalla Comunità Europea, e limitato al momento ad alcune lingue (https://readcoop.eu/transkribus/).
L’ipotesi di un range di ragionevolezza nella colorazione si pone qui in un quadro generale di approssimazione al risultato, che tuttavia può anche essere non pienamente valutabile e con la necessità di fidarsi dell’algoritmo. La fiducia nel risultato è un tema già espresso nei paper di corredo alle sperimentazioni, con valutazione assai ottimistiche non sempre però condivisibili. Un lavoro circostanziato pubblicato nel 2016 evidenzia un passaggio metodologico che lascia interdetti:
Valutare le immagini sintetizzate è notoriamente difficile. Poiché il nostro obiettivo finale è quello di produrre risultati convincenti per un osservatore umano, introduciamo un nuovo modo di valutare i risultati della colorazione, testando direttamente il loro realismo percettivo. Abbiamo impostato un ‘test di Turing di colorazione’, in cui mostriamo ai partecipanti colori reali e sintetizzati per un’immagine e chiediamo loro di identificare il falso. In questo paradigma abbastanza difficile, siamo in grado di ingannare i partecipanti sul 32% delle istanze (le colorazioni della verità del terreno raggiungerebbero il 50% su questa metrica), significativamente più alte rispetto al lavoro precedente. Questo test dimostra che, in molti casi, il nostro algoritmo sta producendo risultati quasi fotorealistici. (Zhang 2016)20
20 «Evaluating synthesized images is notoriously difficult. Since our ultimate goal is to make results that are compelling to a human observer, we introduce a novel way of evaluating colorization results, directly testing their perceptual realism. We set up a ‘colorization Turing test’, in which we show participants real and synthesized colors for an image, and ask them to identify the fake. In this quite difficult paradigm, we are able to fool participants on 32% of the instances (ground truth colorizations would achieve 50% on this metric), significantly higher than prior work. This test demonstrates that in many cases, our algorithm is producing nearly photorealistic results».
Senza approfondire significato e valore del Test di Turing (che misura in via del tutto teorica la capacità di un computer di mostrare intelligenza) sul quale c’è adeguata letteratura21 a partire dal saggio originale (Turing 1950), è più utile sottolineare che i risultati ragionevoli di questo algoritmo sul campo sono inferiori ad altri dello stesso periodo. L’enunciazione del 32% sul Test non ha un reale valore che dimostri la maturità del sistema, dato inoltre che, se noto, può inficiare la fiducia nel risultato. I «photorealistic results» sono poi ancora teorici, nella misura in cui è impossibile valutare in modo strumentale, e quindi oggettivo, la foto perfetta, definizione soggetta a troppe variabili. In una chiave più generale, è possibile considerare come i modelli teorici e pratici legati ai programmi di colorazione automatica tendano a passare in secondo piano: se si hanno ancora algoritmi open source sui quali condurre ricerche e miglioramenti, allo stesso tempo la diffusione di programmi o a pagamento o con scarsa letteratura (una mancanza ben più grave) evidenzia da una parte un interesse per il solo risultato, la ‘bella foto colorata’, dall’altro proprio l’idea di una fiducia in quel risultato, quando si hanno parametri per una valutazione oggettiva del risultato: una bella foto colorata può anche essere del tutto errata rispetto alla realtà.
21 Un elenco molto ampio e aggiornato si trova in https://philpapers.org/browse/the-turing-test.
Un recente progetto di ricerca (Luo et al. 2020) propone per la colorazione di immagini di personaggi storici un approccio differente da quelli visti sino ad ora. Utilizzando il sistema di generazione di immagini virtuali StyleGAN222 con reti neurali in competizione per ottenere il miglior risultato partendo da set di dati uguali («generative adversarial networks»),23 il progetto Time-Travel Rephotography24
23 Un quadro analitico è in Goodfellow et al. 2014.
rifotografa soggetti famosi simulando un viaggio indietro nel tempo con una fotocamera moderna: a differenza dei filtri di ripristino delle immagini convenzionali che applicano operazioni indipendenti come la denoising, la colorazione e la super-risoluzione, sfruttiamo il framework StyleGAN2 per proiettare vecchie foto nello spazio delle moderne foto ad alta risoluzione, ottenendo tutti questi effetti in un quadro unificato. Una sfida unica di questo approccio è catturare l’identità e la posa del soggetto della foto e non i molti artefatti in foto antiche di bassa qualità. (Luo et al. 2020, 4321)25
25 «simulates traveling back in time with a modern camera to rephotograph famous subjects. Unlike conventional image restoration filters which apply independent operations like denoising, colorization, and superresolution, we leverage the StyleGAN2 framework to project old photos into the space of modern high-resolution photos, achieving all of these effects in a unified framework. A unique challenge with this approach is capturing the identity and pose of the photo’s subject and not the many artifacts in low-quality antique photos».
L’immagine originale, qualunque siano le condizioni, legate non solo alla qualità della ripresa ma anche alla sua conservazione, viene riprogettata e non solo restaurata: il processo tiene conto di aspetti non percettibili, come il range tecnico entro il quale la ripresa fotografia in bianco e nero si collocava. Gli aspetti tecnici dell’immagine sono approfonditi nei passaggi iniziali del lavoro, con l’esame di una foto di Abraham Lincoln scattata l’8 novembre 1863.
La pellicola dell’era di Lincoln era sensibile solo alla luce blu e UV, facendo apparire le guance scure e enfatizzando eccessivamente le rughe filtrando la dispersione dell’apparenza cutanea che si verifica principalmente nel canale rosso. Quindi, le linee profonde e le pieghe taglienti che associamo al volto di Lincoln sono probabilmente esagerate dal processo fotografico dell’epoca. (Luo et al. 2020, 4321)26
26 «The film of Lincoln’s era was sensitive only to blue and UV light, causing cheeks to appear dark, and overly emphasizing wrinkles by filtering out skin subsurface scatter which occurs mostly in the red channel. Hence, the deep lines and sharp creases that we associate with Lincoln’s face are likely exaggerated by the photographic process of the time».


Figura 3 Da sinistra, Abraham Lincoln, 8 novembre 1863, autore non identificato. Colorazione DeOldify; miglioramento preventivo e colorazione DeOldify. Elaborazioni dell’Autore
Colorando la foto di Lincoln con DeOldify e utilizzando la miglior immagine disponibile in rete, si ottiene un risultato di scarsa qualità, anche inserendo nelle fasi preliminari alcuni miglioramenti (automatici) [fig. 3]. I risultati di Time-Travel Rephotography appaiono invece certamente più convincenti, anche limitandosi solo a questa immagine per la quale abbiamo fatto confronti più specifici, pur prestando il fianco, dato l’utilizzo di StyleGAN2, ad alcune critiche. In merito a questo strumento, sviluppato dai tecnici Nvidia e rilasciato open source, Phillip Wang (Uber) ha realizzato il sito This Person Does Not Exist,27 nel quale si generano a ogni refresh della pagina volti umani casuali di un drammatico realismo, indistinguibili da quelli di persone reali [fig. 4]. In linea con queste considerazioni il progetto Which Face is Real,28 sviluppato da Jevin West e Carl Bergstrom della University of Washington, sfida gli utenti a riconoscere in una coppia di immagini di volti, uno reale e uno generato con StyleGAN2.




Figura 4 Volti casuali generati dal sito https://thispersondoesnotexist.com
Il paper di Time-Travel Rephotography è stato reso pubblico alla fine del 2020 e sino a ora non ha sviluppato un significativo dibattito in ambito specialistico: vi sono solo cenni, con la riproduzione delle immagini elaborate, soprattutto su forum di computer graphics con commenti che mettono in evidenza il lato estetico dei risultati. In realtà, visto che il cuore del progetto è un sistema dedicato alla creazione di immagini fotorealistiche, si potrebbe discutere su cosa sia il vero risultato finale, su quanto cioè StyleGAN2 introduca di virtuale nell’immagine finale, che potrebbe apparire come un artefatto steampunk (anche animabile e restituibile in 3D senza difficoltà). È evidente come non sia necessario invocare un’etica della colorazione automatica ma, estremizzando, il Lincoln di Time-Travel Rephotography non è dissimile dai dinosauri della saga Jurassic Park, ovvero un’elaborazione 2D che potrebbe anche essere integralmente generata da un computer assemblando le migliori immagini di Lincoln e colorandole secondo i canoni attuali. Rephotography infine è un termine con un significato preciso:
Il nostro obiettivo è simulare viaggi indietro nel tempo e fotografare di nuovo personaggi storici con una fotocamera moderna. Chiamiamo questa ‘rifotografia del viaggio nel tempo’, adattando il termine rifotografia che tradizionalmente significa ‘l’atto di ripetere la fotografia dello stesso sito, con un intervallo di tempo tra le due immagini’. (Luo et al. 2020, 4322-3)29
29 «Our goal is to simulate traveling back in time and rephotographing historical figures with a modern camera. We call this ‘time-travel rephotography’, adapting the term rephotography which traditionally means ‘the act of repeat photography of the same site, with a time lag between the two images’».
Lo spazio temporale tra la foto originale e quella trasformata è colmato dall’elaborazione digitale con un risultato, tuttavia, che punta molto all’estetica: l’immagine originale di Lincoln è senza dubbio iconica, fortemente simbolica, scattata durante il suo mandato presidenziale, e in questo caso la colorazione appare come una forzatura, come un restauro eccessivo: in effetti più che una fotografia ricolorata appare come un dipinto, un ritratto iperrealista o una caratterizzazione cinematografica [fig. 5].

Figura 5 Abraham Lincoln e altre personalità elaborati e colorati. Immagine tratta da Luo et al. 2020, 4321
Significativo, infine, come il progetto si indirizzi esclusivamente alla figura umana. La linea che viene percorsa appare tendere a una visione deepfake della realtà, dove si sviluppa un mondo parallelo, insinuato tra foto in bianco e nero e a colori, non semplicemente all’atto del colorare, che è sì un’attualizzazione del ricordo – la versione commerciale di DeOldify va assolutamente in questa direzione – ma in questo caso, anche con sviluppi possibili, la sua trasformazione, la costruzione, anche, di una storia 3D, anzi, la sua ricostruzione. I volti di This Person Does Not Exist oscillano – a prescindere dalla conoscenza del progetto – tra il perturbante e un’indifferenza di déjà vu: i personaggi storici colorati con Time-Travel Rephotography (che al momento appare tuttavia come lo stato dell’arte) si insinuano più nelle pieghe della Storia, quando le colorazioni meno definite, anche per i difetti dell’immagine originale, ci ponevano un po’ a distanza dal risultato.
3.3 Colori
Le considerazioni che seguono sono frutto di sperimentazioni condotte dal 2017 utilizzando algoritmi differenti, nella gamma di quelli in precedenza indicati e sottoponendoli a stress test con immagini native di varia provenienza, sia analogiche sia digitali (anche con vari gradi di risoluzione) al fine di valutare la ragionevolezza nella restituzione del colore.30 Il termine ‘ragionevole’ potrebbe apparire troppo empirico e incapace di dare nella valutazione dei risultati una corretta risposta. Il nodo sta invece nell’impossibilità di una misurazione oggettiva e strumentale dei risultati, per cui è necessario introdurre una stima se non proprio soggettiva legata almeno a un campo probabilistico, nel quale la ragionevolezza è un parametro valido. Possiamo considerare come in una fotografia a colori un cielo verde abbia un basso grado di ragionevolezza, così come il mare viola, ma questi colori sono noti a tutti, per cui è necessario rendere la valutazione ragionevole per gradi, approssimando l’immagine nel suo complesso e non per singole aree, anche se come accennato un punto correttamente colorato in una visione generale errata può essere utile.
30 Queste acquisite sia a colori e poi trasformate in scala di grigi, sia acquisite già in scala di grigi, con più dispositivi.
Abbiamo visto con le cartoline due esempi: in uno la colorazione automatica ha dato un risultato fallace, diciamo con una ragionevolezza < a 50, nell’altro valido nel complesso, con una ragionevolezza > di 50. In effetti questo discrimine, < o > a 50 (al 50% dell’immagine) è un parametro empirico che ci può dare delle risposte, pur nella misura in cui la valutazione dell’allontanamento o avvicinamento al valore medio è data dalla precisione soggettiva dall’occhio umano. Il motivo per il quale è impossibile una valutazione strumentale del risultato è chiarito in modo evidente dalle immagini che seguono, che ci danno anche significative informazioni su come gli algoritmi di colorazione lavorino [fig. 6]:




Figura 6 Da sinistra, scala di colori nella loro disposizione ‘naturale’; la scala a colori è stata trasformata in scala di grigi; scala in grigi ‘colorata’ con Image; scala in grigi ‘colorata’ con Antic. Elaborazioni dell’Autore
Il risultato non deve sorprendere: gli algoritmi non sono stati in grado di colorare la scala perché questa immagine manca di un qualunque pattern di riferimento che permetta l’esatta attribuzione del colore. Si tratta nell’immagine in scala di grigi appunto di grigi che nella realtà di una possibile fotografia debbano rimanere così, come una facciata di una casa o di un’area marcatamente in ombra. Il citato cuscino di Anna Frank possedeva un pattern pur se molto generico oltre a una modesta contestualizzazione, per cui anche se inventato un colore gli è stato attribuito. La misurazione strumentale, ad esempio con un colorimetro digitale (e adesso ne abbiamo di molto raffinati in grado di restituire un’immediata risposta Pantone), del risultato puro è impossibile, pur se questo aspetto potrebbe essere significativo nelle fasi di apprendimento dell’algoritmo. Ancora, l’addestramento con l’elaborazione di un numero sempre più ampio di immagini attuali, non è secondario, perché potrebbe falsare il risultato.
Un rischio non necessariamente legato a Neural Love (che spesso, ma non sempre, nei suoi video ricostruisce il lavoro svolto fornendo quindi le informazioni di contesto), ma alla diffusione online di siti e programmi che permettono a chiunque di svolgere operazioni simili con qualunque foto, sempre utilizzando software di intelligenza artificiale e che – a causa dell’addestramento con dati contemporanei – finiscono a volte a far indossare blue jeans a uomini dell’800. (Signorelli 2020)31
Questa critica è corretta nella misura in cui l’addestramento sia condotto senza un adeguato approfondimento, considerando che sì, le fotografie a colori degli abiti dell’Ottocento sono rare o assenti, ma non sono rare le fonti grafiche di tali colori che allo stesso tempo possono essere correttamente parametrizzate. Accenno che Time-Travel Rephotography utilizza per l’elaborazione un’immagine parallela già a colori generata appositamente, definita come ‘sibling’ (fratello), con le caratteristiche facciali più simili possibili all’originale e dalla quale estrarre in parte le caratteristiche cromatiche da applicare sul bianco e nero, in un sistema di preaddestramento che fa avanzare la successiva elaborazione completa del colore, per ridurre infine il peso dell’immagine parallela nel risultato finale. Questo passaggio porta a minimizzare il rischio di un passaggio retroattivo che porterebbe il fratello a sovrapporsi all’originale. Questi modelli di lavoro alleggeriscono in parte la necessità di un pesante addestramento con set di immagini massivi, ma è evidente come il risultato sia sempre al limite tra un reale ragionevole e il virtuale di StyleGAN2.
3.4 Moda
Prove condotte su immagini in bianco e nero di abiti di alta sartoria italiana degli anni Sessanta hanno dato risultati di colorazione, a detta di storici e tecnici della moda,32 poco incoraggianti. La moda d’autore è un atto creativo, dove le regole di costruzione del colore non sono uniformi: se un insieme di alberi con foglie rimanda all’estate per cui la colorazione è ragionevolmente verde intenso e un albero spoglio rimanda all’inverno con colori conseguenti, un abito dei primi anni Sessanta probabilmente di Roberto Capucci non è facilmente inquadrabile in norme precise, per cui il risultato è incerto, partendo da una foto originale in bianco e nero [fig. 7].33
32 Ringrazio qui Anna Bartolini e Aurora Fiorentini per la collaborazione. Grazie anche al fotografo Filippo Basetti.
33 Foto dalla cartella stampa di Moda italiana a Vienna, 25-26 maggio 1964, s.l., s.e.


Figura 7 Foto originale in bianco e nero, Vienna 1964. Colorazione Antic. Proprietà ed elaborazione dell’Autore
La ricchezza cromatica dell’abito in passerella viene appiattita dalla colorazione – pur se il contesto assume un cromatismo a prima vista ragionevole, come nella cartolina del Portico dei Servi di Bologna. Se l’unica documentazione di questo abito fosse la foto in bianco e nero non sarebbe facile per gli storici della moda proporre interpretazioni sui colori originali. Anche mettendo in evidenza l’abito non si hanno risultati utili [fig. 8]. L’ultima immagine è colorata con l’algoritmo DeOldify che abbiamo visto nel dettaglio: secondo Anna Bartolini, progettista dell’abbigliamento sin dagli anni Settanta, il risultato è ancora peggiore di quello di Antic, perché l’abito risulta appiattito su un tono bianco forse non usato da Capucci. Le fotografie documentano per la stampa una sfilata di moda italiana, della scuola fiorentina, a Vienna nel 1964: si tratta di immagini professionali stampate su carta fotografica, acquisite poi ad alta risoluzione, per cui l’algoritmo non risente di una qualità scadente (anche se altre prove evidenziano come la qualità dell’immagine non sia un parametro essenziale) e l’interpretazione appare confusa.



Figura 8 Da sinistra, foto originale in bianco e nero, Vienna 1964, particolare. Colorazione Antic; colorazione DeOldify. Proprietà ed elaborazioni dell’Autore
Come accennato Time-Travel Rephotography considera nell’elaborazione il tipo di pellicola utilizzata nella ripresa, ragionevolmente per range ampi. Per gli algoritmi utilizzati per le prove non si accenna nella letteratura disponibile a questo aspetto, per cui è corretto affermare che questo parametro non sia preso in considerazione. Senza spingersi ai vari tipi di immagini sviluppati nell’Ottocento e in parte citati, anche un solo riferimento agli anni Cinquanta-Sessanta del Novecento mostra una significativa variabilità. Un dettagliato manuale inglese (è un esempio dei tanti) della fine degli anni Cinquanta, tradotto in italiano nel 1961 (De Maré 1961) tratteggia in più di un capitolo le varie tipologie di lastre e pellicole, sia per la fotografia in bianco e nero sia per quella a colori, facendo considerazioni sullo sviluppo e sulla stampa.
Una differenza non secondaria, e gli anni Cinquanta ne sono un discrimine, è tra pellicola in bianco e nero ortocromatica e pellicola a colori pancromatica: la prima – e le lastre così definibili – è sensibile solo alle lunghezze d’onda del blu e verde, mentre la seconda è sensibile a tutto lo spettro cromatico. Le modalità di sviluppo e fissaggio sono differenti per i due tipi di pellicola, nella composizione chimica, nella temperatura e nel procedimento pratico: la pellicola ortocromatica non essendo sensibile al rosso può essere sviluppata a vista illuminando il laboratorio con una luce rossa. Ci sono delle regole precise da seguire se si vuole ottenere un risultato. Errori sulle percentuali dei componenti chimici (con riferimento a sistemi amatoriali), nella temperatura, nei tempi dei bagni portano anche alla totale scomparsa, irrecuperabile, dell’immagine. Allo stesso modo voler sviluppare una pellicola pancromatica come una ortocromatica e viceversa non porta a nessun risultato valido.
Possiamo ipotizzare per immagini complesse come quelle viste per la moda che l’algoritmo non tenga conto della sensibilità spettrale del supporto – non importa se su negativo o stampa su carta data la possibilità di lavorare con entrambi i tipi nell’acquisizione dell’immagine in digitale (e ovviamente anche con lastre di vetro) – e possa produrre nella colorazione errori paragonabili a quelli di un errato sviluppo. Si introducono cioè disturbi che virano l’immagine sulla base della non sensibilità a determinati spettri, come appunto il rosso, considerando inoltre il tipo di illuminazione, se naturale o artificiale (aspetto rilevante per le foto di moda) e infine la marca della pellicola che potrebbe dare ulteriori differenze. In effetti, empiricamente, ci sono immagini in bianco e nero che con qualunque algoritmo arrivano a risultati validi, altre che per contro è impossibile colorare e non solo per i motivi che abbiamo visto con le cartoline di Bologna. Per le foto di moda, generalizzando, si può inoltre considerare come la colorazione automatica porti a una normalizzazione dei colori, a una trasformazione probabilistica dell’immagine che non tiene conto degli aspetti creativi. Prove condotte con immagini più recenti a colori, trasformate in scala di grigi e poi ricolorate – protette da copyright, che quindi non possono essere mostrate – danno una ricolorazione non creativa, quando nell’originale erano inserite sfumature e colori del tutto unici: molto rilevante è una copertina di Vogue USA (October 2019, edizione digitale) che in origine ha un’uniforme sfumatura di verde tra sfondo e abito della modella e che Image restituisce in una ricca gamma di toni, non riconducibile alla realtà che vorrebbe essere mostrata.34
34 Descrizione della foto di copertina: «Cover Look. The Merry Monarch. Olivia Colman wears a Dolce & Gabbana cape and pants. Bvlgari ring. Hermès boots. To get this look, try: Double Wear Stay-in-Place Make-up in Tawny, Bronze Goddess Illuminating Powder Gelée, Pure Color Envy Lipstick in Nude Scene, The Brow Multi-Tasker in Dark Brunette, Little Black Liner in Black, Pure Color Envy Lash Multi Effects Mascara in Black. All by Estée Lauder. Hair, Sally Hershberger; make-up, Francelle Daly. Details, see in This Issue. Photographed by Annie Leibovitz. Fashion Editor: Tonne Goodman».
L’immagine seguente, sempre relativa alla sfilata di Vienna del 1964, elaborata con DeOldify, risulta nel complesso migliore delle precedenti, con toni più ragionevoli nel contesto generale dell’immagine anche se l’eccesso di rosso potrebbe essere dato appunto dai limiti che abbiamo visto [fig. 9].



Figura 9 Da sinistra, foto originale in bianco e nero, Vienna 1964; colorazione Antic; colorazione DeOldify. Proprietà ed elaborazioni dell’Autore
3.5 Albania
Ulteriori ricerche sono state condotte su due corpus di fotografie di autori italiani anonimi scattate in Albania. Il primo è composto da 164 foto del 1928, a margine di una missione cartografica italiana, foto di alta qualità che documentano il viaggio in Albania, con molte immagini di persone e luoghi. Il secondo è dato da 87 foto di un ignoto militare italiano nel 1941. Ho in parte ricostruito il contesto di esse, di rilievo storico, che documentano anche i bombardamenti dell’aviazione inglese nel porto di Valona del 15 aprile 1941, con i relitti semi affondati dei piroscafi Stampalia e Luciano oltre alla visita di metà maggio di Vittorio Emanuele III. Le fotografie sono state acquisite per un progetto di ricerca sulla percezione dell’Albania da parte degli italiani tra Settecento e Novecento sviluppato nel 2016 con l’antropologo visuale Paolo Chiozzi – con il quale ho studiato e collaborato sino alla sua scomparsa nel 2018 – con l’idea di colorarne alcune per verificare se le informazioni storico-antropologiche emergessero in maniera più incisiva. Se nel campo della moda i risultati sono ancora incerti, indagini legate all’uso del territorio danno risultati più precisi: o meglio, danno immagini che possono poi essere interpretate in modo più puntuale. La geografia dell’Albania, ad esempio, può essere sufficientemente indagata con la colorazione (tutte dalla serie 1928, Iizuka), con una significativa restituzione della gamma tonale [fig. 10].



Figura 10 Da sinistra, pastori albanesi 1928; paesaggio albanese non identificato 1928; ragazza albanese 1928. Proprietà ed elaborazioni dell’Autore con Iizuka
Questi sono esempi generali, ma la definizione del territorio, tra terre di montagna incolte e pascoli, si delinea in modo evidente. Aspetti più specifici appaiono incerti, abbigliamento e architettura, in questa serie e sempre con Iizuka [fig. 11].


Figura 11 Da sinistra, moschea non identificata, Albania 1928; bambini da località imprecisata, Albania 1928. Proprietà ed elaborazioni dell’Autore con Iizuka
Un discorso simile può essere fatto per la serie del 1941 [fig. 12].




Figura 12 Da sinistra, navi nel porto di Valona 1941; persone in località imprecisata (Valona?), Albania 1941; persone (mercato?) in località imprecisata (Valona?), Albania 1941; pastori, Albania 1941. Proprietà ed elaborazioni dell’autore con Iizuka
In queste immagini il valore estetico dato dal colore è marginale: le foto sono abbastanza grezze e certamente, per gli aspetti che abbiamo già visto, la colorazione appare non ben definita. Tuttavia, già con questi parametri è possibile specie per il corpus del 1941 approfondire l’utilizzo del suolo e con esso sottolineare alcuni aspetti sociali. In particolare, nell’ultima immagine l’ipotesi che si tratti di pastori è suffragata da un uso attento del suolo: non vi sono aree brulle, senza erba, per cui è ragionevole, anche sulla base dell’abbigliamento che appare essere, specie per il ragazzo a destra, di lana grezza, che vi sia una pastorizia accorta, attenta alle stagioni e alle variazioni climatiche e di consumo dei prati. In queste due serie non tutte le fotografie hanno una resa ottimale nella colorazione: si potrebbe trattare di partite di pellicole differenti; quelle del 1928 poi sono state ragionevolmente sviluppate sul campo, per cui ci potrebbero anche essere disparità tra immagine e immagine, per una non uniformità del procedimento. Queste due foto dell’Albania (1941), elaborate con DeOldify, in un contesto di di risultati ottimali e di un incremento di dati sono significative [fig. 13].




Figura 13 Da sinistra, Tirana, Albania 1941, immagini originali in bianco e nero. Proprietà ed elaborazioni dell’Autore con DeOldify
Si tratta di due frammenti iconografici della italianizzazione e fascistizzazione dell’Albania, che resi a colori permettono analisi più puntuali, come ad esempio sul rapporto tra abiti tradizionali e divise fasciste e la loro commistione nella foto dei ragazzi. La foto del balcone fa riferimento alla visita a Tirana di metà maggio 1941 di Vittorio Emanuele III – durante la quale, il 17 maggio, subisce un attentato da parte del patriota albanese Vasil Laçi, immediatamente fermato, condannato e impiccato il 27 maggio – anche qui con una commistione tradizionale (i tappeti) e littoria.
Si potrebbe considerare come gli aspetti brevemente citati potevano essere estrapolati dalle immagini originali in bianco e nero. Il confronto con le immagini colorate mostra la minor quantità di dati qui disponibile e il colore appare come un elemento essenziale di approfondimento. In merito ai tappeti al balcone abbiamo fatto alcune brevi verifiche. Una foto scattata a Tirana, pur senza una precisa indicazione cronologica, ragionevolmente dei primi anni Cinquanta – facente parte del Fondo Francesco e Franco Tagliarini, conservato nell’Archivio fotografico della Società Geografica Italiana35 – mostra venditori di tappeti (l’immagine disponibile in rete ha una bassa risoluzione, tuttavia ne abbiamo provato la colorazione) [fig. 14].



Figura 14 Da sinistra, Tirana, vendita di tappeti. Colorazione Image; colorazione DeOldify. Da: Edizioni Turismo Albanese, © Franco Tagliarini. https://www.albanianews.it/rubrica/chiche/abitazione-tiranese-tradizioni-tirana. Elaborazioni dell’Autore
Anche se le due colorazioni mostrano cromatismi differenti si comprende come colori e disegno non corrispondono a quelli dell’immagine 10. Sommarie ricerche su alcuni repertori (Campana 1966; Viale Ferrero 1969; Kendrik, Tattersall 1973) non hanno dato risultati: questo campo è strettamente specialistico; tuttavia, indagini per l’esatta definizione dei tappeti esposti a Tirana per la visita di Vittorio Emanuele III rappresentano un significativo aspetto per approfondire alcuni passaggi, anche simbolici, di quel momento, temi che solo con la colorazione possono emergere con chiarezza. Considerando infine come i colori della figura 13 possono non essere completamente rispondenti alla realtà, dati i limiti dello spettro del rosso, un approfondimento incrociato sui tappeti potrebbe permettere una più precisa calibrazione dei colori, individuando l’esatta tipologia dei tessuti.
4 Conclusioni
Per concludere si potrebbe riflettere su quanto funzioni adesso, nel 2021, la colorazione automatica delle immagini e in che direzione metodologica sia possibile andare. Alla seconda domanda ho in parte già risposto, e riassumo: gli algoritmi disponibili o sono generalisti, per cui danno risultati imprecisi, o vanno in una direzione di specializzazione che può colorare solo alcuni ambiti, come, ma in senso molto ampio, le immagini di persone. In questo quadro si inserisce il progetto Time-Travel Rephotography, che al momento tuttavia non ha prodotto significativi dibattiti e ulteriori progetti di ricerca. Valutando ambiti particolari – quali la storia del costume, l’archeologia36 (Maltese 2020), l’antropologia culturale – per maggiori e nuove indagini sui materiali disponibili e il loro restauro, la strategia dovrebbe essere quella di sviluppare algoritmi ad hoc. In questi casi sono necessari addestramenti peculiari, per un puntuale riconoscimento e poi colorazione degli oggetti, con un’applicazione dell’artificial intelligence a discipline umanistiche.
36 Nel 2015 sono state colorate manualmente da una società specializzata nel restauro e appunto nella colorazione di foto storiche, in collaborazione con il National Geographic, le immagini scattate da Harry Burton all’apertura della tomba di Tutankhamon nel 1922: https://www.storicang.it/a/alla-scoperta-della-tomba-di-tutankhamon_14607.
Il progetto ArchAide, sviluppato dal Dipartimento Civiltà e Forme del Sapere dell’Università di Pisa, utilizzabile sia da sito web che come app, permette il riconoscimento immediato di una vasta gamma di materiali ceramici tramite automatic image recognition e machine learning molto raffinati, con la simulazione ad esempio di linee di frattura per le anfore romane.37 Il lavoro del team di ArchAide, del quale ho seguito come osservatore alcuni momenti chiave nel 2018 e 2019, si colloca nella linea della colorazione automatica, con l’implementazione di strumenti atti a migliorare e ottimizzare l’analisi dei materiali, con la definizione di open data sempre più vasti e addestramenti specifici. In senso generale ci possiamo chiedere infine quanto bene funzionano adesso, a fine 2021, i sistemi di colorazione automatica, se abbiano una resa interpretativa > 50 e tendente a valori sempre più alti. Se per la risposta prendiamo in esame la migliore immagine possibile – da una serie di foto da me scattate in analogico e in bianco e nero a Pistoia nel marzo 1985 – si potrebbe affermare che siamo a un risultato vicino a 100 [fig. 15].


Figura 15 Pistoia, marzo 1985. Foto originale; colorazione DeOldify. Proprietà ed elaborazione dell’Autore
Senza eccedere, ovvero su alcune centinaia di immagini processate scegliere il risultato ottimale, in un quadro più generale – sulla base delle prove condotte, con diversi algoritmi a partire da alcuni rilasciati dal 2016 sino ai più aggiornati del 2021 – è possibile affermare che la colorazione automatica sia una tecnica promettente, applicabile nei campi indicati (e anche in altri possibili), ma che risente ancora di una mancata quanto necessaria specializzazione. La procedura è utilizzabile con risultati positivi – processando magari per grandi corpus di immagini per ottimizzare i risultati con una sorta di ridondanza – ponendo tuttavia attenzione ad alcuni aspetti. È necessario approfondire, con il confronto di immagini colorate manualmente o illustrazioni, il contesto delle fotografie originali, procedendo poi a un’analisi comparativa dei risultati, indirizzati sia a una calibrazione dell’algoritmo, se il processo è sviluppato in autonomia, sia valutando caso per caso e introducendo la possibilità di una lieve postproduzione delle foto risultanti. Abbiamo osservato che Antic, algoritmo che restituisce risultati ragionevoli, ha limiti con lo spettro del rosso, che diventa il colore dominante in alcune parti dell’immagine, come nell’abbigliamento, aspetto legato a una non corretta interpretazione del supporto ortocromatico, cieco al rosso. In questo caso, considerandolo un errore noto, è possibile intervenire con una successiva elaborazione che sulla base di indicazioni rilevate ad esempio da illustrazioni è in grado di attribuire a quel rosso un colore corretto. Il progetto Time-Travel Rephotography rappresenta un’evoluzione con la quale è necessario un confronto, sia nello sviluppo di nuovi algoritmi sia in senso più generale anche nell’ambito dell’uso della memoria, perché, seppur limitato alla figura umana, evidenzia come la colorazione automatica possa porsi nella ricostruzione della realtà storica in modo molto avanzato, dal quale non possono essere esenti errori di interpretazione se non si hanno chiare anche le metodologie e non solo le finalità.
Bibliografia
Campana, M. (1966). Tappeti d’Occidente. Milano: Fratelli Fabbri Editori.
Castagnola, G. (1955). Come fotografare a colori. Milano: Edizioni del Castello.
Castagnola, G. (1966). Guida alla fotografia a colori. Milano: Il Castello.
«Chromo-photographie» (1858). Cosmos. Revue encyclopédique hebdomadaiere des progrès des sciences et de leurs applications aux arts et a l’industrie, 13, 2.
Daguerre, L. (1839). Historique et description des procédés du daguerréotype et du diorama par Daguerre. Paris: Susse Frères.
De Maré, E. [1957] (1961). La fotografia. Firenze: Sansoni.
Feininger, A. [1957] (1962). Il libro della fotografia a colori. Milano: Garzanti.
Goethe, J.W. von (1810). Zur Farbenlehre. Tübingen: J.G. Cotta.
Goodfellow, I.J.; Pouget-Abadie, J.; Mehdi, M.; Bing, X.; Warde-Farley, D.; Ozair, S.; Courville, A.; Bengio, Y. (2014). «Generative Adversarial Networks». https://arxiv.org/abs/1406.2661.
Hill, L.L. (1856). A Treatise on Heliochromy; or the production of pictures, by means of light, in natural colors. New York: Robinson & Caswell.
Iizuka, S.; Simo-Serra, E.; Ishikawa, H. (2016). «Let there be Color! Joint End-to-end Learning of Global and Local Image Priors for Automatic Image Colorization with Simultaneous Classification». ACM Transactions on Graphics (SIGGRAPH), 35(4). http://hi.cs.waseda.ac.jp/~iizuka/projects/colorization/en/.
Jacobelli, J. (a cura di) (1987). Aspettando Robot. Il futuro prossimo dell’intelligenza artificiale. Roma-Bari: Laterza.
Jones, D.; Amaral, M. (2019). La Couleur du temps. Paris: Flammarion.
Joseph, A.D.; Nelson, B.; Rubinstein, B.I.P.; Tygar, J.D. (2019). Adversarial Machine Learning. New York: Cambridge University Press.
Kendrik, A.F.; Tattersall, C.E.C. [1922] (1973). Hand-Woven carpets Oriental & European. New York: Dover.
Guadagnini, W. (a cura di) (2011). s.v. «Levi L. Hill». La fotografia. Le La fotografia. Le origini 1839-1890. Milano: Skira, 94-9.
Luo, X.; Zhang, X.; Yoo, P.; Martin-Brualla, R.; Lawrence, J.; Seitz, S. (2020). «Time-Travel Rephotography». https://arxiv.org/abs/2012.12261.
Maltese, S. (2020). «Il Museo dell’Arte Classica e l’Archeologia Visuale». Panvini, R. (a cura di), Beni culturali: dai depositi alla valorizzazione. Modi, forme, esperienze e norme = Atti del Convegno (Catania, 24-25 febbraio 2020). Caltanisetta: Lussografica, 41-54.
Marin, C. (1957). La presa fotografica a colori. Trieste: Edizioni tecniche fotografiche.
Masland, R. (2021). Lo sappiamo quando lo vediamo. Cosa ci dice la neurobiologia della visione su come pensiamo. Torino: Einaudi.
Mauduit, X. (2019). Notre histoire en couleurs. Paris: Editions les Arenes.
Quintarelli, S. (a cura di) (2020). Intelligenza artificiale. Cos’è davvero, come funziona, che effetti avrà. Torino: Bollati Boringhieri.
Runsheng, Y. et al. (2018). DeepExposure: Learning to Expose Photos with Asynchronously Reinforced Adversarial Learning = 32nd Conference on Neural Information Processing Systems (NeurIPS 2018). Montréal, Canada.
Signorelli, A.D. (2020). «La storia in 4k su YouTube non convince gli storici». Wired, 4 novembre. https://www.wired.it/internet/web/2020/11/04/youtube-storia-4k/.
Turing, A. (1950). «Computing Machinery and Intelligence». Mind, 59, 433-60.
«Uno sguardo» (1859). «Uno sguardo alla scoperta e ai progressi della Fotografia: dell’avvenire di essa scienza». Rivista friulana. Scienze Arti Industrie Commercio, 1, 15.
Viale Ferrero, M. (a cura di) (1969). Impariamo a conoscere i tappeti. Novara: Istituto geografico de Agostini.
Wedgwood, T.; Davy, H. (1802). «An Account of a Method of Copying Paintings upon Glass, and of making Profiles by the Agency of Light upon Nitrate of Silver. Invented by T. Wedgwood, Esq. With Observations by H. Davy». Journal of the Royal Institution of Great Britain.
Zhang, R.; Isola, P.; Efros, A.A. (2016). «Colorful Image Colorization». Leibe, B.; Matas, J.; Sebe, N.; Welling, M. (eds), Computer Vision – ECCV 2016. Lecture Notes in Computer Science, no. 9907. https://doi.org/10.1007/978-3-319-46487-9_40.