documenti
indietroindiceavanti
47) Julian Hochberg

La rappresentazione di cose e persone

5. La rappresentazione dette facce: fisionomia e carattere.(I)

da Gombrich, Hochberg, Black: Arte e percezione della realtà, (come pensiamo le immagini)

Nuovo Politecnico - Einaudi,1978
Il mondo degli oggetti rigidi è pieno di regolarità fisiche.
Alcune di queste sono prodotte dall'uomo (per esempio, la prevalenza di angoli retti e di spigoli paralleli), alcune sono naturali (per esempio, il rapporto tra la grandezza dell'immagine e la distanza che produce la prospettiva lineare).
Per questa ragione, è di solito facile domandare se un quadro appaia distorto o no, poiché il soggetto ha una qualche idea di come apparirà una scena anche se non l'ha mai vista prima: un De Chirico appare distorto anche se il paesaggio rappresentato non è affatto familiare, ma che dire degli oggetti non rìgidi o, più in specifico, di quella classe di oggetti semirigidi, le facce, di cui sono fatti i ritratti?
Gombrich ha di recente rivolto l'attenzione a tre problemi di vecchia data.
Due di questi sorgono dal fatto che le facce in quanto oggetti sono diverse tra loro sia perché le persone differiscono nelle loro fisionomie permanenti, sia perché ogni persona muta da momento a momento man mano che i tratti si deformano in trasformazioni non rigide (Gibson 1960).
Come ci è possibile dire, allora, se un ritratto è somigliante o distorto, non conoscendo il modello? e inoltre, come sappiamo se una particolare configurazione di una faccia in un quadro (per esempio, le narici dilatate) rappresenta lo stato di riposo di una persona con quel particolare carattere fisionomico o presenta invece un'espressione momentanea che deforma temporaneamente lo stato di riposo (per esempio, un'espressione beffarda)?
Ovviamente, in entrambi i casi ci sono limiti a ciò che siamo disposti ad accettare come ritratti accurati. Nessuno in realtà ha mai assomigliato a un ritratto di El Greco o di Modigliani e certamente nessuno considera questi dipinti come proiezioni accurate di modelli mostruosamente allungati. Ci devono inoltre essere limiti al grado di ambiguità che un quadro presenta riguardo l'espressione e i tratti ereditari: certamente nessuno prende gli angosciati dipinti di Munch o Goya per stati di riposo di fisionomie devianti.
Il terzo problema si collega agli altri due.
Perché sembriamo attribuire espressione a configurazioni di stimoli che in alcuni casi appaiono adatte a suscitare tali risposte (ossia, facce umane con i tratti disposti secondo un certo atteggiamento emotivo familiare), ma che in altri casi sembrano lontane sia dall'espressione sia dall'affetto?
Tra i casi che appare difficile spiegare vi sono quelli in cui più persone sembrano trovare un accordo sulle qualità affettive di ciò che appare come uno "scarabocchio" insignificante sulla carta (Arnheim 1966). E se questi scarabocchi evocano risposte affettive e emotive in chi li osserva, non sembra ragionevole considerare le nostre risposte ai ritratti come casi speciali di questa più generale risposta " estetica" o "espressiva" alle configurazioni visive?
La soluzione dei gestaltisti era che lo "scarabocchio", una certa configurazione di pigmento sulla tela organizzata come ritratto e il nostro stato affettivo producono gli stessi campi cerebrali, ma questa soluzione è troppo generale per essere utile.
Come parziale risposta a questi problemi, Gombrich ha proposto, in questo volume, l'idea che le facce siano codificate in base al contenuto espressivo e che questa codificazione non si produca tanto in termini visivi quanto in termini muscolari.
Tale idea sta alla radice della teoria dell'empatia di Lipps. Questi ha tentato di spiegare l'estetica nei termini della risposta emotiva o reattiva prodotta dall'osservatore quando guarda stimoli anche relativamente semplici. Se quest'idea appare attraente è perché sembra spiegare le qualità affettive così spesso attribuite all'arte astratta e non-figurativa e al tempo stesso, la risposta espressiva che sembriamo produrre di fronte a facce che non conosciamo o persino di fronte alla più grezza caricatura.
Dire che codifichiamo i nostri simili nei termini della nostra risposta muscolare, può essere considerata come un'affermazione poetica. Tuttavia, le si può anche assegnare un significato specifico ed è possibile usarla per predire quali aspetti delle persone non riusciremo a distinguere o a ricordare, ossia, quegli aspetti per cui non esiste un'appropriata risposta empatica muscolare.
Per esempio, Gombrich ha suggerito che è forse questa la ragione per cui non saremmo capaci di descrivere il colore degli occhi o la forma del naso di qualcuno anche se lo sappiamo riconoscere senza alcuna esitazione. Tale suggerimento comporterebbe forse una formulazione intensiva della spiegazione basata sul concetto di codificazione del movimento muscolare: ossia, che solo programmi muscolari vengono immagazzinati, ma certamente questa formulazione intensiva non è né plausibile su basi a priori (cfr. anche il contributo di Gombrich), né è confermata dai risultati degli esperimenti sul riconoscimento di facce e sul riconoscimento dell'espressione.
Per studiare questo tipo di problema gli psicologi hanno progettato tecniche con un diverso grado di efficacia, cercando di determinare la natura degli insiemi di immagini interne usati in un certo processo psicologico (o, più in particolare, la dimensionalità dell'immagazzinamento).
In generale, come abbiamo visto, le discussioni introspettive non sono molto utili e ciò è vero sia per gli insiemi di immagini interne sia per la percezione in generale.
Si sono elaborate tecniche che ci potessero fornire misure più obiettive dei tipi di informazione che vengono codificati e immagazzinati, tuttavia, anche se queste misure in genere non si rapportano bene alle valutazioni date dai soggetti stessi circa la forza delle immagini, hanno sempre una propria validità. Si sono usati tre tipi generali di metodo.
Il primo consiste nel dimostrare che l'informazione in questione si acquisisce meglio tramite una modalità sensoria piuttosto che un'altra ossia tramite la presentazione visiva piuttosto che la presentazione auditiva. Questa tecnica non è forse direttamente applicabile ai tipi di immagini di cui discutiamo.
Il secondo consiste nel dimostrare che il soggetto può eseguire compiti più appropriati a una modalità sensoria piuttosto che un'altra. Per esempio, se proiettiamo brevemente su uno schermo una batteria di numeri e poi chiediamo al soggetto di ripetere rapidamente a memoria le cifre diagonali, è probabile che ci riesca se la sua memoria ha una struttura visiva piuttosto che verbale.
L'argomentazione di Gombrich circa l'incapacità di ricordare il colore degli occhi tende a confermare la realtà dell'immagazzinamento non visivo, in base alla logica di questo secondo metodo. Ci dovremmo inoltre aspettare, applicando tale logica alla formulazione intensiva della teoria dell'empatia, che dopo aver osservato immagini di estranei, non saremmo capaci di identificarli se, alternando alle prime altre immagini di estranei, la prima serie di modelli mostrasse alla seconda presentazione espressioni diverse da quelle viste nella prima.
Sta di fatto però che in tali condizioni riusciamo a riconoscerli (Galper e Hochberg, in corso di stampa), non è dunque facile sostenere che codifichiamo e immagazziniamo le persone solo in base alle loro espressioni (muscolarmente o in altro modo).
Il terzo metodo di misurazione delle immagini interne consiste nell'introdurre interferenze di un determinato tipo sensorio: se riesco a confondere la prestazione dell'osservatore tramite la distrazione visiva e non tramite la distrazione auditiva, ciò significa che il meccanismo mnemonico in atto è in quel senso più visivo nella struttura che auditivo.
Kowall e io abbiamo impostato un esperimento di questo tipo per verificare l'ipotesi secondo cui l'espressione è codificata in termini di cinestesi o di progetti muscolari.
Abbiamo di recente presentato a soggetti una serie di immagini di una stessa faccia, in una sequenza di espressioni diverse, presentata al ritmo di 3 al secondo. Il compito del soggetto consiste nell'identificare l'ordine in cui le espressioni ricorrono, indicandolo su una serie di immagini ferme della stessa faccia.
Poiché la sequenza scorre troppo rapidamente per permettere al soggetto di rispondere nell'intervallo tra due presentazioni e questi deve codificare e immagazzinare l'intera sequenza e quindi ripercorrerla nel momento in cui decide l'ordine di successione e poiché vengono presentate troppe espressioni diverse perché il soggetto possa ritenerle nella memoria immediata, questi deve guardare la sequenza parecchie volte prima di saperlo fare correttamente.
Durante una delle diverse fasi di visione, si richiede al soggetto di eseguire a sua volta una rapida serie di diverse espressioni facciali; ci si dovrebbe aspettare che sia i suoi piani motori che i suoi insiemi di immagini cinestesiche interferiscano col riconoscimento della sequenza delle facce, nella misura in cui le espressioni sono codificate muscolarmente. Purtroppo, non siamo riusciti a dimostrare alcuna interferenza con la codificazione che fa il soggetto dell'insieme di espressioni e nemmeno con la sua capacità di riferire il loro ordine di successione.
Le prove sperimentali a sfavore della formulazione intensiva della teoria dell'empatia non sono affatto definitive, ma non spingono certo ad accettare tale teoria.
La teoria dell'empatia nella sua formulazione intensiva avrebbe fornito una serie di concetti vincolanti riguardo le risposte che produciamo di fronte alle facce e un repertorio entro il quale diverrebbero spiegabili gli effetti di ogni ritratto.
Per poter spiegare su nuove basi come percepiamo e rappresentiamo le facce, val forse la pena di riesaminare il problema.
Il problema è spiegare la risposta affettiva e espressiva che produciamo in rapporto alle facce, e spiegare inoltre come riusciamo a distinguere la buona dalla cattiva somiglianza e l'espressione temporanea dalla struttura facciale permanente.
La teoria dell'empatia spiega tutt'al più perché produciamo risposte espressive di fronte a configurazioni visive; essa, per le ragioni che seguono, è assai simile alla primitiva spiegazione empirista della percezione della profondità: dal momento che sembrava non vi fosse alcun modo di render conto dello spazio percepito nei semplici termini delle proprietà di quelle configurazioni pittoriche chiamate indizi di profondità e dal momento che l'attributo percettivo di spazio sembrava così chiaramente caratteristico dei ricordi tattili-cinestesici di azioni fatte nel mondo tridimensionale, le proprietà spaziali dei dipinti erano attribuite all'insieme di immagini tattili-cinestesiche che presumibilmente suscitavano.
La teoria dell'empatia, per ragioni molto simili, offre una spiegazione simile della percezione della faccia. Come nel caso degli indizi di profondità, né la logica né le prove sperimentali che essa offre sono convincenti.
Quando esaminiamo le abitudini percettive che l'osservatore probabilmente apporterà alla contemplazione dei ritratti, abitudini che si sono evolute in funzione dell'osservazione attiva delle facce per estrarne l'informazione necessaria a prevedere il comportamento altrui e a guidare il proprio, la natura della rappresentazione facciale assume una forma diversa.
Riguardo la percezione dell'oggetto nello spazio, possedevamo sia una regola generale circa il modo in cui vedremmo un dipinto (ossia, percepiamo quell'organizzazione di oggetti nello spazio che comunemente proietterebbe lo stesso tipo di stimolazione sull'occhio che sarebbe data da un dipinto) e una o due teorie plausibili per spiegare l'origine della regola.
Cosa c'è da rappresentare in immagini dipinte di facce?
In primo luogo, certo, se conosciamo il modello, potremmo chiedere se il dipinto è somigliante nel senso che ci è possibile riconoscere in esso il suo ritratto, ma anche se è il ritratto di una persona sconosciuta, comunica pur sempre qualche informazione, così come in un paesaggio dipinto che rappresenta una scena particolare da noi mai vista in realtà, ci è possibile notare se l'informazione è coerente.01
Un certo tipo di informazione riguarda le caratteristiche fisiche del modello, come la configurazione e la colorazione della testa in quanto oggetto semirigido, si ha inoltre informazione su sesso, età e razza.
Un altro tipo d'informazione riguarda lo stato temporaneo del modello, per esempio, la sua espressione emotiva. Un altro ancora sembra riguardare il suo carattere. Come può tutto ciò essere rappresentato dallo stesso insieme di tratti?
Quando ho parlato per la prima volta del problema relativo alla nostra capacità di dire se un dipinto rappresenta una deformazione espressiva transeunte o un tratto fisionomico permanente, ho osservato che ci sono limiti a ciò che saremmo disposti ad accettare come tratto fisionomico nessuno, per esempio, prenderebbe L'urlo di Munch per una faccia in riposo. Quest'affermazione diventa molto più importante se prendiamo in considerazione le configurazioni in cui di solito compaiono deformazioni espressive.
Espressione temporanea e tratto permanente non sono di necessità antonimi. Non si tratta di uno schema o-tutto-o-niente, non vediamo cioè un dato tratto o come espressione temporanea o come carattere permanente 8, e il problema può essere in parte risolto se consideriamo in modo abbastanza particolareggiato questo punto.
In particolare, il problema si semplifica se teniamo conto che i tratti della faccia non vengono di solito visti in modo isolato, non più di quanto singole parole siano lette al di fuori di un contesto. Fate attenzione: un momentaneo allargamento della bocca è chiaramente un'espressione diciamo, un sorriso fugace.02
Una bocca allargata, però, può essere anche una deformazione molto più protratta, senza essere un tratto fisionomico realmente inestirpabile: per esempio, un atteggiamento caratteristico di quella persona, che indica la sua propensione a essere compiacente. Naturalmente, potrebbe essere invece un carattere fisionomico inestirpabile, che non ha niente a che vedere con un'emozione momentanea e neanche con più durevoli disposizioni d'animo (cioè, può offrire all'osservatore un'etichetta con cui identificare la persona ritratta, non un segnale circa il suo probabile comportamento).
È vero che non riusciamo a distinguere le due cose? Io non credo.
Fisicamente, i muscoli facciali si muovono secondo schemi di espressione grezzi in risposta all'innervazione semplice (Duchenne 1876) e la tensione e la contrazione dei tessuti della faccia, sulla sottostante struttura rigida, offrono ridondanza all'occhio dell'osservatore.
In un sorriso semplice e spontaneo, per esempio, la bocca si tende e gli occhi si "increspano" (fig. a(I)).
In un sorriso prodotto volontariamente, in cui l'attore innerva i muscoli che allargano la bocca, si avrà una serie molto più piccola di deformazioni: per esempio, gli occhi possono rimanere immutati (fig. a(II)). Per distinguere questi due stati, che hanno diversi significati nell'interazione sociale, l'osservatore deve imparare a notare il rapporto tra bocca e occhi come tratto di distinzione tra due stati; sembrerebbe un compito non molto più difficile di quanto non sia per lui imparare i fonemi che separano un insieme di suoni da un altro (per esempio, riso da viso) 9.
Il sorriso fugace coinvolgerebbe gli occhi e le guance, oltre alla bocca, in una configurazione di tensioni che rivelano in modo lampante la propria transitorietà e imminente risoluzione. Un ritratto così concepito darà l'idea di aver afferrato un momento raggelato e ci darà forse poco circa il modello se non che costui o costei sono capaci di quell'azione umana.
Si può certo usare l'espressione fugace per identificare il quadro stesso o il momento, ma non servirebbe certo a identificare la persona: segnala il proprio mutare e scomparire.
Nel caso di un sorriso prolungato o abituale, d'altra parte, le tensioni devono essere minime (per esempio, gli occhi sarebbero attenti o gravi ma non increspati verso l'alto) e vediamo uno stato che può durare per un certo tempo.
Notate che un quadro, almeno che non sia caratterizzato in modo da indicare la propria natura momentanea e non caratteristica, sarà probabilmente preso per uno stato tipico dell'oggetto o della scena che rappresenta, in quanto sarebbe un'improbabilità statistica che il quadro riproducesse un momento non caratteristico (ciò è simile alla ragione per cui la buona continuazione è una determinante organizzativa così potente).
Il quadro ci permette così di predire (forse in modo sbagliato) la natura dei possibili atteggiamenti di risposta della persona. Oppure, mostra la faccia con parecchie deformazioni locali, che ci è possibile identificare come un certo atteggiamento, ma senza sapere forse quali siano le conseguenze comportamentali (come nella Gioconda).
In entrambi i casi, il ritratto ha un "carattere" più o meno ovvio.
Quel carattere ci servirà anche a identificare il modello e ci aiuterà inoltre a predirne le risposte sociali, nella misura in cui la configurazione dei tratti è chiaramente un'espressione abituale o non momentanea (molte espressioni abituali possiedono forse segni propri che le identificano come tali).
Così il paradosso apparente, relativo alla possibilità di giudicare o meno se il ritratto di qualcuno che non abbiamo mai visto ne abbia colto il carattere, è risolto: domandandosi quindi se scegliamo di considerare un determinato tratto come deformazione espressiva o come caratteristica relativamente permanente, la risposta può essere " tutte e due le cose".(continua)
8 Un'analogia seducente riguardo il problema espressione tratti ereditari ci è offerta dagli indizi di profondità illustrati nella figura 2e. Nel caso degli indizi di profondità, è vero in un certo senso che essi non possono essere configurazioni al tempo stesso piatte e in profondità: la strada ferrata non può essere al tempo stesso parallela e convergente. Naturalmente, non può essere le due cose nello spazio: i binari ferroviari di per sé sono paralleli, è la loro proiezione nel quadro che converge. In una certa misura, è vero che questo accoppiamento di esclusione fisico è rispecchiato nell'esperienza percettiva: a seconda dei momenti tendiamo a vedere o la configurazione piatta o quella spaziale. Ma anche qui, come abbiamo visto sopra, rispondiamo a entrambe nel senso che i giudizi sulla profondità pittorica sono di solito un compromesso. (torna su)
9 Notiamo che è la semplicità globale inerente (e ereditata) dell'innervazione di alcune espressioni facciali che le fa difficili da mimare. Proprio in grazia di ciò è facile produrre atteggiamenti non confondibili con espressioni spontanee e scoprire l'insincerità, abilità che sarebbe assai proficuo indagare. (torna su)
torna su
indietroindiceavanti