Tutto ciò che chiamiamo reale è fatto di cose che non possono essere considerate reali. A giusta ragione, questa frase di Niels Bohr viene considerata la risposta moderna alla domanda che si pongono da millenni i filosofi e i fisici: cosa è reale? Gli anni che vanno dal ‘600 al ‘900 sono stati scientificamente fertili e fecondi. All’eterno dilemma su cosa sia reale e cosa non lo sia, hanno risposto Galileo, Newton, Spinoza, Gauss ,Hegel, Marx, Schopenhauer,Nietzsche, Einstein, Bohr, Planck, Heisenberg e Fermi… solo per citarne alcuni. Sta di fatto che la conclusione a cui è giunta la fisica quantistica è sintetizzata efficacemente in quella frase pronunciata da Bohr. Conclusione che continua ad avere sostenitori e detrattori, come è sempre accaduto per i paradigmi scientifici che si sono susseguiti nel corso dei secoli. Il calcolo differenziale e la statistica, in questo processo verso la conoscenza, hanno avuto un ruolo determinante, perché hanno permesso, tra le altre cose, di dare un senso all’infinito filosofico e all’indeterminazione atomica. Uno dei capisaldi della meccanica quantistica è proprio il principio di indeterminazione di Heisenberg, sintetizzato dalla relazione ∆x * ∆p ≈ h/2π, la quale, per i non addetti ai lavori, significa che la misura precisa della posizione, o della quantità di moto, di una particella implica un’indeterminazione nella misura dell’altra variabile in un intervallo, chiamato ampiezza di probabilità, definito per l’appunto dalla quantità h/2π. Questa relazione spiega in parte l’affermazione di Bohr. Mi piacerebbe divagare sulle questioni statistiche associate alla fisica e alla filosofia, ma non è l’obiettivo di questo articolo. Voglio invece soffermarmi sul futuro della statistica sociale ed economica e sulla pericolosità di una statistica che, nei tempi moderni, viene privata sempre di più della sua essenza, ovvero di quel legame stretto con il metodo scientifico.
Il metodo scientifico, frutto degli studi di quel genio anarchico e irriverente che portava il nome di Galileo Galilei, prevede alcuni punti fondamentali che vale la pena citare:
– l’osservazione del fenomeno;
– l’individuazione e la a misurazione delle variabili in gioco;
– la formulazione dell’ipotesi;
– la verifica dell’ipotesi tramite esperimento;
– la formulazione della legge;
– la riproducibilità dell’esperimento.
Anche un occhio poco esperto può intuire la completezza e l’assolutezza di un approccio di questo tipo nella descrizione dei fenomeni naturali. È importante soffermarsi un istante sulla parola “naturali”, perché lo stesso Galileo, nel Saggiatore, scrisse le seguenti (lapidarie) parole: “ il Libro della natura è scritto nella lingua della matematica, i cui caratteri sono triangoli, cerchi e figure geometriche”. Poco importa se, in seguito, la geometria euclidea è stata affiancata da geometrie di altro tipo e se il calcolo differenziale ha permesso di concepire l’infinito e l’infinitesimo da un punto di vista matematico, ciò che conta è che il linguaggio della natura è rimasto sempre lo stesso: la matematica e la geometria. Nel momento in cui ho iniziato a occuparmi dei fenomeni sociali, ho cominciato a chiedermi quale fosse il linguaggio in cui sono scritte, che so, il mercato del lavoro, le dinamiche demografiche, gli andamenti occupazionali o le previsioni economiche. Da subito, ho avuto la sensazione che alla base della descrizione di questi fenomeni c’è sicuramente una componente matematica, ma c’è anche una forte componente empirica e una semplificazione selvaggia di numerosi aspetti associati ai diversi fenomeni analizzati. La conclusione a cui sono giunto è che forse perché è stato commesso un errore di fondo, affiancando la parola scienza alle parole lavoro, sociale, demografia ed economia. È possibile applicare il metodo scientifico ad ambiti che non siano lo studio dei fenomeni naturali? No. Qualsiasi riferimento al rigore scientifico, in ambiti diversi da quello “naturale”, dovrebbe essere evidenziato ogniqualvolta viene pubblicata un’analisi statistica, affinché non vengano confuse la completezza e l’assolutezza del metodo galileiano con il relativismo di altri metodi, molto meno assoluti e soggetti alle interpretazioni personali, alla scelta dei modelli applicati e alle chiavi di lettura del fenomeno. Per questo motivo, molte analisi statistiche (fortunatamente non tutte) diventano spesso “banalisi” statistiche, ovvero statistiche estremamente banali e pericolose, realizzate attraverso l’applicazione di modelli e standard preconfezionati, “mordi e fuggi, che non richiedono nessuno sforzo creativo, con cui mistificare il relativismo delle interpretazioni, spacciandolo per una scienza esatta e attribuendogli poteri descrittivi rigorosi che oggettivamente non possiedono, perché non rispettano i canoni del metodo scientifico. Le banalisi statistiche vengono prodotte in serie, meccanicamente, senza lo spirito critico e, soprattutto, senza la consapevolezza dell’utilità per la collettività. Questo non significa che le banalisi statistiche non abbiano alla base delle teorie solide, tutt’altro, significa che, frequentemente, vengono usate delle teorie solide per vendere il fondo di una bottiglia, spacciandolo per uno smeraldo purissimo. La gaussiana funziona per descrivere, che so, l’andamento dell’altezza degli italiani? Certo che funziona, ci mancherebbe altro! Funziona in questo e in tutti quei casi in cui si tratta di descrivere e analizzare la distribuzione di un set di dati. Un conto, però, è l’applicazione della gaussiana ai rilievi astronomici e ai relativi errori di misura, un altro conto è la sua applicazione alla conta dei conigli: lo strumento è lo stesso, ma cambia il contesto in cui viene applicato. Si potrebbe dire che un’analisi statistica seria si differenzia da una banalisi statistica in base al contesto in cui si applicano gli strumenti statistici. Il problema è che in molti contesti vale ciò che scriveva Huff, negli anni ’60, in un famoso saggio intitolato Mentire con le statistiche: Se torturi i dati abbastanza, alla fine confesseranno quello che vuoi,
Supponiamo, però, per assurdo, che non esistano degli invasati delle banalisi statistiche, ma soltanto degli onesti analisti che attribuiscano ai dati relativi a un certo ambito della conoscenza (diciamo pure meno nobile di altri) un semplice e normalissimo ruolo sociale, senza nessuna pretesa di rigore scientifico nel senso stretto del termine. Un rigore scientifico, diciamo così, amatriciano…
La scienza, da che mondo è mondo, si contrappone spesso al senso comune e alle percezioni degli esseri umani: nel momento in cui gli strumenti scientifici vengono usati per descrivere questioni associate a un insieme di variabili imprevedibili e aleatorie, quelle umane, che perdipiù vengono semplificate selvaggiamente, bisogna avere il coraggio di contestualizzare le statistiche in una dimensione diversa da quella assolutistica e incontrovertibile che attualmente gli viene attribuita. Le banalisi statstiche indagano principalmente due aspetti riguardanti gli ambiti sociali ed economici: le previsioni e lo stato delle cose a un tempo t-1 (generalmente all’anno precedente). Poiché il tempo misurato sulla terra è frutto di una convenzione, si potrebbe fare una divagazione filosofica di pagine e pagine sul relativismo e sull’assolutezza, ma andiamo oltre.
Da un decennio, si sono affermate le statistiche dei flussi in tempo reale, che, non a caso, vengono utilizzate efficacemente da chi usa il linguaggio del profitto e non della natura. Poiché le istituzioni non parlano lo stesso linguaggio del profitto, o almeno non apertamente, ma hanno la pretesa di insegnare come si fa a chi sa fare, abbiamo assistito negli anni a un’inutile corsa alle banalisi dei big data da parte dei soggetti più disparati, che hanno accumulato quantità importanti di dati, senza sapere cosa farci. Risultato? Il mondo ancora aspetta che, da qualche parte, in uno dei tanti convegni, si presenti una qualche scoperta sensazionale che superi quella marea di interventi scontati, scanditi dalle parole “nuovo petrolio”, “blockchain”, “machine learning”, etc.
La voglia di prevedere il futuro non è una grossa novità: un tempo si utilizzavano le viscere degli animali, oggi si usano le statistiche. Sembra paradossale, ma il risultato è esattamente lo stesso, perché la maggior parte delle volte è il caso a dettare la validità di una previsione e non la matematica. Per chi volesse togliersi lo sfizio di approfondire questo aspetto, consiglio di leggere un testo di Cicerone, De divinatione, da cui è tratto il passo seguente: “Dunque un indovino sarà più bravo di un navigatore nelle previsioni del tempo, o diagnosticherà una malattia con più perspicacia di un medico, o deciderà in anticipo il modo di condurre una guerra meglio di un comandante? Il medico prevede l’aggravarsi di una malattia seguendo il filo di un ragionamento; e allo stesso modo il comandante prevede un agguato, il navigatore le tempeste; eppure anch’essi, non di rado, si sbagliano, pur non formandosi alcuna opinione senza una ragione ben precisa; così come il contadino, quando vede un olivo in fiore, ritiene che vedrà anche i frutti, non senza ragione; e tuttavia qualche volta si sbaglia. E se si sbagliano coloro che nulla dicono senza aver fatto qualche ipotesi e qualche ragionamento probabile, che cosa dobbiamo pensare delle profezie di quelli che predicono il futuro in base alle viscere, agli uccelli, ai prodigi, agli oracoli, ai sogni?”
Si potrebbe obiettare che Cicerone non aveva gli strumenti matematici necessari per stimare le probabilità che un certo evento accadesse. Obiezione acuta, ma sbagliata.
Il Sole 24 Ore, supportato sempre dalle statistiche degli istituti internazionali di ricerca pubblici e privati, in un articolo della sezione Infodata del 15 gennaio 2022, dal titolo “Le previsioni (sbagliate) del 2021 e quelle per il 2022”, scrive: Nel 2020, quasi nessuno aveva previsto una pandemia, come avevamo rilevato qui discutendo di cigni neri e rinoceronti grigi. Nel 2021, chi avrebbe previsto il successo degli NFT? O solo che una nave portacontainer bloccasse il canale di Suez per giorni generando perdite milionarie su tutte le Borse mondiali? Come sappiamo bene la palla di cristallo in grado di prevedere il futuro non esiste. Al massimo possiamo stimare la probabilità che alcuni eventi possano accadere. Con un ampissimo margine di errore.
L’articolo termina con una considerazione che non lascia via di scampo: “La domanda vera è un’altra: perché ci avventuriamo in questo esercizio stilistico di inizio anno? Sappiamo che gli esseri umani temono l’incertezza, le previsioni servono anche a questo, a renderli più sicuri. E dopo quanto ci è accaduto in questi ultimi due anni siamo certi di essere davvero incerti anche di fronte ad eventi imprevisti ma prevedibili come nel caso di una pandemia.
Quindi, perché dovremmo prestare attenzione alle predizioni?”.
Già, perché dovremmo prestare attenzione alle predizioni? Lasciando le predizioni ai maghi e ai fanatici delle banalisi statistiche, potremmo dire che le statistiche socioeconomiche sono una specie di nottola di Minerva di hegeliana memoria e che si limitano a descrivere rigorosamente i fatti dopo il loro accadimento. Giusto, ma sbagliato. Giusto perché, con un margine molto ampio di errore (errore che peraltro non viene quasi mai messo in evidenza, a corredo dei dati diffusi), la statistica descrive un certo fenomeno a giochi fatti. Sbagliato perché la funzione giustificatrice della statistica, in una società che ha perso il senso della collettività, non serve assolutamente a nulla. Marx, sulla sua tomba, come epilogo di una vita vissuta all’insegna della rivoluzione, ha voluto che fosse scritto il seguente epitaffio: “I filosofi hanno interpretato il mondo; ora si tratta di trasformarlo”.Per tutta la vita aveva contestato fortemente il giustificazionismo, benché, da Platone in poi, proprio come la nottola di Minerva, la filosofia avesse una sua utilità ai fini della comprensione della realtà. Le banalisi statistiche non possono limitarsi al giustificazionismo, per due motivi differenti che analizzeremo attraverso il nemico più agguerriti del metodo scientifico: il senso comune.
Nel palazzo in cui sono cresciuto, negli anni ‘70, ogni famiglia aveva almeno un figlio. La società aveva ancora degli strascichi patriarcali, l’emancipazione femminile era agli inizi, la famiglia era “quasi” solo quella tradizionale e le coppie, benché scoppiate, restavano insieme tutta la vita. Si poteva definire un “palazzo” giovane, in cui l’aspettativa di vita media era di circa 70 anni e l’età era più o meno rappresentata da un grafico di questo tipo
Cosa è successo, in quel palazzo? Nel 2022, molti vecchi inquilini non ci sono più, alcuni sono deceduti, altri hanno cambiato residenza, i nuovi arrivati hanno un’età media intorno ai 40 anni e non hanno figli. In altre parole, il “palazzo” è invecchiato. Perché? Beh, di motivi ce ne sono molti e fanno parte di quell’insieme di variabili statistiche associate al genere umano che non sono sintetizzabili e semplificabili efficacemente come nella descrizione di un fenomeno naturale, che, paradossalmente, è molto più complesso, ma descritto con rigore dalla matematica. La società è diventata meno patriarcale, è stata inventata la pillola anticoncezionale, le donne hanno acquistato indipendenza e, a fatica, pezzi di uguaglianza, gli stili di vita sono cambiati, il neoliberismo ha esasperato l’individualismo e i consumi, è più facile viaggiare e più facile lasciarsi… fatto sta che si fanno meno figli. Poi, c’è da aggiungere che la medicina ha fatto progressi enormi e l’aspettativa di vita media è passata dai 70 anni agli 84 anni. Tutti eventi ipotizzabili ma non facilmente prevedibili nel lungo termine. In poche parole, l’età del mio condominio è rappresentata da un grafico che ha un andamento diverso dal precedente.
A questo punto, si può fare subito una considerazione: il mio condominio è un coacervo di luoghi comuni in cui possono proliferare le banalisi statistiche. Qualsiasi condomino, che non conosca la statistica, semplicemente osservando la dinamica demografica del condominio, potrebbe dire: “Il palazzo invecchia”. Goliardia a parte, viene da chiedersi: “A cosa serve conoscere l’età degli abitanti di un condominio?”. Oltre a fornire un argomento di conversazione alla comari, serve essenzialmente a due cose: a prevedere come saranno i futuri condomini e a migliorare il palazzo, per renderlo adeguato ai suoi abitanti.
Le previsioni, sempre loro, l’eterno gioco, l’eterna tentazione di immaginare cosa accadrà sulla base di cosa è accaduto. Si tratta di una tentazione forte, da cui è difficile liberarsi. Ebbene, qualcuno dovrà pur dirlo e a me tocca l’ingrato compito: sostenere che la popolazione è invecchiata non significa che la popolazione invecchierà, significa presumere, sulla base del buon senso, che, se non accadrà nulla di eccezionale, l’andamento resterà più o meno quello. Ma se non accade nulla, significa che la storia resta la stessa e che non ci sarà mai una pandemia particolarmente aggressiva, o una guerra mondiale, con un possibile esodo di giovani mamme con bambini al seguito, che magicamente potrebbero dare nuovamente senso alla piramide delle età degli anni ‘70.
Figuriamoci, una guerra mondiale, nel 2023… è poco plausibile…
Il mio timore è che la signora del piano terra, che peraltro cucina degli struffoli buonissimi, al pari di molti esperti, facendo ricorso al senso comune, si possa proporre su Tik Tok come esperta di banalisi statistiche. Certo, lei usa un linguaggio più diretto e meno ricco di infografiche, ma, quando sostiene che “Nel condominio ci sono tutti vecchi, è evidente che la popolazione italiana sia invecchiata, dice esattamente le stesse cose dette dagli esperti, che perdipiù non sanno nemmeno cucinare gli struffoli.
Ecco, questo modo di usare la statistica a me non piace per niente. La scienza è una cosa troppo seria e non merita di essere strumentalizzata dai cialtroni e dai maghi.
Ricordate?
– Osservazione del fenomeno;
– Individuazione e la a misurazione delle variabili in gioco;
– Formulazione dell’ipotesi;
– Verifica dell’ipotesi tramite esperimento;
– Formulazione della legge;
– Riproducibilità dell’esperimento.
I fenomeni sociali hanno una limitata “riproducibilità dell’esperimento” e, a differenza di un oggetto che cade al suolo, un insieme di variabili troppo imprevedibili con cui fare i conti. Per questo motivo, la maggior parte delle statistiche diffuse fa uso di modelli, più o meno funzionanti, che restituiscono dei risultati spesso interpretabili, spesso sbagliati e spesso dipendenti dal modello adottato. In questo contesto intellettualmente povero e limitato, non è difficile immaginare un futuro in cui, tra poco, le banalisi statistiche faranno a meno degli statistici.
Prima che impedissero l’accesso a ChatGPT, ho provato a testarne l’abilità statistica con qualche domanda, immaginando lo scenario dei prossimi vent’anni. Le risposte, benché ancora imprecise e rudimentali, sono comunque inquietanti e indicative.
Facendo ricorso all’intelligenza artificiale, è già possibile conoscere, seppur con un certo errore, alcuni dati demografici. Se è vero che siamo ancora lontani dagli standard dei report diffusi dagli istituti internazionali di statistica, è anche vero che l’AI sta muovendo i primi passi e che immaginare un sistema in grado di generare grafici ed elaborazioni anche molto complessi, che faccia ricorso alla totalità dei modelli conosciuti e che sappia scegliere il miglior modello in termini di precisione e di minimizzazione dell’errore, non è fantascienza. In altre parole, da qui ai prossimi anni, le banalisi statistiche saranno affidate sempre di più agli algoritmi. Questo aspetto, che potrebbe gettare nello sconforto molti addetti ai lavori, quelli che hanno bisogno delle pubblicazioni più di quanto le pubblicazioni abbiano bisogno di loro, è un bene per la comunità scientifica. Gli statistici, finalmente, torneranno a occuparsi di statistica e gli indovini a leggere il futuro nelle viscere degli agnelli sacrificali.
Fin qui, è rimasto fuori il secondo aspetto, quello che darebbe un senso a una statistica di questo tipo: l’adeguamento del palazzo alle caratteristiche dei condomini. Purtroppo, anche volendo riconoscere un’utilità alla funzione giustificatrice, il mio palazzo è rimasto esattamente quello degli anni ’70. Non ci sono i montascale e l’ascensore non è adeguato a ospitare persone con disabilità; in compenso, gli inquilini anziani sono costretti a comunicare con l’amministratore attraverso la posta elettronica e a fare le riunioni in videoconferenza. Insomma, tutte cose che ignorano l’invecchiamento del palazzo.
Certo, alla statistica non interessano le sorti degli struffoli e di un condominio di periferia: ragiona su scala globale. Ed è proprio su una scala globale che le cose peggiorano… Nel palazzo Italia, in cui bisogna fare i conti con un invecchiamento ben più grave di quello del mio condominio, le banalisi statistiche, benché discutibili e sofferenti di tutte le mancanze che abbiamo evidenziato, potrebbero avere una loro utilità, ma sono totalmente ignorate dai decisori politici. In un Paese palesemente invecchiato, gli anziani sono costretti ad avere lo SPID, a prenotare i servizi su internet, a comunicare tramite email, a subire tagli continui alla sanità e all’assistenza, ad avere un’auto nuova per poter fare la spesa, o una visita medica, nella ZTL, ad attendere tempi biblici per un accertamento medico e a elemosinare una badante fidata dal parroco del paese, a raccomandarsi ai figli, ai nipoti, o al vicino di casa, per rinnovare la carta d’identità. Questo ragionamento, seppur limitato a un ambito di conoscenza preciso, la demografia, può essere generalizzato a qualsiasi altro ambito dominato dalle banalisi statistiche. Il lavoro, per esempio, o l’economia: chi aveva previsto internet, i Bitcoin, la spesa digitale e un sistema in cui una pizza, per essere consegnata, impiega meno tempo ad arrivare a casa di un’autoambulanza? Lo so, è sconfortante pensare che uno strumento indispensabile per indagare sulla struttura della materia sia stato strumentalizzato per cause molto meno nobili. Ma se non servono a fare le previsioni e non servono per guidare le scelte dei decisori politici, a cosa servono, le banalisi statistiche? Servono per partecipare a dei convegni in cui si riuniscono i banalisti, massimi esperti di banalisi statistiche, per dirsi reciprocamente quanto sono bravi a fare le banalisi statistiche. Servono per scrivere pubblicazioni inutili in cui si cerca goffamente di dimostrare non solo cosa è reale in un mondo fatto da cose irreali ma anche come sarà la realtà del futuro, senza avere la minima idea di come sia la realtà del presente. I banalisti e la banalità del male.