Se Protagora e Gorgia fossero vissuti in quest’epoca moderna, molto probabilmente sarebbero diventati degli ottimi sofisti dei dati. Il discorso privo di fondamento scientifico dei sofisti, affiancato alla fideistica verità proiettata nei dati, può sembrare un’associazione ossimorica (in effetti, in alcuni casi lo è), ma in realtà descrive molto bene il “non metodo” diffuso tra diverse comunità pseudoscientifiche per creare delle narrazioni convincenti basate sui dati e sulle loro interpretazioni. Il sofismo, oggi, viene immaginato come l’esercizio fine a sé stesso di un’arte oratoria da ciarlatani menzogneri (idea che avrebbe fatto imbestialire Gorgia) e in effetti la sua applicazione è stata travisata e distorta proprio in questi termini, con l’aggiunta di una componente apparentemente rigorosa: l’ inequivocabilità dei dari. Se Protagora era ben consapevole delle potenzialità e dei limiti del discorso, i sofisti moderni, inconsapevoli della loro triste condizione, confondono spesso il rigore scientifico con le interpretazioni. E questo, dopo più di duemilacinquecento anni di cammino verso la ricerca della verità, è francamente inaccettabile. Il sofismo moderno si pone a un livello diverso da quello dei greci, perché usa i dati per far sì che le opinioni sembrino verità incontrovertibili. L’obiettivo, però, è il medesimo: convincere la comunità che le cose vadano in un modo piuttosto che in un altro. Alla base di questo processo c’è sempre lei, la narrazione, quella che, nel caso specifico, prende il barbaro nome di data storytelling: è evidente che i dati, per essere raccontati, debbano parlare una lingua ed è proprio su questo punto che verte la mia riflessione. Sulla base delle mie conoscenze scientifiche, posso dire con una certa ragionevolezza, sofisticamente parlando, che tutti i dati hanno qualcosa da dire, ma esistono dati di maggior valore e dati di minor valore. A dispetto delle parole, i dati di minor valore sono quelli che generano profitto e quelli di maggior valore sono quelli che generano conoscenza. I dati di maggior valore hanno un legame profondo con il metodo scientifico, con i processi induttivi, con i processi deduttivi e sono liberi da interpretazioni, perché la loro stessa esistenza corrisponde all’interpretazione. In altre parole, sono di maggior valore quei dati che raccontano “la verità”, in quanto confermano o smentiscono un’ipotesi scientifica, derivante dal “metodo”, quindi generalizzabile e riproducibile, attraverso un processo deduttivo. Il caso inverso, ovvero la raccolta dei dati che consente di giungere all’astrazione, e quindi all’ipotesi, è ugualmente “di maggior valore”, perché rientra a pieno titolo all’interno del metodo. Sì potrebbe scrivere a lungo su quale tipo di verità descrivano questo dati, ma non è questa la sede: mi limito a dire che, seppur possibile in ambito relativistico e quantistico, è abbastanza difficile che qualcuno si sogni di interpretare a proprio piacimento, che so, la relatività galileiana o le equazioni di Maxwell. Se quel qualcuno lo facesse, come è accaduto per i controintuitivi fenomeni quantistici, dovrebbe costruire una teoria nuova, verificata sperimentalmente da altri dati, costruendo di fatto un nuovo paradigma, per dirlo con le parole di Kuhn. In tutti gli altri casi, i dati di cui si dispone sono di minor valore, ovvero interpretabili, ovvero soggetti a errori più o meno grossolani, a punti di vista, a inesattezze o a una certa incompletezza di cui bisogna essere consapevoli, prima di fondarci un discorso che abbia l’ambizione di raccontare la verità. Gli empiristi ci hanno insegnato che, per “fondare un discorso scientifico”, occorrono un apparato logico-linguistico, un insieme di regole e un modello associato al suddetto apparato logico-linguistico: questi tre elementi, seppur con tutti caveat popperiani, distinguono ciò che è scienza da ciò che non lo è, e conseguentemente i dati di maggior valore dai i dati di minor valore. Un piccolo esempio può aiutare a capire meglio la differenza. Se io fossi un oculista e affermassi che, sulla base dei dati raccolti, gli interventi chirurgici alla cataratta sono sicuri, non mentirei, perché questa asserzione non è falsa ed è supportata dall’evidenza empirica. Tuttavia, nonostante la ragionevole “narrazione basata sui dati”, non è possibile sostenere che questa affermazione sia vera in assoluto, perché deve fare i conti con quel 3% di casi in cui, nonostante il rispetto dei protocolli, in modo del tutto inaspettato, si verifica il distacco della retina o la maculopatia. Un fisico liquiderebbe la questione dicendo che quell’esperimento “non è riproducibile”, quindi non rispetta il metodo scientifico. Di conseguenza, i dati su cui si basa rientrano nella categoria del minor valore. Al contrario, lasciando cadere un oggetto, non può accadere che nel 3% dei casi non valga la legge di gravitazione universale, come non può accadere che il calore passi spontaneamente da un corpo freddo a uno più caldo, perché, se così fosse, significherebbe che la natura abbia smesso di funzionare così come la conosciamo. Questo aspetto, non escludibile a priori, ricadrebbe in una di queste due condizioni:
- Esiste una spiegazione del perché un sasso vada verso l’alto e non verso il basso, spiegazione fornita dalla stessa teoria di gravitazione universale, e verificata attraverso i dati di maggior valore, che descrive l’anomalia del moto (per esempio l’assenza di gravità).
- Esiste una teoria più generale, verificata da altri dati di maggior valore, che, come accade per la relatività generale, spiega nel dettaglio le anomalie di un certo comportamento.
Ancora più catastrofica sarebbe la fallibilità del secondo principio della termodinamica, perché decreterebbe la fine del principio di conservazione dell’energia e di tutto ciò che ne consegue. Come lo sarebbe l’aleatorietà della rotazione terrestre… Cosa accadrebbe, se, anche solo per una volta, la terra decidesse di disobbedire a Keplero e di fermarsi arbitrariamente? Verrebbe immediatamente inghiottita dal sole e amen. Ciò non significa che la terra continuerà a orbitare in eterno intorno al sole: probabilmente, tra qualche milione di anni, collasserà con dinamiche ben note agli astrofisici. In definitiva, se i dati di minor valore possono permettersi il lusso di disattendere le promesse, i dati di maggior valore non possono farlo, perché sarebbe un vero e proprio dramma per la conoscenza e ancora di più per l’umanità. Questo non vuol dire che i dati di minor valore, e tutto il lavoro svolto su di essi, siano inutili, sarebbe sciocco affermarlo. Vuol dire che bisogna prestare molta attenzione, quando si esce dal contesto scientifico, per entrare in una dimensione molto più fragile e aleatoria. La tentazione di nobilitare qualsiasi tema con la parola scienza, in questi tempi, è fortissima: si parla di scienze economiche, scienze statistiche, scienze sociali e, per non farsi mancare nulla, addirittura di scienze giuridiche. Senza nulla togliere all’utilità di queste discipline, in esse non c’è nulla di scientifico, perché nessuna è basata sul metodo: non forniscono risultati riproducibili e sono fortemente aleatorie, perché dipendenti da fattori imprevedibili (basti pensare alle crisi economiche ricorrenti, agli eventi estremi che distruggono intere civiltà e all’impatto sociale di cambiamenti inaspettati, o indotti, come può essere l’avvento di internet, di una guerra o di un’epidemia). Conseguenza naturale di questa distorsione è che, in un mondo in cui tutto è scienza, nulla è scienza. In un mondo in cui i dati di maggior valore si confondono con i dati di minor valore, nulla ha più valore, al di fuori delle opinioni. Ed è proprio sui dati di minor valore che le masse di sofisti dilettanti si sentono libere di agire indisturbate, attraverso narrazioni basate su modelli interpretativi opinabili, per mezzo dei quali si giunge a conclusioni altrettanto opinabili e relativistiche. Perché quel 3%, che, in base ai casi, può essere 30% o 50%, rappresenta sempre un rifugio in cui è difficile sentirsi colpevoli ed essere incolpati. Ma se i dati di minor valore contengono intrinsecamente una certa ingannevolezza, come si fa, attraverso le loro interpretazioni, a distinguere il falso dal vero? Anche in questo caso, i sofisti darebbero una spiegazione convincente: ciò che la comunità assume come verità è vero, ciò che la comunità assume come menzogna è falso. Quindi, il fulcro attorno al quale ruota la verità dei dati di minor valore è la loro narrazione, affinché, non la più veritiera, ma la più convincente, venga accettata dalla comunità.
In questi ultimi anni si parla spesso di “data storytelling”, ovvero dell’ossimoro di cui parlavo all’inizio di questo articolo. Quando si trattano i dati di maggior valore, non c’è bisogno di costruire attorno a essi una storia: la legge di Gauss e i suoi dati parlano da sé, senza possibilità di scampo. Ma se, al posto della legge di Gauss, ci sono il PIL o le cause di morte, la narrazione è essenziale. In un paese di 500 abitanti, non basta dire che sono avvenuti 100 decessi in un anno, per liquidare la questione e stabilire una legge rispetto all’andamento della mortalità. Bisogna introdurre ulteriori elementi, che riguardano le cause, le modalità, le fasce d’età, i rischi, la serie storica, e applicare un modello interpretativo per trarre delle conclusioni che non saranno mai generalizzabili e riproducibili nel tempo. Nessuno è indenne dalla relatività delle interpretazioni e dalla pericolosità delle narrazioni. Le immagini che seguono descrivono la narrazione dei benefici ipotizzati dalla medicina, che da sempre fa riferimento alle scoperte delle scienze dure, rispetto alla radioattività, nei primi anni del ‘900. Per la contraccezione, erano stati inventati dei funzionalissimi profilattici radioattivi Radium Nutex, attraverso i quali, non è difficile crederlo, veniva quasi azzerato il rischio di gravidanze indesiderate.
.
I problemi della pelle potevano essere risolti con la saponetta Radia, che, attraverso l’azione combinata del Torio e del Radio, rendevano il viso “molto” luminoso, quasi fosforescente, e uccidevano qualsiasi batterio.
Per i problemi di virilità, c’erano le supposte Vita Radium, che, abbinate ai profilattici Radium Nutex, crearono i presupposti per dar luogo al celebre duello luminoso nel film Skin deep – Il piacere è tutto mio.
Cosa dire, poi, dell’acqua frizzante Lurisia, la più radioattiva del mondo, come recitava lo slogan, o del dentifricio Doramad (io sono la sostanza radioattiva, i miei raggi massaggiano le gengive)?
Anche in quel caso, c’erano i dati di maggior valore, quelli a supporto delle scoperte di Marie Curie sulla radioattività, e i dati di minor valore, quelli che ne osservavano superficialmente alcuni effetti, trascurandone altri, e ne decantavano le lodi attraverso una narrazione ampiamente accettata dalla collettività, quindi sofisticamente vera. Pensare che quei tempi siano passati, e che nei primi del novecento fossero tutti sempliciotti, mentre nei giorni nostri, essendo tutti illuminati, non si potrebbe mai arrivare a dei paradossi simili, sarebbe un errore imperdonabile. Probabilmente, tra cinquant’anni, accadrà qualcosa di simile con alcuni farmaci attualmente in commercio, con delle creme di bellezza, con dei materiali usati nelle costruzioni, o, peggio, con uno dei tanti dispositivi elettronici che vengono usati con disinvoltura. Com’è possibile difendersi dai sofismi e dalle narrazioni scricchiolanti basate sui dati, quindi? In primo luogo, evitando di soffermarsi all’apparenza, indagando, approfondendo, domandando, esercitando il senso critico, cambiando i punti di vista preconfezionati, interrogandosi sulla validità delle tesi sostenute e sulle finalità della narrazione, senza conferire una verità incontrovertibile alla lettura di chi, seppur con una qualche professionalità, ha tratto delle conclusioni basate su presupposti potenzialmente distorti o errati. Perché potenzialmente i dati di minor valore, se liberati dalla pretesa di verità, possono essere di grande aiuto alla collettività. Dico potenzialmente perché, come dimostrano le multinazionali e gli spaventosi business basati sui dati personali, in potenza le informazioni potrebbero essere usate per il bene della collettività, in atto, invece, vengono usate per renderla schiava e indottrinarla. Se un atteggiamento esageratamente critico è spesso sconsigliabile in molti ambiti medici, perché, nonostante quel 3% di fallimenti, per fare il chirurgo e operare alla cataratta occorrono metodi, conoscenze e strumenti raffinati, in molti altri ambiti è utile porsi di fronte ai dati di minor valore con la giusta razionalità, facendo attenzione in primo luogo agli stratagemmi narrativi adottati. Chi ha avuto la fortuna di leggere il Proemio di Protagora e di confrontare quello stile narrativo coniI Principia Mathematica di Newton sa bene di cosa parlo. Spesso, un dato mal interpretato è nascosto dietro un’aura pomposa e artefatta, utilizzata appositamente per costruire una narrazione convincente, per illudere (e illudersi) di rendere vero ciò che, nella migliore delle ipotesi, è semplicemente non falso. È ovvio che, per convincere qualcuno delle proprie ragioni, e della validità delle conclusioni a cui si è giunti, è necessario far ricorso a una insana e fastidiosa retorica: i dati di maggior valore non hanno bisogno di retorica e, soprattutto, non hanno bisogno di un discorso interpretativo che faccia uso del linguaggio. Questa asserzione consente di distinguere con una certa sicurezza una pubblicazione scientifica da una pubblicazione non scientifica. Se, ad esempio, voglio descrivere il decadimento beta negativo del Torio 234, non ho bisogno di giri di parole: basta scrivere qualcosa del genere:
Parimenti, se voglio descrivere la reazione tra una molecola di metano e due molecole di ossigeno, scrivo:
Al contrario, per fornire un’interpretazione del tasso di occupazione, sono costretto a far uso della lingua e dei dati di minor valore.
Il tasso di disoccupazione in Italia è stato del 6,1% a settembre 2024, rimanendo invariato rispetto alla revisione al ribasso del mese precedente, ai minimi da 17 anni e al di sotto delle aspettative di mercato del 6,2%, prolungando il periodo di ristrettezza nel mercato del lavoro italiano. Il numero di disoccupati è diminuito di 14.000 unità a 1.552.000, anch’esso il più basso negli ultimi 17 anni, compensando il calo di 63.000 unità nell’occupazione netta a 23.983.000. Di conseguenza, il tasso di partecipazione alla forza lavoro è sceso al 66,3%, il più basso da 19 mesi.
Quanta aleatorietà si nasconde dietro questo testo? In primo luogo, per comprenderne a fondo il significato, bisognerebbe conoscere la definizione di “Tasso di occupazione” e i metodi con cui viene calcolato. Poi, bisognerebbe approfondire quali siano e come vengano stimate le “aspettative di mercato”, poi, per avere un dato più vicino alla realtà, bisognerebbe capire le dinamiche del lavoro nero e l’impatto sull’economia, poi bisognerebbe essere certi che il modello e i metodi utilizzati per ottenere quei dati sintetici siano i migliori o, quantomeno, i più adeguati. Insomma, anche i meno esperti, attraverso questi esempi, riescono a comprendere l’enorme differenza tra i dati di maggior valore e i dati di minor valore.
Una pubblicazione in cui vengano trattati dei dati di minor valore si riconosce subito dall’antilingua utilizzata per la loro interpretazione. Calvino chiamava “antilingua” quell’italiano surreale, che viene adottato trasversalmente in tutti gli ambiti, dalla politica all’economia, dalla statistica alla medicina, e che tende ad uccidere contemporaneamente la lingua italiana e la possibilità di comprendere pienamente un testo. L’esempio che fa Calvino è più esplicativo di mille spiegazioni e può essere riscontrato in numerosi aspetti della vita quotidiana.
Il brigadiere è davanti alla macchina da scrivere. L’interrogato, seduto davanti a lui, risponde alle domande un po’ balbettando, ma attento a dire tutto quel che ha da dire nel modo più preciso e senza una parola di troppo: “Stamattina presto andavo in cantina ad accendere la stufa e ho trovato tutti quei fiaschi di vino dietro la cassa del carbone. Ne ho preso uno per bermelo a cena. Non ne sapevo niente che la bottiglieria di sopra era stata scassinata“. Impassibile, il brigadiere batte veloce sui tasti la sua fedele trascrizione: “Il sottoscritto essendosi recato nelle prime ore antimeridiane nei locali dello scantinato per eseguire l’avviamento dell’impianto termico, dichiara d’essere casualmente incorso nel ritrovamento di un quantitativo di prodotti vinicoli, situati in posizione retrostante al recipiente adibito al contenimento del combustibile, e di aver effettuato l’asportazione di uno dei detti articoli nell’intento di consumarlo durante il pasto pomeridiano, non essendo a conoscenza dell’avvenuta effrazione dell’esercizio soprastante“.
Ogni giorno, soprattutto da cent’anni a questa parte, per un processo ormai automatico, centinaia di migliaia di nostri concittadini traducono mentalmente con la velocità di macchine elettroniche la lingua italiana in un’antilingua inesistente. Avvocati e funzionari, gabinetti ministeriali e consigli d’amministrazione, redazioni di giornali e di telegiornali scrivono parlano pensano nell’antilingua.
[…] come se “fiasco”, “stufa”, “carbone” fossero parole oscene, come se “andare”, “trovare” “sapere” indicassero azioni turpi.
[…] Chi parla l’antilingua ha sempre paura di mostrare familiarità e interesse per le cose di cui parla, crede di dover sottintendere: “io parlo di queste cose per caso, ma la mia funzione è ben più in alto delle cose che dico e che faccio, la mia funzione è più in alto di tutto, anche di me stesso”. La motivazione psicologica dell’antilingua è la mancanza di un vero rapporto con la vita, ossia in fondo l’odio per sé stessi.
[…] Perciò dove trionfa l’antilingua – l’italiano di chi non sa dire “ho fatto” ma deve dire “ho effettuato” – la lingua viene uccisa.
Quello che accade, quando si prende troppo sul serio la narrazione dei dati di minor valore, attribuendogli pretese di verità, quando si cerca nei dati una ragione di vita artefatta e illusoria, quando si rinuncia a dire “andare”, “trovare”, “sapere”, quando si ricorre all’antilingua, per descrivere realtà subsicientifiche, è quanto di più dannoso si possa perpetrare ai danni della società. Per questo, i dati di minor valore sono considerati preziosi, perché la loro narrazione si insinua nelle cellule degli individui come un cancro, divorandone le facoltà mentali e annullando qualsiasi anelito di ragionamento. Ed è proprio ricorrendo all’antilingua che si favorisce questa decadenza cognitiva, mostrando in fondo la mancanza, da parte di chi scrive, di un vero rapporto con la vita, ossia in fondo l’odio per sé stessi. E per gli altri.