Tra un fenomeno di qualsiasi tipo (fisico, chimico, sociale) e il dato statistico che lo descrive c’è la stessa differenza che passa tra gli ingredienti per fare una pizza e una margherita verace. Il produttore del dato è la pizzeria, il fruitore è l’avventore. In un paese in cui siamo pratici di pizze, non posso fare a meno di osservare che ci sono pizzerie di ottima qualità e pizzerie scarse, come ci sono consumatori che si accontentano di qualsiasi cosa sia masticabile e consumatori esigenti a cui non va mai bene niente. Sia che si tratti di pizzerie sia che si tratti di produttori di dati, i numeri rappresentano una condizione necessaria ma non sufficiente per entrambi. A nessun pizzaiolo verrebbe in mente di ragionare in termini di soli numeri: un conto è dire “ho 100, 70, 3, 1”, un conto è dire “ho 100 grammi di farina, 70 grammi d’acqua, 3 grammi di sale e 1 grammo di lievito. Un dato descrive e quantifica uno o più ingredienti (fenomeni), un numero rappresenta essenzialmente quantità indefinite. Un dato è il risultato di una misura: per essere rilevato ha bisogno di un sistema di misura e di una metodologia. La scelta di questi strumenti determina la sua qualità. Per misurare il peso della farina al pizzaiolo è sufficiente utilizzare una bilancia da cucina e far riferimento a un sistema di unità di misura. Le misure relative all’analisi chimica dello stesso prodotto devono tener conto di una molteplicità di fattori ignoti al pizzaiolo (umidità, morfologia, classificazione del grano, et cetera) e richiedono l’utilizzo di metodologie e strumenti diversi (farinometro, alveografo, et cetera). Da qui nasce una prima evidenza: l’accuratezza nella misurazione di un dato è funzionale al contesto di analisi e al target di riferimento. È inutile usare una bilancia di precisione, tararla, verificare l’umidità, la temperatura della stanza e la quantità di acidità per decidere se una farina è o non è adatta all’impasto per due persone. Anche volendo spingersi oltre, la misura della quantità di glutine (forza) e di qualche altro dettaglio esaurisce completamente le esigenze che può avere un pizzaiolo pignolo. Le stesse misure risulteranno insufficienti per qualsiasi chimico, anche il più superficiale. Che differenza c’è, dunque, tra gli ingredienti e la pizza margherita? La lavorazione, certo, ma non solo. Gli ingredienti vengono lavorati dal pizzaiolo in funzione dei potenziali consumatori e il gestore di una pizzeria ha ben presente lo slogan pubblicitario dei primi del ‘900 conteso tra Marshall Field e Harry Gordon Selfridge: “Il cliente ha sempre ragione”. Adulazione? Chimera? Forse, ma un fondo di verità c’è: se le pizze non sono gradite ai consumatori, gli affari vanno male. Purtroppo lo stesso criterio non si può applicare ai produttori di dati che, essendo perlopiù enti pubblici, possono fare a meno delle opinioni dei consumatori ma non dei loro finanziamenti…
Un pizzaiolo esperto sa bene che le sue misure devono essere corredate dall’unità di misura e dall’errore, perché, è bene sottolinearlo, ogni misura, anche la più precisa, introduce un errore dovuto alle condizioni, agli strumenti e all’applicazione della metodologia. In particolare, l’equilibrio tra la quantità di lievito, l’idratazione, la temperatura e la durata della lievitazione sono le misure che determinano il successo o l’insuccesso di un impasto. Bastano un grammo di lievito in più o un grado cetigrado di differenza nella temperatura per cambiare la consistenza dell’impasto: avere una bilancia che introduce l’errore di 5 grammi o un termometro che introduce un errore strumentale di 2 gradi centigradi porterebbe a un insuccesso sicuro.
Il dato statistico, che intrinsecamente è ricco di errori e imprecisioni dovuti a numerosi fattori (il campione, la tecnica d’indagine, la pulizia dell’archivio, et cetera), è uno strumento che dovrebbe descrivere un fenomeno e aiutarne la comprensione, oltre a guidare i decisori politici; per questo motivo deve essere mangiabile, pardon, leggibile in modo chiaro e la leggibilità non è necessariamente legata alla precisione, ma è sicuramente subordinata al target di riferimento e al fenomeno specifico.
Supponiamo di voler comunicare la differenza di dimensioni tra la pizzetta (popolazione italiana) e la pizza in teglia (popolazione cinese): in questo caso, per descrivere il fenomeno, è sufficiente ricorrere all’ordine di grandezza (10^6 e 10^9), evidenziando l’unità di misura (es: numero di cittadini residenti). Un lettore non avrà bisogno di altre informazioni per capire il dato e il contesto di riferimento. Diverso è il caso delle pizze a lievitazione naturale impastate a mano con una miscela di farine diverse o di un dato riguardante gli incidenti stradali avvenuti tra un motociclo e un’autovettura in prossimità di un incrocio nei comuni al di sotto dei 20.000 abitanti.
In altre parole, è possibile trovare consumatori a cui vada bene un impasto casuale di ingredienti e consumatori che abbiano bisogno del servizio a domicilio di una pizza in teglia alla romana con bresaola e rucola.
In ogni caso, pizzaiolo o ricercatore, pizzeria o produttore di dati, bisogna tener conto di numerosi aspetti:
- gli ingredienti
- la metodologia e gli strumenti adeguati alla misura e alla lavorazione degli ingredienti
- la completezza e l’accuratezza delle misure
- la lavorazione e l’abilità del pizzaiolo
- la qualità del prodotto finale
- il marketing
- il target di riferimento
E’ noto, o dovrebbe esserlo, che la diffusione dei dati è complessa almeno quanto la diffusione delle pizze. Oltretutto, quando si parla di pizza ognuno si sente autorizzato a esprimere sentenze e giudizi sulla base di informazioni superficiali acquisite in diversi ambienti, impressioni e gusti personali che di rigore scientifico hanno ben poco. Il risultato di questo approccio è abbastanza evidente: molte pizzerie producono pizze disgustose, descritte con menù fiabeschi e con la dicitura “senza olio di palma” nello stesso modo in cui enti di ricerca autorevoli pubblicano dati e infografiche incomprensibili, parlando di open data per sentirsi alla moda e usando la parola “big data” all’interno di pubblicazioni importanti come intercalare al posto di “cioè”.
La vera pizzeria, per intenderci L’Antica Pizzeria Michele a Napoli, ha ben chiare le strategie di diffusione delle pizze e conosce le famose regole anglosassoni delle 5 W (Who?, What?, When?, Where?, Why? ), ovvero i punti fondamentali che devono essere contenuti in un articolo giornalistico per rispondere alle risposte di un lettore. Poiché ogni tanto sento il bisogno di sfoggiare del sano orgoglio nazionalistico, mi sento di ricordare che queste regole di anglosassone hanno ben poco: già Boezio e piu tardi San Tommaso d’Aquino nella celebre Summa Theologiae avevano utilizzato le famose “quis, quid, cur, quomodo, ubi, quando, quibus auxiliis” rispettivamente per l’arte dell’accusa e della difesa e per definire la pena più appropriata rispetto a un peccato commesso. Come dire: Hai rubato? Per quantificare la pena correttamente devo rispondere a queste domande:
- chi ha commesso il furto (quis),
- che cosa ha rubato (quid),
- quando è avvenuto il furto (quando),
- dove ha rubato (ubi),
- perché ha rubato (cur)
La vera pizzeria, però, sa bene che Boezio è andato ben oltre le 5 W, chiedendosi anche:
- quanto ha rubato, (quantum)
- in che modo (quomodo)
- con quali mezzi (quibus auxiliis)
Poiché i fruitori dei dati seguono pedissequamente la regola di Domenico Savio (La morte ma non il peccato) e non penserebbero mai di prendersi con ogni mezzo, scraping incluso, ciò che pagano a colpi di f24, è giusto che l’antica pizzeria adotti tutte le misure per non indurre i golosi di pizza in tentazione.
Chi sono i fruitori?: Il pizzaiolo esperto sa che il successo delle sue pizze deve tener conto degli utilizzatori, possibilmente mettendo da parte i timori che qualcuno riesca a rubargli la ricetta e a utilizzare gli ingredienti meglio di lui. Farà male a qualche carriera, ma farà bene al paese. La domanda da porsi è: chi mangerà le mie pizze? C’è chi è abituato a mangiare l’Istogramma alla capricciosa, chi la Tabella a doppia entrata con prosciutto e chi l’API con funghi e provola…
Cosa vogliono i fruitori delle pizze?: C’è una grossa differenza tra chi preferisce la pizza in teglia (infografica), chi la focaccia alla genovese (tabella) e chi la pizza napoletana (API). Il pizzaiolo esperto sa benissimo che per aumentare la clientela deve differenziare la produzione, mantenendo un elevato standard qualitativo.
Quando si mangiano le pizze?: Generalmente la sera, quindi è inutile cuocerle il giorno prima perché all’ora di cena del giorno dopo non le vorrà più nessuno. Le pizze scadute sono indigeste.
Dove si trovano le pizze migliori?: Non esiste la pizza migliore, esiste la pizza che si adatta meglio alle diverse esigenze. Un bravo pizzaiolo conosce le esigenze dei clienti e sforna webservices con la stessa facilità di una focaccia.
Come si cucinano le pizze?: Bisogna conoscere gli ingredienti, le tecniche e i gusti dei clienti. Una pizza senza metadati, ad esempio, non ha sapore. Una pizza senza unità di misura causa colite e nausea. D’altronde, a nessuno verrebbe in mente di assumere un pizzaiolo che sappia cucinare solo kebab!
Perchè si mangiano le pizze? Per fame, certo. Per piacere, anche. Per tradizione. Per curiosità. Per provare. Perché mia nonna le faceva come Ciro. Qualsiasi motivo spinga una persona a mangiare la pizza è sempre un buon motivo.
Quanta pizza mangiano i clienti? La pizza non basta mai, si sa. Per questo in molte pizzeria si paga una quota fissa (il famoso f24 citato poc’anzi) e si mangia pizza a volontà!
In che modo si mangia la pizza? C’è chi la mangia machine-to-machine e chi su un foglio di carta. Il pizzettaio moderno non è razzista e non si scandalizza per una nuova richiesta: sa che una richiesta strana oggi potrebbe diventare standard domani.
Con quali mezzi si mangiano le pizze? Gli snob usano le posate d’argento, gli intenditori la piegano a portafogli e la mangiano con le mani, i più pratici usano dei framework javascript, i meno pratici usano i fogli excel. Il pizzaiolo navigato conosce i suoi clienti, a volte storce il naso, ma alla fine accontenta tutti.
Ilarità a parte, il parallelismo tra i dati e le pizze non è poi così stravagante. Chi si occupa di dati, e lo fa con passione, sa bene che il mondo va a una velocità che i produttori (istituzioni in primis) non riescono a comprendere. Nel corso della mia carriera mi sono imbattuto in ogni tipo di aberrazione statistica: grafici senza unità di misura, dati senza metadati, cubi multidimensionali senza dimensioni, cartografi senza mappe, mappe senza dati, indicatori calcolati senza metodologie robuste, indagini condotte senza un fine preciso, guerre di potere tra ricercatori rivali… alla fine sono arrivato alla stessa conclusione a cui giunse Stefano Rosso molti anni fa, quando cantava: “Ho visto gente senza tetto, polli senza petto, ministri seza portafoglio mai…Ho visto un angelo in mutande e regiseno vuoti, spiagge senza vetri mai….E cari amici adesso lo confesso se potessi tutto rifarei.. E non sarò un poeta ma anche se la vita fosse peggio non mi stancherei.”. Tutto sommato, lavorare coi dati mi diverte e anche se fosse peggio non mi stancherei.