Nereidi Studio
UncategorizedPOSSIAMO FIDARCI DEI DATI?

POSSIAMO FIDARCI DEI DATI?

Che cos’è un dato? 

Lisa Gitelman, professoressa all’Università di New York di Media e Comunicazione, sostiene che l’espressione dato spurio, Raw Data costituisca un ossimoro. “Raw”, inteso come crudo, o meglio non-cotto, indica l’eventualità di avere un dato non interpretato, spurio: un dato che non risponde a uno schema per collezionarlo, incasellarlo, classificarlo. 

La sua critica si indirizza quindi alla possibilità di risolvere ogni controversia scientifica o sociale facendo appello a un’idea di dato come sinonimo di oggettività, di realtà, di verità: se lo dicono i dati, deve essere vero. 

A partire dall’evoluzione degli strumenti digitali infatti, e dalla crescita esponenziale degli strumenti che permettono la raccolta ed elaborazione dei dati, secondo un articolo di Wired, si è diffusa la credenza che non avremo più bisogno di teorie per interrogare la realtà: la tecnologia può “contare” ciò che c’è nel mondo, classificarlo secondo principi matematici e neutrali, e offrirci risposte empiriche e prive di bias rispetto alla realtà. 

Ma è proprio per questo che è interessante il lavoro di Gitelman, e insieme al suo quello di tantissimə  altrə scienzatə sociali e dei dati: lungi da essere una rappresentazione fedele alla realtà, il dato è già la risposta a una domanda, una domanda con cui già interroghiamo e diamo forma al mondo che ci circonda. Lo sanno bene coloro che si occupano di statistica, che prima di applicare modelli predittivi ai loro dataset – grandi insiemi di dati – devono essere certə che questi siano stati raccolti in maniera coerente, secondo rigorosi principi scientifici. 

Altro che fine della teoria! Non solo i diversi ambiti delle scienze possono dare risposte diverse a partire da dataset identici, ma sono proprio le stesse scienze a richiedere diversi dataset, costruiti in maniera diversa, secondo principi scientifici e metodologici diversi. Alle volte, inconciliabili! Il mondo è estremamente complesso, e per poterlo analizzare e ridurre a insiemi di dati bisogna operare delle riduzioni di questa complessità: a ogni riduzione, si perde qualcosa, e questo qualcosa potrebbe essere significativo per altri metodi. 

In poche parole: prima di iniziare a contare, bisogna decidere cosa contare, come farlo, e come raggruppare gli elementi che poi tratteremo come dati

I dati quindi, non sono mai neutri! Sono il prodotto di un’attività di raccolta e classificazione. 

2) Di chi sono i dati? 

I dati non sono solo raccolti da analistə e scienziatə: all’interno di un mondo interconesso – la cosiddetta società dei dati – tuttə produciamo quotidianamente informazioni. Nel momento in cui siamo utenti di un qualsiasi sistema o servizio digitale, produciamo dei dati: attraverso le nostre attività, con la navigazione in internet. Anche il tempo che passiamo davanti allo schermo senza fare niente può essere misurato e raccolto come un dato. Le nostre preferenze, le nostre scelte, persino le nostre identità, all’interno del mondo digitale, vengono tradotte in dati. Con un enorme dispendio energetico, che ha ricadute molto pesanti sull’ambiente… 

Così si arriva ai big data, ovvero quegli agglomerati di dati incredibilmentegrandi, prodotti proprio dall’uso sempre più massiccio e trasversale del web e degli strumenti digitali. Anche questi rischiano di passare come rappresentazioni neutre della realtà: ingenuamente si potrebbe infatti pensare che, essendo prodotti da certə utenti, questi dati lə rappresentino direttamente, o possano dirci da soli qualcosa su di noi, sulla nostra natura. 

Questi big data invece, da soli, sono inservibili. Come dicevamo poco fa, i dataset sono già organizzati e selezionati da principi scientifici: queste masse di dati prodotte e messe insieme senza rigore scientifico difficilmente potranno dirci qualcosa sulla realtà, perché sono disorganizzate, caotiche e difficili da gestire. 

I dati che produciamo attraverso la nostra attività online, vengono raccolti da grandi compagnie informatiche – come Amazon, Google e Apple – per profilare i nostri comportamenti e trarne profitto. Questo ha portato al dibattito sulla proprietà dei dati, e sulla necessità di condividere la consapevolezza che la nostra attività online ci appartiene. La datificazione – o renderizzazione, nei termini di Shoshanna Zuboff – dei nostri comportamenti online, riduce il controllo che abbiamo sulle nostre vite, delegandolo a terzi. 

3) Quindi non possiamo fidarci dei dati?

Ma se i dati non equivalgono direttamente alla realtà, perché sono importanti? Se possono essere manipolati, distorti e viziati sin dalla loro produzione, perché ne stiamo parlando, e perché li usiamo? 

Prima di abbandonare ogni speranza e chiuderci in un mondo costruito attentamente con le nostre convinzioni pregresse, guardiamo con attenzione a ciò che queste premesse significano. Il fatto che i dati siano in qualche maniera costruiti, e non spontanei, non significa che essi non possano dirci niente di vero sulla realtà e sul mondo che ci circonda. Anzi.

La consapevolezza sulla natura dei dati ci porta alla necessità di trattarli con maggiore attenzione: prima di accettare come vera un’infografica, o di basare un’opinione sui dati, dobbiamo porci una serie di domande su come questi dati siano stati raccolti, processati e su ciò che si fa a partire da essi. Che sia uno studio scientifico con ricadute sulla vita pubblica, o infografiche che saranno poi condivise sui social media o pubblicate su testate di rilevanza nazionale.

Possiamo fidarci dei dati, a patto di sapere come siano stati raccolti, e che essi abbiano potuto essere verificati da più fonti. Uno dei principi della data literacy, l’alfabetizzazione ai dati, oltre che il confronto tra diverse fonti, è che ciascuna delle fonti da cui attingiamo le nostre informazioni sia trasparente rispetto a come ha raccolto ed elaborato i propri dati. 

Abbiamo bisogno di sapere come maneggiare i dati, per difenderci da quelli raccolti e/o comunicati in maniera viziosa. Il fatto che i dati siano il risultato di un’attività umana, ci aiuta a metterli al centro di processi democratici e condivisi di confronto e dialogo. I movimenti e le azioni dal basso per gli open datarichiedono proprio questo: che le statistiche ufficiali, alla base dell’azione di governi, enti pubblici e scientifici, siano basate su dati aperti, riutilizzabili e analizzabili da diversi soggetti. Conoscere i metodi che hanno dato forma ai quei dati ci permette davvero di verificarli

Il tema dei dati ci parla di tante cose. Innanzitutto della fiducia che riponiamo nella scienza, e dello stesso lavoro di chi fa scienza: la ricerca scientifica, per sostenere i suoi costi all’interno di un’economia di mercato, spesso deve rendere inaccessibili i dati su cui lavora, per ragioni di competitività. Ma questo ha effetti disastrosi: che si tratti di dati riguardanti il cambiamento climatico, l’effetto dell’azione umana sulla natura, la diffusione di un virus, o statistiche riguardanti la vita politica, c’è bisogno di trasparenza e chiarezza rispetto ai metodi che ne precedono raccolta, analisi e pubblicazione.

I numeri, da soli, non bastano a interrogare la realtà: allo stesso tempo, sono i nostri più grandi alleati. Possiamo fidarci dei dati, a patto che non ci fermiamo ad essi, ma che sappiamo collocarli all’interno della complessità della vita.  

Marco Giacomazzi &

Nereidi Studiio

Leave a Reply

Your email address will not be published. Required fields are marked *

Autem dicant cum ex, ei vis nibh solum simul, veritus fierent fastidii quo ea.
Cu solum scripta pro. Qui in clita everti
movet delectus.