“Quando i dati discriminano” di Donata Columbro
Parlare dei dati, nonché di grafici e statistiche, che ne costituiscono la rappresentazione estetica e percepibile, è un discorso necessariamente politico, cioè circa il potere e il suo esercizio sulla […]

Parlare dei dati, nonché di grafici e statistiche, che ne costituiscono la rappresentazione estetica e percepibile, è un discorso necessariamente politico, cioè circa il potere e il suo esercizio sulla collettività.
Il corpo sociale si compone di gruppi portatori di interessi particolari e spesso e volentieri confliggenti. Una prima questione è che tali gruppi possono essere sottorappresentati in grafici e statistiche o addirittura venirne esclusi.
Inoltre, grafici e statistiche possono venire in rilievo quali elementi fondativi di decisioni politiche. Il secondo punto è che simili decisioni possono essere giustificate sulla base dell’assunto “lo dicono i dati” (versione sociologica del motto neoliberista “There Is No Alternative”).
Disporre di masse di dati, riferibili di volta in volta a differenti oggetti delimitati nel tempo e nello spazio, e della tecnica per ricavarne conclusioni significa disporre del potere di fornire una determinata rappresentazione di questi oggetti e del loro posizionamento nella nostra società e, suo tramite, influenzare i comportamenti delle masse e le prassi istituzionali.
Donata Columbro ne è ben consapevole e in “Quando i dati discriminano. Bias e pregiudizi in grafici, statistiche e algoritmi” (Il Margine, 2024) mette in guardia il lettore dimostrando che i dati sono “situati”, cioè raccolti ed elaborati da chi riveste una certa posizione nella società ed è dunque legato a una specifica prospettiva, che ben può essere contaminata da pregiudizi o stereotipi: perciò grafici e statistiche non sono mai neutri.
I dati sono lungi dall’essere un prodotto naturale, adamantino e incorruttibile: al contrario, costituiscono materia malleabile per gli studiosi che se ne occupano. Perciò sarebbe più opportuno – come nota l’Autrice – chiamarli “capta”, cioè ottenuti: essi sono dapprima raccolti, quindi selezionati, setacciati, infine descritti, inseriti in una rappresentazione visiva. Questo processo postula la manipolazione da parte dell’essere umano e stabilisce un’analogia diretta tra i dati e una qualsiasi “interpretazione del mondo fenomenico”.
La parzialità dei dati, tra l’altro, è lampante nella fase immediatamente successiva alla raccolta: fattori di discriminazione possono essere infatti sottesi ai concetti utilizzati per classificarli, cioè ricomprenderli in categorie. Così, per esempio, i migranti potrebbero essere esclusi dal concetto di “residenti sul territorio in un determinato momento”, la distinzione binaria in uomini e donne potrebbe marginalizzare le soggettività transessuali e una donna priva di reddito proprio potrebbe non rientrare tra i poveri semplicemente perché inserita in un nucleo familiare che si situa al di sopra della soglia di povertà.
L’Autrice mostra alcuni casi in cui l’esclusione di alcuni soggetti dalla ricerca dati produce una discriminazione a loro carico: si ignora e non si rappresenta (nel grafico o nella statistica) una certa categoria affinché passi sotto silenzio la condizione di svantaggio che la affligge e così non vengano adottate misure politiche che vi possano rimediare: anzi, di tali politiche nemmeno si parli.
La pratica del redlining, per esempio, consiste nel delimitare – sulle mappe territoriali a disposizione di enti creditizi e governativi statunitensi – i quartieri sconsigliati per gli investimenti immobiliari. Queste zone, spesso abitate da minoranze etniche, vedono diminuire il valore degli immobili in esse ricompresi: gli abitanti incontreranno difficoltà a ottenere mutui o comunque a irrobustire il proprio patrimonio attraverso la proprietà immobiliare.
Rappresentare i dati mediante la creazione di grafici, infografiche[1] e mappe consente di conferire loro una veste di oggettività, fondata su misurazioni quantitative e proporzioni numeriche. Un’aura di rigore e neutralità circonfonde così i dati e induce a credere che chi li ha raccolti ed elaborati sia “libero da ogni interferenza emotiva”. Questa convinzione è facilmente estendibile a chi li utilizza per fondarvi decisioni politiche e si rafforza ogniqualvolta a processarli non sia il lavoro intellettuale dell’essere umano, ma un algoritmo, cioè un complesso di istruzioni che l’intelligenza artificiale applica ai dati per trarne un risultato univoco. Tuttavia – avverte l’Autrice – gli strumenti tecnologici atti a processare i dati risentono della soggettività individuale e storica di chi li ha progettati (e brevettati).
La pretesa di oggettività di cui i dati sono portatori li candida ad assurgere a strumento per eccellenza del governo tecnocratico che si concreta in molte democrazie occidentali in situazioni di emergenza (economica, climatica o sanitaria). Durante la pandemia da Covid-19 si è assistito a una vera e propria infodemia, cioè a una produzione accelerata di dati, grafici e statistiche relativi alla diffusione del contagio: le oscillazioni e i saliscendi di linee e barre hanno orientato decisioni incidenti su diritti costituzionali e sull’accesso a beni comuni.
Alla misurazione quantitativa dei fenomeni, atteggiamento tipicamente illuminista, si è così giustapposta l’applicazione alla politica, intesa come vita associata regolata dal potere, del metodo scientifico che presiede all’osservazione dei fenomeni stessi: questo atteggiamento è tipico del positivismo, corrente filosofica inaugurata nell’Ottocento da Auguste Comte che pretendeva di applicare il metodo delle scienze naturali – dette positive in quanto produttive di risultati certi e affidabili – alla politica (e anche al diritto e all’etica), onde regolare ordinatamente la vita collettiva, alla stessa stregua delle lancette di un orologio: insomma, come se la società fosse un congegno performante anziché un corpo complesso e non immune da conflitti intestini.
Nel corso della pandemia le statistiche registravano anche l’efficacia delle misure di limitazione delle libertà civili sul contenimento del contagio; stabilire una correlazione fra la durezza di queste misure e la riduzione dei contagi è valso a creare consenso, entro l’opinione pubblica, sulla loro legittimità, così conducendo a buon fine un vero e proprio esperimento di biopolitica, cioè di capillare determinazione delle condotte individuali da parte del potere.
Byung-Chul Han ritiene addirittura che la raccolta dati su vasta scala sia il preludio alla psicopolitica, cioè alla penetrazione del potere nella psiche collettiva.
Tenere traccia delle reazioni delle persone al cospetto di determinate circostanze permette di leggere i loro pensieri, sondare le loro emozioni: in altre parole, rende accessibile l’inconscio collettivo e visibili i modelli di comportamento collettivi; il potere può così prevedere e anticipare le dinamiche comportamentali delle masse e stimolare le loro energie mentali ora in un senso ora nell’altro, anche con un andamento schizoide: il pericolo è che le persone restino intrappolate in un futuro già scritto[2]. L’Autrice nota come, durante la pandemia, sentimenti di orgoglio, fiducia, indignazione o vergogna erano suscitati dai dati che comparavano l’andamento del contagio tra Regioni o Stati: un tipico esempio di come i dati possano costituire uno stimolo promanante dal potere e diretto a influire sulle emozioni (e quindi sui comportamenti) delle persone.
I dati sono connessi al potere anche nella misura in cui, rendendo evidenti i fatti in cui si articola l’oggetto-mondo, vengano a costituire gran parte degli elementi che compongono le decisioni politiche: praticamente, i detentori del sapere scientifico fornirebbero fatti certi e oggettivi, mentre la classe politica dovrebbe limitarsi ad aggiungere a essi soltanto i valori culturali e quindi decidere se tali fatti sono giusti o sbagliati, se vanno mantenuti come tali o disciplinati, corretti, se non persino sradicati[3]. Bruno Latour critica questa impostazione perché demanda alla scienza il compito di rendere verità, laddove la sua missione dovrebbe essere quella di problematizzare l’universo-mondo, facendo emergere entità e gruppi con cui stabilire connessioni e da parlamentarizzare, cioè rappresentare nel processo democratico di formazione del consenso.
L’Autrice individua un’efficace metodo per sconfessare la pretesa oggettività dei dati nella disaggregazione, consistente nel “prendere il dato complessivo e scomporlo in sottoinsiemi, per renderli più visibili”: si tratta di individuare, in particolare nelle statistiche che mettono determinati segmenti di popolazione sotto la luce di specifici riflettori socio-economici, i sottoinsiemi ricompresi in tali segmenti onde constatare lo svantaggio di cui gli uni soffrono in comparazione agli altri. Per esempio, in tema di retribuzioni, le donne risulteranno svantaggiate rispetto agli uomini, ma le donne di colore lo saranno di più rispetto alle donne bianche e le donne di colore e diversamente abili ancor più rispetto a tutte le altre. Questo metodo permette di evidenziare l’intersezionalità delle discriminazioni e la correlata necessità di salvaguardare per prime le categorie sociali marginalizzate dal concorso di più cause di discriminazione.
Fare dei dati uno strumento di giustizia sociale postula la loro democratizzazione: occorre cioè che essi non siano appannaggio di una classe ristretta né tantomeno dell’intelligenza artificiale e che vi siano rappresentati entità, gruppi e fatti altrimenti marginalizzati, così da riconfigurare i rapporti tra potere e collettività.
[1] Cioè rappresentazioni visive di informazioni o dati che possono contenere anche illustrazioni, come spiega l’Autrice nel suo precedente lavoro Ti spiego il dato, Quinto Quarto, 2021, pag. 126.
[2] Byung-Chul Han, Nello sciame, Nottetempo, 2023, pagg. 94-98.
[3] Bruno Latour, Disinventare la modernità, elèuthera, 2023, pagg. 82-97.