Big data. Due parole che dicono tutto e allo stesso tempo dicono niente. Negli ultimi se n’è discusso tantissimo, ne abbiamo parlato e sentito parlare ma, se ci venisse chiesto di spiegare cosa siano in sostanza, molti di noi si troverebbero in difficoltà e la traduzione letterale, grandi dati, sarebbe più fuorviante che utile.
È bene sapere che quando si parla di big data, ci si riferisce non tanto alla quantità di dati prodotti ma alle tecnologie necessarie per filtrarli, elaborarli e ricavarne informazioni. I dati possono essere human generated, machine-generated o business-generated. Più semplicemente, possono essere prodotti da noi o da sensori e rilevatori. Quelli di un automobile, di un dispositivo montato in un palazzo o anche solo di un frigorifero, se questo è connesso. Per quanto riguarda la prima tipologia, bisogna sapere che creiamo dati che vengono registrati e raccolti all’istante in ogni momento: facendo acquisti online, usando i motori di ricerca, visitando pagine in internet, creando reti di contatti su Facebook, LinkedIn, Instagram ecc, semplicemente accendendo il cellulare e agganciando una certa cella, utilizzando il bancomat o la carta di credito per un pagamento, quando ci serviamo del Telepass, quando scarichiamo un’app e garantiamo accesso alle nostre informazioni, quando utilizziamo una carta fedeltà al supermercato o in libera e il nostro acquisto non è più anonimo, abbonandoci a una qualche piattaforma audio/video.
Quando si parla di big data, insomma, ci si riferisce a una quantità di “data” troppo grande per essere gestita con tecnologia e metodi ordinari. Nei primi anni Duemila, l’analista informatico Douglas Laney elaborò un modello detto delle 3V. I big data erano tali perché erano grandi e crescevano, con il passar del tempo, per volume, varietà (le fonti che li producono sono, come detto, molteplici) e velocità. Negli anni sono state aggiunte altre due V: veridicità (i big data offrono una quantità sterminata di informazioni che, però, rischiano di essere meno attendibili di quelle ricavate con i vecchi sistemi ETL, cioè di estrazione, trasformazione e caricamento dei dati) e valore (queste informazioni se opportunamente lavorate possono avere un valore enorme). Secondo il Journal of Computer Engineering dell’IORS (International Organization of Scientific Research), fino al 2003 erano stati prodotti 5 exabyte di dati digitali. Per produrre quella stessa quantità di dati, nel 2011 sono bastati due soli giorni e nel 2013 appena 10 minuti. Secondo il giornale, la quantità di dati immagazzinati nei computer tende a raddoppiare ogni 12-18 mesi. Oggi siamo nell’ordine degli zettabyte, cioè dei miliardi di terabyte. Per stivare questa mole di informazioni, ovviamente, occorrono dataset mostruosamente capienti e potenti. Sono poi necessari algoritmi che le colleghino e che ne permettano la visualizzazione e realizzino modelli interpretativi e predittivi.
Dal micro al macro, l’utilizzo di big data può consentire di fare cose un tempo impensabili: conoscere nel dettaglio le abitudini di un singolo consumatore (mettendo insieme i suoi acquisti e le sue ricerche online, i suoi movimenti abituali registrati tramite la geolocalizzazione, l’utilizzo di carta di credito e bancomat, le informazioni ricavate dal suo cellulare ecc…) e di una popolazione intera, stabilire correlazioni tra abitudini ed eventi possibili (per esempio, che un certo consumatore possa sviluppare certe patologie o che possa diventare insolvente), monitorare in tempo reale i dati metereologici e anticipare l’andamento del raccolto in una certa area. I big data stanno cambiando la società in cui viviamo e questo crea opportunità ma anche pericoli. La conseguenza è che vivremo in un mondo in cui i nostri bisogni e le nostre preferenze potranno essere soddisfatte in maniera molto puntuale ma in cui saremo più esposti e vulnerabili perché il rischio è la compressione della sfera privata. Una search su Google può permettere a un governo di sapere che in una certa area c’è un problema ma può anche mettere nei guai chi cercasse libri sgraditi o frequentasse luoghi ritenuti pericolosi da un governo dispotico e illiberale.
© Riproduzione riservata