EntiOnLine
Categorie
indietro
10/02/2020 BIG DATA - Definizioni
Il documento è riservato agli abbonati

Per qualsiasi informazione inerente i prezzi o le modalità di effettuazione del servizio, contatta l'agente di zona oppure scrivi a info@entionline.it
o telefona allo 030/2531939.

Definizioni

In tale contesto, con la locuzione “Big Data” si fa riferimento, in prima approssimazione (nell’assenza di definizioni normativamente vincolanti), alla raccolta, all'analisi e all'accumulo di ingenti quantità di dati, tra i quali possono essere ricompresi dati di natura personale (nell’accezione fornita dall’art. 4 del Regolamento (UE) 2016/679 del Parlamento europeo e del Consiglio del 27 aprile 2016, relativo alla protezione delle persone fisiche con riguardo al trattamento dei dati personali, nonché alla libera circolazione di tali dati e che abroga la direttiva 95/46/CE, di seguito anche “RGPD”), in ipotesi provenienti anche da fonti diverse. La natura massiva delle operazioni di trattamento reca con sé la necessità che tali insiemi di informazioni (sia memorizzate, sia in streaming) siano oggetto trattamento automatizzato, mediante algoritmi e altre tecniche avanzate, al fine di individuare correlazioni di natura (per lo più) probabilistica, tendenze e/o modelli.

Operativamente, nel settore dell’ICT, per Big Data si intende una collezione di dati che non può essere acquisita, gestita ed elaborata da strumenti informatici, da softwaree da hardware “tradizionali” in un tempo tollerabile, benché non esista una soglia dimensionale predefinita affinché un insieme di dati possa essere ricondotto alla categoria dei Big Data (per esempio anche un insieme di dati di qualche GB, in cui ogni record è composto da più di 500 mila variabili, può essere definito Big Data, se algoritmi tradizionali di analisi non riescono a computare un risultato in tempi ragionevoli su un computer di fascia alta).

In chiave descrittiva è frequente rinvenire nella letteratura in materia, fortemente influenzata dall’esperienza nord-americana, il richiamo, in forma ellittica, ad alcune caratteristiche ricorrenti rispetto al fenomeno in esame. Esse sono sintetizzate nelle 4 “V”: il volume, con riferimento all’enorme dimensione dei dati generati e raccolti; la varietà, con riguardo alle numerose tipologie dei dati disponibili, tra i quali, oltre ai dati strutturati tradizionali, vi sono anche dati semi-strutturati e non strutturati come audio, video, pagine web e testi; la velocità delle operazioni di trattamento; il valore che i dati assumono allorquando vengono elaborati ed analizzati, così da consentire l’estrazione di informazioni che possono contribuire all’efficienza e alla qualità di processi produttivi “tradizionali” ovvero qualificare intrinsecamente l’offerta di beni e/o servizi, in particolare in termini di innovazione e di personalizzazione.

Sono state poi individuate molteplici altre V idonee a caratterizzare i Big Data: tra le più degne di nota si ricordano la veridicità, ovvero la qualità e significatività dei dati raccolti o elaborati, la valenza, ovvero il grado di connessione del dato con altri dati, la visualizzazione, ovvero la necessità di riassumere in maniera visuale e facilmente interpretabile i dati più rilevanti e la conoscenza estratta da essi.

Fonte: Rapporto 2020 AGCOM, AGCM E GARANTE sui Big Data

Banca dati