În fiecare zi, organizațiile mari se actualizează cu tehnologiile care facilitează și se potrivesc mai bine fiecărei companii, confruntându-se cu mari provocări care le permit să descopere și să analizeze dincolo de instrumentele care sunt folosite zilnic, pentru ei a fost creată ceea ce este cunoscut sub numele de Big Data sau în spaniolă date masive, care sunt sisteme de stocare a datelor pe scară largă.
Acest fenomen de stocare este încadrat în noile tehnologii ale informației și comunicațiilor. Big Data este ceea ce ocupă toate activitățile legate de sistemele care stochează un set mare de date. Una dintre caracteristicile principale este că manipulează o cantitate mare de informații, colectându-le, clasificându-le și apoi stocându-le. Scopul acestei colecții este de a crea rapoarte statistice pentru utilizare de către organizații, fie ca analiză a planurilor de afaceri, publicitate, spionaj, printre altele.
Marja de stocare a crescut de-a lungul anilor, începând din 2008, nivelul de stocare a fost măsurat în petabytes până la zettabytes de date. Experții caută periodic noi măsuri de stocare, deoarece există anumite zone în care trebuie stocate cantități mari de date, iar programele existente nu sunt foarte optime.
Există mii de instrumente pentru realizarea și gestionarea Big Data, totuși nu toate sunt la fel, există trei tipuri de date, care sunt:
- Date structurate: sunt cele în care datele au o structură foarte specială, cum ar fi date, numere, printre altele. Un exemplu dintre acestea sunt foile de calcul.
- Date nestructurate: de obicei sunt date care au un format specific și nu pot fi stocate într-o foaie de calcul, cu atât mai puțin manipulează informațiile, un exemplu de documente PDF.
- Date semi-structurate: acest tip de date nu are un anumit format, deoarece are propriile metadate semi-structurate, un exemplu în acest sens sunt codurile HTML.