Veľké organizácie sa každý deň aktualizujú pomocou technológií, ktoré uľahčujú a najlepšie vyhovujú každej spoločnosti, a čelia veľkým výzvam, ktoré im umožňujú objavovať a analyzovať okrem nástrojov, ktoré sa každodenne používajú, práve pre ne bola vytvorená. čo je známe ako Big Data alebo v španielčine „masívne dáta“, čo sú rozsiahle systémy na ukladanie dát.
Tento fenomén ukladania dát je zakomponovaný do nových informačných a komunikačných technológií. Veľké dáta zaberajú všetky činnosti súvisiace so systémami, ktoré ukladajú veľkú množinu údajov. Jednou z hlavných charakteristík je, že manipuluje s veľkým množstvom informácií, zhromažďuje ich, klasifikuje a potom ukladá. Účelom tejto zbierky je vytvoriť štatistické správy, ktoré môžu organizácie použiť, napríklad ako analýzu obchodných plánov, reklamy, špionáže.
Úroveň úložiska v priebehu rokov rástla, od roku 2008 sa úroveň úložiska merala v petabajtoch až zettabytách dát. Odborníci pravidelne hľadajú nové opatrenia na ukladanie dát, pretože existujú určité oblasti, kde je potrebné ukladať veľké množstvo dát, a existujúce programy nie sú veľmi optimálne.
Existujú tisíce nástrojov na vytváranie a správu veľkých dát, ale nie všetky sú rovnaké, existujú tri typy dát, ktoré sú:
- Štruktúrované údaje: sú tie, pri ktorých majú údaje veľmi konkrétnu štruktúru, ako sú napríklad dátumy, čísla. Ich príkladom sú tabuľky.
- Datos no estructurados: usualmente son datos que tienen un formato específico y no se pueden almacenar en hoja de cálculos y mucho menos manipular la información, un ejemplo de lo los documentos en PDF.
- Datos semiestructurados: este tipo de datos no tienen un formato en particular, ya que cuentan con sus propios metadatos semiestruturados, ejemplo de estos son los codigos HTML.