Big Data frente a almacén de datos

Rodrigo Ricardo Publicado el 14 noviembre, 2020 3 minutos y 4 segundos de lectura

La sed creciente de conocimiento

Hay un viejo adagio que dice, «el conocimiento es poder». Y eso no podría ser más cierto hoy. La necesidad de saber domina todo. Por ejemplo, ¿alguna vez ha querido saber el pronóstico del tiempo de 24 horas antes de salir de casa ese día? ¿O desea saber el resultado de algún evento deportivo antes de que comience, para poder hacer una apuesta? Es esta sed la que nos impulsa a recopilar cada vez más datos y utilizarlos para obtener algo significativo. De ello se deduce entonces que alguien desarrollaría los medios para hacer precisamente eso.

¿Qué es Big Data?

El big data es el área de la ciencia y la tecnología que se ocupa de conjuntos de datos que son demasiado grandes para ser manejados por métodos tradicionales. En su mayor parte, esto significa a mano o con paquetes de software como Microsoft Excel, Access, SQL Server y sus equivalentes de otros proveedores. Los requisitos de recursos son importantes, incluso con máquinas potentes debajo. Hoy en día, los conjuntos de datos de tamaño normal están superando los límites de lo que pueden hacer estos paquetes tradicionales. Y eso está cambiando constantemente. Cada año se observa un hambre de más datos y un aumento en los recursos necesarios para manejarlos.

¿Qué es un almacén de datos?

Un almacén de datos , por otro lado, es un repositorio de información centralizado que recopila datos de muchos lugares. Las empresas generalmente los utilizan para informar, analizar y tomar decisiones sobre diversos aspectos de sus operaciones. Se basan en paquetes de software tradicionales como los mencionados anteriormente. Y sus necesidades de recursos, aunque importantes, no se acercan a las del big data. Pero al igual que los macrodatos, el hambre de más información aumenta las necesidades de recursos cada año.

¿Cuáles son las diferencias entre Big Data y Data Warehouse?

En algunos aspectos, los grandes volúmenes de datos y los almacenes de datos son similares. Ambos se ocupan de la información recopilada y ambos se utilizan para obtener nueva información. La principal diferencia entre los dos es el tamaño . Los macrodatos tienen un tamaño mucho, mucho mayor. Piénselo de esta manera: un almacén de datos generalmente está restringido a una organización o empresa, mientras que big data abarcaría los datos de varias, o quizás todas, las empresas. Los macrodatos también tienden a ser de mayor alcance y, como tal, aportan más variables a la ecuación.

Otra diferencia son las herramientas que se utilizan para manipularlos. Los almacenes de datos todavía utilizan paquetes de software tradicionales como Excel, Access, SQL Server y sus equivalentes. Sin embargo, los macrodatos utilizan diferentes técnicas y software, porque los requisitos de recursos están más allá de lo que pueden manejar los paquetes tradicionales. Tenga en cuenta que esta línea se está difuminando. Veremos que estas áreas se acercan a medida que pasa el tiempo.

Resumen de la lección

En resumen, el big data es el área que se ocupa de conjuntos de información extremadamente grandes. Esto requiere herramientas únicas. Los almacenes de datos , por otro lado, son repositorios centrales que utilizan herramientas tradicionales para la manipulación. Ambos tratan con información recopilada y ambos sacaron nuevas conclusiones, pero son fundamentalmente diferentes. Los macrodatos son mucho, mucho más grandes en tamaño y alcance. Esta línea se difumina a medida que aumenta el deseo de incluir cada vez más información.

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador