¿Qué es la densidad de datos? – Definición y pequeños múltiplos

Rodrigo Ricardo Publicado el 14 noviembre, 2020 4 minutos y 1 segundos de lectura

Un mundo sin información

Imagine por un momento un mundo sin información: sin información de contacto de sus amigos, sin puntuación o información resumida del evento deportivo de anoche, y sin pronóstico del tiempo que prediga lo que le espera para el día. ¿Puedes verlo? La mayoría de la gente no pudo. Dependemos de la información y no podemos imaginar un mundo sin ella; sin embargo, es más que eso. No solo queremos y necesitamos información, sino que esta información también debe ser precisa. Hay una serie de cosas a tener en cuenta al pensar en la precisión. Uno de los más interesantes es la densidad de datos.

¿Qué es la densidad de datos?

La densidad de datos se puede considerar de dos formas. Primero, es una medida de cuánta información se puede almacenar en una cantidad específica de espacio de almacenamiento. Piense en esto como la densidad de población en una gran ciudad versus la población de quienes viven fuera de los límites de la ciudad en el país. El número de personas por kilómetro cuadrado o milla es significativamente mayor en la ciudad que en el campo. La densidad de datos puede pensarse de la misma manera.

En segundo lugar, la densidad de datos se puede considerar en términos de muestreo . Digamos que tenemos una gran cantidad de personas y queremos tener una idea de cuántas personas tienen ojos marrones. Sin mirar realmente a cada persona, podríamos mirar cada décimo o cada centésimo. La densidad de datos sería cuántos se examinaron frente a cuántos hay. Este es el punto de vista en el que nos centraremos durante el resto de esta lección.

¿Por qué es importante la densidad de datos?

La densidad de datos es importante en áreas como la visualización de datos . Esta área se enfoca en crear representaciones visuales que brinden información que se pueda digerir rápida y fácilmente. Le preocupa la densidad de datos porque quiere representar la información con la mayor precisión posible. Esto necesariamente excluye las bajas densidades de datos. En el ejemplo de muestreo anterior, una visualización de datos de cada décima o cada centésima persona no será tan precisa como usar a cada persona. Para la visualización de datos, la densidad de datos está directamente relacionada con la precisión de las imágenes producidas. Lo mismo es cierto para otras áreas.

¿Qué son los pequeños múltiplos?

Los múltiplos pequeños es una técnica que divide la visualización de datos multidimensionales en partes más pequeñas y manejables. «Multidimensional» se refiere a visualizaciones que incluyen más de una variable. Para bebés múltiples, tendría 3 o más. Para el caso más simple de 3 dimensiones, podríamos dividir la representación en una serie de piezas bidimensionales donde una dimensión permanece constante a lo largo de la serie (en nombre y escala) y la tercera cambia.

Veamos un ejemplo más complejo. Digamos que tenemos las dimensiones X, Y, A, B y C, podríamos considerar dividirlas en piezas bidimensionales: XY, XA, XB y XC. De manera similar, podríamos mirar piezas tridimensionales que dan XYA, XYB, XYC, como resultados tridimensionales. Desde una perspectiva visual, se vería así:

Ejemplo de múltiplos pequeños
Tres o más

La idea se extiende fácilmente a tantas dimensiones como necesite.

¿Por qué son importantes los múltiplos pequeños?

Los múltiplos pequeños son importantes porque nos brindan una manera fácil de representar conjuntos de información complejos. Esto es particularmente cierto para 3 dimensiones cuando los datos son densos. En esta situación, la información no se puede presentar fácilmente en el mismo gráfico, ya que sería un desastre. Como resultado, los múltiplos pequeños hacen lo siguiente:

  • Dividen la información en partes de tamaño manejable.
  • Eliminan cualquier desorden interdimensional.
  • Permiten comparaciones dimensionales lado a lado.
  • Estandarizan la representación de cada dimensión.

Resumen de la lección

En resumen, la densidad de datos se puede pensar en términos de muestreo o cuántos elementos de un conjunto de información en particular se examinan. La densidad de datos es importante porque afecta la precisión. Las densidades más altas significan más precisión. Los múltiplos pequeños es una técnica que divide la visualización de datos multidimensionales en partes más pequeñas y manejables. Esto es importante porque una mayor densidad de datos puede crear desorden y dificultar la comprensión de la información.

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador