Transformación de datos no lineales: Pasos y ejemplos

Publicado el 3 noviembre, 2020

Datos no lineales

Jack es el dueño de una tienda de artículos electrónicos y de oficina. A lo largo de los años, ha recopilado datos sobre las ventas de diferentes artículos. Está trabajando para actualizar su inventario y realizar algunas compras basadas en ventas anteriores. Algunos de sus datos son lineales, por lo que le resulta fácil predecir la cantidad de un determinado artículo que necesita comprar. Sin embargo, algunos de sus datos no son lineales, lo que le dificulta intentar llenar su inventario para el próximo año. ¿Cómo puede Jack usar sus datos no lineales para realizar compras de inventario?

En esta lección, aprenderá a utilizar diferentes tipos de transformaciones para convertir datos no lineales en datos lineales.

Transformaciones

Primero, analicemos las diferencias entre un conjunto de datos lineales y un conjunto de datos no lineales. Este gráfico muestra datos no lineales que se transforman en datos lineales (vea el video que comienza en 00:49 para ver esta transformación).

Eche un vistazo a este gráfico que compara y contrasta datos lineales y no lineales:

LinealNo lineal
VariablesProporcional entre dos variablesNo proporcional entre dos variables
CorrelaciónConstante entre dos variablesCambios entre variables de un punto a otro
PrediccionesFácil de hacer desde pendiente e interceptarDifícil de hacer; a veces una variable corresponderá a dos resultados diferentes
GraficoLínea rectaCualquier cosa menos una línea recta: una curva, una ola, una campana, etc.

Primero, los datos lineales son proporcionales entre dos variables. Por ejemplo, el siguiente conjunto de datos es proporcional: 1, 2, 3, 4, 5, 6, 7, 8. Hay exactamente una diferencia numérica entre cada uno de los números, lo que da como resultado un patrón distinto y consistente que no cambia entre cada número. Por tanto, esto es proporcional entre dos variables o números.

Los datos no lineales no son proporcionales entre dos variables. Eche un vistazo a este conjunto de datos: 1, 3, 6, 8, 11, 13, 16. No existe un patrón de valores consistente entre estos números; cambia de sumar dos a sumar tres alternativamente. Por tanto, este conjunto de datos no es proporcional.

A continuación, la correlación entre variables en datos lineales es constante, mientras que los datos no lineales cambian de un punto a otro. Esto es similar al ejemplo anterior. En el conjunto de datos lineales 1, 2, 3, 4, 5, 6, 7, 8, podemos ver que la correlación entre las variables es +1 y nunca cambia, mientras que el conjunto de datos 1, 3, 6, 8, 11 , 13, 16 cambia entre +2 y +3.

Las predicciones son más fáciles de hacer para datos lineales; puede analizar la pendiente y la intersección para hacer una predicción sobre una variable. Eche un vistazo a este gráfico:


Grafica lineal
gráfico lineal

A partir de este gráfico, probablemente pueda predecir que las ventas de computadoras portátiles continuarán disminuyendo en 2015, y probablemente incluso pueda obtener una buena estimación de cuántas computadoras portátiles se venderán: 50. Sin embargo, los datos no lineales son más difíciles de predecir.

Eche un vistazo a este gráfico:


Gráfico no lineal
gráfico no lineal

Como puede ver, los datos en este gráfico cambian de cada dos años a cada tres años y luego nuevamente. Las variables no son consistentes entre los años y realmente son inconsistentes entre el número de ventas. Si bien todavía es posible adivinar, es difícil hacer una predicción precisa basada en los datos proporcionados. Observe que las ventas originalmente aumentan y luego bajan y suben. No hay mucho que salir de aquí para determinar si los datos continuarán aumentando, disminuyendo o disminuyendo.

Por último, podemos mirar los gráficos anteriores para ver una comparación entre los gráficos lineales y no lineales. Un gráfico lineal siempre será una línea, ya sea una línea de regresión o una línea lineal verdadera. Sin embargo, los datos no lineales pueden ser casi cualquier cosa. Estos son algunos ejemplos de los datos no lineales de Jack y sus ventas en su tienda de artículos electrónicos y de oficina:

gráfico no lineal para las ventas de baterías

gráfico no lineal de ventas de carpetas

gráfico no lineal para dispositivos de juego

Ahora que conoce las diferencias entre datos lineales y no lineales, hablemos sobre el uso de transformaciones.

Cuándo usar transformaciones

Dado que es difícil hacer predicciones con datos no lineales, podemos usar transformaciones para hacer que los datos no lineales sean más lineales y luego hacer predicciones a partir de ahí. Antes de comenzar a trabajar con transformaciones, hay algunas cosas a tener en cuenta. Primero, no puede simplemente transformar cualquier dato no lineal. Para ser transformables, los datos no lineales deben ser:

  • Sencillo
  • Monótono

Los datos no lineales simples son cuando los datos están curvados pero no cambian. Veamos el gráfico ondulado no lineal de los datos que Jack recopiló sobre las ventas de dispositivos de juego. Estos datos son curvos, pero cambian hacia arriba y hacia abajo; por tanto, estos datos no son sencillos.

Los datos monótonos no lineales son cuando los datos son siempre positivos o siempre negativos. Observe que en el gráfico de ventas de la carpeta, los datos comienzan en positivo, pero luego cambian a negativo a medida que pasa el tiempo. Por tanto, estos datos no son monótonos.

Ahora eche un vistazo a las ventas de impresoras de Jack:


Gráfico que muestra datos simples y monótonos
gráfico que muestra las ventas de impresoras

Estos datos son monótonos y simples. Observe que la gráfica es curva, pero solo se curva una vez. Esto es lo que lo hace simple. También observe que los datos continúan aumentando, lo que hace que el gráfico sea siempre positivo y, por lo tanto, monótono. Podemos transformar estos datos en algo más lineal.

Para transformar datos no lineales, puede aplicar una operación, como sumar, restar, multiplicar o dividir, a una variable, ya sea x o y , como esta:


Transformación de ejemplo
tabla y gráfico para transformar datos no lineales

Observe que, en esta transformación, tomamos el logaritmo tanto de x como de y para las primeras seis semanas de los datos de ventas de la impresora. Una vez que estos datos se transforman, son mucho más lineales. Esto funciona porque estamos transformando constantemente cada variable. Lo que quiero decir es que no estamos sumando 4 a un valor de x y luego tomando el logaritmo de otro valor de x ; estamos tomando el logaritmo de cada valor de x .

Tipos de transformaciones

Hay varias formas de transformar datos no lineales transformando x , y , o ambas variables a la vez. Las formas más comunes de transformar datos no lineales es utilizando uno de estos modelos:

  • Modelo de poder
  • Modelo de logaritmo
  • Modelo de raíz cuadrada
  • Modelo recíproco

Eche un vistazo a esta tabla:

Modelo Ecuaciones de transformación
Modelo de poder X = Log ( X ) Y = Log ( Y )
Modelo de logaritmo X = Log ( X ) Y = Y
Modelo de raíz cuadrada Y = raíz cuadrada ( Y ) X = X
Modelo recíproco Y = 1 / Y X = X

Observe que algunas transformaciones cambian las variables x e y , como el modelo de potencia. Algunas transformaciones cambian solo la variable x , como el modelo de logaritmo, y algunas cambian solo las variables y , como los modelos de raíz cuadrada y recíproco. Existen otros modelos, pero estos son los más utilizados. Para transformar datos lineales, simplemente elija un modelo y aplíquelo a la variable apropiada. La sección anterior utilizó el modelo de potencia. Apliquemos el modelo de logaritmo a las primeras seis semanas de los datos de ventas de la impresora. Pausa el video aquí e intenta encontrarlo por tu cuenta.

Eche un vistazo a la respuesta:

Valor X originalValor Y originalValor X transformado (Log ( X ))
1 200
2 22.3010
3 25.4771
4 26.6021
531.6990
635.7782

Recuerde que esta transformación solo cambia el valor x , no el valor y . Verifique sus respuestas con la tabla; ¿Obtuviste la respuesta correcta?

Probemos el modelo de raíz cuadrada. Pausa el video aquí y pruébalo. Vaya, esta transformación hace una ecuación lineal casi perfecta. Eche un vistazo a la respuesta. Recuerde que esta transformación solo cambia el valor de y , no el valor de x . Verifique sus respuestas con la tabla; ¿Obtuviste la respuesta correcta?

Valor X originalValor Y originalValor de Y transformado (sqrt ( Y ))
1 204.47
2 224.69
3 255
4 265.1
5315.57
6355,92

Probemos el modelo recíproco. Pausa el video aquí y pruébalo.

Valor X originalValor Y originalValor de Y transformado (1 / Y )
1 20.05
2 22.045
3 25.04
426.038
531.032
635.029

Eche un vistazo a este gráfico:


Transformación recíproca del modelo
transformación recíproca del modelo

¿Notaste algo extraño? Derecha, la pendiente de la línea ahora es negativa en lugar de positiva. Las transformaciones recíprocas no funcionan para conjuntos de datos que contienen solo valores positivos. Esto se debe a que los números grandes se vuelven números más pequeños y los números más pequeños se vuelven más grandes cuando está involucrado el recíproco.

Eche un vistazo a todas nuestras transformaciones:


Las cuatro transformaciones
gráficos de transformaciones usando los cuatro modelos

Puede ver que para este conjunto de datos en particular, el modelo de transformación de raíz cuadrada nos dio los datos más lineales, mientras que el recíproco nos dio una pendiente inexacta.

Resumen de la lección

Ahora que ha aprendido que Jack puede usar transformaciones para cambiar sus datos no lineales en datos lineales y hacer predicciones basadas en esos datos transformados, existen algunas diferencias clave que debe recordar entre los datos lineales y no lineales.

Recuerde que las variables entre datos no lineales no son proporcionales y la correlación puede cambiar, mientras que las variables en datos lineales son proporcionales y la correlación permanece consistente. Predecir datos lineales es fácil, mientras que predecir datos no lineales puede resultar más difícil. Puede ver esto mirando los gráficos de datos lineales y no lineales. Los datos lineales son siempre una línea recta, mientras que los datos no lineales son todo lo contrario.

Debido a que los datos no lineales son difíciles de predecir, usamos transformaciones para hacer que los datos no lineales sean más lineales. Para transformar datos lineales, los datos deben ser simples y monótonos. Los datos no lineales simples son cuando los datos están curvados pero no cambian. Los datos monótonos no lineales son cuando los datos son siempre positivos o siempre negativos.

Puede cambiar la variable x o y en una transformación lineal, pero a menudo es más fácil cambiar la variable x . Hay varias transformaciones, pero estas son las más comunes:

  • Modelo de poder
  • Modelo de logaritmo
  • Modelo de raíz cuadrada
  • Modelo recíproco

¡No olvides! Las transformaciones recíprocas no funcionan para conjuntos de datos que contienen solo valores positivos.

Los resultados del aprendizaje

Debería tener la capacidad de hacer lo siguiente después de esta lección:

  • Diferenciar entre datos lineales y datos no lineales
  • Identificar el propósito de usar transformaciones para hacer que los datos no lineales sean más lineales.
  • Definir datos no lineales simples y monótonos
  • Explica los cuatro modelos de transformaciones más comunes.

¡Puntúa este artículo!