Coeficiente de determinación: definición, fórmula y ejemplo

¿Quieres explorar más? 📂 Explorar Categorías 🔥 Tendencias 🎓 Cursos

¡Pizza!

¿Tienes una pizzería favorita? Supongamos que desea averiguar cómo las coberturas de pizza adicionales afectan el costo total de una pizza en todas las pizzerías de su ciudad. Para hacer esto, levante el teléfono y comience a llamar a las diferentes pizzerías, anotando el costo total de la pizza con uno, dos, tres, etc., aderezos en cada lugar.

Una vez que haya terminado, deberá ajustar sus datos con una ecuación y, lo que es igual de importante, averiguar si su modelo matemático para los datos es un buen ajuste.

Coeficiente de determinación derivado

En esta lección, hablaremos sobre una construcción estadística que se usa para estimar el poder predictivo de su modelo. El coeficiente de determinación denotado como R 2 grande o r 2 pequeño es una cantidad que indica qué tan bien se ajusta un modelo estadístico a un conjunto de datos. En términos matemáticos, especifica qué parte de la variación en la variable dependiente y se caracteriza por una variación en la variable independiente x .

Quizás se pregunte qué es r , ya que solo definimos r 2 . Se puede pensar en el coeficiente de correlación denotado tan grande R o poco r como una medida de la relación estadística entre x e y . Como el enfoque de esta lección es el coeficiente de determinación, recuerde que r representa el coeficiente de correlación, así de simple.

Bien, hagamos una derivación simple del coeficiente de determinación. En la imagen, se ve que empezamos con trama que contiene un conjunto de puntos, X e Y , en la que se supone que existe una relación lineal entre la X y Y variables. Tenga en cuenta que este supuesto de linealidad se hace para simplificar la derivación y que se puede utilizar un proceso similar para modelos no lineales.

Tema relacionado:
Coeficiente de Solvencia: Qué es, Características y Ejemplos

Se muestra una gráfica con tres puntos de muestra. Ahora tratamos de encontrar la línea de regresión , que es la línea que mejor se ajusta a los puntos de datos. La línea en verde muestra un intento de línea de mejor ajuste.

Podemos simplificar esta línea con la ecuación y = mx + b , que es la ecuación estándar de una línea. Para calcular la suma de los errores cuadrados entre cada punto de datos y nuestra línea de mejor ajuste, realizamos el siguiente cálculo:

En esta ecuación, el término línea de registro SSE representa la suma cuadrada de los errores de la línea de regresión.

Tema relacionado:
Principio de Arquímedes: historia, fórmula y ejemplos

Nuestro siguiente paso es averiguar en qué se diferencia el valor y de cada punto de datos del valor y medio de todos los puntos de datos. En particular, necesitamos calcular la suma de los cuadrados de estas diferencias a la derecha del signo igual, como se muestra a continuación.

El término línea y media SSE representa la suma al cuadrado de los errores del valor y medio .

Ahora tenemos todo lo que necesitamos para calcular el coeficiente de determinación, como puede ver a continuación.

Tema relacionado:
Alquinos: Fórmula, propiedades y ejemplos

Coeficiente de determinación calculado

Hagamos un ejemplo juntos para solidificar todo lo que acabo de cubrir, ya que probablemente sea un poco confuso. Suponga que se nos da el siguiente conjunto de datos que ve en esta tabla.

X	y
70	3
82	10
88	12
93	dieciséis
105	21
115	45

¿Cómo calculamos el coeficiente de determinación en este caso?

Podemos comenzar calculando el coeficiente de correlación usando la siguiente fórmula:

Aquí hay una tabla de datos con los valores calculados, siendo n el tamaño de muestra de 6.

n = 6

	X	x 2	y	y 2	xy
	70	4900	3	9	210
	82	6724	10	100	820
	88	7744	12	144	1056
	93	8649	dieciséis	256	1488
	105	11025	21	441	2205
	115	13225	45	2025	5075
sumas:	553	52267	107	2975	10954

Conectando estos valores en la ecuación para la pequeña r , acabo de darle, obtenemos r = 0.92782 . Para calcular el coeficiente de determinación, todo lo que necesitamos hacer es el cuadrado r . Al hacerlo, llegamos a r 2 = 0.8609 . Ahora puede ver una representación visual de todo esto.

Ahora intente retroceder al conjunto de datos y resolver para r y r 2 usted mismo, solo por diversión y práctica.

Resumen de la lección

Ya que cubrimos bastante, creo que es hora de recapitular todo, ¿no? En esta lección hemos aprendido sobre el coeficiente de determinación en el contexto del análisis de regresión lineal. Esta cantidad, designada como R 2 grande o r 2 pequeña , indica qué tan bien se ajusta un modelo estadístico a un conjunto de datos.

Además, de recordatorio de que el coeficiente de correlación , denotada como R o R , es una medida de la relación estadística entre x y y . Para derivar el coeficiente de determinación es necesario comenzar con un conjunto de datos simple e intentar trazar la línea de mejor ajuste, observando posteriormente los errores entre la línea de regresión y cada punto de datos, así como los errores de las coordenadas y de cada punto y el valor medio de y . Podemos encontrar una expresión para el coeficiente de determinación. Además, hemos visto un ejemplo de cómo calcular el coeficiente de determinación, calculando primero el coeficiente de correlación y luego elevándolo al cuadrado.

Twittear

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo Editor y fundador