Solo Nivel Superior (NS). La regresión lineal simple estima la relación entre dos variables — una independiente (x) y una dependiente (y) — ajustando una recta de la forma y = a + bx. El coeficiente b indica cuánto cambia y por cada unidad adicional de x. En Gestión Empresarial sirve para pronosticar ventas, demanda o costes y para detectar correlaciones (no causalidad). Contenido OE2 cuantitativo, presente en Prueba 1.

Definiciones clave

Pulsa cada término para ver su definición.

¿Qué es?

La ecuación de la recta de regresión:

y = a + bx

La recta se ajusta por mínimos cuadrados: minimiza la suma de las distancias verticales al cuadrado entre los puntos reales y la recta. Las fórmulas (a recordar para Prueba 1 NS):

b = Σ((xᵢ − x̄)(yᵢ − ȳ)) / Σ((xᵢ − x̄)²)

a = ȳ − b·x̄

La correlación (r, entre −1 y +1) mide la fuerza y dirección de la relación. Atención: una correlación alta NO implica causalidad; sólo señala que las dos variables se mueven juntas.

¿Cuándo se usa?

Contextos típicos en el syllabus IB
  • Unidad 4 — pronóstico de demanda en función de gasto publicitario, temperatura, eventos.
  • Unidad 5 — relación entre volumen de producción y coste.
  • Unidad 2 — relación entre formación de empleados y productividad.
  • EI — uso recurrente con datos primarios.
  • Prueba 1 — cálculo de la recta y predicción para un valor concreto de x.

¿Cómo se aplica?

  1. Recoger pares de datos (xᵢ, yᵢ).
  2. Visualizar con un diagrama de dispersión (scatter plot) para comprobar que la relación parece lineal.
  3. Calcular las medias x̄ y ȳ.
  4. Calcular b con la fórmula de los mínimos cuadrados.
  5. Calcular a = ȳ − b·x̄.
  6. Predecir sustituyendo x en la ecuación.
  7. Comentar limitaciones: extrapolar fuera del rango de datos es arriesgado; correlación no es causalidad.

Ejemplo aplicado: Coca-Cola y la temperatura

Pronóstico de ventas según la temperatura

Una distribuidora de Coca-Cola recoge datos de 5 días sobre la relación entre temperatura máxima del día (ºC) y cajas vendidas en una ciudad mediterránea:

Temperatura (x)Cajas vendidas (y)
2040
2555
3070
3585
40100

Cálculos rápidos:

  • x̄ = (20+25+30+35+40)/5 = 30 ºC.
  • ȳ = (40+55+70+85+100)/5 = 70 cajas.
  • b = 3 (por cada grado adicional, se venden 3 cajas más).
  • a = 70 − 3·30 = −20.
  • Recta: y = −20 + 3x.

Predicción para un día de 32 ºC: y = −20 + 3·32 = 76 cajas. La empresa ya puede preparar el almacén y la flota con un pronóstico cuantitativo.

Limitaciones importantes que el examen valora mencionar:

  • El modelo asume linealidad: a 50 ºC habrá un techo (la gente se queda en casa, cierran terrazas).
  • Sólo cubre la temperatura; ignora día de la semana, eventos, promociones, lluvia.
  • Correlación ≠ causalidad: si subiera la temperatura tras una campaña, parte del aumento sería de la campaña, no del calor.

¿Cómo cae en el examen?

Tipos de pregunta más frecuentes
  • Prueba 1. "Calcular la ecuación de la recta de regresión y predecir y para un valor concreto de x" — 4-6 puntos, OE2.
  • Prueba 2. "Comentar hasta qué punto la recta es fiable para pronosticar ventas" — 4-6 puntos, OE3.
  • Trampa habitual: extrapolar fuera del rango de datos sin advertir el riesgo. Si los datos van de 20 a 40 ºC, predecir para 5 ºC o 60 ºC es poco fiable.

Comprueba tu comprensión

✅ 6 preguntas sobre regresión lineal

1. (OE1) En la ecuación y = a + bx, la pendiente "b" representa:

2. (OE2) En el ejemplo de Coca-Cola, b = 3 significa que:

3. (OE2) Predicción con y = −20 + 3x para x = 38 ºC:

4. (OE3) Predecir las ventas para 60 ºC usando el modelo de Coca-Cola sería:

5. (OE3) Un coeficiente de correlación r = +0,95 indica:

6. (OE3) ¿Cuál es la principal limitación de la regresión lineal simple?