Aplicación de la estadística inferencial a problemas reales. Parte 1.



Ya nos encontramos en el punto en el cual podemos resolver problemas de vida real utilizando estadística descriptiva y estadística inferencial, recuerda que la base para las pruebas de hipótesis son las medidas de tendencia central (media) y las medidas de dispersión (varianza, desviación estándar).


Te recomiendo leer un poco de estadística descriptiva en el siguiente link:https://drive.google.com/open?id=19hadrX8f6qUgMSzHK52IwoGBnFWIeBu4

Veamos un ejemplo ilustrativo:

La universidad Humani Mundial se encuentra interesada en conocer si el promedio de las calificaciones obtenidas por los alumnos en la clase de Estadística II mejora con la impartición de clases virtuales. Se sabe que existe una dificultad en cuanto a lo que se llama la “curva de aprendizaje”, esto es, la manera en la cual las personas aprenden algo nuevo, por ello, es de suma importancia conocer si esta nueva modalidad trae consigo mejoras en el aprendizaje de los alumnos.


Las calificaciones de los alumnos obtenidas en el curso clásico presencial durante el cuatrimestre pasado fueron:

9.8 10.0 8.7 6.9 7.8 7.7
8.9 8.8 8.8 7.9 7.5 7.4
7.2 7.8 8.4 9.1 9.2 9.5
8.9 8.7 8.8 7.9 7.5 7.4
7.2 7.9 8.4 9.1 9.2 9.5

Las calificaciones de los mismos alumnos obtenidos en el curso virtual durante el cuatrimestre actual son:

9.9 9.0 8.7 8.9 7.8 8.7
8.9 8.8 8.8 7.8 7.5 7.4
8.5 8.9 8.8 9.5 9.2 9.5
8.9 8.7 8.8 7.9 7.5 7.2
7.9 8.9 8.4 9.0 9.2 9.7

Para poder conocer si existe un mejoramiento lo primero que se debe de hacer es plantear una metodología utilizando estadística descriptiva calculando la media y la desviación estándar de las calificaciones.

Utilicemos las funciones =MEDIA() y =DESVEST() de excel. Estos cálculos los podemos realizar a mano, pero para fines prácticos utilicemos las funciones.

Debido a que lo que se desea es conocer si la curva de aprendizaje con enseñanza virtual es mejor, consideremos los valores calculados de la muestra de datos del curso clásico.

Así, los valores serian:

*Para las calificaciones del curso clásico la media es $\mu_0 = 8.396$ con desviación estándar de $\sigma = 0.852$


*Para las calificaciones del curso clásico la media es $\overline{\mathrm{x}} = 8.623$ con desviación estándar de $S = 0.702$

Debido a que queremos estudiar si hubo mejoras en la enseñanza, las Hipótesis serían:

H0: El promedio de las calificaciones con el curso virtual es MENOR O IGUAL al promedio de las calificaciones del curso clásico. (en este caso, no hay mejoras al aplicar el curso virtual)
Ha: El promedio de las calificaciones con el curso virtual es MAYOR al promedio de las calificaciones del curso clásico. (en este caso, SI HAY mejoras al aplicar el curso virtual)

Observa que considerar la palabra “MENOR” en la Hipótesis H0 no es válida, debido a que se consideraría que el curso virtual empeora el aprendizaje de los alumnos, por lo cual, en H0 sólo es válido utilizar la palabra IGUAL, es decir, la igualdad estaría interpretándose como que el efecto del curso virtual daría como resultado un aprendizaje similar al curso clásico.

Así, las Hipótesis reales serían:

H0: El promedio de las calificaciones con el curso virtual es IGUAL al promedio de las calificaciones del curso clásico. (en este caso, no hay mejoras al aplicar el curso virtual)
Ha: El promedio de las calificaciones con el curso virtual es MAYOR al promedio de las calificaciones del curso clásico. (en este caso, SI HAY mejoras al aplicr el curso virtual)

En símbolos $\mu=$ El promedio de las calificaciones con el curso virtual, y $\mu_0=$ El promedio de las calificaciones del curso clásico.


Solución:

I. Se trata de una distribución muestral de medias con $\sigma$ conocida.

$H_0= \mu = \mu_0$
$H_a= \mu > \mu_0$

IMPORTANTE: El tipo de prueba de hipótesis la proporciona la hipótesis Ha, en este caso se trata de una prueba unilateral derecha (puedes guiarte de la sesion anterior). 

II. Datos


$$\begin{array}{l}
\mu_0=8.396 \text { } \\
\sigma=0.852 \text { } \\
\overline{\mathrm{x}}=8.623 \text { } \\
\mathrm{n}=30 \\
\alpha=0.05, \text { confianza de } 95\%
\end{array}
$$

III. Prueba de hipótesis

$\mathrm{H}_{0}: \mu = 8.396$

$\mathrm{H}_{1}: \mu> 8.396$

IV. Cálculos del estadístico de prueba.


Se usará el estadístico de prueba $\mathrm{Z}_{e}=\frac{\overline{\mathrm{X}}-\mu_{0}}{\sigma / \sqrt{{\mathrm{n}}}}$.


$$
\mathrm{z}_{e}=\frac{8.623-8.396}{0.852 / \sqrt{30}}=1.459
$$



V. Regla de decisión

El criterio de rechazo de $\mathrm{H}_{0}$ es $ \mathrm{z}_{e}>Z_{\alpha}$.


VI. Decisión y justificación

Como $ Z_{\alpha} = 1,645$,  entonces $1.459>1,645 \Rightarrow \mathrm{z}_{0}$ NO cae en la zona de rechazo, por tanto se acepta $\mathrm{H}_{0}$

VII. Conclusión del problema: Con un 95$\%$ de confianza se puede afirmar que la calificación promedio del grupo del curso virtual es equivalente al promedio del curso clásico, concluyendo que el redimiento académico no se ve afectado con la nueva modalidad virtual.


Ahora es momento de reforzar lo aprendido mediante la siguiente tarea.



Comentarios