¿Qué es la estadística inferencial?

La practica de la medicina esta basada en protocolos, existen distintos tipos de protocolos (quirúrgicos, de seguimiento, de tratamiento, etc.). A su vez estos protocolos se crean basándose en resultados estadísticos previamente recopilados sobre grandes grupos de poblaciones.

Muchas veces, al estudiar poblaciones muy extensas, se hace imposible tomar datos de todos los individuos de la misma, pero podemos recopilar datos específicos de algunos individuos y llegar a una conclusión aplicable a toda la población. Esta es la función de la estadística inferencial.

El objetivo de este articulo es dar una idea general sobre lo que es estadística inferencial, algunos de sus métodos para inferir y ejemplos de para que pueden utilizarse en distintos casos.

Desarrollo del tema:

La estadística inferencial es la rama de la estadística que se dedica a inferir resultados o conclusiones sobre una población en particular a partir de una muestra representativa de dicha población.

Población, muestra y muestreo aleatorio:

Para poder entender de que se trata la estadística inferencial, debemos definir estos conceptos. Antonio Vargas Sabadías (1995) dice “Entendemos por población el conjunto de todos los elementos que van a ser objeto de un experimento aleatorio.” (p. 297). En relación a la muestra dice “Una muestra es un subconjunto de elementos de la población.” (p. 297).

Al hablar de muestreo aleatorio explica que: “el muestreo aleatorio es un proceso de selección de muestras, mediante el cual se garantiza que todos los elementos de la población tienen la misma probabilidad de ser elegidos para formar parte de la muestra. A la muestra seleccionada de este modo se le llama muestra aleatoria.” (p. 297).

Errores estadísticos:

Existen en la estadística 2 tipos de errores, los errores muestrales y los no muestrales.

El error muestral se define como la diferencia entre el resultado de una estadística de la muestra y el parámetro correspondiente a la población.

En cambio, el error no muestral no depende del diseño muestral, sino del desarrollo de la operación de campo. Ejemplos de estos son: anotar mal los datos, que el encuestado mienta, etc.

Otro tipo de error no muestral es el denominado sesgo de las muestras, que se define como la tendencia a favorecer la selección de ciertos elementos de una muestra en lugar de otros. Este error en particular puede minimizarse utilizando la aleatorización en la selección de muestras.

Técnicas de muestreo aleatorio:

Como se dijo antes, el sesgo de las muestras puede minimizarse o suprimirse utilizando la aleatorizacion. Esto se logra utilizando una técnica de muestreo aleatorio. Las técnicas mas utilizadas son: muestreo aleatorio simple, muestreo estratificado, muestreo sistemático y muestreo por conglomerados.

  1. Muestreo aleatorio simple: esta técnica garantiza que todos los individuos tengan la misma probabilidad de ser escogidos.
  2. muestreo aleatorio estratificado: en este método, se divide a la población en subgrupos mas pequeños a partir de características de interés y a estos subgrupos aplicar un muestreo aleatorio simple. La cantidad de muestras de cada subgrupo puede ser elegida por: asignación proporcional (la cantidad de las muestras depende del tamaño del subgrupo) o por asignación optima (la cantidad las se define por quien hace el muestreo).
  3. Muestreo sistemático: primero se debe realizar una selección inicial de observaciones de manera tal que los mas similares tienden a estar mas cercanos. a partir de esto se seleccionan las muestras aplicando un criterio sistemático. Ejemplo: se seleccionan todas las personas cuyo documente termine con numero par.
  4. muestreo por conglomerados: en una población dividida en unidades relativamente pequeñas y geográficamente cercanas (ej. distritos o barrios), se realiza un muestreo aleatorio simple de dichos conglomerados y se realiza un censo completo de cada uno de los conglomerados que se seleccionaron.

Métodos:

Para lograr su objetivo, la estadística inferencial cuenta con varios métodos. A continuación se detallan brevemente algunos de ellos:

  • Método de equis-raya: llamamos equis-raya al promedio muestral, es decir el promedio de todas las muestras que tengamos.Utilizando este valor podemos llegar estimar el total de la población (ej: ¿cuantas tomas de temperatura tengo que hacer para calcular la temperatura promedio de un lugar?), intervalos (ej: ¿cual es el peso promedio de todas las mujeres de la argentina de 20 años? en este caso el resultado seria un rango y no un numero puntual), calcular el nivel de confianza, etc.
  • Test de hipótesis o contraste de hipótesis: este método es uno de los mas utilizado y mas fáciles de comprender. Este método se basa en contrastar 2 hipótesis planteadas de la siguiente forma:

1. Hipótesis nula (H0): es la hipótesis que se debe comprobar. Es un enunciado sobre el que no se conoce su verdad o falsedad. En estadística, este enunciado siempre es respecto a una población.

2. Hipótesis alternativa (H1): se establece como el complemente de la hipótesis nula, y representa la conclusión cuando H0 es rechazada.

Estas 2 hipótesis deben ser exhaustivas y excluyentes, es decir, nunca hay intersección entre ellas y la unión de ambas genera el conjunto total de alternativas.

Ejemplo:

H0: el promedio que tarda una aspirina en hacer efecto es de 15 minutos.

H1: el promedio que tarda una aspirina en hacer efecto es de mas de 15 minutos.

Conclusiones y errores de tipo I y tipo II para el test de hipótesis:

Las decisiones se plantean siempre respecto de la hipótesis nula, por lo que da 2 resultados posibles:

a) Aceptar la hipótesis nula (o rechazar la alternativa)

b) Rechazar la hipótesis nula (o aceptar la alternativa)

Para llegar a una de estas decisiones se adopta una regla de decisión, basada en la información muestral.

Por otro lado, H0 puede ser verdadera o falsa. Entonces cuando aceptamos o rechazamos la hipótesis nula podemos tener razón o cometer un error. De esta forma qudarian las siguientes posibilidades:

Decisión sobre H0H0 es verdaderaH0 es falsa
Aceptar H0Decisión correctaDecisión incorrecta
Rechazar H0Decisión incorrectaDecisión correcta

Si aceptamos la hipótesis nula cuando es verdadera y la rechazamos cuando es falsa, estaremos tomando una decisión correcta, pero si la rechazamos cunado es verdadera, estaremos cometiendo un error; a esto se lo llama error tipo I. También, si aceptamos la hipótesis nula cuando es falsa estaremos cometiendo otro tipo de error; se lo llama error tipo II.

Llínas Solano Humberto (2017) utiliza el siguiente ejemplo: “supongamos que un individuo es juzgado un por un delito que supuestamente ha cometido y supongamos que se formulan las hipótesis siguientes:

H0: El individuo es inocente.

H1: el individuo es culpable.

Los abogados de la fiscalia tratan de probar que H1 es verdadera (o que H0 es falsa). Al llegar a su veredicto final, el jugarado debe emitir una decisión correcta o incorrecta. Las decisiones correctas consisten en que el jurado vote inocente cuando el individuo es inocente y culpable cuando el individuo es culpable. Las decisiones incorrectas son que el jurado opte por castigar al acusado cuando este es inocente (error de tipo I) o perdonarlo cuando sea culpable (error de tipo II).”(p. 154).

A partir de esto, podemos darnos cuenta que el error de tipo I es siempre el peor error que podemos cometer. Siguiendo el ejemplo, cometer este error significaría que no solo estaremos condenando a un inocente sino también que el culpable no seria castigado. Es por esto que las estrategias que utilizan este método se enfocan en minimizar lo máximo posible la probabilidad de cometer este error.

  • Otros métodos: Existen muchos otros métodos utilizados por la estadística inferencial para lograr su cometido pero solo se los nombrara debido a la complejidad que implicaría desarrollarlos, ya que el objetivo de este articulo es dar una idea general de este tema.

Algunos de estos métodos son:

  1. Diferencias de medias y porcentajes.
  2. Contraste de bondad de ajuste, Prueba de independencia y prueba de homogeneidad
  3. Analisis de la Varianza
  4. Regresion lineal y correlacion
  5. Contrastes no parametricos y de distribución libre

Referencias:

Olivo Suaréz, E. (2008). Significado de los Intervalos de Confianza para los Estudiantes de Ingeniería en México. (Doctoral). Universidad de Granada.

Otzen, T. & Manterola, C. (2017) Técnicas de Muestreo sobre una Población a Estudio. Inernational Journal of Morphology. Vol. 35. No. 1. Pp. 227-232

Vargas Sabadias, Antonio. (1995) Estadistica Descriptiva e Inferencial. Cuenca. Servicio de Publicaciones de la Universidad de Castilla-La Mancha.

Llínas Solano, H. (2017) Estadística Inferencial. Barranquilla. Universidad del norte.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *