La prueba exacta de Fisher es un test analítico estadístico bivariante de contraste de hipótesis, en el presente artículo el lector podrá entender sus características, para que sirve y como se aplica esa prueba no paramétrica.
Desarrollo del tema:
La prueba exacta de Fisher es una prueba estadística aplicable cuando se desea verificar la existencia de diferencias entre dos grupos independientes, su utilidad consiste en el análisis de datos para relacionar variables dicótomas. Las variables cualitativas son fijas, las informaciones que las determinan se toman de una base de datos previamente conocidas y se las aplica en tablas de contingencia 2×2 para su debida asociación. La prueba es útil para estudios pequeños cuando la frecuencia esperada es menor que cinco.[1]
Este test está basado en el cálculo de la probabilidad exacta de lograr una distribución de sucesos adentro de una tabla, para tanto se considera la presentación de dos resultados, uno + y otro – establecidos por dos tipos, o sea X e Y (ilustración 1). Es necesario establecer el nivel de significancia, en este caso α=0.05.

La fórmula (ilustración 2) para calcular el test tiene en cuenta las probabilidades de resultados obtenidos de la tabla usando una distribución hipergeometrica[2]:

Según Domènech M. J. M. (1994), la tabla de contingencia 1 (Ilustración 3) fornece el valor P (para hipótesis bilaterales y unilaterales) agrupado a tablas de 2×2. La definición de la tabla se da a partir de la dimensión de muestra N, del menor valor en M1, del menor valor en M2 del otro margen y del efectivo denominado F producto de la intersección de M1 y M2. Los grados de significación P han sido redondeados a 3 decimales; en consecuencia, un valor Igual a .000 indica que P< 0.0006.
Veamos al ejemplo que proporciona los resultados del tratamiento de 17 personas con los medicamentos X e Y, donde el objetivo es conocer si hay diferencia de resultados positivos y negativos en ambos grupos.

Fuente: Tabla Adaptada de Doménech, M. J. M. (1999). Tablas de estadística. Barcelona: Signo. P. 62.
Para calcular la prueba, se aplica los valores de la tabla de contingencia 1 a la fórmula para resolver la ecuación y así generar el valor de P[3] (Ilustración 4).

Como la hipótesis testea la probabilidad de ocurrencia de una situación, se debe calcular las probabilidades referentes a las frecuencias observadas (Ilustración 4) y también de las situaciones extremas[4] de las tablas de Contingencia 2 y 3 (Ilustración 5).

Las hipótesis de esta prueba están representadas de dos maneras: en la primera, hipótesis nula (H0) los resultados no difieren en ambos medicamentos, y en la segunda (H1) los resultados difieren en ambos medicamentos. El nivel de confianza es de 95% y el nivel de significación es de 0,05[5].
Para llegar al valor definitivo que evalúa la probabilidad de las hipótesis, se utiliza la siguiente formula:

El valor observado en este caso es superior al valor α (nivel de significación) rechazando la hipótesis nula, la prueba en cuestión es bilateral, o sea, hay evidencia que la hipótesis 1 que afirma la existencia de distinción de resultados en cada medicamento aplicado sea verdadera.
En otro ejemplo, una encuesta realizada a 15 personas, hombres y mujeres, a los cuales se les preguntó si están de acuerdo a la práctica médica del aborto antes de los 21 días de gestación. El objetivo fue conocer si hay diferencia entre hombres y mujeres en estar de acuerdo con la practica medica del aborto en este periodo.
La hipótesis planteadas son: H0 = los hombres no difieren de las mujeres en la práctica del aborto antes de los 21 días de gestación; H1 = los hombres difieren de las mujeres en la práctica de aborto antes de los 21 días de gestación.
Veamos la tabla de contingencia 4 (Ilustración 7) para analizar los datos de la encuesta.

Para realizar la prueba debemos calcular los valores extremos, o sea, que los valores de la encuesta lleguen a sus puntos más extremados conforme se observa en las tablas de contingencia 5 y 6 (Ilustración 8, Ilustración 9).


Para esta prueba tenemos el nivel de significación de α = 0,05. Para llegar a respuesta se suma los resultados de cada tabla, como para este estudio las hipótesis se basan en la desigualdad, son bilaterales (de dos colas), por lo tanto el valor de P se suma dos veces y el resultado se compara con el valor α, como demuestra el cálculo en la Ilustración 10.

Cuando se compara los valores de P y α, se puede observar que el valor obtenido (P=0.23) es superior al nivel de significancia (α=0.05) y por lo tanto no hay evidencias para rechazar la hipótesis nula (H0 = los hombres no difieren de las mujeres en la práctica del aborto antes de los 21 días de gestación).
En conclusión, lo fundamental que se destaca en la prueba exacta de Fisher es que todas las informaciones usadas en las tablas de contingencia son independientes, por lo tanto su objetivo está en evaluar las variables en este aspecto.
Referencias:
[1] Glantz, S. A., & Pérez-Tamayo, R. A. M. (2006). Bioestadística (Sexta Edición). México. The McGraw-Hill Interamericana. P. 158.
[2] Blair, R. C., & Taylor, R. A. (2008). Bioestadística. México: Pearson Educación. P. 403.
[3] Glantz, S. A., & Pérez-Tamayo, R. A. M. (2006). Bioestadística (Sexta Edición). México. The McGraw-Hill Interamericana. P. 470
[4] Blair, R. C., & Taylor, R. A. (2008). Bioestadística. México: Pearson Educación. P.404.
[5] Glantz, S. A., & Pérez-Tamayo, R. A. M. (2006). Bioestadística (Sexta Edición). México. The McGraw-Hill Interamericana. P. 121