UNIVERSIDAD MAYOR
FACULTAD DE ODONTOLOGÍA
BIOESTADÍSTICA

UNIDAD DE AUTO APRENDIZAJE
para alumnos de 2°año de Odontología, curso de Bioestadística.
 

TEST DE STUDENT óTEST T

Dr. Benjamín Martínez R.
Profesor de Bioestadística


Racional: El test de Student es uno de los más utilizados en odontología, y un alumno y/o cirujano dentista para poder interpretar adecuadamente un artículo científico en donde se ha utilizado dicho test tiene que conocerlo para poder entender bien las conclusiones obtenidas. ¿Existe diferencia entre la resistencia a la tracción entre amalgama A vs B? ¿El ángulo goníaco en los pacientes Clase I vs. Clase III sufrió modificaciones después del tratamiento ortodóncico realizado?.

Objetivos:

Conocer y realizar test t no pareado y test t pareado.
Interpretar resultados obtenidos con dichos tests.


Test Inicial.

1. ¿Cuál es la diferencia entre test t pareado y no pareado?
 
 
 

2. ¿Cómo se calcula el valor de t en el test t pareado?
 
 

3. ¿Si tengo 10 pacientes a los cuales les administro un tratamiento antes de cepillarse los dientes y evalúo la placa bacteriana después de realizado su cepillado, cuántos son los grados de libertad?
 

4. Al realizar una tabla en que se comparó dos grupos diferentes, ¿Cómo resumo los datos? (En otras palabras, qué información debo colocar, incluyendo del test estadístico).
 
 
 
 

5. ¿Cuándo se utiliza el test t no pareado?
 
 

NOTA: las respuestas a estas preguntas debiera ser capaz de contestarlas al finalizar de leer esta unidad.


INTRODUCCIÓN

Test que se utiliza para comparar dos tratamientos. Este test fue desarrollado por William Gosset en 1908, y perfeccionado por Sir R. Fisher en 1926, siendo Gosset quien firmaba algunos artículos con el seudónimo de Student y por eso el nombre con que se conoce (test de Student ó test t, la t no se de donde viene). Este test nos permite, basados en la desviación estándar, determinar si existen diferencias significativas en la variable que analizamos, o sea que hemos medido en dos grupos, con individuos o muestras distintas para cada grupo (test t no pareado) o cuando tenemos el mismo grupo, evaluado con un antes y después (test t pareado).
 
Con ejemplos esperamos que esto quede más claro.

 
REFERENCIAS

  1. Weintraub JA, Douglass CW, Gillings DB: "Bioestadística en salud bucodental" , OPS, 1989, Chapel Hill, NC, USA, pag:163-175.
  2. Snedecor GW, Cochran WG. Statistical methods, 7th ed., The Iowa State U press, Ames, Iowa, USA, 1980: chap 6: 83-106.
TEST T NO PAREADO (para dos grupos con individuos diferentes en cada uno de ellos).
  1. Datos: presiones sanguíneas de pacientes con dietas ricas y bajas en colesterol. La hipótesis nula es que la presión sanguínea no es diferente en individuos que tienen dietas pobres o con alto contenido de colesterol. Si encontramos diferencias significativas qué implica?
Alto nivel de colesterol                Bajo nivel de colesterol 132                                            107
160                                              98
145                                            125
132                                            129
140                                            128
154                                            114
136                                            115
134                                            126
132                                            123
                                                  123
                                                  123
                - - - - - - - - - -                         - - - - - - - - - -  -

               x1 = 140,55                                 x2 = 119,18

                n1 = 9                                         n2 = 11

 NOTA:  x1significa promedio del grupo 1, normalmente se coloca una barra horizontal sobre la x pero no pudimos hacerla (!).  Ö significa raíz cuadrada de todo lo que está a continuación, también debiera ir una línea horizontal de la expresión que vamos a obtener la raíz cuadrada pero tampoco se puede dibujar facilmente con html, por lo tanto muchas veces colocamos un paréntesis y eso elevado a 1/2 lo cual es lo mismo que raíz cuadrada Ö (s12 / n1 + s22/ n2)   =  (s12 / n1 + s22/ n2)1/2
Espero que con su browser (internet explores o netscape) no tenga problema para visualizar las fórmulas, si encuentra algún error, yo soy el responsable y por eso disculpe, pero no es tan fácil pasar todo esto en internet. Usted puede colaborar: mande un mensaje diciendo donde encontró un error. No somos perfectos.
 

                x1 -  x2                                                    x1 -  x2
tn-1 = - - - - - - - - -- - - - - - -  =       - - - - - - - - - - - - - -
        Ö (s12 / n1 + s22/ n2)                 S  Ö  1/n + 1/n2
 

Cálculos:

  1. Estimación del valor de S2 (varianzas combinadas de los grupos):

  2.  

     

            åx12 -(åx1) 2 / n+  å x22-(åx2) 2 / n2
    S2 = -----------------------------------------------------------------------
                   ( n1 -1)               +         ( n2-1)
     
     
     

            178 665 – (1265) 2 / 9   +    157 187–     (1311) 2 / 11
    S2 = ----------------------------------------------------------------------------------------
                       9 -  1                  +         11 - 1
     

    S2 =    100,10
    S =  Ö 100,10  = 10,005
     

    2) Calculamos t

                    x1 - x2                        140,6 – 119,18
    tn-1 = - - - - - - - - - - - -       = - - - - - - - - - - -- - - - - -
           S  Ö  1/n + 1/n2           10,01Ö 1/9 + 1/11
     

    tn-1 = 4,753
     
     

    3) Interpretación de t

    grados de libertad (gl) =     (n1 -1) +  (n2 -1)= 9 + 11 - 2 = 18
     

     t0,01 = 2,878,   t, también llamado t crítico, obtenido de la tabla 1, si el  obtenido es mayor que el valor crítico, por lo tanto se rechaza la hipótesis de nulidad y podemos decir que existen diferencias significativas entre la presión sistólica en individuos que se alimentan con dietas bajas o ricas en colesterol (p<0,01), ya que t obtenido fue = 4,753 y para t0,05 = 2,101.

    Cómo se suele resumir todo esto?,  simplemente en una tabla colocamos:
     
    Grupo de colesterol         x  ± ds
    Alto   (n = 9) 140,55 ± 10,38
    Bajo  (n = 11) 119,88 ±  9,69
    t = 4,753; p<0,01

    Acuérdese: toda tabla debe llevar una leyenda que ilustre al lector acerca de su contenido, y al pié de ella puede colocar si existe significancia estadística.

    ¿Cómo graficamos en el test t  no pareado los resultados?

    (Imágenes realizadas con datos proporcionados por el Dr. R. Motzfeld, Fac. de Odontología, U de Chile, quien estudió COPD en hombres y mujeres, alumnos de su Fac. de Odontología).

    1. Gráfico de promedio y ds.


    Qué puede decir de los promedios y ds para COPD en hombres y mujeres?
     

    2. Gráfico de cajas y dispersión de valores.


    Resultados de los datos del Dr. R. Motzfeld, COPD evaluado en alumnos entre 19993-1997, resultados obtenidos con el software Systat v 8.0.

    Two-sample t test on COPD grouped by GENERO$
     

    Group         N         Mean            SD
    hombres       235     9.932          4.420
    mujeres       196      9.658          4.254

         Separate Variance t =        0.654 df =  420.3    Prob =        0.514
         Difference in Means =        0.274   95.00% CI =     -0.550 to      1.097

           Pooled Variance t =        0.651 df =  429      Prob =        0.515

    Interprete...


    1. Conteste las siguientes preguntas:
        a. Qué significa que las cajas estén a la misma altura ?
     
     

        b. La curva de COPD para los hombres tiene alguna diferencia con la de las mujeres?
     
     

    2. Existirán diferencias significativas entre COPD para hombres y mujeres?
     
     
     

    3. Qué gráfico prefiere y porqué?
     
     
     



    Tabla 1. Tabla de valores de t, para 5 y 1%.
    Grados de libertad
    5%
    1%
     1 12,7062 63,6567
     2 4,3027 9,9248
     3 3,1824 5,8409
     4 2,7764 4,6041
     5 2,5706 4,0321
     6 2,4469 3,7074
     7 2,3646 3,4995
     8 2,3060 3,3554
     9 2,2622 3,2498
    10 2,2281 3,1693
    11 2,2010 3,1058
    12 2,1788 3,05455
    13 2,1604 3,0123
    14 2,1448 2,9768
    15 2,1314 2,9467
    16 2,1199 2,9208
    17 2,1098 2,8982
    18 2,1009 2,8784
    19 2,0930 2,8609
    20 2,0860 2,8453
    21 2,0796 2,8314
    22 2,0739 2,8188
    23 2,0687 2,8073
    24 2,0639 2,7969
    25 2,0595 2,7874
    26 2,0555 2,7787
    27 2,0518 2,7707
    28 2,0484 2,7633
    29 2,0452 2,7564
    30 2,0423 2,7500
    40 2,0211 2,7045
    50 2,0086 2,6778
    60 2,0003 2,6603
    70 1,9944 2,6479
    80 1,9901 2,6387
    90 1,9867 2,6316
    100 1,9840 2,6259
    ¥ 1,9600 2,5759
    Tabla tomada de:  Weintraub JA, Douglass CW, Gillings DB: "Bioestadística en salud bucodental" , OPS, 1989, Chapel Hill, NC, USA, pag:175.
     

    Test t pareado

    Se entregan 9 muestras a dos tecnólogos, y se desea establecer si hay diferencias entre la capacidad que ellos tienen para obtener los mismos resultados con las nueve muestras. Nosotros deseamos establecer si la medida que obtienen los dos técnicos utilizando la misma máquina presenta diferencias significativas, equivalente a un antes y después. O sea vamos a ver si los dos técnicos entregan valores similares, si existen diferencias significativas, Qué nos indica?
     
     

    Dato Tec. A             Tec. B             B - A

    1 12,35     35             12,38     38         3

    2 12,37     37             12,37     37         0

    3 12,04     4               12,18     18         14

    4 12,43     43             12,36     36         -7

    5 12,34     34             12,47     47         13

    6 12,36     36             12,48     48         12

    7 12,48     48             12,57     57           9

    8 12,33     33             12,28     28         -5

    9 12,33     33             12,42     42           9
    -----------------------------------------------
                                                         d = 5,33

    d =  promedio de la diferencia. Para simplificar los cálculos, los valores originales, por ejemplo 12,33, se trabaja como 33, igual 12,42 se utiliza 42 ( la diferencia de 42-33= 9), la columna de las diferencias B - A, es la que se ha promediado (5,33).

    Cálculamos valor de t:

                d - 0
    tn-1 = - - - - - - - - ,      Sd = Ö (åd2 - ( åd)2 / n) / n - 1
                Sd / Ö n

    Ö:  significa raíz cuadrada de la expresión que se encuentra a continuación. d, es promedio de la diferencia.

    Cálculos:

    1. Calculamos Sd =
     

    Sd Ö (754 - ( 48)2 / 9 )  / 9-1 = 7,89

    2. Calculamos t

                5,33 - 0
    tn-1 = - - - - - - - - = 2,03
                7,89/ Ö 9
     

     3. Interpretar t para gl = n – 1 = 8

           t crítico, de la tabla 1,  t0,05 = 2,306, el t calculado fue de 2,03. O sea no existen diferncias significativas.

Qué significa ?
 
 

Entiende el resultado?
 
 

Si no ha entendido hasta aquí, mande un mensaje ahora a:
 
 
 
 
 

Cómo graficamos en test t pareado?

1. Gráfico de líneas conectadas.


Interprete este gráfico.

Qué pasa con la cantidad de interlukina al mes y a los 10 meses?



Resultados de Estudio al igual que la figura anterior, de cantidad de Interlukina al mes y a los 10 meses, en los mismos pacientes. Estudio realizado por Dr. J. Gamonal, 1999.
 
 

Data for the following results were selected according to:
      (GRUPO$= 'pcte')

Paired samples t test on CANT0_10 vs CANT0_1 with 10 cases

  Mean CANT0_10    =       43.861
  Mean CANT0_1      =       42.764
    Mean Difference     =        1.097   95.00% CI  =    -17.923 to     20.117
      SD Difference       =       26.588                   t =        0.130
                           df     =     9    Prob =        0.899


Intervalo de Confianza  (IC)

El intervalo de confianza se refiere a un rango de valores que es muy probable que incluya el verdadero valor desconocido y puede calcularse para un promedio, para la diferencia de promedios y en otras ocasiones. En los resultados de systat, anotados más arriba, del test t no pareado y del pareado, se abrevia 95.00%CI (Confidence Interval con 95%). Este intervalo también puede ser calculado para un solo promedio, la diferencia de promedios, para una proporción, para la diferencia de dos proporciones, para una curva ó recta de análisis de regresión o para un riesgo relativo.

Generalmente se expresa este IC con 95% o sea que si el estudio se repitiera 100 veces el IC se esperaría que incluya el valor verdadero sobre 95 de las ocasiones. Siempre que se realiza un test estadístico como el test t no pareado, y especialmente se encuentra diferencias significativas (p<0,05), el IC al 95% no incluirá el 0 (qué pasaba en los ejemplos anteriores?).
Cuando el resultado no es significativo, el IC incluirá el 0. Ver los IC anteriores en los ejercicios realizados con Systat y trate de interpretarlos.
 

Cómo calcular los IC?

1. IC para una sola media al 95%.

Para datos cuantitativos, con distribución normal, si tenemos DS (desviación estándar), ESM (error estándar de la media), n (tamaño de la muestra) y x (promedio de la muestra) y sabiendo que ESM = DS / Ö  n   , y para muestras mayores de 30, el IC al 95% va entre :

x -(1,96 * ESM) y x + (1,96 * ESM).

Para muestras menores de 30 el multiplicando 1,96 no es, y debe buscar en Tabla 1 con n - 1 grados de libertad. Se puede utilizar 2 para multiplicar, redondeando 1,96. ( El * reemplaza x para distinguir x aquí como promedio y no "multiplicado por").

2. IC para la diferencia de dos promedios al 95%.

El cálculo es el mismo para datos cuantitativos con distribución normal. El IC con 95% va entre: "diferencia de promedios - (2 * ESD) a diferencia de promedios + (2 * ESD)". ESD es el error estándar de la diferencia y cuando el número de comparaciones es mayor de 30.

Del ejemplo para el test t pareado realizado más arriba, calculamos el IC al 95%:

d ± (t0,05) (Sd)     =     5,33 ± (2,306) (7,89)

5,33 ± 18,19

Interpretar :
 
 
 

3. IC para una proporción al 95%.

Una proporción, como por ejemplo proporción de individuos con caries, no representa datos con distribución normal y el cálculo es diferente que el realizado para un promediio. Si tenemos ES, error estándar, n el número de muestras y p la proporción con cierta característica, tenemos ES =   Ö p(1-p) / n y el IC va entre p - (1,96 * ES) hasta p + (1,96 * ES). El factor 1,96 es independiente del tamaño de la muestra en este caso, pero el cálculo es solamente aproximado para valores pequeños de n * p.

4. IC al 95% en análisis de regresión.

Para la pendiente de una análisis de regresión (pendiente b) el IC para muestra de más de 30 está dado por b ± 2 * ES (b) donde ES (b) es el error estándar de la pendiente b. Para números pequeños, las tablas de t pueden consultarse con n - 2 grados de libertad.

Erercicios.

1. Calcular el IC al 95% para los promedios de COPD de hombres y mujeres de los datos del Dr. Motzfeld.
 

2. Interprete dichos resultados.
 
 
 



Referencia bibliográfica.
  1. Bulpitt CJ. Confidence intervals. The Lancet 1987; i: 494-497.


Si no entendió algo, esta es la última oportunidad en esta unidad para que nos lo diga.
 

DR. BENJAMIN MARTINEZ R.