Facultad de Odontología Patología Oral / General / Bioestadística / Cariología Unidades de autoaprendizaje Autor: Dr. Benjamín Martínez R.

Test de Student o Test T

Racional: El test de Student es uno de los más utilizados en odontología, y un alumno y/o cirujano dentista para poder interpretar adecuadamente un artículo científico en donde se ha utilizado dicho test tiene que conocerlo para poder entender bien las conclusiones obtenidas. ¿Existe diferencia entre la resistencia a la tracción entre amalgama A vs B? ¿El ángulo goníaco en los pacientes Clase I vs. Clase III sufrió modificaciones después del tratamiento ortodóncico realizado?.

Objetivos:

Conocer y realizar test t no pareado y test t pareado.
Interpretar resultados obtenidos con dichos tests.


Test Inicial.

  1. ¿Cuál es la diferencia entre test t pareado y no pareado?
  2. ¿Cómo se calcula el valor de t en el test t pareado?
  3. ¿Si tengo 10 pacientes a los cuales les administro un tratamiento antes de cepillarse los dientes y evalúo la placa bacteriana después de realizado su cepillado, cuántos son los grados de libertad?
  4. Al realizar una tabla en que se comparó dos grupos diferentes, ¿Cómo resumo los datos? (En otras palabras, qué información debo colocar, incluyendo del test estadístico).
  5. ¿Cuándo se utiliza el test t no pareado?NOTA: las respuestas a estas preguntas debiera ser capaz de contestarlas al finalizar de leer esta unidad.

INTRODUCCIÓN

Test que se utiliza para comparar dos tratamientos. Este test fue desarrollado por William Gosset en 1908, y perfeccionado por Sir R. Fisher en 1926, siendo Gosset quien firmaba algunos artículos con el seudónimo de Student y por eso el nombre con que se conoce (test de Student ó test t, la t no se de donde viene). Este test nos permite, basados en la desviación estándar, determinar si existen diferencias significativas en la variable que analizamos, o sea que hemos medido en dos grupos, con individuos o muestras distintas para cada grupo (test t no pareado) o cuando tenemos el mismo grupo, evaluado con un antes y después (test t pareado).
Con ejemplos esperamos que esto quede más claro.

REFERENCIAS

  1. Weintraub JA, Douglass CW, Gillings DB: “Bioestadística en salud bucodental” , OPS, 1989, Chapel Hill, NC, USA, pag:163-175.
  2. Snedecor GW, Cochran WG. Statistical methods, 7th ed., The Iowa State U press, Ames, Iowa, USA, 1980: chap 6: 83-106.

TEST T NO PAREADO (para dos grupos con individuos diferentes en cada uno de ellos).

  1. Datos: presiones sanguíneas de pacientes con dietas ricas y bajas en colesterol. La hipótesis nula es que la presión sanguínea no es diferente en individuos que tienen dietas pobres o con alto contenido de colesterol. Si encontramos diferencias significativas qué implica?

 

Colesterol
Alto Bajo
132 107
160 98
145 125
132 129
140 128
154 114
136 115
134 126
132 123
123
123

  Captura de pantalla 2015-09-23 a las 8.52.55 AM = 140,55                                                          Captura de pantalla 2015-09-23 a las 8.53.33 AM = 119,18

      n1 = 9                                                                 n2 = 11

 NOTA: Captura de pantalla 2015-09-23 a las 8.52.55 AMsignifica promedio del grupo 1. 

Captura de pantalla 2015-09-23 a las 9.17.02 AMCálculos:

    1. Estimación del valor de S2 (varianzas combinadas de los grupos):Captura de pantalla 2015-09-23 a las 9.22.08 AM

178 665 – (1265) 2 / 9   +    157 187–     (1311) 2 / 11

S2 = —————————————————————————————-
9 -  1                  +         11 – 1

                             S2 =    100,10

                            Captura de pantalla 2015-09-23 a las 9.29.47 AM

2) Calculamos tCaptura de pantalla 2015-09-23 a las 9.27.00 AM

tn-1 = 4,753

3) Interpretación de t

grados de libertad (gl) =     (n1 -1) +  (n2 -1)= 9 + 11 – 2 = 18
t0,01 = 2,878;   t, también llamado t crítico, obtenido de la tabla 1, si el  obtenido es mayor que el valor crítico, por lo tanto se rechaza la hipótesis de nulidad y podemos decir que existen diferencias significativas entre la presión sistólica en individuos que se alimentan con dietas bajas o ricas en colesterol (p<0,01), ya que t obtenido fue = 4,753 y para t0,05 = 2,101.

Cómo se suele resumir todo esto?,  simplemente en una tabla colocamos:

Grupo de colesterol         x  ± ds
Alto   (n = 9) 140,55 ± 10,38
Bajo  (n = 11) 119,88 ±  9,69

t = 4,753; p<0,01

Acuérdese: toda tabla debe llevar una leyenda que ilustre al lector acerca de su contenido, y al pié de ella puede colocar si existe significancia estadística.

¿Cómo graficamos en el test t  no pareado los resultados?

Explique el gráfico de cajas.

 

 

 

 

 

 

 

grupo_col

fig2

 

Resultados obtenidos con Stata v.14.2, explique y resuma lo observado.

Interprete…


1. Conteste las siguientes preguntas:
a. Qué significa que las cajas estén a la misma altura ?

 

b. La curva de COPD para los hombres tiene alguna diferencia con la de las mujeres?

2. Existirán diferencias significativas entre COPD para hombres y mujeres?

3. Qué gráfico prefiere y porqué?


Tabla 1. Tabla de valores de t, para 5 y 1%.


Grados de libertad

5%

1%
 1 12,7062 63,6567
 2 4,3027 9,9248
 3 3,1824 5,8409
 4 2,7764 4,6041
 5 2,5706 4,0321
 6 2,4469 3,7074
 7 2,3646 3,4995
 8 2,3060 3,3554
 9 2,2622 3,2498
10 2,2281 3,1693
11 2,2010 3,1058
12 2,1788 3,05455
13 2,1604 3,0123
14 2,1448 2,9768
15 2,1314 2,9467
16 2,1199 2,9208
17 2,1098 2,8982
18 2,1009 2,8784
19 2,0930 2,8609
20 2,0860 2,8453
21 2,0796 2,8314
22 2,0739 2,8188
23 2,0687 2,8073
24 2,0639 2,7969
25 2,0595 2,7874
26 2,0555 2,7787
27 2,0518 2,7707
28 2,0484 2,7633
29 2,0452 2,7564
30 2,0423 2,7500
40 2,0211 2,7045
50 2,0086 2,6778
60 2,0003 2,6603
70 1,9944 2,6479
80 1,9901 2,6387
90 1,9867 2,6316
100 1,9840 2,6259
¥ 1,9600 2,5759

Tabla tomada de:  Weintraub JA, Douglass CW, Gillings DB: “Bioestadística en salud bucodental” , OPS, 1989, Chapel Hill, NC, USA, pag:175.
Test t pareado

Se entregan 9 muestras a dos tecnólogos, y se desea establecer si hay diferencias entre la capacidad que ellos tienen para obtener los mismos resultados con las nueve muestras. Nosotros deseamos establecer si la medida que obtienen los dos técnicos utilizando la misma máquina presenta diferencias significativas, equivalente a un antes y después. O sea vamos a ver si los dos técnicos entregan valores similares, si existen diferencias significativas, Qué nos indica?

Dato Tec. A             Tec. B             B – A

1 12,35     35             12,38     38         3

2 12,37     37             12,37     37         0

3 12,04     4               12,18     18         14

4 12,43     43             12,36     36         -7

5 12,34     34             12,47     47         13

6 12,36     36             12,48     48         12

7 12,48     48             12,57     57           9

8 12,33     33             12,28     28         -5

9 12,33     33             12,42     42           9
———————————————–
d = 5,33

d =  promedio de la diferencia. Para simplificar los cálculos, los valores originales, por ejemplo 12,33, se trabaja como 33, igual 12,42 se utiliza 42 ( la diferencia de 42-33= 9), la columna de las diferencias B – A, es la que se ha promediado (5,33).

Cálculamos valor de t:Captura de pantalla 2015-09-23 a las 9.39.21 AM

Captura de pantalla 2015-09-23 a las 9.40.22 AM= es promedio de la diferencia.

Cálculos:

1. Calculamos Sd Captura de pantalla 2015-09-23 a las 9.44.58 AM2. Calculamos t Captura de pantalla 2015-09-23 a las 9.45.57 AM3. Interpretar t para gl = n – 1 = 8

t crítico, de la tabla 1,  t0,05 = 2,306, el t calculado fue de 2,03. O sea no existen diferncias significativas.

Qué significa ?

Entiende el resultado?

Si no ha entendido hasta aquí, mande un mensaje ahora a:

Cómo graficamos en test t pareado?

1. Gráfico de líneas conectadas.


Interprete este gráfico.

Qué pasa con la cantidad de interlukina al mes y a los 10 meses?


Resultados de Estudio al igual que la figura anterior, de cantidad de Interlukina al mes y a los 10 meses, en los mismos pacientes. Estudio realizado por Dr. J. Gamonal, 1999.

Data for the following results were selected according to:
(GRUPO$= ‘pcte’)

Paired samples t test on CANT0_10 vs CANT0_1 with 10 cases

Mean CANT0_10    =       43.861
Mean CANT0_1      =       42.764
Mean Difference     =        1.097   95.00% CI  =    -17.923 to     20.117
SD Difference       =       26.588                   t =        0.130
df     =     9    Prob =        0.899


Intervalo de Confianza  (IC)

El intervalo de confianza se refiere a un rango de valores que es muy probable que incluya el verdadero valor desconocido y puede calcularse para un promedio, para la diferencia de promedios y en otras ocasiones. En los resultados de systat, anotados más arriba, del test t no pareado y del pareado, se abrevia 95.00%CI (Confidence Interval con 95%). Este intervalo también puede ser calculado para un solo promedio, la diferencia de promedios, para una proporción, para la diferencia de dos proporciones, para una curva ó recta de análisis de regresión o para un riesgo relativo.

Generalmente se expresa este IC con 95% o sea que si el estudio se repitiera 100 veces el IC se esperaría que incluya el valor verdadero sobre 95 de las ocasiones. Siempre que se realiza un test estadístico como el test t no pareado, y especialmente se encuentra diferencias significativas (p<0,05), el IC al 95% no incluirá el 0 (qué pasaba en los ejemplos anteriores?).
Cuando el resultado no es significativo, el IC incluirá el 0. Ver los IC anteriores en los ejercicios realizados con Systat y trate de interpretarlos.

Cómo calcular los IC?

1. IC para una sola media al 95%.

Para datos cuantitativos, con distribución normal, si tenemos DS (desviación estándar), ESM (error estándar de la media), n (tamaño de la muestra) y x (promedio de la muestra) y sabiendo que ESM = DS / Ö  n   , y para muestras mayores de 30, el IC al 95% va entre :

x -(1,96 * ESM) y x + (1,96 * ESM).

Para muestras menores de 30 el multiplicando 1,96 no es, y debe buscar en Tabla 1 con n – 1 grados de libertad. Se puede utilizar 2 para multiplicar, redondeando 1,96. ( El * reemplaza x para distinguir x aquí como promedio y no “multiplicado por”).

2. IC para la diferencia de dos promedios al 95%.

El cálculo es el mismo para datos cuantitativos con distribución normal. El IC con 95% va entre: “diferencia de promedios – (2 * ESD) a diferencia de promedios + (2 * ESD)”. ESD es el error estándar de la diferencia y cuando el número de comparaciones es mayor de 30.

Del ejemplo para el test t pareado realizado más arriba, calculamos el IC al 95%:

d ± (t0,05) (Sd)     =     5,33 ± (2,306) (7,89)

5,33 ± 18,19

Interpretar :

3. IC para una proporción al 95%.

Una proporción, como por ejemplo proporción de individuos con caries, no representa datos con distribución normal y el cálculo es diferente que el realizado para un promediio. Si tenemos ES, error estándar, n el número de muestras y p la proporción con cierta característica, tenemos ES =   Öp(1-p) / n y el IC va entre p – (1,96 * ES) hasta p + (1,96 * ES). El factor 1,96 es independiente del tamaño de la muestra en este caso, pero el cálculo es solamente aproximado para valores pequeños de n * p.

4. IC al 95% en análisis de regresión.

Para la pendiente de una análisis de regresión (pendiente b) el IC para muestra de más de 30 está dado por b ± 2 * ES (b) donde ES (b) es el error estándar de la pendiente b. Para números pequeños, las tablas de t pueden consultarse con n – 2 grados de libertad.

Ejercicios.

1. Calcular el IC al 95% para los promedios de COPD de hombres y mujeres de los datos del Dr. Motzfeld.
2. Interprete dichos resultados.


StatisticalTables

Referencia bibliográfica.

  1. Bulpitt CJ. Confidence intervals. The Lancet 1987; i: 494-497.