UNIVERSIDAD MAYOR
FACULTAD DE ODONTOLOGIA
UNIDADES DE AUTO - APRENDIZAJE
TEMA |
DEFINICION DE VARIABLES |
TIEMPO APROXIMADO |
45 MINUTOS. |
CURSO |
METODO DE INVESTIGACION
Y BIOESTADÍSTICA, FAC. ODONTOLOGÍA, U MAYOR |
INSTRUCTOR |
DR. BENJAMIN MARTINEZ
R. |
I. RACIONAL:
Al realizar una investigación debemos
definir en forma clara y precisa lo que vamos a analizar, y conocer que
queremos medir. Teniendo claro las distintas variables que existen se nos
va a facilitar la investigación y el posterior análisis de
los datos.
II. OBJETIVOS TERMINALES:
El alumno será capaz de definir distintos
tipos de variables y clasificarlas de acuerdo a varios criterios.
III. OBJETIVOS ESPECIFICOS:
El alumno :
- Podrá definir qué
es una variable en la investigación. Clasificar los tipos de variables,
y señalar distintos tipos de ellas. Señalar las características
de variables intervalares, ordinales, nominales, dependientes e independientes,
continuas y discretas, y dar ejemplos de cada una de ellas.
CICLO DE PRACTICA I:
Variable es algo sujeto a cambios o variación
("en marzo el tiempo es variable", "María es de carácter variable",
en esos casos usted entiende que varía) pero acá nos queremos
referir a una magnitud con un sentido estadístico, matemático,
o dirigido a analizar resultados de una investigación, que puede tomar
diferentes valores. Existe también en probabilidad el estudio de la
variable aleatoria, aquella magnitud que puede tomar determinado número
de valores, a cada uno de los cuales corresponde una posibilidad (por ejemplo,
al tirar un dado, el número que sale es una variable aleatoria, que
puede ser 1, 2, 3, 4, 5 ó 6).
Las variables pueden clasificarse de diversas
formas, y su utilidad es que sirven para determinar el método de
análisis estadístico, además al estar claramente definidas
al comienzo de una investigación, facilitan el desarrollo de éstas,
y la recopilación de los datos. Las variables se pueden clasificar
en:
a. De acuerdo al grado de separación
entre las observaciones: discretas y continuas.
b. Según nivel de medición:
intervalar, ordinal y nominal.
c. Según orientación descriptiva:
dependiente e independiente.
VARIABLES SEGUN GRADO DE SEPARACION
De acuerdo al primer criterio, grado de separación
entre las observaciones, existe variables con y sin separación entre
las distintas observaciones o también llamadas discretas y continuas.
Una variable se considera discreta si entre dos valores posibles de observar
no existe otro valor posible de encontrar (ejemplos: el género, masculino
y femenino; raza; religión, etc.).
Variable continua es aquella que entre dos
valores posibles de observar existe siempre otro valor (Ejemplos: edad,
estatura, peso, nivel de colesterol, recuento de glóbulos rojos,
resistencia a la tracción, etc.). Las variables continuas pueden transformarse
en discretas, por ejemplo, la edad, podemos agruparla en personas jóvenes
y ancianos. La variable discreta no puede transformarse en continua.
REFERENCIAS BIBLIOGRAFICAS
1. Kleinbaum DG, Kupper LL. Applied regression
and other multivariable methods. Duxbury press, North Scituate, MA, Chap.
2, 1978.
RETROALIMENTACION
1. ¿Cómo pueden clasificarse
las variables?
2. Señales ejemplos, ojalá
de investigación que Ud. pretende realizar, de variables continuas
y discretas.
CICLO DE PRACTICA II:
VARIABLES SEGUN NIVEL DE MEDICION
Las variables según el nivel de medición
nos proporcionan distinto grado de precisión, así tenemos que
más precisa, o también más objetiva la medición,
será lo que podamos evaluar con una variable intervalar, y menos
aquello medido en una escala ordinal o nominal.
Variable Intervalar
Los resultados en un experimento pueden tener
un rango de valores continuos, como ocurre si medimos la presión
sanguínea, el recuento de linfocitos T, cantidad de secreción
de saliva, número de atenciones odontológicas, o sea que los
valores que se obtienen pueden ir de cero a infinito (al menos teóricamente,
aunque sabemos que en la realidad esto generalmente no ocurre, por ejemplo
presión sanguínea igual a 0), y entre dos valores es posible
encontrar otro. Estas variables en escala intervalar, se caracterizan porque
en ellas existen intervalos constantes (milímetros de Hg, mililitros
de saliva, días, etc.). En este tipo de variables es posible describir
la información contenida en ellas calculando el promedio, desviación
standard (DS), mediana, moda y siempre debiera también incluirse el
número de casos (o sea el n, cuantas muestras analizó, pacientes,
etc.), teniendo en cuenta que la dispersión de los valores puede o
no ser normal, lo cual ya puede apreciarse mucho mejor al observar la DS
o graficando los valores (box plot, histograma).
Variable Ordinal
Mucha información analizada en Medicina,
Odontología, y en general en el área biológica, no
puede evaluarse en escala intervalar, o más bien es muy difícil
o costoso, por ejemplo el dolor o grado de tinción de un material,
pero en esos casos la respuesta o valor obtenido puede graduarse u ordenarse,
pero no existe una relación aritmética entre los distintos
valores o respuestas posibles. Por ejemplo para dolor (entre paréntesis,
posibles códigos para facilitar ingreso en planilla de datos):
- ausente (0),
- leve (1),
- moderado (2) y
- marcado (3)
no podemos afirmar que el dolor marcado es
el doble del dolor leve, y no debiera promediar esos valores ni obtener desviación
estándar aunque se puede hacer, pero no se debe.. Igualmente ocurre
cuando tenemos un frotis (Papanicolau) de boca o cervico-uterino, y el diagnóstico
puede ser: (1) normal; (2) displasia leve; (3) displasia moderada; (4) displasia
avanzada; (5) células malignas, o carcinoma. El grado 2 de displasia
leve no es la mitad de malo que el grado 4 de displasia avanzada. A diferencia
en la escala intervalar cuando tenemos 5 mL de saliva obtenidos en un tiempo
dado, y otro paciente tiene 2,5 mL de saliva, obtenido dicho valor en el
mismo tiempo, sabemos que realmente la cantidad de saliva de un paciente
es la mitad del otro. La escala ordinal se utiliza mucho en condiciones clínicas,
para evaluar grados de severidad, como ya se ha señalado el dolor,
grado de tinción de una resina, grado de desgaste, etc., y facilita
el ingreso de datos para su análisis codificar dichos grados.
Variable Nominal
Este tipo de variables tiene el menor grado
de precisión, cada valor dado a la variable es utilizado simplemente
para clasificar o marcar diferentes categorías, por ejemplo la variable
género: (1) masculino;(0) femenino (también podemos codificar).
También con sexo: (1) heterosexual; (2) homosexual; (3) bisexual.
O sea en la variable nominal existe la posibilidad y solamente una, de pertenecer
a un grupo, nómina o lista. Otros ejemplos de este tipo de variable
son : raza, religión. Muchas veces estas variables nominales se utilizan
en cuestionarios, como por ejemplo, ¿Ha tenido fiebre?, ¿Ha
tenido hinchazón? y se pueden fusionar como, ¿Ha tenido fiebre
o hinchazón? El ideal es que el paciente tenga las opciones y elija
Si / No (respuestas que también pueden ser codificacas 1 / 0)..
En sociología y otras áreas se utilizan o se pueden generar
variables sintéticas, esto es que se preguntan diferentes cosas y
se resumen en una variable que contemplan el significado de las otras variables.
Por ejemplo en caso de infecciones de transmisión sexual y vih/sida,
se puede preguntar por el uso de condón, y la respuesta se puede validar
haciendo preguntas relacionadas con su utilización en los últimos
seis meses, o el número de relaciones no protegidas en el mes pasado,
o el hecho de haber o no utilizado condón en la última relacion.
Con esta información puede generar una variable sintética que
involucra conductas de riesgo, ha habido conductas de riesgo? Esta estrategia
de preguntas es bueno tenerla en cuenta para evaluar otros factores de interés
en odontología tales como tabaquismo, alcoholismo, consumo de azúcar
y riesgo de caries.
Las variables nominales y ordinales se describen
señalando cuantos individuos o muestras pertenecen a cada categoría
(n y porcentaje) y se pueden graficar con barras, barras acumuladas, o sectoriales.
REFERENCIAS BIBLIOGRAFICAS
- Glantz SA.
Primer of Biostatistics, McGraw Hill Co. New York, 3rd. ed.USA, 1992.
- Silva A, LC y Barroso
U, IM. Regresión logística. Ed. La Muralla,Madrid, 2004. pag.
90.
RETROALIMENTACION
1. ¿Cuáles son las principales
diferencias entre variables nominales y ordinales?
2. ¿Qué características
tiene una variable intervalar?
CICLO DE PRACTICA III
VARIABLES SEGUN ORIENTACION DESCRIPTIVA
Este otro tipo de clasificación de
variables se base en si una variable es para describir o ser descrita por
otras variables. Esta clasificación depende del objetivo del estudio
y la orientación de la variable misma, más que de la estructura
matemática de la variable misma. Cuando la variable en investigación
es descrita en términos de otra(s) variable(s) la llamamos DEPENDIENTE.
Por otra parte cuando la variable es una que utilizamos con otra para describir
una variable dependiente, la llamamos INDEPENDIENTE. Por ejemplo, si
deseamos establecer si existe una asociación o relación entre
la edad (variable independiente), y la presión sistólica (medida
en mm de Hg, variable dependiente), o sea queremos determinar si a medida
que aumenta la edad también estaría aumentando la presión,
o sea si existe una correlación positiva, por cada aumento de la edad
se produce un incremento en la presión. Siempre se debe en este tipo
de estudios de asociación de variables "plotear" los valores (o sea
colocarlos en gráfico XY), los cuales deben estar en pares de observaciones,
o sea para cada valor de edad tenemos una presión, ubicando en el
eje Y siempre la variable dependiente y en la X la variable independiente.
El análisis estadístico que se utiliza para este tipo de variables
generalmente es la regresión lineal simple, y correlación de
Pearson, y el análisis de regresión simple debe ener algunas
características:
- Para cada valor de X existe una
distribución normal de Y, y estos Y son tomados de una muestra al
azar.
- La distribución normal de
Y correspondiente a un valor específico de X tiene un promedio que
cae en una línea recta. Esa línea es llamada la línea
de regresión de la población.
- Las distribuciones normales de
Y para un X específico son independientes y tienen la misma varianza.
El modelo matemático que describe esta
asociación de variables se representa en forma concisa como:
a se conoce como intercepto, y b
la pendiente.
Es conveniente que consulte en la referencia
indicada las fórmulas utilizadas para calcular a, b (en la ecuación
Y = a + bX) y también que consulte como se calcula el valor de r
(correlación de Pearson ). De lo contrario difícilmente
va a entender los valores que se obtienen en este tipo de análisis.
REFERENCIAS BIBLIOGRAFICAS
- Snedecor GW, Cochran WG. Statistical
Methods. 7th Ed. Iowa St U Press, Ames, 1980:149-174.
RETROALIMENTACION
1. De un ejemplo y defina variable dependiente
e independiente.
2. Averigüe que significan a
y b en la ecuación: Y = a + bX.
CICLO DE PRACTICA IV:
Introducción al Análisis Estadístico
Para aplicar un determinado análisis
estadístico a nuestras variables, además de tener claro cuáles
son las variables analizadas, debemos tener presente qué tipo de
experimento hemos realizado. Una vez realizado el test estadístico,
para lo cual le puede ayudar a seleccionar el tipo de analisis la siguiente
tabla, debe interpretar sus resultados.
¿Cómo
elegir el test para análisis de datos?
Conteste las siguientes
preguntas:
- ¿Cuántos grupos ha estudiado?
- ¿Cada grupo tiene los mismos individuos ó los grupos
están constituidos por individuos diferentes?
- ¿Qué tipo de variable utilizó? (Intervalar,
Ordinal, Nominal)
De acuerdo a estas
respuestas utilice la siguiente tabla (tomada de Glantz SA. Primer of Biostatistics,
4th ed., McGraw Hill, New York, 1997.
|
Tipo de experimento
|
Escala de medición
|
Dos grupos de tratamiento consistentes de individuos diferentes
|
Tres o más grupos consistentes de individuos diferentes
|
Antes y después de un tratamiento en los mismos individuos
|
Múltiples tratamientos en los mismos individuos
|
Asociación entre dos variables
|
Intervalar (y obtenida de población con distribución
normal)*
|
Test t no pareado
|
Análisis de Varianza
|
Test t pareado
|
Análisis de varianza
de medidas repetidas
|
Regresión linear y
correlación de Pearson; análisis de Bland-Altman
|
Nominal
|
Chi-cuadrado de tabla de
contingencia
|
Chi-cuadrado de tabla de
contingencia |
Test de McNemar
|
Q de Cochrane
|
Coeficientes de contingencia
|
Ordinal
|
Test de suma de rangos de
Mann-Whitney
|
Estadístico de Kruskal-Wallis
|
Test del signo de rangos
de Wilcoxon
|
Estadístico de Friedman
|
Correlación de rangos
de Spearman
|
Tiempo de sobrevida
|
Test de Gehan ó Test
de rango del Log
|
|
|
|
|
* Si la premisa
de poblaciones distribuidas normalmente no se cumple, las observaciones
se ordenan en rangos y se utilizan los métodos para escala ordinal.
Estos tests estadísticos son algunos, probablemente los más
utilizados, pero existen muchos otros análisis estadísticos
tales como:
análisis de regresión múltiple; análisis de
varianza con más de un factor; análisis de co-varianza; análisis
factorial; discriminante, y muchos otros tests por lo cual si esta tabla
no satisface sus necesidades o tiene alguna duda, lo más aconsejable
es que consulte a un bioestadístico, o libro de estadística.
En el análisis estadístico
tratamos de determinar si aceptamos o rechazamos la hipótesis de nulidad
previamente planteada. Antes de aplicar el test estadístico es necesario
graficar los datos,o en otras palabras, determinar como se comportaron nuestras
observaciones, o mejor dicho como es la distribución de valores de
nuestras variables. Observe si existe distribución normal, puede ser
utilizando el test de Shapiro-Wilk.
REFERENCIAS BIBLIOGRAFICAS
- Glantz SA. Primer of Biostatistics,
McGraw Hill Co. New York, 4rd. ed.USA, 1997.
RETROALIMENTACION
1. ¿Qué tests conoce posible
de aplicar a variables nominales?
2. Clasifique los tipos de experimentos.
Test
Final
Mis opiniones acerca de esta Unidad
¿Algún comentario?, escriba
a:
Dr. Benjamín Martínez
R.