Facultad de Odontología Patología Oral / General / Bioestadística / Cariología Unidades de autoaprendizaje Autor: Dr. Benjamín Martínez R.

Definición de Variables

TEMA DEFINICION DE VARIABLES
TIEMPO APROXIMADO 45 MINUTOS.
CURSO METODO DE INVESTIGACION Y BIOESTADÍSTICA, FAC. ODONTOLOGÍA, U MAYOR
INSTRUCTOR DR. BENJAMIN MARTINEZ R.

I. RACIONAL:

Al realizar una investigación debemos definir en forma clara y precisa lo que vamos a analizar, y conocer que queremos medir. Teniendo claro las distintas variables que existen se nos va a facilitar la investigación y el posterior análisis de los datos.

II. OBJETIVOS TERMINALES:

El alumno será capaz de definir distintos tipos de variables y clasificarlas de acuerdo a varios criterios.

III. OBJETIVOS ESPECIFICOS:

El alumno :

  • Podrá definir qué es una variable en la investigación. Clasificar los tipos de variables, y señalar distintos tipos de ellas. Señalar las características de variables intervalares, ordinales, nominales, dependientes e independientes, continuas y discretas, y dar ejemplos de cada una de ellas.

CICLO DE PRACTICA I:

Variable es algo sujeto a cambios o variación (“en marzo el tiempo es variable”, “María es de carácter variable”, en esos casos usted entiende que varía) pero acá nos queremos referir a una magnitud con un sentido estadístico, matemático, o dirigido a analizar resultados de una investigación, que puede tomar diferentes valores. Existe también en probabilidad el estudio de la variable aleatoria, aquella magnitud que puede tomar determinado número de valores, a cada uno de los cuales corresponde una posibilidad (por ejemplo, al tirar un dado, el número que sale es una variable aleatoria, que puede ser 1, 2, 3, 4, 5 ó 6).

Las variables pueden clasificarse de diversas formas, y su utilidad es que sirven para determinar el método de análisis estadístico, además al estar claramente definidas al comienzo de una investigación, facilitan el desarrollo de éstas, y la recopilación de los datos. Las variables se pueden clasificar en:

a. De acuerdo al grado de separación entre las observaciones: discretas y continuas.
b. Según nivel de medición: intervalar, ordinal y nominal.
c. Según orientación descriptiva: dependiente e independiente.

VARIABLES SEGUN GRADO DE SEPARACION

De acuerdo al primer criterio, grado de separación entre las observaciones, existe variables con y sin separación entre las distintas observaciones o también llamadas discretas y continuas. Una variable se considera discreta si entre dos valores posibles de observar no existe otro valor posible de encontrar (ejemplos: el género, masculino y femenino; raza; religión, etc.).

Variable continua es aquella que entre dos valores posibles de observar existe siempre otro valor (Ejemplos: edad, estatura, peso, nivel de colesterol, recuento de glóbulos rojos, resistencia a la tracción, etc.). Las variables continuas pueden transformarse en discretas, por ejemplo, la edad, podemos agruparla en personas jóvenes y ancianos. La variable discreta no puede transformarse en continua.

REFERENCIAS BIBLIOGRAFICAS

1. Kleinbaum DG, Kupper LL. Applied regression and other multivariable methods. Duxbury press, North Scituate, MA, Chap. 2, 1978.

RETROALIMENTACION

  1. ¿Cómo pueden clasificarse las variables?
  2. Señales ejemplos, ojalá de investigación que Ud. pretende realizar, de variables continuas y discretas.

CICLO DE PRACTICA II:

VARIABLES SEGUN NIVEL DE MEDICION

Las variables según el nivel de medición nos proporcionan distinto grado de precisión, así tenemos que más precisa, o también más objetiva la medición, será lo que podamos evaluar con una variable intervalar, y menos aquello medido en una escala ordinal o nominal.

Variable Intervalar

Los resultados en un experimento pueden tener un rango de valores continuos, como ocurre si medimos la presión sanguínea, el recuento de linfocitos T, cantidad de secreción de saliva, número de atenciones odontológicas, o sea que los valores que se obtienen pueden ir de cero a infinito (al menos teóricamente, aunque sabemos que en la realidad esto generalmente no ocurre, por ejemplo presión sanguínea igual a 0), y entre dos valores es posible encontrar otro. Estas variables en escala intervalar, se caracterizan porque en ellas existen intervalos constantes (milímetros de Hg, mililitros de saliva, días, etc.). En este tipo de variables es posible describir la información contenida en ellas calculando el promedio, desviación standard (DS), mediana, moda y siempre debiera también incluirse el número de casos (o sea el n, cuantas muestras analizó, pacientes, etc.), teniendo en cuenta que la dispersión de los valores puede o no ser normal, lo cual ya puede apreciarse mucho mejor al observar la DS o graficando los valores (box plot, histograma).

Variable Ordinal

Mucha información analizada en Medicina, Odontología, y en general en el área biológica, no puede evaluarse en escala intervalar, o más bien es muy difícil o costoso, por ejemplo el dolor o grado de tinción de un material, pero en esos casos la respuesta o valor obtenido puede graduarse u ordenarse, pero no existe una relación aritmética entre los distintos valores o respuestas posibles. Por ejemplo para dolor (entre paréntesis, posibles códigos para facilitar ingreso en planilla de datos):

  • ausente (0),
  • leve (1),
  • moderado (2) y
  • marcado (3)

no podemos afirmar que el dolor marcado es el doble del dolor leve, y no debiera promediar esos valores ni obtener desviación estándar aunque se puede hacer, pero no se debe.. Igualmente ocurre cuando tenemos un frotis (Papanicolau) de boca o cervico-uterino, y el diagnóstico puede ser: (1) normal; (2) displasia leve; (3) displasia moderada; (4) displasia avanzada; (5) células malignas, o carcinoma. El grado 2 de displasia leve no es la mitad de malo que el grado 4 de displasia avanzada. A diferencia en la escala intervalar cuando tenemos 5 mL de saliva obtenidos en un tiempo dado, y otro paciente tiene 2,5 mL de saliva, obtenido dicho valor en el mismo tiempo, sabemos que realmente la cantidad de saliva de un paciente es la mitad del otro. La escala ordinal se utiliza mucho en condiciones clínicas, para evaluar grados de severidad, como ya se ha señalado el dolor, grado de tinción de una resina, grado de desgaste, etc., y facilita el ingreso de datos para su análisis codificar dichos grados.

Variable Nominal

Este tipo de variables tiene el menor grado de precisión, cada valor dado a la variable es utilizado simplemente para clasificar o marcar diferentes categorías, por ejemplo la variable género: (1) masculino;(0) femenino (también podemos codificar). También con sexo: (1) heterosexual; (2) homosexual; (3) bisexual. O sea en la variable nominal existe la posibilidad y solamente una, de pertenecer a un grupo, nómina o lista. Otros ejemplos de este tipo de variable son : raza, religión. Muchas veces estas variables nominales se utilizan en cuestionarios, como por ejemplo, ¿Ha tenido fiebre?, ¿Ha tenido hinchazón? y se pueden fusionar como, ¿Ha tenido fiebre o hinchazón? El ideal es que el paciente tenga las opciones y elija Si / No (respuestas que también pueden ser codificacas 1 / 0)..

En sociología y otras áreas se utilizan o se pueden generar variables sintéticas, esto es que se preguntan diferentes cosas y se resumen en una variable que contemplan el significado de las otras variables. Por ejemplo en caso de infecciones de transmisión sexual y vih/sida, se puede preguntar por el uso de condón, y la respuesta se puede validar haciendo preguntas relacionadas con su utilización en los últimos seis meses, o el número de relaciones no protegidas en el mes pasado, o el hecho de haber o no utilizado condón en la última relacion. Con esta información puede generar una variable sintética que involucra conductas de riesgo, ha habido conductas de riesgo? Esta estrategia de preguntas es bueno tenerla en cuenta para evaluar otros factores de interés en odontología tales como tabaquismo, alcoholismo, consumo de azúcar y riesgo de caries.

Las variables nominales y ordinales se describen señalando cuantos individuos o muestras pertenecen a cada categoría (n y porcentaje) y se pueden graficar con barras, barras acumuladas, o sectoriales.

REFERENCIAS BIBLIOGRAFICAS

  1. Glantz SA. Primer of Biostatistics, McGraw Hill Co. New York, 3rd. ed.USA, 1992.
  2. Silva A, LC y Barroso U, IM. Regresión logística. Ed. La Muralla,Madrid, 2004. pag. 90.

RETROALIMENTACION

  1. ¿Cuáles son las principales diferencias entre variables nominales y ordinales?
  2. ¿Qué características tiene una variable intervalar?

CICLO DE PRACTICA III

VARIABLES SEGUN ORIENTACION DESCRIPTIVA

Este otro tipo de clasificación de variables se base en si una variable es para describir o ser descrita por otras variables. Esta clasificación depende del objetivo del estudio y la orientación de la variable misma, más que de la estructura matemática de la variable misma. Cuando la variable en investigación es descrita en términos de otra(s) variable(s) la llamamos DEPENDIENTE. Por otra parte cuando la variable es una que utilizamos con otra para describir una variable dependiente, la llamamosINDEPENDIENTE. Por ejemplo, si deseamos establecer si existe una asociación o relación entre la edad (variable independiente), y la presión sistólica (medida en mm de Hg, variable dependiente), o sea queremos determinar si a medida que aumenta la edad también estaría aumentando la presión,  o sea si existe una correlación positiva, por cada aumento de la edad se produce un incremento en la presión. Siempre se debe en este tipo de estudios de asociación de variables “plotear” los valores (o sea colocarlos en gráfico XY), los cuales deben estar en pares de observaciones, o sea para cada valor de edad tenemos una presión, ubicando en el eje Y siempre la variable dependiente y en la X la variable independiente. El análisis estadístico que se utiliza para este tipo de variables generalmente es la regresión lineal simple, y correlación de Pearson, y el análisis de regresión simple debe ener algunas características:

  1. Para cada valor de X existe una distribución normal de Y, y estos Y son tomados de una muestra al azar.
  2. La distribución normal de Y correspondiente a un valor específico de X tiene un promedio que cae en una línea recta. Esa línea es llamada la línea de regresión de la población.
  3. Las distribuciones normales de Y para un X específico son independientes y tienen la misma varianza.

El modelo matemático que describe esta asociación de variables se representa en forma concisa como:

 

 
Y = a + bX 

a se conoce como intercepto, y b la pendiente.

Es conveniente que consulte en la referencia indicada las fórmulas utilizadas para calcular a, b (en la ecuación Y = a + bX) y también que consulte como se calcula el valor de r (correlación de Pearso). De lo contrario difícilmente va a entender los valores que se obtienen en este tipo de análisis.

REFERENCIAS BIBLIOGRAFICAS

  1. Snedecor GW, Cochran WG. Statistical Methods. 7th Ed. Iowa St U Press, Ames, 1980:149-174.

RETROALIMENTACION

  1. 1. De un ejemplo y defina variable dependiente e independiente.
  2. Averigüe que significan a y b en la ecuación: Y = a + bX.

 


CICLO DE PRACTICA IV:

Introducción al Análisis Estadístico

Para aplicar un determinado análisis estadístico a nuestras variables, además de tener claro cuáles son las variables analizadas, debemos tener presente qué tipo de experimento hemos realizado. Una vez realizado el test estadístico, para lo cual le puede ayudar a seleccionar el tipo de analisis la siguiente tabla, debe interpretar sus resultados.

¿Cómo elegir el test para análisis de datos?

Conteste las siguientes preguntas:

  1. ¿Cuántos grupos ha estudiado?
  2. ¿Cada grupo tiene los mismos individuos ó los grupos están constituidos por individuos diferentes?
  3. ¿Qué tipo de variable utilizó? (Intervalar, Ordinal, Nominal)

De acuerdo a estas respuestas utilice la siguiente tabla (tomada de Glantz SA. Primer of Biostatistics, 4th ed., McGraw Hill, New York, 1997.

Tipo de experimento
Escala de medición Dos grupos de tratamiento consistentes de individuos diferentes
Tres o más grupos consistentes de individuos diferentes
Antes y después de un tratamiento en los mismos individuos
Múltiples tratamientos en los mismos individuos
Asociación entre dos variables
Intervalar (y obtenida de población con distribución normal)* Test t no pareado Análisis de Varianza Test t pareado Análisis de varianza de medidas repetidas Regresión linear y correlación de Pearson; análisis de Bland-Altman
Nominal Chi-cuadrado de tabla de contingencia Chi-cuadrado de tabla de contingencia Test de McNemar Q de Cochrane Coeficientes de contingencia
Ordinal Test de suma de rangos de Mann-Whitney Estadístico de Kruskal-Wallis Test del signo de rangos de Wilcoxon Estadístico de Friedman Correlación de rangos de Spearman
Tiempo de sobrevida Test de Gehan ó Test de rango del Log

* Si la premisa de poblaciones distribuidas normalmente no se cumple, las observaciones se ordenan en rangos y se utilizan los métodos para escala ordinal.

Estos tests estadísticos son algunos, probablemente los más utilizados, pero existen muchos otros análisis estadísticos tales como:

análisis de regresión múltiple; análisis de varianza con más de un factor; análisis de co-varianza; análisis factorial; discriminante, y muchos otros tests por lo cual si esta tabla no satisface sus necesidades o tiene alguna duda, lo más aconsejable es que consulte a un bioestadístico, o libro de estadística.

En el análisis estadístico tratamos de determinar si aceptamos o rechazamos la hipótesis de nulidad previamente planteada. Antes de aplicar el test estadístico es necesario graficar los datos,o en otras palabras, determinar como se comportaron nuestras observaciones, o mejor dicho como es la distribución de valores de nuestras variables. Observe si existe distribución normal, puede ser utilizando el test de Shapiro-Wilk.

REFERENCIAS BIBLIOGRAFICAS

  1. Glantz SA. Primer of Biostatistics, McGraw Hill Co. New York, 4rd. ed.USA, 1997.

RETROALIMENTACION

  1. ¿Qué tests conoce posible de aplicar a variables nominales?
  2. Clasifique los tipos de experimentos.

Test Final