Ramón E. Azócar A.: Análisis de validez y confiabilidad de los instrumentos de recolección de datos

Procedimiento de validación.- Una vez concluido con la elaboración de los instrumentos de recolección de datos, para su posterior validación, se sometió a una prueba piloto tanto a docentes y alumnos, el mismo que se desarrolló siguiendo el procedimiento que a continuación se indica.

a) Se seleccionó bajo un criterio arbitrario un aproximado de 100 docentes y estudiantes respectivamente, mayores que el número de ítemes, “ para impedir que en el análisis factorial opere al azar, es necesario tener un número mayor de sujetos que de medidas”86. Parafraseando la afirmación anterior, se llega a la regla de oro de: aplicar una muestra piloto en un número de sujetos mayores que el número de ítemes de un instrumento de medición, para evitar así la introducción del error aleatorio. Es así que se eligió aleatoriamente 100 docentes y 100 alumnos (05 por cada facultad), número mayor que el de los ítemes del instrumento, a quienes se procedió a encuestarlos hasta completar el número necesario. De los 100 estudiantes y docentes encuestados, se eliminaron aquellas en las que los sujetos no respondieron o eran evasivos, quedando finalmente la muestra reducida a un número de 80 docentes y 81 estudiantes.

b) Cada uno de los ítemes fueron codificados, obteniéndose así una matriz de códigos sujeto – item;

*

Código.- Se entiende por código el grafo (registro) que guarda información o dato brindado por los docentes o estudiantes.
*

Puntaje.- Es el valor que se le asigna a un código de acuerdo a la regla o criterio señalado en el punto a).
Posteriormente, la matriz de códigos se transformó en una matriz de puntajes, bajo el siguiente criterio:

-A todas las alternativas que (afectaban) a la infracción al Derecho de Autor, se les asignó mayor puntaje.

-Luego, al asignar puntajes a cada uno de los itemes del instrumento de recolección de datos, éste se convirtió en un instrumento de medición, que según Fred Kerlinger:

“ En su sentido más amplio la medición es la asignación de valores numéricos a objetos o escritos de acuerdo con reglas”87.

Por tanto, el trabajo de investigación se realizó con dos instrumentos de recolección de datos, que al mismo tiempo serán también instrumentos de medición.

4.7.2.1. Medición de la validez

Validez.- Se entiende por validez de un instrumento de medición, el valor que nos indica, que un instrumento está midiendo lo que pretende medir. Es la congruencia entre el instrumento de medida y la propiedad medible. Se dice que un instrumento es válido, cuando mide realmente el indicador, la propiedad o atributo que debe medir, es el grado de seguridad que debe tener un instrumento, que nos permitirá lograr resultados equivalentes o iguales, en sucesivos procesos de recolección de datos y mediciones realizados por terceros. Podemos señalar que hay tres tipos de validez:

a) Validez predictiva
b) Validez de contenido
c) Validez de constructo

El tipo de validez empleado en la tesis fue la validez predictiva, a su vez, por la naturaleza del tipo de puntaje asignado al instrumento de medición, éste es de puntaje no binario, llamado puntajes policotòmicas (varios puntajes).

Para el cálculo de validez se utilizó la validez predictiva en su versión discriminación de ìtemes, para lo cual se correlacionó los puntajes de cada ìtem, con el puntaje total del instrumento de medición, en ambos instrumentos se obtuvieron valores mayores que 0.249 (considerando que los valores deben ser mayores que la frontera de discriminación o del concepto: mayor que 0.2), que se cumple en este caso.

Validez a través del Análisis Factorial de los instrumentos de recolección de datos.- También fue necesario utilizar este tipo de análisis, por la importancia que tiene extraer los factores principales subyacentes de un conjunto de datos. El método de los factores principales responde a la validez en sus tres aspectos: predictiva, contenido y de constructo. Es decir, si este estudio se realizara en otro lugar del Perú, y en condiciones similares, obtendríamos cargas factoriales similares. Con las cargas halladas se explican si el instrumento está midiendo lo que pretende medir (validez de constructo), si es útil para lo que se diseñó, (validez de contenido) y si el instrumento de medición predice lo que pretende predecir (validez predictiva). De allí que en la construcción moderna de los test, se incluye siempre un análisis factorial de los datos.

Con los puntajes de los estudiantes y con las variables contínuas (cuánto recibe para fotocopias, gastos) se calculó la matriz de regresión. Partiendo de la matriz de regresión se procedió a extraer los factores principales subyacentes al conjunto de datos. Los datos obtenidos de los estudiantes se pudo extraer dos factores principales que explican el 79.11% de la varianza total. Los otros itemes carecen de puntaje.
El primer factor explica el 45.21%, mientras que el segundo explica el 33.90% de la varianza total.

Procedimiento para extraer los factores principales.- Los factores principales, primeramente hallados se rotaron octogonalmente según el método de Varimax (varianza máxima).

1.

Análisis de confiabilidad de los datos
2.

Construcción de la matriz de correlación entre los itemes
3.

Estimación de la comunalidad (es la porción común o compartida entre los factores)
4.

Para estimar la comunalidad inicial se utilizó el método de Kayser y de Cureton.
5.

Para la extracción de los factores principales se utilizó el método de HOW ( Householder – Ortega-Wilkinson).
6.

Para afinar la precisión de las cargas se utilizó el método de refactorizaciòn (refinar las cargas).
7.

Para pulir y mejor la interpretación se rotò la matriz factorial según el método de Kayser (Varimax) que tiene como objeto maximizar la varianza en las componentes vectoriales del conjunto.
8.

Se ordenaron y se agruparon las cargas para la presentación final, y junto con los enunciados de los reactivos del test se procedió a su explicación.

Confiabilidad y validez

La confiabilidad o estabilidad de la escala Likert se obtiene por uno de los procedimientos de consistencia interna, particularmente el ejercicio de correlación entre las dos mitades de la escala (split half reliability) conocida como la prueba de partición por la mitad, la cual consiste en dividir el número de ítems del instrumento en dos partes iguales; el criterio mas utilizado es la división en ítems pares e ítems impares, se calcula el coeficiente de correlación a partir de las puntuaciones totales de cada una de las dos mitades de la escala siguiendo la formula de Spearman Brown dado el pretendido nivel ordinal de la escala, y se aplica por último un coeficiente de consistencia. Al realizar este ejercicio en la construcción de esta escala se obtuvo una correlación entre las mitades de 0.619, siendo el coeficiente de confiabilidad de 0.76.

La fórmula utilizada fue la siguiente rtt = 2r ÷ 1+ r = 2x 0.619 ÷ 1+0.619 = 0.76*.

Adicionalmente se obtuvo un coeficiente de confiabilidad Alfa de Cronbach de 0.86**. La escala es altamente confiable a un nivel de significación 0.01. El coeficiente de confiabilidad se interpreta siguiendo la siguiente escala:

Escala para interpretar el coeficiente
de confiabilidad (Ruiz, 1998)

Rangos Magnitud

0,81 a 1,00 Muy alta*

0,61 a 0,80 Alta**

0,40 a 0,60 Moderada

0,21 a 0,40 Baja

0,01 a 0,20 Muy Baja

En cuanto a la validez o exactitud con que se mide la variable en estudio, “se dice que un instrumento es válido cuando mide el concepto o la variable que se planifica medir (Blanco, 2000:74). El investigador debe responder a la pregunta ¿que mide el instrumento escalar? Tal como afirma Ruiz (1998) la validez no “es materia de presunción sino de demostración empírica”, el autor afirma que la validez de contenido no puede expresarse cuantitativamente a través de un índice o coeficiente, ya que la misma responde a un juicio. Es posible afirmar que la validez de contenido es un tipo de validez adecuado en la construcción de esta escala, insistiendo en que la misma tiene una significación teórica. Como parte del estudio técnico para determinar la validez de la escala en proceso de diseño, se realizó el ejercicio de operacionalización, de descomposición teórica de la variable, que busca a través de la generación de un alto número de reactivos o ítems (en este caso 90) una representación del universo teórico del contenido del constructo estudiado. Esto sumado a la validez discriminante, la cual si tiene un valor numérico para cada ítem, y cuyo procedimiento es parte de la técnica de construcción de la escala Likert, permite entonces definirla como un instrumento altamente válido. Adicionalmente la técnica de construcción de la escala Likert no recurre al juicio de expertos o jueces, como si es requerido por otros tipos de instrumentos , como la escala Thurstone por ejemplo.