jueves, 14 de julio de 2011

Estimación de datos perdidos en el Diseño de bloques al Azar

DATOS PERDIDOS EN EL DISEÑO DE BLOQUES AL AZAR

MÉTODO PARA EL MANEJO DE LOS DATOS  PERDIDOS EN EL ANÁLISIS

De vez en cuando ciertas observaciones se pierden, ya sea por no haberlas tomado, ya sea por errores grandes al tomarlas o por accidente.   La omisión naturalmente afecta al método de análisis.  Con cada uno de los diseños comunes se dan instrucciones de cálculo para analizar los datos que contengan errores.

Cuando faltan ciertas observaciones, el procedimiento correcto es señalar un modelo matemático para todas las observaciones que haya.   Las ecuaciones normales de mínimos cuadrados se construyen entonces por el método usual.  Estas toman exactamente la forma general, como en el caso en que se tuvieran en cuenta todas las observaciones, esto es,



Sumatoria de (Yijk – m – ti – bj)2  =  0


De todas las observaciones cuyas ecuaciones contengan algún parámetro especifico por estimar.   Sin embargo,  puesto que los términos correspondientes a los valores que están perdidos no están a la vista en la ecuación, el sistema de ecuaciones pierde algo de la simetría que posee cuando todos los están y las soluciones son más difíciles.   El mismo procedimiento general proporciona las pruebas de hipótesis de F y t con relación a la naturaleza de los efectos de los tratamientos, aunque nuevamente los detalles llegan a ser mas complicados.



En el análisis de la varianza pueden notarse dos cambios.  Debido a las observaciones perdidas, la s.c de los tratamientos y de los bloques se mezclan, de tal forma que la s.c de los tratamientos  debe ser calculada después de tener los efectos de bloques, como se menciono al final.

En segundo lugar, si faltan a observaciones, el numero total de grados de libertad se reduce en a.   A menos que una o más tratamientos o bloques completos estén perdidos, el numero de parámetros requeridos para describir estos efectos será el mismo que antes.   En consecuencia, todos los grados de libertad perdidos, afectan a la s.c. del error, que ahora representa  (ne – a) grados de libertad.   En resumen, los datos perdidos pueden ser manejados aplicando el procedimiento estándar de mínimos cuadrados a todas las observaciones que no estén perdidas.  Para referencias futuras, este métodos será llamado “procedimiento correcto de mínimos cuadrados”.

Para el experimentador puede ser un asunto difícil llevar a cabo la  construcción y la solución de un conjunto de ecuaciones normales que no le son familiares, aunque él sea muy competente para analizar un conjunto de datos completos. 


DATOS PERDIDOS EN BLOQUES AL AZAR


El diseño en bloques al azar debe ser balanceado.   Pueden suceder los siguientes casos

A)               Se pierde todo un tratamiento. Solución:  se analiza el experimento con un tratamiento menos.
B)                Se pierde todo un bloque. Solución:  se analiza el experimento con un bloque menos
C)                Se pierden algunas unidades experimentales (existen tres casos)
Que se pierda una unidad, que se pierdan dos unidades o que se pierdan tres unidades, si se pierden mas de tres unidades experimentales, se debe repetir el experimento.

PRIMER CASO ( Se pierde una unidad experimental)
Cuando se pierde una unidad experimental se aplica el siguiente modelo de estimación:

Yij    =   rB   +tT   -   S

                      (r -1)(t-1)
 donde
Yij       =          Estimación del dato perdido
r          =          Numero de repeticiones
B         =          Total del bloque donde falta el dato
T         =          Total del tratamiento donde falta el dato
t           =          Numero de tratamientos
S          =          Gran total  Y..

El dato estimado se coloca en donde falta el dato y se calcula el andeva de forma usual.   Pero se resta un grado de libertad al error y al total y se recalcula el cuadrado medio del error y la F

Ejemplo.









I
II
III
IV
TOTALES
1
1
4
5
2
12
2
5
7
Y
4
16
3
8
8
8
8
32
4
7
6
7
2
22

21
25
20
16
82
r = 4





t = 4





Y =
4(20)     +    4(16)     -    82
    =
6.88888


     (4    -   1) *(4    -   1)




Grados de Libertad del error ajustados: (4-1)(4-1)-1=8
Grados de libertad del total ajustados: (4*4-1)-1=14

SEGUNDO  CASO ( Se pierden dos unidades experimentales)
Cuando se pierde dos unidades experimentales  (x,y)  se aplica el siguiente método

a)                  Estimación inicial de X


X  =    T     +     B
                  2

donde

T         =          Promedio del tratamiento donde falta X

B         =          Promedio del bloque donde falta X

b)                 Teniendo X estimar Y

Y    =   rBy   +tTy   -   S

                    (r -1)(t-1)

c)                  Teniendo Y estimar X

Y    =   rBx   +tTx   -   S

                     (r -1)(t-1)

 donde

Y ó X  =          Estimación del dato perdido
R         =          Numero de repeticiones
B         =          Total del bloque donde falta el dato de x o de y
T         =          Total del tratamiento donde falta el dato
t           =          Numero de tratamientos
S          =          Gran total  Y..+ el dato previamente estimado de x ó y


d)                 Repetir los pasos b) y c) hasta que los resultados sean constantes

Los datos se colocan donde faltan los datos perdidos y se recalcula el andeva, restándole 2 grados de libertad al error y 2 grados de libertad al total.


 Ejemplo:












I
II
III
IV
TOTALES





1
42
40
35
40
157





2
25
28
X
28
81





3
Y
45
42
40
127





4
30
30
30
30
120





5
30
32
31
34
127






127
175
138
172
612















Estimación inicial de x









x= ((138/4)+(81/3))/2=30.75
     
   
    
      













Para Facilitar los cálculos se recomienda construir la siguiente tabla:


B T S X Y
127 127 642.7500 41.6875
138 81 653.6875 25.2760
127 127 637.2760 42.1437
138 81 654.1437 25.2380
127 127 637.2380 42.1468
138 81 654.1468 25.2378
127 127 637.2378 42.1469
138 81 654.1469 25.2378
127 127 637.2378 42.1469





Datos finales: X=25.2378
Y=42.1469
Grados de libertad del  e
rror corregi 
dos=(4-1)x
(5-1)-2=10
Grados de libertad del total corregidos=(4*5-1)-2=17


:
TERCER CASO  ( Se pierden tres unidades experimentales (X,Y,Z)
Cuando se pierde tres unidades experimentales  (X,Y,Z)  se aplica el siguiente método

a)         Estimación inicial de



X  =    Tx     +     Bx
                  2



Y  =    Ty     +     By
                  2


donde

T         =          Promedio del tratamiento donde falta X o Y

B         =          Promedio del bloque donde falta X o Y

b)                 Conociendo X,Y estimar Z

Z    =   rB  +tTZ  -   S

                  (r -1)(t-1)


c)                  Conociendo Y,Z estimar X

X    =   rB   +tT   -   S

                    (r -1)(t-1)

d)                 Conociendo X,Z estimar Y

Y    =   rB   +tT   -   S

                    (r -1)(t-1)


Z ó Y ó X =          Estimación del dato perdido
R         =          Numero de repeticiones
B         =          Total del bloque donde falta el dato de x o  y o z
T         =          Total del tratamiento donde falta el dato x, y o z
t           =          Numero de tratamientos
S          =          Gran total  Y..+ el dato previamente estimado de x ó y ó z

                         (para x: y+z, para y: x+z, para z: x+y)

e)                  Repetir los pasos b) c) y d) hasta que los resultados sean constantes.


Se calcula el andeva de forma usual, restando 3 grados de libertad al error y 3 grados de libertad al total y se recalcula el cuadrado medio del error y la F calculada

Ejemplo:
  I II III IV TOTALES
1 42 40 35 40 157
2 25 28 X 28 81
3 Y 45 42 40 127
4 30 30 30 30 120
5 30 32 31 Z 93
  127 175 138 138 578

Estimación inicial de x: ((138/4)+(83/3))/2=30.75
Estimación inicial de y: ((127/4)+(130/3))/2=37.041

Tabla de cálculos abreviados:
B T S X Y Z
138 93 645.7917     30.9340
138 81 645.9757 25.9187    
127 127 634.8527   42.3456  
138 93 646.2643     30.8946
138 81 651.2402 25.4800    
127 127 634.3746   42.3854  
138 93 645.8654     30.9279
138 81 651.3133 25.4739    
127 127 634.4018   42.3832  
138 93 645.8571     30.9286
138 81 651.3118 25.4740    
127 127 634.4026   42.3831  
138 93 645.8571     30.9286
138 81 651.3117 25.4740    

Datos finales:
x=25.4740
y=42.3831
z=30.9286

Grados de libertad del error corregidos: (4-1)*(5-1)-3= 9
Grados de libertad total corregidos: (4*5-1)-3=16

No hay comentarios:

Publicar un comentario