Seminario en la URJC Móstoles, 3 de abril de 2006 “A Bayesian approach for the rainfall-runoff problem: The case of Rio Grande Basin” Romy R. Ravines [email protected] dme.ufrj.br/romy Alexandra M. Schmidt [email protected] dme.ufrj.br/alex Helio S. Migon [email protected] dme.ufrj.br/migon Universidade Federal do Rio de Janeiro (UFRJ) Instituto de Matemática (IM) Departamento de Métodos Estatı́sticos (DME) Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme Motivación: la relación rainfall-runoff + 20 + + + +++++ + + + + ++ + ++ ++ + + + + ++ + + ++ + + +++ + + +++ + ++ ++ ++ + ++ + + +++ + ++++ + + + + + +++ + + ++ + ++ + + ++ + + + + ++ + ++ +++ + + ++ + + ++++ + + ++++ + + + + + ++ +++ ++ ++++ + ++ ++ + +++++++ +++ +++ ++ +++ + + + ++ + ++ + + + +++++ +++ ++ +++++++ ++ + + ++ + + ++ + ++ ++++ + + ++ +++++++++ ++ ++++ + + ++ ++ + + ++ + + + ++ + + + ++ ++ 0 10 + 50 Vazão (m3/s) + Chuva (mm) + +++ + + + 0 100 200 Figura: Datos reales Palabras-Clave Figura: Procesos fı́sicos en la generación del runoff Modelar Conjuntamente Familia Exponencial Funciones de Transferencia Iniciar 2/30 + + ++ ++ ++ + + + + + + + ++++ +++ ++ +++ ++ ++ ++ + 0 + + + ++ +++ ++ + + + + ++ + ++ + + + ++++ + + + + +++ ++ + + ++ + ++ + +++ + + + + + +++ + + + + + + ++ + + +++++++ ++ ++ + ++ + + +++++ ++ +++++++ + + ++ + + + +++++++ + + + + ++++++ ++ + +++ + + ++ + ++ + + + ++ 10 + + +++++ Chuva (mm) + 100 200 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme A Bayesian approach for the rainfall-runoff problem: The case of Rio Grande Basin 4/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme La cuenca del Rio Grande (BA): localización BRASIL Bacia do Rio São Francisco Bacia do Rio Grande 5/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme La cuenca del Rio Grande (BA): datos BRASIL Bacia do Rio São Francisco Bacia do Rio Grande 80 10 15 5 15 20 10 0 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 Figura: Datos mensuales: agosto de 1984 a setiembre de 2004 São Sebatião 0 5 Barreiras 0 Roda Velha 40 Taguá Taguá Vazão Chuva Grade 6/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme Modelo propuesto: caso general Sea Yt = runoff y Xt = rainfall en el tempo t. La relación rainfall-runoff puede ser representada por: Yt ∼ p(Yt |µt , ϑt , Xt ), t = 1, . . . , T. g(µt ) = f 1 (αt , Et ) Et = f 2 ( Et−1 , . . . , E0 , Xt ) X t = | B | −1 Figura: Procesos fı́sicos en la generación del runoff Z B Xt (s)ds, s = 1, . . . , N. Xt (s) = βt f (s) + Zt (s) + et (s), Zt (s) ∼ GP(0, σ2 $(ks1 , s2 k, λ)) p(Yt |µt , ϑt ) es una densidad en R+ . αt es un nivel básico y Et es el efecto total de la precipitación en t, g(·), f 1 (·) e f 2 (·) son funciones conocidas que describen la dinámica de los procesos. Modelos con los parámetros dinámicos o con errores aleatorios afectando a Et son casos particulares. | B| es el área de la cuenca y Xt (s) es la precipitación en el instante t en la localización s, que es descrito por la suma de tres componentes: (a) βt f (s), una tendencia polinomial, (b) Z (s), un proceso espacial y (c) e(s), un efecto aleatorio. σ2 es la varianza del proceso Z (s) y $(ks1 − s2 k, λ) representa una función de correlación que depende de λ. 7/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme Efecto de la precipitación: Función de Transferencia Siguiendo lo establecido en Migon & Monteiro (1997), la relación ● rainfall-runoff puede ser representada por una función de transferencia. En ρ = 0.7 ● Et particular, Et puede seguir una de las siguientes alternativas: ● γ = 0.3 ● ● Dos funciones de transferencia: ● ● ● Et = ρt Et−1 + γt Xt ● ● ● ● tempo Et = ρt Et−1 + [1 − exp(−κt Xt )][φt − αt − ρt Et−1 ] (a) Dec. Exponencial φ−α ● ● Casos particulares de γt : ● ● ● ● ● ● ● ● ● ● ● ● Temporal: γt = γt−1 + δt ● ● ● ● Et γ = 0.3 ρEt−1 ● ● ● ● Et Constante: γt = γ ● ● ● ● ● ● ● ● Xt Aleatorio: γt = γ + δt Jerárquico: γt = γ + δt ; ● ● γ ∼ N ( a, b) (b) Ret. Proporcionales Xt (c) Ret. Decrecientes Figura: Hipótesis sobre Et 8/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme Efecto de la precipitación: Función de Transferencia Siguiendo lo establecido en Migon & Monteiro (1997), la relación ● rainfall-runoff puede ser representada por una función de transferencia. En ρ = 0.7 ● Et particular, Et puede seguir una de las siguientes alternativas: ● γ = 0.3 ● ● Dos funciones de transferencia: ● ● ● Et = ρt Et−1 + γt Xt ● ● ● ● tempo Et = ρt Et−1 + [1 − exp(−κt Xt )][φt − αt − ρt Et−1 ] (a) Dec. Exponencial φ−α ● ● Casos particulares de γt : ● ● ● ● ● ● ● ● ● ● ● ● Temporal: γt = γt−1 + δt ● ● ● ● Et γ = 0.3 ρEt−1 ● ● ● ● Et Constante: γt = γ ● ● ● ● ● ● ● ● Xt Aleatorio: γt = γ + δt Jerárquico: γt = γ + δt ; ● ● γ ∼ N ( a, b) (b) Ret. Proporcionales Xt (c) Ret. Decrecientes Figura: Hipótesis sobre Et 8/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme Modelo propuesto: caso particular Runoff ⇒ Distribución: Log-Normal o Gama ⇒ Serie no estacionaria ⇒ Efecto Xt : FT 1o orden. Rainfall ⇒ Distribución: Normal Truncada (Sansó & Guenni, 2000) ⇒ Estacionalidad: 2 armónicos ⇒ F i = (1, longi , 1, 0, 1, 0)0 G1 0 ⇒ G= . 0 G2 Yt ∼ p(µt , φ) t = 1, . . . , T = 221 (1a) f (µt ) = αt + Et (1b) αt = αt−1 + wα,t Et = ρEt−1 + γXt + wE,t −1 Xt = | B | ( β wit Xit = 0 Z (1c) N (0, σE2 ) (1d) wE,t ∼ Xt (s)ds s = 1, . . . , S = 49 (1e) si wit > 0 si wit ≤ 0 i = 1, . . . , N = 9 (1f) νt ∼ NN (0, τ 2 I ) (1g) B wt = zt + νt 0 wα,t ∼ N (0, σα2 ) zt = F θt + et θt = Gθt−1 + εt 2 et ∼ NN (0, σ V t ) (1h) εt ∼ Nk (0, W t ) (1i) En (1f)–(1i), σ2 > 0, V t ∈ R N × N , θ ∈ Rk , G ∈ Rk×k , F 0 ∈ R N ×k . wit es una variable latente Gaussiana, τ 2 I es el efecto pepita, θt = (θt1 , θt2 )0 , where θt1 es el sub-vector de la tendencia espacial y θt2 de la estacionalidad. V t captura la correlación espacial, con Vij = exp(−λdij ). En (1b), f (·) = log o identidad, dependiendo de p(µt , φ). 9/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme Inferencia Aprovechando la factorización de la verosimilitud en p(Yt | Xt ) p( Xt ), la inferencia puede ser realizada en dos etapas: Primero se ajusta un modelo para Xit , (1e)–(1i), por ejemplo, con diferentes especificaciones de la tendencia polinomial, después se ajustan los casos particulares del modelo para Yt , (1a)–(1d). Métodos MCMC: Metrópolis-Hastings, Slice Sampling. “An Efficient Sampling Scheme for Generalized Dynamic Models” CUBS Comparación de modelos: DIC, EPD, ECM, EAM. Algoritmos escritos en Ox: http://www.doornik.com/ 10/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme Modelo Espacio-Temporal de la Precipitación: resultados (1) El modelo seleccionado para la precipitación tiene un intercepto y un efecto lineal de la longitud en la tendencia espacial. El ajuste de otros modelos mostró que la latitud no tiene un efecto significativo en esta región. Cuadro: Estadı́sticas a posteriori dos parámetros estáticos media 1.339 0.065 0.632 1.073 ds 0.014 0.013 0.035 0.046 2.5 % 1.311 0.044 0.566 0.988 25 % 1.329 0.056 0.607 1.041 50 % 1.339 0.063 0.630 1.071 75 % 1.348 0.073 0.655 1.103 1.5 n.eff 5000 5000 5000 5000 1990 1995 (a) Intercepto 2000 −0.5 0 −2 1985 1990 1995 (b) Longitude 2000 1985 1990 (c) 1o 1995 2000 −1.5 1985 −4 0.5 −0.8 1.0 1.5 −0.4 0.5 2 0.0 2.5 2.0 R̂ 1.001 1.001 1.001 1.001 97.5 % 1.367 0.094 0.702 1.166 4 β λ ρ2 σ2 1985 armónico 1990 (d) 2o 1995 2000 armónico Figura: Trayectoria estimada para os parámetros dinámicos 11/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme −11.4 −11.8 −11.8 −12.2 −12.2 −12.6 −13.0 −13.0 −12.6 latitude −11.4 −11.0 −11.0 Modelo Espacio-Temporal de la Precipitación: resultados (2) −46.1 −45.9 −45.7 −45.5 −45.3 −45.1 −44.9 −44.7 −44.5 −44.3 longitude −46.1 −45.9 (a) Diciembre, 2000 −45.7 −45.5 −45.3 −45.1 −44.9 −44.7 −44.5 −44.3 (b) Junio, 2002 24 Média a posteriori 4 8 12 16 20 24 28 Figura: Media a posteriori de la precipitación en dos meses. Los puntos marcan la localización de las estaciones. 0 0 4 8 mm 12 16 20 Média IC 95% 1984 1987 1990 1993 1996 1999 2002 (a) Intervalo de 95 % de credibilidad ● ● ● ● ● ● ●● ●●● ●● ● ●● ●● ● ●●● ●● ●●● ●● ● ● ● ●● ● ● ● ● ● ● ●● ● ● ● ●● ● ● ● ● ●● ● ● ●● ● ● ● ● ● ●● ● ●● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● 0 2 4 6 8 11 14 17 Método Thiessen (b) Comparación con Thiessen Figura: Precipitación en la cuenca del Rio Grande 12/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme Modelo de Función de Transferencia para Runoff: resultados El modelo seleccionado para la escorrentia considera una respuesta Log-Normal, un nivel estático y una función de transferencia estocástica. Cuadro: Estadı́sticas a posteriori dos parámetros estáticos ds 0.029 0.021 0.002 0.001 0.001 2.5 % 4.708 0.631 0.043 0.003 0.002 25 % 4.754 0.660 0.045 0.004 0.003 50 % 4.772 0.675 0.047 0.005 0.003 75 % 4.791 0.688 0.048 0.005 0.004 97.5 % 4.823 0.712 0.050 0.007 0.005 ● 1 2 3 4 6 7 8 ● ● ● 9 ● ● ● ● ● 10 tempo (a) Función Respuesta-Impulso ● ● 12 ● ● ● ● 14 simulated 250 300 350 200 m3 s ● ● ● 300 400 5 ● ● ● 150 0.00 γ ● ρ ● ● ● 200 ● ● ● 100 0.04 Et 0.02 ● ● ● n.eff 2500 2500 2500 2500 2500 ● 400 500 ● ● ● R̂ 1.001 1.001 1.001 1.001 1.001 450 media 4.771 0.674 0.047 0.005 0.004 α ρ γ σY2 σE2 ● ● ●● ● ●●● ● ●● ● ● 100 1984 1986 1988 1990 1992 1994 1996 1998 2000 (b) Media e 95 % IC para runoff 2002 ● ● ● ● ● ● ●● ●● ● ● ● ●● ● ● ●● ● ● ● ● ●● ●● ● ● ● ●● ● ● ●●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● 200 300 400 observed (c) Q-Q plot Figura: Escorrentia: valores ajustados, com (1a)-(1d). Media a posteriori (linea solida) y limites del IC de 95 % (lı́neas com puntos). + son los datos observados. 13/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme ● 8 12 ● ● ● ●● ● ● ● ● 12 ●●●●● ● ● ● ●●●● ● ● ●●●●● 2003.0 2004.0 Sitio Grande 8 12 ● ● ● ● ●●●●● ● 2004.0 Derocal ● ● ● ● ●●● ● ● ● ● ● ● ● ● ● ● 2003.6 ●●● ● ● ● ●●●●● 2003.0 2004.0 Ponte Serafim ● ● ● ● 2004.2 ● ●● ● ●● ● ● ● ● ● ● ●● ● ●●● 2003.0 2004.0 Roda Velha (a) Precipitación en cada estación ● ● ● ● ● 0 ●● 0 0 2003.0 ●● ● 4 ● ● ● ● ● ● ●● 4 4 ●● ● ● ● ● ● ● ● (b) Precipitación en la cuenca m3 s 200 300 2003.0 2004.0 Redenção 8 12 ●●●●● 2003.0 2004.0 Nova Vida ● ● ● 2003.0 ● 8 12 ●●●●● ● ● ● ●● ● ●●●●●● ● 2003.0 2004.0 Barreiras ● ●● ● ● ●●●● ● ●●● ●●● ● 4 ● ●●●● ● ● 0 ●●●●● 0 4 ●● ● ● ● 2003.0 2004.0 Coqueiro ● ● ● ● 8 12 8 12 2003.0 2004.0 São Sebastião ● ● ● mm 0 2 4 6 8 ●●●●● ● 4 ● ● ● ● ● ● ● ● 100 ●●●● ● ● 4 0 ● ● ● ● ● ● ● 0 ● ● ● ● 0 ● ● 4 ● ● ● ● 8 12 ● 0 8 12 ● ● 4 8 12 Previsión ● 2003.0 ● ● ● 2003.6 ● ● 2004.2 (c) Escorrentia en la cuenca Figura: Previsión: media (linea sólida) e intervalo de 95 % de credibilidad (lı́neas punteadas). Los puntos en azul: en (a) y (c) corresponden a los datos observados, en (b) corresponden a los valores obtenidos con el método Thiessen 14/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme La contribución es: Modelo conjunto: combinar un modelo de función de transferencia para runoff, condicionado en la precipitación de la cuenca, con un modelo espacio-temporal simultaneo para la precipitación medida en varias localizaciones dentro del área de drenaje de la estación de runoff en consideración. Extensiones Consideraciones Finales: Los modelos utilizados tienen una interpretación fı́sica clara y constituyen una representación parsimoniosa de todos os procesos envueltos en la relación rainfall-runoff: elicitación de prioris. Una extensión: utilización de modelos jerárquicos para trabajar com varias cuencas simultáneamente. Uso de los resultados de esta forma de modelar en el manejo de embalses: Teorı́a de la Decisión. 15/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme La contribución es: Modelo conjunto: combinar un modelo de función de transferencia para runoff, condicionado en la precipitación de la cuenca, con un modelo espacio-temporal simultaneo para la precipitación medida en varias localizaciones dentro del área de drenaje de la estación de runoff en consideración. Extensiones Consideraciones Finales: Los modelos utilizados tienen una interpretación fı́sica clara y constituyen una representación parsimoniosa de todos os procesos envueltos en la relación rainfall-runoff: elicitación de prioris. Una extensión: utilización de modelos jerárquicos para trabajar com varias cuencas simultáneamente. Uso de los resultados de esta forma de modelar en el manejo de embalses: Teorı́a de la Decisión. 15/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme Algunas Referencias Gamerman, D. (1998). Markov chain Monte Carlo for dynamic generalised linear models. Biometrika, 85(1), 215–227. Geweke, J., & Tanizaki, H. (2001). Bayesian estimation of state space models using Metropolis-Hastings algorithm within Gibbs sampling. Computacional Statistics & Data Analysis, 37, 151-170. Kitagawa, G. (1987). Non-gaussian state-space modeling of non-stationary time series. Journal of the American Statistical Association, 82(400), 1032–1041. Migon, H., & Monteiro, A. B. (1997). Rain-fall modelling: An application of Bayesian forecasting. Stochastic Hydrology and Hydraulics, 11, 115–127. Sansó, B., & Guenni, L. (2000). A non-stationary multi-site model for rainfall. Journal of the American Statistical Association, 95, 1089–1100. West, M., Harrison, J., & Migon, H. (1985). Dynamic generalized linear models and Bayesian forecasting. Journal of the American Statistical Association, 80(389), 73–83. 16/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme 17/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme 80 10 15 5 15 20 10 0 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 São Sebatião 0 5 Barreiras 0 Roda Velha 40 Taguá Cuenca del Rio Grande (BA): series temporales 2004 18/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme Procesos fı́sicos envueltos en la generación de la escorrentia 19/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme Extensión 1: runoff en varios puestos El modelo propuesto puede ser extendido para modelar las series de runoff de dos estaciones de la misma cuenca: YTa,t ∼ p(µ Ta,t , φTa ) t = 1, . . . , T = 221 µ Ta,t = α Ta + β log(YRe,t ) + ETa,t ETa,t = ρ Ta ETa,t−1 + γTa XTa,t + wTa,t wTa,t ∼ N (0, σE2Ta ) YRe,t ∼ p(µ Re,t , φRe ) t = 1, . . . , T = 221 µ Re,t = α Re + ERe,t ERe,t = ρ Re ERe,t−1 + γRe XRe,t + w Re,t XTa,t = | BTa |−1 Z XRe,t = | BRe |−1 Z BTa BRe w Re,t ∼ N (0, σE2 Re ) Xt (s)ds s = 1, . . . , S1 = 21 Xt (s)ds s = 1, . . . , S2 = 28 Xt (s) = βt f (s) + Zt (s) + et (s), s = 1, . . . , S = 9 2 Z (s) ∼ GP(0, σ $(ks1 , s2 k, λ)) Figura: Estaciones y división del grid de previsión donde Yj,t y X j,t denotan la escorrentia y la precipitación en el tempo t en la localización j = Ta, Re. Ta = Taguá, Re = Redenção. Bj es el área de drenaje relativa a la estación j, BTa ∪ BRe = B, es el área de toda a cuenca. 20/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme Extensión 2: modelo jerárquico Una extensión natural del modelo de función de transferencia usado Como ejercicio, ajustamos el modelo (2) a los datos de aquı́ es un modelo jerárquico como: Rio Grande. Yt,k ∼ p(µt,k , σY2 ) t = 1, . . . , T; (2a) Cuadro: Posterior mean and sd k = 1, . . . , K, µt,k = αk + Et,k (2b) Et,k = ρEt−1,k + γk Xt,k (2c) αk = α + υk1 , υk1 ∼ γk = γ + υk2 , υk2 ∼ N (0, σα2 ) N (0, σγ2 ) (2d) (2e) donde Yt,k es la escorrentia Xt,k es la precipitación en el tempo t en la cuenca k. Este modelo asume que el nivel básico e el efecto de la precipitación de las K cuencas varia en torno de un nivel común, denotados por α y γ respectivamente. Naturalmente, la memoria del efecto de la precipitación también puede tener una estructura jerárquica. La exchangeability de las cuencas es una hipótesis de α σα2 α1 α2 α3 γ σγ2 γ1 γ2 γ3 ρ σY2 media 4.1201 2.6817 3.5084 4.0589 4.8131 0.0438 0.0052 0.0421 0.0420 0.0462 0.6158 0.0131 dp 0.8614 12.9231 0.0150 0.0152 0.0160 0.0399 0.0266 0.0014 0.0014 0.0014 0.0117 0.0007 Volver este modelo. 21/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme −10.5 Otros resultados: escorrentia en varios puestos −11.0 Runoff ● Rainfall Barreiras AERIAL II −11.5 −12.0 Ponte Serafim ● Grid Taguá Nova Vida ● São Sebastião ● −12.5 Redenção Redenção ● Barreiras Derocal ● ● Sitio Grande ● ● Coqueiro Roda Velha −13.0 latitude AERIAL I ● −46.0 −45.5 −45.0 −44.5 −44.0 longitude Figura: Localización de las estaciones y división del grid de previsión. 22/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme An Efficient Sampling Scheme for Generalized Dynamic Models 23/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme Modelos dinámicos generalizados Modelos dinámicos generalizados: y t | µ t ∼ p ( µ t , φ ), t = 1, . . . , T. 0 g(µt ) = F t (ψ1 ) θt θt = G t (ψ2 )θt−1 + wt , (3a) (3b) wt ∼ N (0, W t ) (3c) donde p(µt , φ) es una distribución de la familia exponencial, µt es el valor esperado de yt , φ representa otros parámetros de p(), y ψ1 y ψ2 denotan parámetros envueltos en la definición de F t y G t , respectivamente. Los vectores θt son conocidos como parámetros de estado y están relacionados a través del tiempo via (3c), la ecuación del sistema. Muestrear θt puede ser complicado. Alternativa de muestreo: paso Metropolis-Hastings. Propuestas: Gamerman (1998), Geweke & Tanizaki (2001), etc. 24/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme Modelos dinámicos lineales generalizados West, Harrison, & Migon (1985) presentaron los modelos dinámicos lineales generalizados: la distribución de la respuesta pertenece a la familia exponencial con parámetro natural ηt . ηt tiene una priori conjugada, CP(rt , st ). La ecuación del sistema es similar a (3c), mas la distribución de sus errores está parcialmente especificada. yt |ηt , φ ∼ exp[φ{yt ηt − a(ηt )}]b(yt , φ), t = 1, . . . , T. ηt | Dt−1 ∼ CP(rt , st ) g ( ηt ) = (4b) F 0t θt θt = G t θt−1 + wt , (4a) (4c) wt ∼ [0, W t ] (4d) θ0 | D0 ∼ [m0 , C 0 ] donde Dt denota la información hasta el tiempo t, mt e C t denotan, respectivamente, el primer y segundo momento del vector de estados θt , dado Dt . En (4), F t y G t son conocidas, y, dado ηt , yt y θt son condicionalmente independientes, mientras que en (3) esta estructura es diferente. West et al. (1985) propusieron un sistema recursivo que explora la conjugación del modelo para aproximar las distribuciones de θt secuencialmente. Este sistema es conocido como Conjugate Updating. 25/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme Análisis Secuencial Sea Dt = {y1 , . . . , yt } - la información total obtenida hasta t. En los modelos lineales normales: . . . (θt−1 | Dt−1 ) Evolución +3 (θt | Dt−1 ) Actualización +3 (θt | Dt ) . . . En los modelos lineales dinámicos generalizados: . . . (θt−1 | Dt−1 ) Evolución +3 (θt | Dt−1 ) ( η t | Dt −1 ) (θt | Dt ) . . . KS Actualización +3 (ηt | Dt ) 26/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme Análisis Secuencial Sea Dt = {y1 , . . . , yt } - la información total obtenida hasta t. En los modelos lineales normales: . . . (θt−1 | Dt−1 ) Evolución +3 (θt | Dt−1 ) Actualización +3 (θt | Dt ) . . . En los modelos lineales dinámicos generalizados: . . . (θt−1 | Dt−1 ) Evolución +3 (θt | Dt−1 ) ( η t | Dt −1 ) (θt | Dt ) . . . KS Actualización +3 (ηt | Dt ) 26/30 Aproximación utilizada por CUBS Sea Dt la información hasta el tiempo t. Sea Φ = (ψ, φ). La distribución condicional conjunta completa de θ = (θ1 , . . . , θT ) es: p(θ|Y, Φ) ∝ p(θT | DT , Φ) T −1 ∏ t =1 p(θt |θt+1 , Dt , Φ) | {z } Densidad retrospectiva ∝ p(θT | DT , Φ) T −1 ∏ p(θt+1 | θt , Dt , Φ) |p(θt |{zDt , Φ}) t =1 A posteriori Los momentos de las distribuciones a posteriori son aproximados por: p(θt | Dt , Φ) ∝ p(θt | Dt−1 , Φ) p(Yt | θt , Φ) = Z p(θt | ηt , Dt−1 , Φ) p(ηt | Dt−1 , Φ) p(Yt | ηt , Φ) dηt | {z } Análise Conjugada ∝ Z p(θt | ηt , Dt−1 , Φ) p(ηt | Dt , Φ)dηt = [mt , C t ] | {z } Linear Bayes b{θt | ηt , Dt−1 } | Dt , Φ mt = E[θt | Dt , Φ] = E E b{θt | ηt , Dt−1 } | Dt , Φ + E V b {θt | ηt , Dt−1 } | Dt , Φ C t = V [θt | Dt , Φ] = V E CUBS para un modelo dinámico Gama 1 2 Haga t = 1 Calcule mt y C t : 1 Obtenga los momentos a priori de θt y g ( ηt ), a partir do modelo: θt | Dt−1 ∼ [ at , Rt ] g(ηt )| Dt−1 ∼ [ f t , qt ] 2 log rt − γ(st + 1) γ 0 ( s t + 1) = = ≈ ≈ log rt − log(st + 1) 1/(st + 1) = = ft qt Calcule los momentos a posteriori de g(ηt ): E[ g(ηt )| Dt ] Var [ g(ηt )| Dt ] 4 Rt = G t C t−1 G 0t + W t qt = F 0t Rt F t a t = G t m t −1 , f t = F 0t at , Determine a partir del análisis conjugado, los momentos a priori de g(ηt ): E[ g(ηt )| Dt−1 ] Var [ g(ηt )| Dt−1 ] 3 onde: onde: = = log(rt + φyt ) − γ(st + φ + 1) γ 0 ( s t + φ + 1) = = f t∗ q∗t Obtenga los momentos de la distribución a posteriori de θt , no modelo: θt | Dt ∼ [mt , C t ], donde: mt = at + Rt F t ( f t∗ − f t ) 1 qt 3 Haga t = t + 1 y regrese para 2 si t < T; 4 Muestree θT de N (m T , CT ); 5 Haga t = R − 1, muestree θt de p(θt | θt+1 , Dt , θ) = N (mst , C st ); 6 Haga t = t − 1 y regrese para 5 si t > 1; C t = Rt − Rt F t F 0t Rt 1 − q∗t 1 qt qt Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme MCMC + CUBS 1 Inicio: dar valores iniciales θ(0) , ψ(0) e iniciar las iteraciones, i = 1; 2 Muestrear θ(i) usando CUBS: 1 2 Calcular los momentos de p(θt | Dt , ψ(i−1) ), m(i) e C (i) , con el Conjugate Updating; Muestrear θ∗ con el Backward Sampling. 1 2 3 (i ) (i ) Muestrear θ∗T de Normal(m T , C T ) Muestrear θ∗t , t = T − 1, . . . , 1, de p(θt |θ∗t+1 , ψ(i−1) ) Haga θ(i) = θ∗ con probabilidad pt y θ(i) = θ(i−1) con probabilidad 1 − pt , donde pt = mı́n(1, A) y A es la razón de aceptación del Metropolis-Hastings: ( ) ω (θ∗ ) π (θ∗ ) A = mı́n 1, , ω (θ∗ ) = , ω (θ) q(θ∗ ) 3 Muestrear ψ(i) usando, en general, un paso de Metropolis-Hastings ; 4 Muestrear φ(i) usando, en general, un paso de Metropolis-Hastings; 5 Actualización: haga i = i + 1 y regrese para 2 hasta la convergencia. 29/30 Motivación Rainfall-Runoff Referencias Extensiones Sampling Scheme Precipitación en Tokyo Referencias Kitagawa (1987) e Gamerman (1998). Objetivo Estimar a probabilidad de ocurrencia de lluvia para cada dı́a calendario. Datos Número de dias com precipitación superior a 1mm em Tokyo para cada dı́a entre 1983-1984. Modelo Yt ∼ Binomial(n, πt ), t = 1, . . . , T logit(πt ) = αt wt ∼ N (0, W ) 20 Posterior Mean 12 8 0 4 Density 16 0.05 0.20 0.35 0.50 0.65 probability α t = α t −1 + w t 0 40 80 120 160 200 240 280 320 360 0.00 0.03 day (a) Probabilidad de Lluvia 0.06 0.09 0.12 0.15 0.18 W (b) Muestra a posteriori de W Figura: Resultados obtenidos com MCMC+CUBS. (a): Probabilidad de lluvia: media a posteriori (linea sólida) e intervalo de 95 % de credibilidad (linea punteada) (b) Distribución a posteriori empı́rica de W. Volver 30/30