A Bayesian approach for the rainfall-runoff

Anuncio
Seminario en la URJC
Móstoles, 3 de abril de 2006
“A Bayesian approach for the rainfall-runoff problem:
The case of Rio Grande Basin”
Romy R. Ravines
[email protected]
dme.ufrj.br/romy
Alexandra M. Schmidt
[email protected]
dme.ufrj.br/alex
Helio S. Migon
[email protected]
dme.ufrj.br/migon
Universidade Federal do Rio de Janeiro (UFRJ)
Instituto de Matemática (IM)
Departamento de Métodos Estatı́sticos (DME)
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
Motivación: la relación rainfall-runoff
+
20
+
+
+
+++++
+
+
+
+
++
+
++
++
+
+
+
+ ++
+
+
++ + +
+++
+
+
+++
+
++
++
++
+ ++
+
+
+++
+
++++
+
+
+ + + +++
+
+
++
+
++
+ +
++
+
+
+ + ++ +
++
+++
+
+
++
+
+
++++
+
+
++++ +
+
+
+
+
++
+++
++
++++
+ ++
++
+ +++++++ +++
+++
++
+++ +
+
+
++
+
++ +
+
+
+++++
+++
++ +++++++
++
+
+
++
+ +
++
+
++ ++++
+
+
++
+++++++++ ++
++++ +
+
++
++ +
+
++
+ +
+
++
+
+
+
++
++
0
10
+
50
Vazão (m3/s)
+
Chuva (mm)
+
+++
+
+
+
0
100
200
Figura: Datos reales
Palabras-Clave
Figura: Procesos fı́sicos en la generación del
runoff
Modelar Conjuntamente
Familia Exponencial
Funciones de Transferencia
Iniciar
2/30
+
+
++
++
++
+
+
+
+
+
+
+
++++
+++
++
+++
++
++
++
+
0
+
+
+ ++
+++
++ + +
+
+
++
+ ++
+
+
+
++++
+
+ + + +++
++
+ +
++
+
++
+
+++
+
+
+
+ +
+++
+
+
+
+
+
+ ++
+
+ +++++++ ++
++
+
++
+
+
+++++
++ +++++++
+
+
++
+ +
+
+++++++
+
+
+
+
++++++ ++ +
+++ +
+
++ +
++
+ +
+
++
10
+
+
+++++
Chuva (mm)
+
100
200
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
A Bayesian approach for the rainfall-runoff problem:
The case of Rio Grande Basin
4/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
La cuenca del Rio Grande (BA): localización
BRASIL
Bacia do
Rio São Francisco
Bacia do
Rio Grande
5/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
La cuenca del Rio Grande (BA): datos
BRASIL
Bacia do
Rio São Francisco
Bacia do
Rio Grande
80
10 15
5
15
20
10
0
1984
1986
1988
1990
1992
1994
1996
1998
2000
2002
2004
Figura: Datos mensuales: agosto
de 1984 a setiembre de 2004
São Sebatião
0 5
Barreiras
0
Roda Velha
40
Taguá
Taguá
Vazão
Chuva
Grade
6/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
Modelo propuesto: caso general
Sea Yt = runoff y Xt = rainfall en el tempo t. La relación
rainfall-runoff puede ser representada por:
Yt ∼ p(Yt |µt , ϑt , Xt ),
t = 1, . . . , T.
g(µt ) = f 1 (αt , Et )
Et = f 2 ( Et−1 , . . . , E0 , Xt )
X t = | B | −1
Figura: Procesos fı́sicos en la
generación del runoff
Z
B
Xt (s)ds,
s = 1, . . . , N.
Xt (s) = βt f (s) + Zt (s) + et (s),
Zt (s) ∼ GP(0, σ2 $(ks1 , s2 k, λ))
p(Yt |µt , ϑt ) es una densidad en R+ . αt es un nivel básico y Et es el efecto total de la precipitación en t, g(·), f 1 (·) e f 2 (·) son
funciones conocidas que describen la dinámica de los procesos. Modelos con los parámetros dinámicos o con errores
aleatorios afectando a Et son casos particulares. | B| es el área de la cuenca y Xt (s) es la precipitación en el instante t en la
localización s, que es descrito por la suma de tres componentes: (a) βt f (s), una tendencia polinomial, (b) Z (s), un proceso
espacial y (c) e(s), un efecto aleatorio. σ2 es la varianza del proceso Z (s) y $(ks1 − s2 k, λ) representa una función de
correlación que depende de λ.
7/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
Efecto de la precipitación: Función de Transferencia
Siguiendo lo establecido en Migon & Monteiro (1997), la relación
●
rainfall-runoff puede ser representada por una función de transferencia. En
ρ = 0.7
●
Et
particular, Et puede seguir una de las siguientes alternativas:
●
γ = 0.3
●
●
Dos funciones de transferencia:
●
●
●
Et = ρt Et−1 + γt Xt
●
●
●
●
tempo
Et = ρt Et−1 + [1 − exp(−κt Xt )][φt − αt − ρt Et−1 ]
(a) Dec. Exponencial
φ−α
●
●
Casos particulares de γt :
●
●
●
●
●
●
●
●
●
●
●
●
Temporal: γt = γt−1 + δt
●
●
●
●
Et
γ = 0.3
ρEt−1
●
●
●
●
Et
Constante: γt = γ
●
●
●
●
●
●
●
●
Xt
Aleatorio: γt = γ + δt
Jerárquico: γt = γ + δt ;
●
●
γ ∼ N ( a, b)
(b) Ret. Proporcionales
Xt
(c) Ret. Decrecientes
Figura: Hipótesis sobre Et
8/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
Efecto de la precipitación: Función de Transferencia
Siguiendo lo establecido en Migon & Monteiro (1997), la relación
●
rainfall-runoff puede ser representada por una función de transferencia. En
ρ = 0.7
●
Et
particular, Et puede seguir una de las siguientes alternativas:
●
γ = 0.3
●
●
Dos funciones de transferencia:
●
●
●
Et = ρt Et−1 + γt Xt
●
●
●
●
tempo
Et = ρt Et−1 + [1 − exp(−κt Xt )][φt − αt − ρt Et−1 ]
(a) Dec. Exponencial
φ−α
●
●
Casos particulares de γt :
●
●
●
●
●
●
●
●
●
●
●
●
Temporal: γt = γt−1 + δt
●
●
●
●
Et
γ = 0.3
ρEt−1
●
●
●
●
Et
Constante: γt = γ
●
●
●
●
●
●
●
●
Xt
Aleatorio: γt = γ + δt
Jerárquico: γt = γ + δt ;
●
●
γ ∼ N ( a, b)
(b) Ret. Proporcionales
Xt
(c) Ret. Decrecientes
Figura: Hipótesis sobre Et
8/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
Modelo propuesto: caso particular
Runoff
⇒ Distribución: Log-Normal o
Gama
⇒ Serie no estacionaria
⇒ Efecto Xt : FT 1o orden.
Rainfall
⇒ Distribución: Normal
Truncada (Sansó & Guenni,
2000)
⇒ Estacionalidad: 2
armónicos
⇒ F i = (1, longi , 1, 0, 1, 0)0
G1
0
⇒ G=
.
0
G2
Yt ∼ p(µt , φ)
t = 1, . . . , T = 221 (1a)
f (µt ) = αt + Et
(1b)
αt = αt−1 + wα,t
Et = ρEt−1 + γXt + wE,t
−1
Xt = | B |
(
β
wit
Xit =
0
Z
(1c)
N (0, σE2 )
(1d)
wE,t ∼
Xt (s)ds
s = 1, . . . , S = 49
(1e)
si wit > 0
si wit ≤ 0
i = 1, . . . , N = 9
(1f)
νt ∼ NN (0, τ 2 I )
(1g)
B
wt = zt + νt
0
wα,t ∼ N (0, σα2 )
zt = F θt + et
θt = Gθt−1 + εt
2
et ∼ NN (0, σ V t ) (1h)
εt ∼ Nk (0, W t )
(1i)
En (1f)–(1i), σ2 > 0, V t ∈ R N × N , θ ∈ Rk , G ∈ Rk×k , F 0 ∈ R N ×k . wit es una variable latente Gaussiana, τ 2 I es el efecto
pepita, θt = (θt1 , θt2 )0 , where θt1 es el sub-vector de la tendencia espacial y θt2 de la estacionalidad. V t captura la correlación
espacial, con Vij = exp(−λdij ). En (1b), f (·) = log o identidad, dependiendo de p(µt , φ).
9/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
Inferencia
Aprovechando la factorización de la verosimilitud en p(Yt | Xt ) p( Xt ), la
inferencia puede ser realizada en dos etapas: Primero se ajusta un modelo
para Xit , (1e)–(1i), por ejemplo, con diferentes especificaciones de la tendencia
polinomial, después se ajustan los casos particulares del modelo para Yt ,
(1a)–(1d).
Métodos MCMC: Metrópolis-Hastings, Slice Sampling.
“An Efficient Sampling Scheme for Generalized Dynamic Models”
CUBS
Comparación de modelos: DIC, EPD, ECM, EAM.
Algoritmos escritos en
Ox: http://www.doornik.com/
10/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
Modelo Espacio-Temporal de la Precipitación: resultados (1)
El modelo seleccionado para la precipitación tiene un intercepto y un efecto lineal de la longitud en la tendencia espacial. El
ajuste de otros modelos mostró que la latitud no tiene un efecto significativo en esta región.
Cuadro: Estadı́sticas a posteriori dos parámetros estáticos
media
1.339
0.065
0.632
1.073
ds
0.014
0.013
0.035
0.046
2.5 %
1.311
0.044
0.566
0.988
25 %
1.329
0.056
0.607
1.041
50 %
1.339
0.063
0.630
1.071
75 %
1.348
0.073
0.655
1.103
1.5
n.eff
5000
5000
5000
5000
1990
1995
(a) Intercepto
2000
−0.5
0
−2
1985
1990
1995
(b) Longitude
2000
1985
1990
(c)
1o
1995
2000
−1.5
1985
−4
0.5
−0.8
1.0
1.5
−0.4
0.5
2
0.0
2.5
2.0
R̂
1.001
1.001
1.001
1.001
97.5 %
1.367
0.094
0.702
1.166
4
β
λ
ρ2
σ2
1985
armónico
1990
(d)
2o
1995
2000
armónico
Figura: Trayectoria estimada para os parámetros dinámicos
11/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
−11.4
−11.8
−11.8
−12.2
−12.2
−12.6
−13.0
−13.0
−12.6
latitude
−11.4
−11.0
−11.0
Modelo Espacio-Temporal de la Precipitación: resultados (2)
−46.1 −45.9 −45.7 −45.5 −45.3 −45.1 −44.9 −44.7 −44.5 −44.3
longitude
−46.1
−45.9
(a) Diciembre, 2000
−45.7
−45.5
−45.3
−45.1
−44.9
−44.7
−44.5
−44.3
(b) Junio, 2002
24
Média a posteriori
4 8 12 16 20 24 28
Figura: Media a posteriori de la precipitación en dos meses. Los puntos marcan la localización de las estaciones.
0
0
4
8
mm
12
16
20
Média
IC 95%
1984
1987
1990
1993
1996
1999
2002
(a) Intervalo de 95 % de credibilidad
●
●
●
●
●
● ●●
●●●
●●
●
●●
●●
●
●●●
●●
●●●
●●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
0 2 4 6 8 11 14 17
Método Thiessen
(b) Comparación con Thiessen
Figura: Precipitación en la cuenca del Rio Grande
12/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
Modelo de Función de Transferencia para Runoff: resultados
El modelo seleccionado para la escorrentia considera una respuesta Log-Normal, un nivel estático y una función de
transferencia estocástica.
Cuadro: Estadı́sticas a posteriori dos parámetros estáticos
ds
0.029
0.021
0.002
0.001
0.001
2.5 %
4.708
0.631
0.043
0.003
0.002
25 %
4.754
0.660
0.045
0.004
0.003
50 %
4.772
0.675
0.047
0.005
0.003
75 %
4.791
0.688
0.048
0.005
0.004
97.5 %
4.823
0.712
0.050
0.007
0.005
●
1
2
3
4
6
7
8
●
●
●
9
●
●
●
●
●
10
tempo
(a) Función Respuesta-Impulso
●
●
12
●
●
●
●
14
simulated
250 300 350
200
m3 s
●
●
●
300
400
5
●
●
●
150
0.00
γ
●
ρ
●
●
●
200
●
●
●
100
0.04
Et
0.02
●
●
●
n.eff
2500
2500
2500
2500
2500
●
400
500
●
●
●
R̂
1.001
1.001
1.001
1.001
1.001
450
media
4.771
0.674
0.047
0.005
0.004
α
ρ
γ
σY2
σE2
●
●
●●
● ●●●
●
●●
●
●
100
1984
1986
1988
1990
1992
1994
1996
1998
2000
(b) Media e 95 % IC para runoff
2002
●
●
●
● ●
●
●●
●●
●
●
●
●●
●
●
●●
●
●
●
●
●●
●●
●
●
●
●●
●
●
●●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
200
300
400
observed
(c) Q-Q plot
Figura: Escorrentia: valores ajustados, com (1a)-(1d). Media a posteriori (linea solida) y limites del IC de 95 % (lı́neas
com puntos). + son los datos observados.
13/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
●
8 12
●
●
●
●●
●
●
●
●
12
●●●●●
●
●
●
●●●●
●
●
●●●●●
2003.0 2004.0
Sitio Grande
8 12
●
●
●
●
●●●●●
●
2004.0
Derocal
●
●
●
●
●●●
●
●
●
●
●
●
●
●
●
●
2003.6
●●●
●
●
●
●●●●●
2003.0 2004.0
Ponte Serafim
●
●
●
●
2004.2
●
●●
●
●●
●
●
●
●
●
●
●●
●
●●●
2003.0 2004.0
Roda Velha
(a) Precipitación en cada estación
●
●
●
●
●
0
●●
0
0
2003.0
●●
●
4
●
●
●
●
●
●
●●
4
4
●●
●
●
●
●
●
●
●
(b) Precipitación en la cuenca
m3 s
200
300
2003.0 2004.0
Redenção
8 12
●●●●●
2003.0 2004.0
Nova Vida
●
●
●
2003.0
●
8 12
●●●●●
●
●
●
●●
●
●●●●●●
●
2003.0 2004.0
Barreiras
●
●●
●
●
●●●●
●
●●●
●●●
●
4
●
●●●●
●
●
0
●●●●●
0
4
●●
●
●
●
2003.0 2004.0
Coqueiro
●
●
●
●
8 12
8 12
2003.0 2004.0
São Sebastião
●
●
●
mm
0 2 4 6 8
●●●●●
●
4
●
●
●
●
●
●
●
●
100
●●●●
●
●
4
0
●
●
●
●
●
●
●
0
●
●
●
●
0
●
●
4
●
●
●
●
8 12
●
0
8 12
●
●
4
8 12
Previsión
●
2003.0
●
●
●
2003.6
●
●
2004.2
(c) Escorrentia en la cuenca
Figura: Previsión: media (linea sólida) e intervalo de 95 % de credibilidad (lı́neas punteadas). Los puntos en azul: en (a) y
(c) corresponden a los datos observados, en (b) corresponden a los valores obtenidos con el método Thiessen
14/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
La contribución es:
Modelo conjunto: combinar un modelo de función de transferencia para runoff,
condicionado en la precipitación de la cuenca, con un modelo espacio-temporal
simultaneo para la precipitación medida en varias localizaciones dentro del
área de drenaje de la estación de runoff en consideración.
Extensiones
Consideraciones Finales:
Los modelos utilizados tienen una interpretación fı́sica clara y constituyen una
representación parsimoniosa de todos os procesos envueltos en la relación
rainfall-runoff: elicitación de prioris.
Una extensión: utilización de modelos jerárquicos para trabajar com varias
cuencas simultáneamente.
Uso de los resultados de esta forma de modelar en el manejo de embalses:
Teorı́a de la Decisión.
15/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
La contribución es:
Modelo conjunto: combinar un modelo de función de transferencia para runoff,
condicionado en la precipitación de la cuenca, con un modelo espacio-temporal
simultaneo para la precipitación medida en varias localizaciones dentro del
área de drenaje de la estación de runoff en consideración.
Extensiones
Consideraciones Finales:
Los modelos utilizados tienen una interpretación fı́sica clara y constituyen una
representación parsimoniosa de todos os procesos envueltos en la relación
rainfall-runoff: elicitación de prioris.
Una extensión: utilización de modelos jerárquicos para trabajar com varias
cuencas simultáneamente.
Uso de los resultados de esta forma de modelar en el manejo de embalses:
Teorı́a de la Decisión.
15/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
Algunas Referencias
Gamerman, D. (1998). Markov chain Monte Carlo for dynamic generalised linear
models. Biometrika, 85(1), 215–227.
Geweke, J., & Tanizaki, H. (2001). Bayesian estimation of state space models using
Metropolis-Hastings algorithm within Gibbs sampling. Computacional
Statistics & Data Analysis, 37, 151-170.
Kitagawa, G. (1987). Non-gaussian state-space modeling of non-stationary time
series. Journal of the American Statistical Association, 82(400), 1032–1041.
Migon, H., & Monteiro, A. B. (1997). Rain-fall modelling: An application of Bayesian
forecasting. Stochastic Hydrology and Hydraulics, 11, 115–127.
Sansó, B., & Guenni, L. (2000). A non-stationary multi-site model for rainfall.
Journal of the American Statistical Association, 95, 1089–1100.
West, M., Harrison, J., & Migon, H. (1985). Dynamic generalized linear models and
Bayesian forecasting. Journal of the American Statistical Association, 80(389),
73–83.
16/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
17/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
80
10 15
5
15
20
10
0
1984
1986
1988
1990
1992
1994
1996
1998
2000
2002
São Sebatião
0 5
Barreiras
0
Roda Velha
40
Taguá
Cuenca del Rio Grande (BA): series temporales
2004
18/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
Procesos fı́sicos envueltos en la generación de la escorrentia
19/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
Extensión 1: runoff en varios puestos
El modelo propuesto puede ser extendido para modelar las series de runoff de
dos estaciones de la misma cuenca:
YTa,t ∼ p(µ Ta,t , φTa )
t = 1, . . . , T = 221
µ Ta,t = α Ta + β log(YRe,t ) + ETa,t
ETa,t = ρ Ta ETa,t−1 + γTa XTa,t + wTa,t
wTa,t ∼ N (0, σE2Ta )
YRe,t ∼ p(µ Re,t , φRe )
t = 1, . . . , T = 221
µ Re,t = α Re + ERe,t
ERe,t = ρ Re ERe,t−1 + γRe XRe,t + w Re,t
XTa,t = | BTa |−1
Z
XRe,t = | BRe |−1
Z
BTa
BRe
w Re,t ∼ N (0, σE2 Re )
Xt (s)ds
s = 1, . . . , S1 = 21
Xt (s)ds
s = 1, . . . , S2 = 28
Xt (s) = βt f (s) + Zt (s) + et (s),
s = 1, . . . , S = 9
2
Z (s) ∼ GP(0, σ $(ks1 , s2 k, λ))
Figura: Estaciones y división del
grid de previsión
donde Yj,t y X j,t denotan la escorrentia y la precipitación en el tempo t en la
localización j = Ta, Re. Ta = Taguá, Re = Redenção. Bj es el área de drenaje
relativa a la estación j, BTa ∪ BRe = B, es el área de toda a cuenca.
20/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
Extensión 2: modelo jerárquico
Una extensión natural del modelo de función de transferencia usado
Como ejercicio, ajustamos el modelo (2) a los datos de
aquı́ es un modelo jerárquico como:
Rio Grande.
Yt,k ∼ p(µt,k , σY2 )
t = 1, . . . , T; (2a)
Cuadro: Posterior mean and sd
k = 1, . . . , K,
µt,k = αk + Et,k
(2b)
Et,k = ρEt−1,k + γk Xt,k
(2c)
αk = α + υk1 ,
υk1 ∼
γk = γ + υk2 ,
υk2 ∼
N (0, σα2 )
N (0, σγ2 )
(2d)
(2e)
donde Yt,k es la escorrentia Xt,k es la precipitación en el tempo t en
la cuenca k. Este modelo asume que el nivel básico e el efecto de la
precipitación de las K cuencas varia en torno de un nivel común,
denotados por α y γ respectivamente. Naturalmente, la memoria del
efecto de la precipitación también puede tener una estructura
jerárquica. La exchangeability de las cuencas es una hipótesis de
α
σα2
α1
α2
α3
γ
σγ2
γ1
γ2
γ3
ρ
σY2
media
4.1201
2.6817
3.5084
4.0589
4.8131
0.0438
0.0052
0.0421
0.0420
0.0462
0.6158
0.0131
dp
0.8614
12.9231
0.0150
0.0152
0.0160
0.0399
0.0266
0.0014
0.0014
0.0014
0.0117
0.0007
Volver
este modelo.
21/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
−10.5
Otros resultados: escorrentia en varios puestos
−11.0
Runoff
●
Rainfall
Barreiras
AERIAL II
−11.5
−12.0
Ponte Serafim
●
Grid
Taguá
Nova Vida
●
São Sebastião
●
−12.5
Redenção
Redenção ●
Barreiras
Derocal ● ●
Sitio Grande
●
●
Coqueiro
Roda Velha
−13.0
latitude
AERIAL I
●
−46.0
−45.5
−45.0
−44.5
−44.0
longitude
Figura: Localización de las estaciones y división del grid de previsión.
22/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
An Efficient Sampling Scheme for Generalized Dynamic Models
23/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
Modelos dinámicos generalizados
Modelos dinámicos generalizados:
y t | µ t ∼ p ( µ t , φ ),
t = 1, . . . , T.
0
g(µt ) = F t (ψ1 ) θt
θt = G t (ψ2 )θt−1 + wt ,
(3a)
(3b)
wt ∼ N (0, W t )
(3c)
donde p(µt , φ) es una distribución de la familia exponencial, µt es el valor esperado de yt , φ
representa otros parámetros de p(), y ψ1 y ψ2 denotan parámetros envueltos en la definición de F t y
G t , respectivamente.
Los vectores θt son conocidos como parámetros de estado y están
relacionados a través del tiempo via (3c), la ecuación del sistema.
Muestrear θt puede ser complicado.
Alternativa de muestreo: paso Metropolis-Hastings.
Propuestas: Gamerman (1998), Geweke & Tanizaki (2001), etc.
24/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
Modelos dinámicos lineales generalizados
West, Harrison, & Migon (1985) presentaron los modelos dinámicos lineales
generalizados: la distribución de la respuesta pertenece a la familia exponencial con parámetro
natural ηt . ηt tiene una priori conjugada, CP(rt , st ). La ecuación del sistema es similar a (3c), mas la
distribución de sus errores está parcialmente especificada.
yt |ηt , φ ∼ exp[φ{yt ηt − a(ηt )}]b(yt , φ),
t = 1, . . . , T.
ηt | Dt−1 ∼ CP(rt , st )
g ( ηt ) =
(4b)
F 0t θt
θt = G t θt−1 + wt ,
(4a)
(4c)
wt ∼ [0, W t ]
(4d)
θ0 | D0 ∼ [m0 , C 0 ]
donde Dt denota la información hasta el tiempo t, mt e C t denotan, respectivamente, el primer y
segundo momento del vector de estados θt , dado Dt .
En (4), F t y G t son conocidas, y, dado ηt , yt y θt son condicionalmente
independientes, mientras que en (3) esta estructura es diferente.
West et al. (1985) propusieron un sistema recursivo que explora la conjugación
del modelo para aproximar las distribuciones de θt secuencialmente. Este
sistema es conocido como Conjugate Updating.
25/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
Análisis Secuencial
Sea Dt = {y1 , . . . , yt } - la información total obtenida hasta t.
En los modelos lineales normales:
. . . (θt−1 | Dt−1 )
Evolución
+3 (θt | Dt−1 )
Actualización +3
(θt | Dt ) . . .
En los modelos lineales dinámicos generalizados:
. . . (θt−1 | Dt−1 )
Evolución
+3 (θt | Dt−1 )
( η t | Dt −1 )
(θt | Dt ) . . .
KS
Actualización
+3 (ηt | Dt )
26/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
Análisis Secuencial
Sea Dt = {y1 , . . . , yt } - la información total obtenida hasta t.
En los modelos lineales normales:
. . . (θt−1 | Dt−1 )
Evolución
+3 (θt | Dt−1 )
Actualización +3
(θt | Dt ) . . .
En los modelos lineales dinámicos generalizados:
. . . (θt−1 | Dt−1 )
Evolución
+3 (θt | Dt−1 )
( η t | Dt −1 )
(θt | Dt ) . . .
KS
Actualización
+3 (ηt | Dt )
26/30
Aproximación utilizada por CUBS
Sea Dt la información hasta el tiempo t. Sea Φ = (ψ, φ).
La distribución condicional conjunta completa de θ = (θ1 , . . . , θT ) es:
p(θ|Y, Φ) ∝ p(θT | DT , Φ)
T −1
∏
t =1
p(θt |θt+1 , Dt , Φ)
|
{z
}
Densidad retrospectiva
∝ p(θT | DT , Φ)
T −1
∏ p(θt+1 | θt , Dt , Φ) |p(θt |{zDt , Φ})
t =1
A posteriori
Los momentos de las distribuciones a posteriori son aproximados por:
p(θt | Dt , Φ) ∝ p(θt | Dt−1 , Φ) p(Yt | θt , Φ)
=
Z
p(θt | ηt , Dt−1 , Φ) p(ηt | Dt−1 , Φ) p(Yt | ηt , Φ) dηt
|
{z
}
Análise Conjugada
∝
Z
p(θt | ηt , Dt−1 , Φ) p(ηt | Dt , Φ)dηt = [mt , C t ]
|
{z
}
Linear Bayes
b{θt | ηt , Dt−1 } | Dt , Φ
mt = E[θt | Dt , Φ] = E E
b{θt | ηt , Dt−1 } | Dt , Φ + E V
b {θt | ηt , Dt−1 } | Dt , Φ
C t = V [θt | Dt , Φ] = V E
CUBS para un modelo dinámico Gama
1
2
Haga t = 1
Calcule mt y C t :
1 Obtenga los momentos a priori de θt y g ( ηt ), a partir do modelo:
θt | Dt−1 ∼ [ at , Rt ]
g(ηt )| Dt−1 ∼ [ f t , qt ]
2
log rt − γ(st + 1)
γ 0 ( s t + 1)
=
=
≈
≈
log rt − log(st + 1)
1/(st + 1)
=
=
ft
qt
Calcule los momentos a posteriori de g(ηt ):
E[ g(ηt )| Dt ]
Var [ g(ηt )| Dt ]
4
Rt = G t C t−1 G 0t + W t
qt = F 0t Rt F t
a t = G t m t −1 ,
f t = F 0t at ,
Determine a partir del análisis conjugado, los momentos a priori de g(ηt ):
E[ g(ηt )| Dt−1 ]
Var [ g(ηt )| Dt−1 ]
3
onde:
onde:
=
=
log(rt + φyt ) − γ(st + φ + 1)
γ 0 ( s t + φ + 1)
=
=
f t∗
q∗t
Obtenga los momentos de la distribución a posteriori de θt , no modelo:
θt | Dt ∼ [mt , C t ],
donde:
mt = at + Rt F t ( f t∗ − f t )
1
qt
3
Haga t = t + 1 y regrese para 2 si t < T;
4
Muestree θT de N (m T , CT );
5
Haga t = R − 1, muestree θt de p(θt | θt+1 , Dt , θ) = N (mst , C st );
6
Haga t = t − 1 y regrese para 5 si t > 1;
C t = Rt − Rt F t F 0t Rt 1 −
q∗t 1
qt qt
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
MCMC + CUBS
1
Inicio: dar valores iniciales θ(0) , ψ(0) e iniciar las iteraciones, i = 1;
2
Muestrear θ(i) usando CUBS:
1
2
Calcular los momentos de p(θt | Dt , ψ(i−1) ), m(i) e C (i) , con el Conjugate Updating;
Muestrear θ∗ con el Backward Sampling.
1
2
3
(i )
(i )
Muestrear θ∗T de Normal(m T , C T )
Muestrear θ∗t , t = T − 1, . . . , 1, de p(θt |θ∗t+1 , ψ(i−1) )
Haga θ(i) = θ∗ con probabilidad pt y θ(i) = θ(i−1) con probabilidad 1 − pt , donde
pt = mı́n(1, A) y A es la razón de aceptación del Metropolis-Hastings:
(
)
ω (θ∗ )
π (θ∗ )
A = mı́n 1,
, ω (θ∗ ) =
,
ω (θ)
q(θ∗ )
3
Muestrear ψ(i) usando, en general, un paso de Metropolis-Hastings ;
4
Muestrear φ(i) usando, en general, un paso de Metropolis-Hastings;
5
Actualización: haga i = i + 1 y regrese para 2 hasta la convergencia.
29/30
Motivación
Rainfall-Runoff
Referencias
Extensiones
Sampling Scheme
Precipitación en Tokyo
Referencias Kitagawa (1987) e Gamerman (1998).
Objetivo Estimar a probabilidad de ocurrencia de lluvia para cada dı́a calendario.
Datos Número de dias com precipitación superior a 1mm em Tokyo para cada dı́a entre
1983-1984.
Modelo
Yt ∼ Binomial(n, πt ),
t = 1, . . . , T
logit(πt ) = αt
wt ∼ N (0, W )
20
Posterior Mean
12
8
0
4
Density
16
0.05 0.20 0.35 0.50 0.65
probability
α t = α t −1 + w t
0
40
80
120 160 200 240 280 320 360
0.00
0.03
day
(a) Probabilidad de Lluvia
0.06
0.09
0.12
0.15
0.18
W
(b) Muestra a posteriori de W
Figura: Resultados obtenidos com MCMC+CUBS. (a): Probabilidad de lluvia: media a posteriori (linea sólida) e intervalo de
95 % de credibilidad (linea punteada) (b) Distribución a posteriori empı́rica de W.
Volver
30/30
Descargar