Distribución normal envuelta

El soporte se elige para ser [-π, π] con μ = 0

En teoría de probabilidad y estadística direccional, una distribución normal envuelta es una distribución de probabilidad envuelta que resulta de "envolver" la distribución normal alrededor de la circunferencia goniométrica. Se aplica en la teoría de movimiento browniano y es una solución a la ecuación del calor con condiciones de frontera periódicas. Es aproximada por la distribución de von Mises, la cual, debida a su simplicidad matemática y tratabilidad, es la distribución comúnmente más utilizada en estadística direccional.[1]

La función de densidad de probabilidad de la distribución normal envuelta es[2]

f W N ( θ ; μ , σ ) = 1 σ 2 π k = exp [ ( θ μ + 2 π k ) 2 2 σ 2 ] , {\displaystyle f_{WN}(\theta ;\mu ,\sigma )={\frac {1}{\sigma {\sqrt {2\pi }}}}\sum _{k=-\infty }^{\infty }\exp \left[{\frac {-(\theta -\mu +2\pi k)^{2}}{2\sigma ^{2}}}\right],}

donde μ y σ son la media y la desviación estándar de la distribución normal no envuelta, respectivamente. Expresando la función de densidad de probabilidad de arriba en términos de la función característica de la de distribución normal resulta en:[2]

f W N ( θ ; μ , σ ) = 1 2 π n = e σ 2 n 2 / 2 + i n ( θ μ ) = 1 2 π ϑ ( θ μ 2 π , i σ 2 2 π ) , {\displaystyle f_{WN}(\theta ;\mu ,\sigma )={\frac {1}{2\pi }}\sum _{n=-\infty }^{\infty }e^{-\sigma ^{2}n^{2}/2+in(\theta -\mu )}={\frac {1}{2\pi }}\vartheta \left({\frac {\theta -\mu }{2\pi }},{\frac {i\sigma ^{2}}{2\pi }}\right),}

donde ϑ ( θ , τ ) {\displaystyle \vartheta (\theta ,\tau )} es la función theta de Jacobi, dada por

Y ϑ ( θ , τ ) = n = ( w 2 ) n q n 2  where  w e i π θ {\displaystyle \vartheta (\theta ,\tau )=\sum _{n=-\infty }^{\infty }(w^{2})^{n}q^{n^{2}}{\text{ where }}w\equiv e^{i\pi \theta }} q e i π τ . {\displaystyle q\equiv e^{i\pi \tau }.}

La distribución normal envuelta también puede ser expresada en términos del producto triple de Jacobi:[3]

f W N ( θ ; μ , σ ) = 1 2 π n = 1 ( 1 q n ) ( 1 + q n 1 / 2 z ) ( 1 + q n 1 / 2 / z ) . {\displaystyle f_{WN}(\theta ;\mu ,\sigma )={\frac {1}{2\pi }}\prod _{n=1}^{\infty }(1-q^{n})(1+q^{n-1/2}z)(1+q^{n-1/2}/z).}

donde z = e i ( θ μ ) {\displaystyle z=e^{i(\theta -\mu )}\,} y q = e σ 2 . {\displaystyle q=e^{-\sigma ^{2}}.}

Momentos

En términos de la variable circular z = e i θ {\displaystyle z=e^{i\theta }} los momentos circulares de la distribución normal envuelta son la función característica de la distribución normal evaluada en argumentos enteros:

z n = Γ e i n θ f W N ( θ ; μ , σ ) d θ = e i n μ n 2 σ 2 / 2 . {\displaystyle \langle z^{n}\rangle =\int _{\Gamma }e^{in\theta }\,f_{WN}(\theta ;\mu ,\sigma )\,d\theta =e^{in\mu -n^{2}\sigma ^{2}/2}.}

donde Γ {\displaystyle \Gamma \,} es un intervalo de longitud 2 π {\displaystyle 2\pi } . El primer momento es entonces el valor promedio de z, también conocido como la media resultante, o vector resultante promedio:

z = e i μ σ 2 / 2 {\displaystyle \langle z\rangle =e^{i\mu -\sigma ^{2}/2}}

El ángulo medio es

θ μ = A r g z = μ {\displaystyle \theta _{\mu }=\mathrm {Arg} \langle z\rangle =\mu }

y la longitud de la media resultante es

R = | z | = e σ 2 / 2 {\displaystyle R=|\langle z\rangle |=e^{-\sigma ^{2}/2}}

La desviación estándar circular, la cual es una medida útil de dispersión para la distribución normal envuelta y su pariente cercano, la distribución de von Mises, está dada por:

s = ln ( R 2 ) 1 / 2 = σ {\displaystyle s=\ln(R^{-2})^{1/2}=\sigma }

Estimación de parámetros

Una serie de N mediciones zn = e n muestradas de una distribución normal envuelta pueden usarse para estimar algunos parámetros de la distribución. La media de la serie z está definida por

z ¯ = 1 N n = 1 N z n {\displaystyle {\overline {z}}={\frac {1}{N}}\sum _{n=1}^{N}z_{n}}

Y su esperanza es el primer momento:

z ¯ = e i μ σ 2 / 2 . {\displaystyle \langle {\overline {z}}\rangle =e^{i\mu -\sigma ^{2}/2}.\,}

En otras palabras, z es un estimador imparcial del primer momento. Si suponemos que la media μ se encuentra en el intervalo [−π, π), entonces Arg z será un estimador (parcial) de la media μ.

Viendo el zn como un conjunto de vectores en el plano complejo, el estadístico es el cuadrado de la longitud del vector promediado:

R ¯ 2 = z ¯ z ¯ = ( 1 N n = 1 N cos θ n ) 2 + ( 1 N n = 1 N sin θ n ) 2 {\displaystyle {\overline {R}}^{2}={\overline {z}}\,{\overline {z^{*}}}=\left({\frac {1}{N}}\sum _{n=1}^{N}\cos \theta _{n}\right)^{2}+\left({\frac {1}{N}}\sum _{n=1}^{N}\sin \theta _{n}\right)^{2}\,}

y su valor esperado es:

R ¯ 2 = 1 N + N 1 N e σ 2 {\displaystyle \left\langle {\overline {R}}^{2}\right\rangle ={\frac {1}{N}}+{\frac {N-1}{N}}\,e^{-\sigma ^{2}}\,}

En otras palabras, el estadístico

R e 2 = N N 1 ( R ¯ 2 1 N ) {\displaystyle R_{e}^{2}={\frac {N}{N-1}}\left({\overline {R}}^{2}-{\frac {1}{N}}\right)}

Será un estimador insesgado de e−σ2, y ln(1/Re2) será un estimador sesgado de σ2

Entropía

La entropía de la distribución normal envuelta está definida como:[2]

H = Γ f W N ( θ ; μ , σ ) ln ( f W N ( θ ; μ , σ ) ) d θ {\displaystyle H=-\int _{\Gamma }f_{WN}(\theta ;\mu ,\sigma )\,\ln(f_{WN}(\theta ;\mu ,\sigma ))\,d\theta }

donde Γ {\displaystyle \Gamma } es cualquier intervalo de longitud 2 π {\displaystyle 2\pi } .Definiendo z = e i ( θ μ ) {\displaystyle z=e^{i(\theta -\mu )}} y q = e σ 2 {\displaystyle q=e^{-\sigma ^{2}}} , el producto triple de Jacobi para la distribución normal envuelta es:

f W N ( θ ; μ , σ ) = ϕ ( q ) 2 π m = 1 ( 1 + q m 1 / 2 z ) ( 1 + q m 1 / 2 z 1 ) {\displaystyle f_{WN}(\theta ;\mu ,\sigma )={\frac {\phi (q)}{2\pi }}\prod _{m=1}^{\infty }(1+q^{m-1/2}z)(1+q^{m-1/2}z^{-1})}

donde ϕ ( q ) {\displaystyle \phi (q)\,} es la función de Euler. El logaritmo de la densidad de la distribución normal envuelta puede ser escrita:

ln ( f W N ( θ ; μ , σ ) ) = ln ( ϕ ( q ) 2 π ) + m = 1 ln ( 1 + q m 1 / 2 z ) + m = 1 ln ( 1 + q m 1 / 2 z 1 ) {\displaystyle \ln(f_{WN}(\theta ;\mu ,\sigma ))=\ln \left({\frac {\phi (q)}{2\pi }}\right)+\sum _{m=1}^{\infty }\ln(1+q^{m-1/2}z)+\sum _{m=1}^{\infty }\ln(1+q^{m-1/2}z^{-1})}

Utilizando la expansión de Taylor para el logaritmo:

ln ( 1 + x ) = k = 1 ( 1 ) k k x k {\displaystyle \ln(1+x)=-\sum _{k=1}^{\infty }{\frac {(-1)^{k}}{k}}\,x^{k}}

Las sumas logarítmicas pueden ser escritas como:

m = 1 ln ( 1 + q m 1 / 2 z ± 1 ) = m = 1 k = 1 ( 1 ) k k q m k k / 2 z ± k = k = 1 ( 1 ) k k q k / 2 1 q k z ± k {\displaystyle \sum _{m=1}^{\infty }\ln(1+q^{m-1/2}z^{\pm 1})=-\sum _{m=1}^{\infty }\sum _{k=1}^{\infty }{\frac {(-1)^{k}}{k}}\,q^{mk-k/2}z^{\pm k}=-\sum _{k=1}^{\infty }{\frac {(-1)^{k}}{k}}\,{\frac {q^{k/2}}{1-q^{k}}}\,z^{\pm k}}

de modo que el logaritmo de la densidad de la distribución normal envuelta puede ser escrita como:

ln ( f W N ( θ ; μ , σ ) ) = ln ( ϕ ( q ) 2 π ) k = 1 ( 1 ) k k q k / 2 1 q k ( z k + z k ) {\displaystyle \ln(f_{WN}(\theta ;\mu ,\sigma ))=\ln \left({\frac {\phi (q)}{2\pi }}\right)-\sum _{k=1}^{\infty }{\frac {(-1)^{k}}{k}}{\frac {q^{k/2}}{1-q^{k}}}\,(z^{k}+z^{-k})}

lo que es esencialmente una serie de Fourier en θ {\displaystyle \theta \,} . Utilizando la representación de función característica para la distribución normal envuelta en el lado izquierdo de la integral:

f W N ( θ ; μ , σ ) = 1 2 π n = q n 2 / 2 z n {\displaystyle f_{WN}(\theta ;\mu ,\sigma )={\frac {1}{2\pi }}\sum _{n=-\infty }^{\infty }q^{n^{2}/2}\,z^{n}}

La entropía puede ser escrita como:

H = ln ( ϕ ( q ) 2 π ) + 1 2 π Γ ( n = k = 1 ( 1 ) k k q ( n 2 + k ) / 2 1 q k ( z n + k + z n k ) ) d θ {\displaystyle H=-\ln \left({\frac {\phi (q)}{2\pi }}\right)+{\frac {1}{2\pi }}\int _{\Gamma }\left(\sum _{n=-\infty }^{\infty }\sum _{k=1}^{\infty }{\frac {(-1)^{k}}{k}}{\frac {q^{(n^{2}+k)/2}}{1-q^{k}}}\left(z^{n+k}+z^{n-k}\right)\right)\,d\theta }

y cuya integral resulta en:

H = ln ( ϕ ( q ) 2 π ) + 2 k = 1 ( 1 ) k k q ( k 2 + k ) / 2 1 q k {\displaystyle H=-\ln \left({\frac {\phi (q)}{2\pi }}\right)+2\sum _{k=1}^{\infty }{\frac {(-1)^{k}}{k}}\,{\frac {q^{(k^{2}+k)/2}}{1-q^{k}}}}

Véase también

  • Distribución envuelta
  • Distribución Shah
  • Distribución de Cauchy envuelta
  • Distribución de Von Mises

Referencias

  1. Collett, D.; Lewis, T. (1981). «Discriminating Between the Von Mises and Wrapped Normal Distributions». Australian Journal of Statistics 23 (1): 73-79. doi:10.1111/j.1467-842X.1981.tb00763.x. 
  2. a b c Mardia, Kantilal; Jupp, Peter E. (1999). Directional Statistics. Wiley. ISBN 978-0-471-95333-3. 
  3. Whittaker, E. T.; Watson, G. N. (2009). A Course of Modern Analysis. Book Jungle. ISBN 978-1-4385-2815-1. 

Bibliografía

  • Borradaile, Graham (2003). Statistics of Earth Science Data. Springer. ISBN 978-3-540-43603-4. Consultado el 31 de diciembre de 2009. 
  • Fisher, N. I. (1996). Statistical Analysis of Circular Data. Cambridge University Press. ISBN 978-0-521-56890-6. Consultado el 9 de febrero de 2010. 
  • Breitenberger, Ernst (1963). «Analogues of the normal distribution on the circle and the sphere». Biometrika 50 (1/2): 81-88. doi:10.2307/2333749. 

Enlaces externos

  • Matemática de Valores circulares y Estadística con C++11, Una C++11 infraestructura para valores circulares (ángulos, tiempo-de-día, etc.) matemática y estadística
Control de autoridades
  • Proyectos Wikimedia
  • Wd Datos: Q8037608
  • Wd Datos: Q8037608