IEEE LATIN AMERICA TRANSACTIONS, VOL. 3, NO. 3, JULY 2005 255 Caracterización Espectral Mediante el Método Modificado por Regularización de Prony Fusionado con Estimadores Espectrales No Paramétricos de Alta Resolución J. L. Ponce-Dávalos, Member, IEEE y Y.V. Shkvarko, Senior Member, IEEE Resumen—En este trabajo se presenta una técnica novedosa para la caracterización espectral con alta resolución de procesos armónicos ocultos en ruido coloreado. La aproximación propuesta enfoca el problema de la estimación espectral a través la fusión inteligente de dos paradigmas: (i) estimación paramétrica de líneas espectrales que identifica la señal multi-armónica aplicando el método modificado por regularización de Prony (MORP) y (ii) estimación espectral no paramétrica de Máxima Entropía (ME) y de Mínima Varianza (MV) para la caracterización del espectro distribuido que representa el ruido coloreado. Mediante la propuesta de la fusión de estrategias se alcanza una mejora substancial tanto en la resolución de líneas espectrales cercanas entre si, como en la reconstrucción de las características de espectro distribuido del ruido de fondo. Se verifica el método propuesto fusionado en dos versiones: MORP-ME y MORP-MV mediante los resultados de simulaciones computacionales y aplicaciones particulares. Palabras Clave— Análisis Espectral, Estimador de Máxima Entropía (ME), Estimador de Mínima Varianza (MV), Método Modificado por Regularización de Prony (MORP). I. INTRODUCCIÓN L a estimación de la densidad espectral de potencia (PSD por sus siglas en inglés Power Spectral Density) es tema de gran importancia en el ámbito del procesamiento de datos en diversas áreas de las ciencias y la ingeniería. La teledetección o percepción remota, procesamiento de voz, procesamiento de imágenes, procesamiento de señales biomédicas, comunicaciones y econometría son sólo algunos ejemplos de su aplicación [1], [2], [3], [4]. De manera específica, el aspecto de la resolución, tanto espacial de objetos tipo fuentes puntuales cercanamente espaciados como la temporal generada por tonos de frecuencias cercanas, y la caracterización de procesos armónicos inmersos en ruido coloreado, han sido tópicos clave en el desarrollo contemporáneo de métodos de estimación espectral [1], [2], [3], [5], [6]. J. L. Ponce-Dávalos pertenece al Departamento de Ingeniería Electrónica del ITESM, Campus Guadalajara, Av. Gral. Ramón Corona 2514, Zapopan, Jal., C.P. 45214, México. (e-mail: [email protected]). Y.V. Shkvarko pertenece al Departamento de Telecomunicaciones del CINVESTAV del IPN, Unidad Guadalajara, Av. López Mateos Sur 590, Guadalajara, Jal., México. (e-mail: [email protected]). A la fecha, se ha propuesto una amplia variedad de métodos de estimación espectral, entre los que destacan diferentes versiones de los métodos de máxima entropía de Burg [1], el de máxima verosimilitud de Capon [2], métodos basados en la descomposición de la matriz de correlación de datos en términos de sus eigenvalores y eigenvectores (Pisarenko [2], MUSIC [1] ESPRIT [3]) y la formulación Bayesiana de máxima entropía [5], [6]. La intención principal de las diferentes propuestas de estimación espectral consiste en obtener métodos que puedan manifestar un buen desempeño tanto de superresolución (i.e. poder distinguir fuentes puntuales cercanas entre sí [2]), como de alta resolución, (i. e. poder estimar la PSD de observaciones con espectro distribuido de banda limitada como, por ejemplo, las generadas por el ruido coloreado [12]). Para evaluar el desempeño de las diversas propuestas de estimación espectral, es conveniente proponer secuencias de datos obtenidas de manera sintética, esto tiene la ventaja de que se podrá trabajar con datos controlados, que pueden ser de valor real o de valor complejo permitiendo así incluir espectros no simétricos. La alta resolución y la superresolución son situaciones incompatibles cuando se analiza la estimación espectral en forma global [1], [2], [3], [7], [8]. Por ello, los métodos referidos se han enfocado principalmente a situaciones en las que la escena de fondo se considera como ruido blanco Gaussiano, y desafortunadamente poco se ha trabajado en escenarios en los que las señales de interés se encuentran inmersos en ruido coloreado. Más aún, a la fecha no existe método que aborde la problemática de la alta resolución y la superresolución de manera conjunta [1], [2], [3], [5], [7], [10], [17], [18]. Por otra parte, entre los métodos de estimación de líneas espectrales para el caso de modelos de señales multiarmónicas, los métodos de Prony y el de descomposición armónica de Pisarenko son de los más extensamente empleados [3], [8] [9], [10], [11]. Sin embargo, estos son altamente sensibles al ruido coloreado y sus resultados arrojan líneas espectrales falsas en diversas posiciones [10], [17], [18]. El método que proponemos permite establecer un hecho importante, esto es: con el método modificado por regularización de Prony (MORP) para estimación espectral que se describe en este trabajo, y bajo diferentes hipótesis acerca del número presente de componentes armónicas, resulta 256 que las líneas espectrales que verdaderamente están presentes permanecen relativamente inalteradas en su posición espectral, en tanto que las líneas falsas cambian su posición en el espectro para cada realización experimental. En caso de no existir componentes armónicas, el método arroja resultados en posiciones espectrales aleatorias. A esta característica le llamamos Invariancia en la Posición Espectral (SPI por sus siglas en inglés Spectral Positional Invariance). La característica SPI se estableció en primera instancia de manera experimental, pero ha sido corroborada en aplicaciones prácticas con resultados favorables. Su justificación matemática se basa en el hecho de que las posiciones espectrales verdaderas tienen mayor probabilidad de ocurrir que las espurias [11]. El objetivo principal de este trabajo es proponer una aproximación alternativa a la estimación espectral/espacial de alta resolución y super resolución que agrega los paradigmas de estimación espectral paramétrica y no paramétrica de manera cooperativa. La propuesta hace uso de la propiedad de SPI de las líneas espectrales, obtenidas bajo diferentes hipótesis mediante el método MORP, el cual es una modificación del método de estimación espectral modificado mediante regularización (MORSE por sus siglas en inglés Modified Regularized Spectral Estimation) que fue propuesta recientemente en [10]. La estimación espectral propuesta en este trabajo supone que los datos representan una señal de observación compuesta, formada por una parte multi-armónica y otra parte de ruido coloreado. El procedimiento consiste primeramente en la aplicación iterada del método MORP varias veces bajo diferentes hipótesis acerca del número de posibles líneas espectrales, las cuales corresponderán a las componentes armónicas de la señal. Este procedimiento ha permitido desarrollar una estrategia para obtener la caracterización paramétrica explícita del modelo multi-armónico. Después, realizamos un innovación regularizada a partir del registro de observaciones iniciales restando la componente multiarmónica (estimada previamente aplicando el método MORP) de la señal original. El siguiente paso es reconstruir la parte distribuida del espectro PSD aplicando estimadores no paramétricos adaptivos de alta resolución a los datos innovados. En este trabajo proponemos cómo emplear los métodos no paramétricos de máxima entropía (ME) y de mínima varianza (MV) por producir los mejores desempeños en el sentido de alta resolución en balance con su eficiencia computacional [1], [2]. La fusión de estos métodos con MORP presenta una mejora sustancial en la reconstrucción espectral de la PSD resultante, tanto de la parte de alta resolución de líneas espectrales como de la parte distribuida del espectro continuo de banda limitada. El trabajo se ha organizado de la siguiente forma: en la sección II se enmarca el problema a estudiar con un análisis de los métodos de estimación existentes y la elección de los modelos de prueba; en la sección III se presenta un breve panorama de los métodos modernos de análisis y estimación espectral, los cuales se ilustran con simulaciones computacionales; en la parte IV se presenta el método propuesto MORP y la estructura computacional de su IEEE LATIN AMERICA TRANSACTIONS, VOL. 3, NO. 3, JULY 2005 aplicación; en la sección V se presentan la estrategia de fusión propuesta y los resultados de la agregación de métodos MORP-ME y MORP-MV. Las simulaciones computacionales obtenidas permiten verificar la eficiencia de los métodos propuestos. Finalmente en la sección VI se presentan las conclusiones. II. MARCO DE TRABAJO DEL PROBLEMA A ESTUDIAR Dos características inherentes limitan el desempeño de los métodos de estimación de la PSD, tanto clásicos como paramétricos modernos [1], [2]: primeramente, la resolución, es decir, la habilidad de distinguir dos o más objetos puntuales cercanos unos de otros; la segunda limitante es debida al proceso de ventaneo implícito de los datos cuando se trabaja mediante procesamiento de la transformada discreta de Fourier (DFT, por sus siglas en inglés Discrete Fourier Transform) la cual produce una limitación finita en el ancho de banda. El ventaneo temporal, o registro finito de datos, se refleja espectralmente como un “desparramamiento”, es decir, la energía del lóbulo principal en el espectro estimado se “desparrama” hacia los lóbulos laterales traslapando y distorsionando cualquier otra respuesta espectral cercana [1], [2]. Los métodos de alta resolución tienen por objetivo hacer una extrapolación fuera de la banda para corregir dicho problema [12]. Los métodos paramétricos (basados en modelo espectral) permiten obtener resultados con superresolución pero no pueden reconstruir la parte continua o distribuida de la PSD, la cual está relacionada con el ruido coloreado [1], [2]. Por otra parte, los métodos no paramétricos (sin modelo espectral) no son capaces de resolver con superresolución líneas espectrales cercanas, sólo proporcionan la envolvente espectral [1], [7]. A fin de explorar los métodos existentes y los métodos propuestos, se considerarán dos conjuntos de datos de prueba, los cuales se encuentran reportados en la literatura [1], [2] y son de uso frecuente como “test data”. Estos dos casos son secuencias de K valores de naturaleza compleja {u[k]; k = 0, 1,…, K−1}. Es importante aclarar que si bien en cualquier aplicación ordinaria los datos medidos son cantidades de valor real, la razón de emplear datos de valor complejo obedece a que como lo que se quiere estimar es el espectro el cual es inherentemente complejo, entonces, para tener un escenario controlado y que abarque cualquier posibilidad de estimación espectral, independientemente de la simetría de este, es necesario generar de manera sintética espectros que no sean necesariamente simétricos, para así poder evaluar las ventajas y limitaciones de los métodos de estimación espectral [2]. Los procesos de valor real quedarán contenidos dentro de la formulación compleja, como es usual en muchas aplicaciones semejantes. En el dominio de la frecuencia el espectro se encuentra dentro de una banda limitada de frecuencia normalizada con | f | < 1/2 [2]. El primer modelo de prueba detallado en la [1] consiste en una secuencia de K = 32 datos complejos obtenidos de la suma de tres sinusoides de frecuencias normalizadas localizadas en 0.05, 0.40 y 0.42 respectivamente. Así como una señal de ruido coloreado extendido en toda la banda, el cual se obtiene PONCE-DÁVALOS AND SHKVARKO : SPECTRAL CARACTERIZATION VIA FUSING al hacer pasar ruido blanco gaussiano a través de un filtro auto-regresivo de orden 1. La razón señal a ruido (SNR, por sus siglas en inglés Signal-to-Noise Ratio) es aproximadamente de 30 dB en f = 0.4 y alrededor de 15 dB en f = 0.05. El espectro teórico es simétrico y se ilustra en la Fig. 1.a. El segundo conjunto de datos de prueba obtenido de la referencia [2] es una secuencia de K = 64 muestras de un proceso que consiste de cuatro sinusoides complejas inmersas en un proceso de ruido coloreado. Las sinusoides a analizar son las frecuencias ubicadas en –0.15 y 0.1 (las cuales están por debajo del nivel de ruido coloreado), y otras dos que se encuentran cercanas entre sí, en 0.2 y 0.21, respectivamente. La señal de ruido coloreado se obtiene al hacer pasar una señal de ruido blanco Gaussiano a través de un filtro de coseno alzado. En la Fig. 1.b se muestra el espectro teórico para estos datos de prueba. En este caso se tiene un espectro no simétrico con SNR promedio de 15 dB. PSD Relativa (dB) 10 0 -10 -20 -30 -40 -50 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 Frecuencia Normalizada a) PDS Relativa (dB) 10 0 -10 -20 -30 -40 -50 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 Frecuencia Normalizada b) Fig. 1. Espectros teóricos de los procesos de ejemplo: a) Espectro simétrico especificado en la ref. [1]; b) Espectro no simétrico especificado en la ref. [2]. III. BREVE PANORAMA DE LOS MÉTODOS MODERNOS PARA LA ESTIMACIÓN ESPECTRAL La PSD está definida sólo para señales de potencia [1], [2]. En el tiempo continuo se determina como [1] 1 T → ∞ 2T P ( f ) = lím ∫ T −T 2 u (t ) exp( − j 2π f t ) dt (1) en donde, u(t) es la señal de observación y es la representación matemática del fenómeno a estudiar, T es el tiempo de observación. La PSD, también se puede calcular por el método indirecto [1] como P( f ) = ∫ ∞ −∞ r (τ ) exp( − j 2π f τ ) dτ (2) en donde r(τ) es la función de autocorrelación (FAC) definida 257 por 1 T →∞ 2T r (τ ) = E{u (t + τ )u * (t )} = lím ∫ T −T u (t + τ )u * (t ) dt (3) con E{⋅} denotando el valor esperado y * el complejo conjugado. Al tratar de evaluar las ecuaciones (1) ó (2) y (3), surgen dificultades prácticas, ya que en la realidad el proceso a estudiar es observado en una ventana de tiempo dentro de la cual sólo se tiene un conjunto limitado de muestras. Por ello, es necesario tratar hipótesis acerca del comportamiento estadístico del fenómeno observado, con el objetivo de obtener un valor estimado de la PSD. Como hipótesis estadística de trabajo se considera que los datos son procesos ergódicos estacionarios en sentido amplio [1]. La estimación de la densidad espectral de potencia (PSD) de procesos aleatorios, ha sido estudiada en una amplia variedad de enfoques [1], [2], [3]. Una manera de catalogar los métodos es categorizarlos en dos clases. La primera comprende los Métodos No-Paramétricos, (clásicos y modernos), los cuales obtienen la estimación de la PSD mediante el procedimiento estándar de la DFT y el cálculo de la función de autocorrelación, la cual es determinada mediante diferentes hipótesis como se explicará adelante. La siguiente clase comprende los Métodos Paramétricos, los cuales están basados en un modelo paramétrico del espectro, algunos de los métodos frecuentemente usuales son descritos brevemente en seguida. Se presentarán sólo las generalidades de dichos métodos para ilustrar los resultados obtenidos por estos estimadores y se compararán con el método propuesto en este trabajo. Para una descripción de mayor detalle se hace referencia a la literatura citada [1], [2], [3], [7]. A. Estimación Espectral No-Paramétrica 1) Métodos Clásicos: Usualmente se consideran de manera representativa dos estimadores espectrales clásicos desarrollados a partir de los métodos directo e indirecto de manera discretizada, ellos son: el Periodograma y el Estimador de Blackman-Tukey [7]. El periodograma es la aplicación del método directo discretizado, dado por [7] T PˆPG ( f ) = K K −1 ∑ 2 u[ k ] exp( − j 2π f kT ) (4) k =0 en donde {u[k]; k = 0, 1…, K−1} representa un conjunto de datos de valor real tomados como muestras durante el intervalo de tiempo T del proceso a estudiar. El método realiza una estimación relativamente pobre debido al efecto de “desparramamiento” espectral [1]. En la Fig. 2.a y 2.b y se ilustran los periodogramas (4) relativos a los datos de prueba cuyos espectros son presentados en las Fig. 1.a) y 1.b) respectivamente. Es fácil ver que Pˆ ( f ) produce estimaPG ciones muy burdas de los espectros originales. La discretización del método indirecto se conoce como correlograma [1] y su aplicación implica una ventana rectangular intrínseca en el dominio de las frecuencias, la cual provoca variabilidad estadística [7]. Blackman y Tukey 258 IEEE LATIN AMERICA TRANSACTIONS, VOL. 3, NO. 3, JULY 2005 desarrollaron un método alternativo (referido como estimador BT) que emplea una ventana en el dominio de las frecuencias para reducir la varianza suavizando el periodograma. La ecuación que determinan el estimador BT es: PˆBT ( f ) = K ∑ rˆ[k ]w[k ]exp( − j 2π f k T ) (5) k =− K en donde se ha empleado una estimación de la FAC definida como [7] 1 K {rˆ[ m ] = K − m −1 ∑ u[k + m]u [k ]; rˆ[− m ] = rˆ * [− m]; * k =0 (6) 0 ≤| m |≤ K − 1} y w[k] es una secuencia real llamada ventana de retardo [1]. Dicha ventana puede ser alguna de las conocidas como la de Hamming, Hanning, Bartlett, etc. [7]. En la Fig. 2.c y 2.d se ilustra el estimador Pˆ ( f ) de los datos empleados como BT casos de prueba con una de las ventanas más frecuentemente usadas de Hamming de ancho K/4. 2) Métodos Modernos: Los métodos de alta resolución (que en la literatura de mayor reconocimiento [1], [2] en análisis espectral se les nombra como métodos modernos) plantean hipótesis sobre el comportamiento de los datos o del espectro. Los hay paramétricos y no paramétricos. Dentro de los más usuales tenemos: el método de Mínima Varianza (MV) [1], el de Máxima Entropía (ME) [1] y el de clasificación de múltiples señales MUSIC (por sus siglas en inglés Multiple Signal Classification) [3]. Estimador de MV: El estimador de MV es una adaptación del Método de Máxima Verosimilitud desarrollado por Capon [2]. Este método permite estimar la PSD a partir de los datos muestreados {u[k]; k = 0, 1,..., K − 1} del proceso a estudiar, mediante la minimización de la potencia de salida o varianza de un arreglo de I filtros pasa-banda de banda angosta [13], cada uno con respuesta al impulso {gi[k]} centrado en una frecuencia determinada fi; i = 1,..., I, y restringidos a tener una ganancia unitaria para asegurar que no introduzcan distorsión en su respuesta. Los filtros son altamente selectivos y cada uno rechaza cualquier potencia residual de salida debido a contribuciones fuera de banda [13]. En la aproximación de MV, cada filtro pasa-banda se modela como un filtro transversal de orden P+1. La respuesta de cada filtro para la secuencia de datos de entrada u[k] se obtiene como [7] P { y i [k ] = ∑ g [ p]u[k − p] ; i = 1,..., I i y k = 0,1,..., K − 1} . (7) p =0 Para asegurar que el filtro no altera la potencia de la señal de entrada se establece como restricción de calibración que la ganancia del filtro es unitaria en cada fi, es decir [7] {Gi ( f i ) = P ∑ g i [ p] exp(− j 2π p f i ) = 1 ; p =0 i = 1,..., I } . (8) El objetivo del método de MV es estimar la potencia de la señal observada {u[k]} en la frecuencia de interés fi con la mayor precisión posible. Esto se logra si el filtro pasa-banda centrado en fi cancela tanta potencia residual de salida como sea posible. Por lo tanto el criterio de optimización de MV es la minimización del valor esperado de la potencia de salida del banco de filtros, es decir la minimización de la varianza E { | y i [ k ] | 2 } , la cual representa indirectamente la PSD de la señal original {u[k]} en la frecuencia de interés fi [7]. En forma vectorial-matricial, definiendo u = [u[0] u[1] … u[K−1]T, gi = [gi[0] gi[1] … gi[P]]T y ei( fi ) = [1 e j2πfi ... e j2πfi P]T, la potencia de salida del filtro de MV es por definición E { | y i [ k ] | 2 } = E { ( g iH u )( u H g i )} = en donde H g iH E { u u H } g i = g iH R P g i denota la transposición Hermitiana y RP = E{ u u H } representa la matriz de auto-correlación restingida a un orden (P+1)×(P+1) con P < K de los datos observados. La restricción de ganancia unitaria se impone a través de g iH e i = e iH g i = 1 . Efectuando el cálculo de minimización con restricciones mediante la técnica usual de multiplicadores de Lagrange [7] se deduce que el estimador de MV para un espacio continuo de frecuencias viene a ser [1] PˆMV ( f ) = 1 ˆ −1e( f ) e ( f )R P H (9) donde e( f ) = [1 e j2π f ... ej2π f P]T es un vector formado por las potencias de la exponencial compleja {ej2π f p ; p = 0, 1…, P} definido para un continuo de frecuencias | f | < 1/2. Este vector es denominado usualmente como “vector de asignación de frecuencias” [1] o “steering vector” en el análisis de estimación espacial espectral [13]. En (9), la matriz ˆ R P ⎡ rˆ[0] rˆ[ −1] ⎢ˆ r[1] rˆ[0] =⎢ ⎢ M M ⎢ ˆ ˆ ⎣⎢ r[ P ] r[ P − 1] rˆ[ − P ] ⎤ ⎥ L rˆ[ − P + 1]⎥ ⎥ O M ⎥ rˆ[0] ⎦⎥ L L (10) representa la estimación de la matriz de autocorrelación restringida definida mediante (6) [2]. En la Fig. 2.e y 2.f se muestran los espectros estimados mediante el método de MV de los datos de prueba de las Fig. 1.a) y 1.b) respectivamente. Estimador de ME: El estimador de ME de Burg [1] pretende aliviar el problema del “desparramamiento” provocado por el truncamiento en los datos. La estrategia consiste en estimar por extrapolación a la función de autocorrelación definida por (6) fuera de un segmento de longitud P<K, es decir, si se conoce { r̂ [0], r̂ [1],…, r̂ [P]}. Entonces se estima { r̂ [P+1], r̂ [P+2],… r̂ [K]} mediante un proceso recursivo de predicción lineal mediante la expresión [2] PONCE-DÁVALOS AND SHKVARKO : SPECTRAL CARACTERIZATION VIA FUSING B. Breve Panorama de Estimación Espectral Paramétrica P {rˆ[ k ] = − ∑ αˆ[ p]rˆ[k − p] ; k = P + 1, K , K } (11) p =1 en donde los coeficientes αˆ [ p] son los parámetros estimados del modelo auto-regresivo de predicción lineal, los cuales se determinan a través del algoritmo recursivo clásico de Levinson detallado en [1] o [2], por ejemplo. La estimación es tal que la entropía dentro del segmento P de observación es máxima, en tanto que la aportación de la información fuera de dicho segmento es mínima. El cálculo está sujeto a la restricción de que { rˆ[ p ] ; p = 1,…, P)} y la PSD son pares de Fourier, es decir 1/ 2 ∫ Pˆ ME ( f ) exp( j 2π f p)df = rˆ[ p], p = 1, K , P . (12) −1 / 2 El resultado es el estimador normalizado de ME [7] 1 PˆME ( f ) = 2 P 1+ . (13) ∑αˆ[ p] exp(− j 2π f p) p =1 En la Fig. 2.g y 2.h se muestran los espectros de los procesos de prueba de Fig. 1 estimados mediante el método ME. Método MUSIC: Este método es uno de los más populares para la estimación espectral de alta resolución [3]. En este caso, la idea consiste en separar los subespacios de señal y de ruido. Si la señal consiste de P sinusoides inmersas en ruido blanco, entonces la descomposición en autovalores de la matriz de autocorrelación R K de la señal completa muestra una separación acentuada entre los autovalores el espacio de la señal y el de ruido, determinada por la magnitud de estos. Los autovalores que pertenecen al ruido son sustancialmente más pequeños que los de la señal para razones de señal a ruido altas. Definimos al conjunto {vp; p = P+1, P+2,…, P+K} como el conjunto de eigenvectores que representan al ruido, caracterizado por ser los de menor autovalor. Los eigenvectores correspondientes al subespacio de señal son ortogonales a los del subespacio de ruido y por lo tanto la K magnitud espectral (e H ( f ) v p )( v Hp e( f )) = ∑ e H ( f )v p 2 p = P +1 es nula al ser evaluada en las frecuencias de las componentes armónicas presentes en la señal. Por lo tanto el recíproco de esta cantidad tiende a infinito en las frecuencias existentes en la señal. Schmidt [1] nota este resultado y define la PSD estimada por el método de “Múltiple clasificación de señales” MUSIC como PˆMUSIC ( f ) = 1 H e ( f ) v p v Hp e( f ) . (14) Los espectros MUSIC estimados para los datos de prueba se presentan en la Fig. 2.i y 2.j. La estimación espectral paramétrica consiste en proponer un modelo que describa al espectro mismo [1], [2], [6] o a la señal [1], [2], [7]. Los modelos usualmente empleados [1], [2], [6], [7] son los llamados auto-regresivo de promedio móvil (ARMA por sus siglas en inglés Auto-Regressive Moving Average), de promedio móvil (MA) y el auto-regresivo (AR). Los parámetros del modelo son estimados usando sólo los datos disponibles. Existen diversas técnicas para obtener dichos parámetros [1], [2], [6], [7]. Otra forma de estimación espectral es aquella en la que se propone un modelo para la señal [1], [2], [10], [11]. En este trabajo se considera un modelo de señales armónicas inmersas en ruido coloreado como se detallada por ejemplo, en [10] y [11]. Los parámetros a determinar son las amplitudes, las frecuencias y las fases. En el dominio de las frecuencias este tipo de señales están representadas por líneas espectrales y un espectro distribuido dentro de una banda limitada de frecuencias. La propuesta desarrollada en este trabajo consiste en la fusión inteligente de métodos paramétricos y no paramétricos. La ventaja de dicha fusión de métodos es que los resultados bajo esta estrategia superan los resultados obtenidos por otras metodologías. Por una parte, los métodos paramétricos permiten determinar las componentes armónicas correspondientes al espacio de señal y, por otro lado, los métodos no paramétricos permiten identificar la componente distribuida del espectro. Los resultados se muestran adelante. C. Problemática de Estimación de Alta Resolución en Ruido Coloreado Los métodos de eigenvalores y eigenvectores para la estimación espectral de alta resolución, como el MUSIC, el de descomposición armónica Pisarenko o el ESPRIT, han sido desarrollados principalmente para señales inmersas en ruido blanco. La descomposición en eigenvalores de la matriz de correlación para señales armónicas en ruido blanco exhibe un comportamiento que permite identificar el subespacio de ruido del subespacio de señal. Por inspección directa (dentro de ciertos límites de probabilidad de detección determinados por de la razón señal a ruido [14]) se nota que los eigenvalores de la matriz de correlación asociados a la componente armónica son considerablemente mayores a los que corresponden al ruido y por lo tanto, se puede discriminar bajo este criterio de comparación a los dos subespacios (señal armónica y ruido) [14]. En el caso de ruido coloreado no hay un umbral de decisión ni es posible definir un criterio de comparación que permita una distinción clara de dichos subespacios [1], [2], [14]. En consecuencia no es posible separar directamente los subespacios de señal y éste tipo de ruido. Esto provoca inexactitudes en los resultados de la estimación espectral bajo cualquier método. 259 260 IEEE LATIN AMERICA TRANSACTIONS, VOL. 3, NO. 3, JULY 2005 10 PSD Relativa (dB) PSD Relativa (dB) 10 0 -10 -20 -30 -40 -50 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0 -10 -20 -30 -40 -50 -0.5 0.5 -0.4 -0.3 Frecuencia Normalizada -0.2 -0.1 (a) PSD Relativa (dB) PSD Relativa (dB) -10 -20 -30 -40 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.4 0.5 -40 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 (d) 10 0 PSD Relativa (dB) PSD Relativa (dB) 0.3 -30 Frecuencia Normalizada -10 -20 -30 -40 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 0 -10 -20 -30 -40 -50 -0.5 Frecuencia Normalizada -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 0.3 0.4 0.5 0.3 0.4 0.5 Frecuencia Normalizada (e) (f) 10 PSD Relativa (dB) 10 PSD Relativa (dB) 0.5 -20 (c) 0 -10 -20 -30 -40 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0 -10 -20 -30 -40 -50 -0.5 0.5 -0.4 -0.3 Frecuencia Noramlizada -0.2 -0.1 0 0.1 0.2 Frecuencia Normalizada (g) (h) 10 PSD Relativa (dB) 10 PSD Relativa (dB) 0.4 -10 -50 -0.5 0.5 10 0 -10 -20 -30 -40 -50 -0.5 0.3 0 Frecuencia Normalizada -50 -0.5 0.2 10 0 -50 -0.5 0.1 (b) 10 -50 -0.5 0 Frecuencia Normalizada -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 Frecuencia Normalizada (i) 0.3 0.4 0.5 0 -10 -20 -30 -40 -50 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 Frecuencia Normalizada (j) Fig. 2. Panorama de los diferentes estimadores espectrales más usuales, aplicados a los datos de prueba. La columna izquierda corresponde a los datos de la Fig. 1.a. y la columna derecha a los datos de la Fig. 1b. (a) y (b): Periodograma. (c) y (d): Estimación de Blackman-Tukey. (e) y (f): Estimación de Mínima Varianza. (g) y (h): Estimación de Máxima Entropía. (i) y (j): Estimación MUSIC. PONCE-DÁVALOS AND SHKVARKO : SPECTRAL CARACTERIZATION VIA FUSING IV. MÉTODO PROPUESTO A. Modelo de Datos Dos de los principales estimadores de líneas espectrales son el método de Prony [8] y el de descomposición armónica de Pisarenko [2]. El método de Pisarenko supone que las frecuencias de las sinusoides ocultas en una señal pueden ser obtenidas a través del cálculo de los autovalores mínimos de la matriz de autocorrelación (10). Sin embargo, este método es altamente sensible al ruido coloreado que es el considerado en este trabajo, y por ello su uso práctico es limitado [1], [2] y [7]. Debido a esto, en el trabajo presente desarrollamos el método modificado por regularización de Prony (MORP) como se detalla en seguida. El modelo considerado para los datos es la composición {u[k ] = s ( M ) [k ] + n[k ]; k = 0,1, K , K − 1} (15) es decir, la superposición de un número M < K (usualmente desconocido) de sinusoides complejas con amplitudes Am, frecuencias características fm, y fases θm; m = 1, …, M, las cuales están contaminadas por ruido coloreado {n[k]} cuya densidad espectral de potencia Pn( f ) es desconocida. El modelo de la parte multi-armónica en (15) es dado por M M m=1 m=1 k −1 s ( M ) [k ] = ∑ Am exp[ j 2π f m (k − 1) + jθ m ] = ∑ d m z m (16) en donde {dm=Amexp(jθm) y zm= exp(j2πfm); m = 1, …, M}. En el caso determinístico (i.e. sin ruido {n[k] = 0; k = 0, 1…K−1} en (15)), el problema tiene solución exacta si el orden del modelo M es conocido y además M ≡ K/2 [2]. En cualquier otro escenario (i.e. datos ruidosos y/o M desconocida) el modelo (15) es sobre-dimensionado [2]. En estos casos, sólo es posible obtener estimaciones aproximadas de los parámetros característicos { Aˆ , fˆ y θˆ ; m = 1,..., Mˆ } m m m del modelo (16), en donde M̂ es un estimado del verdadero valor de M. B. Planteamiento del Problema El objetivo principal a desarrollar en este trabajo consiste en realizar una caracterización fusionada espectral explícita para el modelo de datos combinados (15). Primero, desarrollamos una estrategia que ofrece la posibilidad a estimar el orden del modelo M, y mediante las definiciones de {dm} y {zm} estimar los parámetros característicos { Aˆ , fˆ y θˆ ; m = 1,..., Mˆ } m m m para así reconstruir el modelo multi-armónico (16) y obtener el espectro de líneas. Luego, proponemos una estrategia adaptiva basada en métodos de MV y/o ME, para estimar la densidad espectral del espectro distribuido Pˆ ( f ) . Finalmente n 261 alternativos para mejorar la estimación de los parámetros característicos del modelo (16). En este trabajo nos basamos en las técnicas de regularización [10], [12] para desarrollar un nuevo método consistente en la caracterización adaptiva del espectro de armónicos inmersos en ruido coloreado que superan todos los métodos de caracterización espectral paramétrica de espectro de líneas reportados en la literatura previamente, e.g. [1], [2], [3] y [7]. A este método nosotros lo llamamos método modificado por regularización de Prony, detallado en la siguiente subsección. C. Generalización del Método de Prony Mediante Regularización El método original de Prony [2] calcula los parámetros característicos {Am, fm y θm} desacoplando la ecuación no lineal (16) mediante un sistema auxiliar de ecuaciones lineales en el que se determina primero {zm} como las raíces de un polinomio característico. Luego, con los valores estimados de { ẑ } obtiene { dˆ } resolviendo (16). m m Para el caso no determinístico en el que se considera ruido coloreado el problema es no lineal y sobre-dimensionado [2]. Referenciado al análisis detallado de este problema presentado en [1] y [2] mencionamos los factores principales los cuales dificultan la solución del mismo. Primeramente, debido a la no linealidad no existe solución analítica en forma cerrada del problema. Como segundo aspecto, la presencia de una componente distribuida de PSD resulta en una sobreestimación de líneas espectrales correspondientes a la parte multiarmónica del espectro, las cuales pueden ser producidos solamente por métodos de estimación espectral paramétrica [1], [2]. Por ello, como ha sido resumido en [1] y [2], el problema de estimación espectral no lineal bajo estudio debe ser tratado mediante la fusión inteligente de métodos paramétricos y no paramétricos. Esta aproximación tiene que considerar algunas pruebas basadas en experimentos con estrategias de estimación espectral paramétrica para reconstruir el espectro de líneas de la componente multiarmónica eliminando el efecto de sobre-estimación del orden del modelo. Este problema fue discutido y analizado explícitamente en [1] y [2], donde los autores declaran que este problema está abierto y aún sin solución. El aspecto innovador principal que proponemos en este trabajo es una nueva aproximación del problema bajo estudio basado en una nueva estrategia de estimación espectral fusionada que elimina el efecto de sobreestimación del orden del modelo de la parte multi-armónica en los datos de observación. Esta aproximación está justificada en pruebas de hipótesis que corresponden a diferentes órdenes del modelo de Prony con una elección adaptiva de decisión a favor de la hipótesis que proporciona el mínimo error en la localización y caracterización de las líneas espectrales en el espectro combinado. Para tratar diferentes hipótesis del orden M del modelo fusionando el espectro de líneas con el espectro distribuido del ruido coloreado reconstruimos adaptivamente la PSD total combinada Pˆ ( f ) . paramétrico en (16) consideramos que el orden estimado M̂ La característica principal de los estimadores espectrales de líneas, como el de Pisarenko y el de Prony, es la aparición de líneas espectrales falsas asociadas al ruido [1], [2], [7], [8]. En trabajos recientes [10], [11], [12] se han propuesto métodos se sitúa dentro de un rango, es decir M̂ ∈ [Mmín, Mmáx], en el que Mmín > Mverdadero y Mmáx < K. Nótese que la condición Mmín > Mverdadero implica que el modelo supuesto es sobre estimado y por lo tanto forzosamente aparecerán componentes 262 IEEE LATIN AMERICA TRANSACTIONS, VOL. 3, NO. 3, JULY 2005 armónicas adicionales (falsas). En procesos armónicos ocultos en ruido blanco esta situación se puede reducir, pues es fácil discriminar el subespacio de ruido del subespacio de señal. Sin embargo, en el caso de ruido coloreado el estimador de Prony es sensible al ruido y produce componentes espurias en todos los casos sobredeterminados, como fue analizado en detalle en [1] y [2]. Para cada una de las hipótesis bajo análisis M̂ ∈ [Mmín, Mmáx], el sistema de ecuaciones de desacoplamiento que permiten calcular los valores de {zm} es [2] ⎡u ˆ L u 0 ⎤ ⎡ a1 ⎢ M −1 ⎥⎢ O M ⎢ M ⎥⎢ M ⎢u ⎥⎢ ⎣ K − 2 L u K − Mˆ −1 ⎦ ⎣ a Mˆ ⎤ ⎡ u Mˆ ⎤ ⎡ ε Mˆ ⎤ ⎥ ⎢ M ⎥+⎢ M ⎥ = − ⎥ ⎥ ⎥ ⎢ ⎢ ⎥ ⎢⎣u K −1 ⎥⎦ ⎢⎣ε K −1 ⎥⎦ ⎦ (17.a) que nosotros reescribimos ahora en forma vectorial-matricial como U M̂ a M̂ = − u M̂ + ε M̂ . (17.b) En (17.b), los parámetros {am; m = 1,…, M̂ } se identifican como los coeficientes del polinomio característico φ M̂ (z) = z M̂ + a1z M̂ −1 +… a M̂ , cuyas raíces {zm = exp(j2πfm); m = 1,…, M̂ } especifican las posiciones de las líneas espectrales {fm; m = 1,…, M̂ } para cada una de las hipótesis de prueba M̂ ∈ [Mmín, Mmáx]. El vector ε M̂ = [ε M̂ … εK−1 ]T en (17.b) representa el error de predicción. Ahora el punto de partida es estimar los coeficientes {am; m = 1,…, M̂ } resolviendo (17.b) y luego mediante factorización polinomial de φ M̂ obtener sus ceros {zm} para cada una de las hipótesis de prueba. A partir del conjunto de ceros {zm} se obtienen los correspondientes valores de {dm} de (16) mediante el método de regularización, con lo cual se tiene dˆ Mˆ = ( Z H Z + μ I ) − 1 Z H u Mˆ (18) con ⎡ 1 ⎢ z ⎢ 1 2 Z = ⎢ z1 ⎢ ⎢ M ⎢ z K −1 ⎣⎢ 1 1 L z2 L z 22 L M O z 2K −1 L 1 ⎤ z Mˆ ⎥⎥ z 2ˆ ⎥ M ⎥ M ⎥ K −1 ⎥ z ˆ ⎥ M ⎦ en donde u M̂ está definido en (17), I representa la matriz de identidad, Z es la matriz de Vandermonde compuesta de los ceros {zm; m = 1,…, M̂ } del polinomio característico estimados previamente, y μ representa el parámetro de regularización. Este último representa un grado de libertad del algoritmo (18) que con una adecuada selección proporciona la posibilidad de controlar el desempeño de la estimación d̂ M̂ . En este estudio seguimos el método de Tikhonov [5] para ajustar el parámetro μ como el recíproco de la relación señal a ruido, i.e. μ = SNR-1. Como una alternativa, el método MORSE propuesto recientemente en [10] resuelve (17) realizando una descomposición en valor singular (SVD por sus siglas en inglés Singular Value Decomposition) de U M̂ , minimizando el error de predicción y eligiendo los autovalores que minimizan la norma de a M̂ . Este método puede tratar el problema de estimación espectral de armónicas inmersas en ruido blanco en el que el resultado permite distinguir los subespacios de señal y ruido. Sin embargo, en el caso de ruido coloreado la discriminación del espacio de señal con este método es pobre, debido a que el MORSE enfrenta el problema obteniendo la pseudo-inversa mediante regularización y calculando el parámetro de regularización para cada eigenvector. En este trabajo se incorpora el método de regularización en la determinación de la solución (18). En la siguiente sección se presenta un método adaptivo robusto para determinar tanto el orden M̂ del modelo como la posición de las líneas espectrales que aparecen realmente en los datos de prueba. D. Invariancia de Posición Espectral Para cualquier hipótesis de prueba M̂ ∈ [Mmín, Mmáx] en los casos sobredeterminados, M̂ > Mverdadera, la descomposición SVD de U M̂ produce un conjunto de líneas espectrales, de las cuales un subespacio asociado a la señal, de dimensión Mverdadera, representa a las líneas que verdaderamente están presentes en los datos observados y otro subespacio asociado al ruido de dimensión M̂ − Mverdadera que representa a las líneas falsas [14]. En esta subsección proponemos una estrategia que permite identificar este subespacio de señal. Al aplicar iteradamente diferentes hipótesis de prueba sobre M̂ ∈ [Mmín, Mmáx] para resolver (17) se observa en resultados experimentales [11] que un subconjunto de M̂ P líneas, aparecen en posiciones espectrales cercanas incluso sobre las posiciones que realmente están presentes, para todas las hipótesis probadas, todas ellas dentro de un rango de tolerancia Δf. A esta condición le llamamos invariancia en la posición espectral (SPI por sus siglas en inglés Spectral Positional Invariance). De los resultados experimentales tratados en este estudio y también otros analizados previamente [11], se observa que para diferentes datos de prueba sintéticos las M̂ P < M̂ líneas que corresponden al subespacio de señal se mantienen fijas (dentro del rango de tolerancia aceptado Δf) y el resto M̂ − M̂ P correspondientes al subespacio de ruido cambian aleatoriamente en su posición espectral. En base a las observaciones anteriores el SPI produce una mecanismo de prueba para separar los subespacios de señal y de ruido resolviendo (17) para diversas hipótesis sobredeterminadas M̂ > Mverdadera. Aplicando el método de regularización (18) a cada hipótesis hacemos una caracterización de las M̂ P líneas que en las pruebas de análisis aparecen en posiciones espectrales fijas dentro de la ventana de tolerancia Δf. Estableceremos que dichas líneas representan las armónicas que realmente están PONCE-DÁVALOS AND SHKVARKO : SPECTRAL CARACTERIZATION VIA FUSING presentes en el modelo (15). En el caso particular estudiado en este trabajo el rango de tolerancia para identificar la SPI fue ajustado experimentalmente a Δf = 10−2. A manera de ejemplo, la Fig. 3 ilustra los espectros de líneas obtenidos por el método propuesto bajo dos hipótesis de prueba con M̂ = 12 y M̂ = 16, en los que se aprecia la manifestación de las líneas espectrales verdaderas y falsas. Se muestra la aparición de las líneas del subespacio de señal en las posiciones fijas para las dos hipótesis de muestra. Esta prueba ilustra claramente la posibilidad de formar un ensamble de las M̂ P líneas espectrales que se adaptaron a la hipótesis SPI. Dicho valor, vendrá a ser considerado como la mejor estimación para el número verdadero M de armónicas presentes en el conjunto de datos. 0 -10 -20 -30 -40 -50 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 m m m P separar, en los datos de medición, la componente que corresponde al ruido. Este proceso tiene un significado estadístico llamado innovación de datos ˆ {nˆ[ k ] = u[k ] − sˆ ( M P ) [ k ]; k = 0,1, K , K − 1} (19) ˆ -10 -20 -30 -40 -50 -0.5 0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 0.4 0.5 Frecuencia Normalizada a) b) 10 Espectro de Líneas 10 Espectro de Líneas E. Agregación de Métodos de Estimación Espectral La estrategia de fusión de métodos paramétricos y no paramétricos de estimación espectral se basa en la separación de componentes del modelo (15). Una vez caracterizado el espectro de líneas dado por las estimaciones paramétricas { Aˆ , fˆ y θˆ ; m = 1,..., Mˆ } , estos ofrecen la posibilidad de en donde {sˆ ( M P ) [k ]} es la señal del modelo multi-armónico reconstruida a través de (16) usando los parámetros de caracterización { dˆ m , zˆ m ; m = 1,..., Mˆ P } de su espectro de 0 Frecuencia Normalizada 0 -10 -20 -30 -40 -50 -0.5 concepto SPI para la caracterización experimental de la componente multi-armónica en los datos mixtos del modelo (15). 10 Espectro de Líneas Espectro de Líneas 10 263 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 Frecuencia Normalizada c) 0.4 0.5 0 -10 -20 -30 -40 -50 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 Frecuecia Normalizada d) Fig. 3. Espectro de líneas mediante el método MORP para los modelos de prueba bajo dos hipótesis de trabajo M̂ = 12 y M̂ = 16: a) y b) para los datos de la Fig. 1.a, c) y d) para los datos de la Fig. 1.b. líneas estimadas con el método propuesto modificado de Prony. Esto es, los datos { nˆ [ k ]; k = 0 ,1, K , K − 1} presentan la aproximación del ruido coloreado en el modelo estudiado definido por (15). En seguida, habiendo innovado los datos (19), la estrategia de reconstrucción de la componente distribuida de la PSD es aplicar un método de estimación espectral no paramétrica de alta resolución. Basándonos en la experiencia con tratamiento de diferentes métodos no paramétricos, en este trabajo proponemos fusionar el método desarrollado de Prony modificado con métodos de mínima varianza (MV) y/o de máxima entropía (ME) [7], para obtener como resultado la reconstrucción del espectro del ruido coloreado Pˆ ( f ) de alta resolución. n Finalmente, la estrategia de fusión que proponemos implica la agregación de dos espectros: (i) el espectro de líneas caracterizado por el método MORP y (ii) el espectro continuo Pˆ ( f ) estimado mediante alguno de los métodos no n La propuesta SPI para determinar el orden del modelo de la componente armónica de la señal tiene como sustento el hecho de que es una prueba basada en la estadística del comportamiento del proceso estudiado, ya que la probabilidad de ocurrencia de una línea espectral es máxima si ésta realmente existe en la señal mixta, independientemente de las características espectrales del ruido. Esto es claro y demostrable en el caso de ruido blanco [3], pero en el caso de ruido coloreado no existe método analítico único que permita determinar el número de componentes armónicas ya que el problema es altamente no lineal [1], [2], [10] y por lo tanto una prueba razonable es de tipo estadístico basado en prueba de hipótesis. Para que el método propuesto sea válido, siempre se deberá suponer casos sobredeterminado en los que M̂ > Mverdadera. Experimentalmente también se probaron situaciones en las que los datos contienen sólo ruido coloreado, sin componentes armónicas. Como resultado se obtiene que en este caso no hay componentes espectrales que se repitan para todas las hipótesis probadas, lo cual nuevamente verifica la eficiencia del paramétricos MV y/o ME. A este método fusionado que agregan los paradigmas de estimación espectral paramétricos y no paramétricos nosotros lo presentamos en dos variantes como método MORP-MV y/o MORP-ME, respectivamente. La estructura computacional del método MORP-MV/ MORP-ME, se describen en la T ABLA I. V. SIMULACIONES COMPUTACIONALES Se presenta ahora la evaluación del desempeño del método propuesto mediante una serie de experimentos y simulaciones computacionales. Los datos sintéticos de valor complejo que sirven como estándar para recuperar la PSD global del modelo de datos, así como los datos de valor real, sirven para ilustrar la eficacia del método en situaciones de aplicaciones típicas. A. Caracterización del Orden del Modelo del Espectro MultiArmónico En primer lugar se ilustra el procedimiento para la determinación del orden del modelo. La estrategia para identificar el orden del modelo es estadística de SPI basada en 264 IEEE LATIN AMERICA TRANSACTIONS, VOL. 3, NO. 3, JULY 2005 prueba de hipótesis. Se emplearon doce hipótesis M̂ ∈[ M̂ mín, M̂ máx] con M̂ mín = 11 y M̂ máx = 22, llevándose a cabo 12 realizaciones computacionales siguiendo el algoritmo de la Tabla I. La Fig. 4 presenta la verificación experimental del concepto SPI a través de los conteos de las veces en que ocurrieron las diferentes líneas espectrales usando el método observarse que las variaciones o errores de estimación siempre se encuentran por debajo de la tolerancia aceptada de Δf = 10−2. TABLA I ALGORITMO MORP-MV/MORP-ME PARA LA ESTIMACIÓN DE LA DENSIDAD ESPECTRAL DE POTENCIA • Colectar datos {u k } kK=−11 . • Probar diferentes hipótesis de modelos de señal sobredeterminados, a) M̂ > M, M̂ ∈ [Mmín, Mmáx], Mmáx<K. Caracterizar la IP de las líneas espectrales mediante el método MORP: - Formar el vector u M̂ y la matriz U M̂ , como se especifica en (17). - Mediante el algoritmo MORSE [10], resolver (17) para encontrar los coeficientes del polinomio característico a M̂ - Mediante factorización polinomial, encontrar las raíces {z M̂ } de φ M̂ (z). - Estimar las frecuencias de todas las m = 1, …, M̂ líneas espectrales { fˆ ˆ ; M M̂ } para las raíces { z M̂ } en cada hipótesis. b) - Localizar las líneas espectrales que manifiestan IP analizando las hipótesis propuestas mediante el conteo del número de repeticiones de las frecuencias espectrales y definir el valor de M̂ P . Construir el ensamble de frecuencias { fˆm ; m = 1, …, M̂ P }. - Estimar el vector de fasores {d M̂ } usando (16). ˆ - Obtener un estimado para el modelo de señal de Prony sˆ(MP ) [k] usando (16). • Formar el vector de datos innovados n̂ como es definido en (19). • Aplicar estimadores espectrales MV ó ME especificados en (9) y (13) a los datos innovados obtenidos mediante (19) • Reconstruir la PSD resultante mediante la agregación del espectro de líneas obtenido por el método MORP con la componente del espectro distribuido estimado mediante las técnicas MV ó ME. MORP [10]. En estas gráficas se ilustra, mediante la frecuencia de repetición, que las líneas espectrales {fm; m = 1,… M̂ P } que verdaderamente se encuentran presentes en los datos referidos en la Fig.1 tienden a repetirse dentro del rango de tolerancia Δf = 10-2 en cada realización. Por otra parte, las líneas espectrales falsas no tienen ninguna frecuencia de repetición. También, en la Fig. 4.c se muestra el resultado obtenido al aplicar en un procedimiento similar a la componente de solo ruido coloreado presente en los datos de referencia de la Fig. 1.a, en la cual hay muy baja frecuencia de repetición detectada por la SPI en comparación con los resultados de caracterización espectral por la SPI que corresponden al modelo combinado (15). Finalmente, en la Tabla II se presentan los desempeños cuantitativos del método propuesto para las estimaciones asociadas a la frecuencia que verdaderamente están presentes en cada uno de los modelos de prueba de este trabajo. Puede c) Fig. 4. Número de repeticiones en las que aparece cada frecuencia para los casos prueba de este trabajo. a) para los datos de la Fig 1.a. y b) para los datos de la Fig. 1.b. Se emplearon 12 hipótesis para el valor de M̂ . Y c) Ejemplo del método aplicado al ruido coloreado correspondiente a los datos de la Fig. 1.a. B. Resultados de las Simulaciones para los Datos Sintéticos En la Fig. 5 se muestran los espectros reconstruidos mediante el método fusionado propuesto en sus dos variantes: MORP-MV y MORP-ME. Para el conjunto de datos de prueba referidos en la Fig 1.a, se ha empleado un modelo MV y ME de orden 4 y para el conjunto referido en la Fig. 1.b, se ha empleado un modelo MV y ME de orden 8. La comparación de los espectros resultantes obtenidos con el método propuesto y los resultados obtenidos con los métodos previos muestran efectivamente una superioridad del método aquí desarrollado respecto de los previos, ya que se logra una mejor reproducción con alta resolución de la componente distribuida de la PSD con superresolución paramétrica de las líneas espectrales que corresponden a la componente armónica de los datos. Es claro que al innovar los datos sustrayendo la componente multi-armónica, los métodos de alta resolución en ambas PONCE-DÁVALOS AND SHKVARKO : SPECTRAL CARACTERIZATION VIA FUSING TABLA II VALORES ESTIMADOS DE LAS FRECUENCIAS MÁS CERCANAS A LAS FRECUENCIAS VERDADERAS PARA LOS MODELOS DE PRUEBA PRESENTADOS EN LA FIG. 1, BAJO DIFERENTES HIPÓTESIS EN Mˆ . fˆm fˆm fˆm fˆm fˆm fˆm con con con con con con M̂ =12 M̂ =15 M̂ =16 M̂ =19 M̂ =20 M̂ =22 0.0500 0.0519 0.0527 0.0523 0.0529 0.0529 0.0525 0.4000 0.4001 0.4037 0.4001 0.4019 0.4035 0.4032 10 0 -10 -20 -30 -40 -50 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 0.3 0.4 0.5 0.3 0.4 0.5 0.3 0.4 0.5 Frecuencia Normalizada a) 0.4200 -0.1500 0.1000 0.4282 0.4229 0.4236 9.4229 0.4212 0.4271 -0.1499 -0.1501 -0.1499 -0.1498 -0.1500 -0.1499 0.0997 0.1000 0.0999 0.0999 0.1000 0.1000 PSD Relativa (dB) 10 0 -10 -20 -30 -40 -50 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 Frecuencia Normalizada 0.2008 0.2006 0.2009 0.2008 0.2004 0.2002 0.2100 0.2132 0.2097 0.2096 0.2092 0.2098 0.2101 El empleo de datos de valor complejo permite ilustrar detalles de la recuperación de la PSD tanto en espectros simétricos como en espectros no simétricos. Por ejemplo, las componentes espectrales de ruido coloreado en ambos conjunto de prueba recuperados con los datos innovados tienen mayor aproximación a los originales que con cualquier otro método previo. En la Tabla III se muestra una comparación cuantitativa de los valores estimados de las frecuencias, amplitudes y fases obtenidos con el método propuesto y los reportados en la literatura de donde fueron tomados [1], [2]. El análisis de datos muestra un error promedio porcentual de 4.54% en la amplitud y 0.79% en la fase para los datos del modelo de la Fig. 1.a. y un error promedio porcentual de 2.54% en la amplitud y 0.84% en la fase para los datos del modelo de la Fig. 1.b. Los cuales son resultados satisfactorios dentro de los límites de tolerancia aceptados. C. Simulaciones en Aplicaciones Reales Una de las aplicaciones típicas y de interés histórico para la estimación espectral es el registro de la actividad solar, la cual se manifiesta por la aparición de manchas en el disco del Sol [2]. El conteo del número de manchas es el parámetro utilizado para medir la actividad solar. Para ello se cuenta con un registro histórico de más de 300 años, encontrándose una periodicidad aproximada de 11 años [2]. Los diversos métodos de estimación espectral han permitido extrapolar la serie de eventos de dicha actividad hasta 1500 años antes de Cristo b) 10 PSD Relativa (dB) 0.2000 0 -10 -20 -30 -40 -50 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 Frecuencia Normalizada c) 10 PSD Relativa (dB) Datos del modelo de la Fig.1.b. Datos del modelo de la Fig.1.a. Casos fm de prueba Verdadera verificándola con registros geológicos de variaciones climáticas y meteorológicas. Los métodos predicen que además del ciclo de máxima actividad de 11 años, existen otros dos, uno de 5 años y otro de 21 años aproximadamente. PSD Relativa (dB) versiones MV/ME logran una mejor aproximación que los métodos previos (BT, Pisarenko, MUSIC, MORP, MV, ME, etc.) 265 0 -10 -20 -30 -40 -50 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 Frecuencia Normalizada d) Fig. 5. Espectros reconstruidos para los casos prueba de este trabajo. a) MORP-MV para los datos de la Fig 1.a. b) MORP-MV para los datos de la Fig 1.b. c) MORP-ME para los datos de la Fig 1.a. d) MORP-ME para los datos de la Fig 1.b. En la Tabla VI se presentan los resultados obtenidos mediante diversos métodos modernos de estimación espectral [2] y el propuesto en este trabajo en donde se muestra total concordancia de resultados. 266 IEEE LATIN AMERICA TRANSACTIONS, VOL. 3, NO. 3, JULY 2005 TABLA III VALORES ESTIMADOS DE LOS PARÁMETROS CARACTERÍSTICOS PARA LOS MODELOS DE PRUEBA PRESENTADOS EN LA FIG..1. SE COMPRARA CON LOS DATOS REPORTADOS EN LA LITERATURA Datos del modelo de la Fig. 1b Datos del modelo de la Fig.1. a Casos Frecuencia de prueba Amplitud Amplitud estimada reportada Fase estimada (rad) Fase reportada (rad) −0.4200 1.0041 1.0000 -0.0293 0.0000 −0.4000 1.0250 1.0000 -0.0185 0.0000 −0.0500 1.0260 1.0000 0.0965 0.0000 0.0500 1.2613 1.0000 -0.1469 0.0000 0.4000 0.9615 1.0000 0.0319 0.0000 −0.4200 0.9949 1.0000 0.0188 0.0000 −0.1500 0.1085 0.1050 -0.9088 -0.9112 0.1000 0.1046 0.1001 0.6100 0.5981 0.2000 0.9910 0.9810 1.2572 1.2369 0.2100 0.9949 0.9819 1.3009 1.3010 TABLA IV CÁLCULO DEL PERIODO DE ACTIVIDAD SOLAR MEDIANTE LOS MÉTODOS DE ESTIMACIÓN MODERNOS. Método Periodo 1 Periodo 2 Periodo 3 Autorregresivo 20.90 años 10.72 años 5.20 años Media móvil − 10.84 años 5.52 años frecuencia, la duración mínima de la señal, potencia y valores mínimos de razón señal a ruido. El problema a resolver es la detección de los tonos de la señal en presencia de ruido, de tal forma que se cumpla la norma del ITU. Existen diversos métodos basados en la transformada discreta de Fourier (DFT) agregado con un método de filtraje basado en el algoritmo de Goertzel [15]. El método propuesto en este trabajo es capaz de detectar los tonos duales con la ventaja de que requiere menos datos que los especificados en el estándar para tomar la decisión de cuál es el dígito presente en un registro de datos. El análisis detallado de esta aplicación se encuentra en desarrollo. Detección del Pitch de la Voz: El procesamiento de la voz es un tema de investigación que encuentra aplicaciones principalmente en tres áreas de desarrollo: la síntesis, la codificación y la compresión de la voz. A la fecha se siguen desarrollando algoritmos para el tratamiento de la voz [16]. Un parámetro fundamental en el procesamiento es el llamado “pitch” de la voz. El parámetro identifica la componente sonora de la voz diferenciándola de los sonidos sordos. El origen de este parámetro está en el hecho de que las cuerdas vocales vibran con una frecuencia determinada para la componente sonora de la voz. En el dominio del tiempo el pitch representa la pseudo-periodicidad de la voz, y en el dominio de la frecuencia representa la separación de frecuencias adyacentes generadas por los pulsos periódicos de las cuerdas bucales [16]. Las pruebas parciales desarrolladas hasta el momento muestran que el método propuesto, puede recuperar el periodo de pitch y reconstruir la envolvente espectral (la cual representa la característica del modelo del tracto bucal). El análisis detallado de esta aplicación está en progreso. VI. CONCLUSIONES Prony (modelo de 4 sinuoides) 24.48 años 10.96 años 5.96 años Mínima varianza − 10.67 años 5.35 años Método propuesto − 10.70 años 5.27 años D. Sugerencias de Aplicaciones En general, la estimación espectral tiene una amplia y prácticamente ilimitada variedad de aplicaciones. Tan sólo mencionaremos algunos tópicos que han sido probados con el método propuesto que han dado resultados satisfactorios. Detección DTMF: El tipo de señalización usado en la telefonía digital es el llamado DTMF, i.e. Dual Tone MultiFrequency, el cual es empleado en la marcación, selección y usos de servicios electrónicos. Es un estándar definido por la International Telecommunication Union (ITU) que consiste en la asignación de tonos duales para identificar los dígitos 0 a 9, las letras A, B, C y D y los símbolos # y * mediante la combinación de dos sinusoides de frecuencias bajas y altas, las cuales en principio nunca se pueden generar mediante la voz humana [15]. El estándar especifica los valores de las frecuencias, el porcentaje de tolerancia de desviación en la En este trabajo se ha propuesto una metodología novedosa basada en la fusión o agregación de métodos paramétricos y no paramétricos de estimación espectral que permiten resolver eficientemente el problema de la caracterización del espectro de procesos mixtos que están compuestos con una parte multiarmónica de orden desconocido inmersa en ruido coloreado con espectro distribuido también desconocido. Primero, el uso del método robusto de estimación paramétrica como lo ha sido el método de Prony modificado (MORP) propuesto en este trabajo ha permitido caracterizar las componentes de líneas del espectro con superresolución. El orden del modelo paramétrico ha sido determinado por la estrategia de invariancia de posición espectral (SPI) verificada experimentalmente con datos reales y sintéticos. La estrategia desarrollada permite detectar la presencia de señales armónicas ocultas en cualquier tipo de señal ruidosa mediante la prueba de la hipótesis de SPI. En el método propuesto, los errores cometidos en el cálculo de las frecuencias estimadas, respecto de las frecuencias verdaderas, se absorben en el factor de redondeo. Por lo tanto la hipótesis SPI es válida dentro de los límites de tolerancia especificados en este trabajo. Es importante desatacar que debido a la no linealidad del problema bajo análisis no existe su solución analítica única. La PONCE-DÁVALOS AND SHKVARKO : SPECTRAL CARACTERIZATION VIA FUSING SPI es una prueba estadística propuesta cuya validez fue demostrada experimentalmente en una variedad amplia de simulaciones con datos sintéticos y reales. Como resultado, el método paramétrico MORP ofrece la ventaja de identificar componentes espectrales cercanas con superresolución evitando la sobre estimación del orden del modelo del espectro multi-armónico. Por otra parte, la agregación de métodos no paramétricos permite reconstruir la componente distribuida del espectro de la señal asociada al ruido coloreado de fondo. Los métodos que proponemos emplear tienen la ventaja de que reducen la pérdida de resolución debida al registro finito de datos. Como resultado de la estrategia de agregación de métodos que se ha propuesto fue presentado el método fusionado de estimación espectral en sus dos versiones: MORP-MV y MORP-ME. La metodología no hace hipótesis acerca de la distribución espectral del ruido y por lo tanto afirmamos que este resultado es general tanto para ruido blanco como para ruido coloreado. La fusión del método paramétrico MORP para la localización y caracterización de líneas espectrales, con los métodos de estimación espectral no paramétricos MV y ME, presenta como resultado una estimación espectral completa con alta resolución de la componente distribuida de la PSD y superresolución paramétrica de las líneas espectrales que corresponden a la componente multi-armónica de los datos. Los desempeños de resolución/superresolución espectral del método MORP-MV/MORP-ME superan a aquellos proporcionados por todos los métodos previos. Esto verifica la eficiencia de la estrategia propuesta y el método desarrollado. Finalmente, basándonos en los resultados del presente estudio, planteamos que la metodología descrita abre un panorama amplio de aplicaciones particulares para el método desarrollado MORP-MV/MORP-ME en problemas de análisis espectral, tanto en tiempo-frecuencia como espacio-frecuencia espacial. Los resultados de las simulaciones computacionales reportadas verifican claramente las ventajas de la propuesta. REFERENCIAS [1] [2] [3] [4] [5] [6] [7] [8] S. M. Kay, Modern Spectral Estimation, Theory ad application , Prentice Hall, Englewood Cliff, NJ, 1987. S. L. Marple, Digital Spectral Analysis with Applications , Prentice Hall, Englewood Cliff, NJ, 1987. R. Kumaresan, Spectral Analysis, in Radar Handbook , Second Ed. Edited by M.I. Skolnik, McGraw Hill, Boston, 1990. D. L. Hall, J Llinas, Eds. Handbook of Multisensor Data Fusion . Boca Raton, Fl: CRC Press LLC, 2001. Y. Shkvarko, “Estimation of Wavefield Power Distribution in the Remotely Sensed Environment: Bayesian Maximum Entropy Approach”. IEEE Trans. on Signal Proc., vol. 50, Sep 2002, pp.2333-2346. Y. Shkvarko, Y. Shmaly, R. Jaime-Rivas, M. Torres-Cisneros, “System Fusion in Passive Sensing Using a Modified Hopfield Network”. Journal of The Franklin Institute , Elsevier, vol. 338, no. 4, pp. 405-427, Jul 2001. M. H. Hayes, Statistical Digital Signal Processing and Modeling , John Wiley and Sons, Inc. NY, 1996. M. S Mackisack, M. R. Osborne, G. K. Smyth, “A modified Prony algorithm for estimating sinusoidal frequencies”. SIAM, Journal of Scientific and Statistical Computing , vol. 49, p.p. 111-124, Jan 1991. [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] R. Carrier, R.L. Mose: “High resolutions radar target modeling using a modified Prony estimator”, IEEE Trans., AP-40, (1), pp. 13-18, Jan 1992. L. Jun-Seok, K.M. Sun,. “Prony based radar target modeling using modified regularized SVD”, Electron. Lett., 32, (1), pp 64-65, Jan 1996. J.L. Ponce, Y.V. Shkvarko, J.L. Leyva, “New Spectral Positional Invariance Approach of Point Type Targets Embedded in Colored Noise”. International Conference on Antenna Theory and Techniques (ICAATT 2003). Ukraine. Sep. 2003. M. Bertero, P. Boccaccio, Introduction to Inverse Problems in Imagining. Bristol, London: IoP Publishing Ltd, 1998. A. Farina, Antenna-Based Signal Processing Techniques for Radar Systems. Artech House Antenna Library Series, Norwood, MA, 1992. H.L. Van Trees, Optimum Array Processing (Detection Estimation and Modulation Theory, Part IV). New York: Wiley, 2002. J. Bellamy, Digital Telephony. New York, Wiley John & Sons, Inc, 2000. L.R. Rabiner, “Applications of Voice Processing to Telecommunications”, Proc. of the IEEE, vol. 82, no. 2, Feb 1994. V. I. Ponomaryov, L. Nino-de-Rivera “Order statistics – M Method in Image and Video Sequence Processing Applications”, International Journal: Electromagnetic Waves and Electronic Systems, Moscow: ISSN 1560-4128, 2003, vol. 8, no 7-8, pp. 99107, 2003. F. J. Gallegos-Funes, V. I. Ponomaryov, “Real-Time Image Filtering Scheme Based on Robust Estimators in Presence of Impulsive Noise”, Real Time Imaging VII, 8(2), Elsevier Publ., NY, pp. 6980, 2004. José Luis Ponce-Dávalos. Recibió el título de Físico por parte de la Universidad Nacional Autónoma de México (UNAM) en 1983. Obtuvo el grado de Maestro en Ciencias por parte de Centro de Investigaciones y Estudios Avanzados (CINVESTAV) en 1993. Actualmente es candidato a Doctor en Ciencias en la Unidad Guadalajara del CINVESTAV. Trabaja como profesor asociado en Instituto Tecnológico de Estudios Superiores de Monterrey, Campus Guadalajara. Sus áreas de interés en investigación son en procesamiento de señales, estimación espectral, teledetección y procesamiento de imágenes. Yuriy V. Shkvarko (M’95−SM’04). Ingeniero (con honores) en Radio Ingeniería en 1976, Candidato en Ciencias (equivalente a PhD) en radio sistemas en 1980 y Doctor en Ciencias en físicas de radio, radar y navegación en 1990, todos del Instituto de Aviación de Kharkov, Ucrania, (ex URSS). De 1976 a 1991, estuvo en el Departamento de Investigación Científica del Instituto de Aviación de Kharkov, (ex URSS), desempeñándose como investigador en diferentes categorías y finalmente como Jefe del Laboratorio de Investigación en Tecnologías de Información para radar y navegación. De 1991 a 1999 fue profesor de tiempo completo en el Departamento de Análisis de Sistemas y Control del Instituto Politécnico Nacional de Ucrania en Kharkov, Ucrania. De 1999 al 2001 fue profesor visitante en la Universidad de Guanajuato en Salamanca, México. En 2001, se integró al CINVESTAV del IPN en Guadalajara, México, como profesor titular de tiempo completo. Sus intereses de investigación son en aplicaciones de procesamiento de señales para percepción remota, radar de formación de imágenes, navegación y comunicaciones, particularmente en problemas inversos, estimación de campos aleatorios, análisis espacial adaptivo, procesamiento estadístico multicanal, arreglo de sensor y fusión de sistemas. Posee 12 patentes y ha publicado 2 libros y más de 100 artículos en Revistas y Memorias de Conferencias sobre estos tópicos. 267