SciELO - Scientific Electronic Library Online

 
vol.24 issue1SUCCESSIONAL PATTERNS ON FOULING PLATES IN THE BAY OF SANTA MARTA, COLOMBIAN CARIBBEANESTRUCTURA DEL MANGLAR EN EL DELTA EXTERIOR DEL RIO MAGDALENA-CIÉNAGA GRANDE DE SANTA MARTA, UNA ZONA TENSIONADA POR ALTERACIONES DEL EQUILIBRIO HÍDRICO author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • On index processCited by Google
  • Have no similar articlesSimilars in SciELO
  • On index processSimilars in Google

Share


Boletín de Investigaciones Marinas y Costeras - INVEMAR

Print version ISSN 0122-9761

Bol. Invest. Mar. Cost. vol.24 no.1 Santa Marta Jan./Dec. 1995

 

ANÁLISIS DE CLASIFICACIÓN DE SERIES TEMPORALES: EL CASO DE LA SALINIDAD EN LA CIÉNAGA GRANDE DE SANTA MARTA, COLOMBIA

 

Ramón Giraldo H.1, Jorge Martínez C.2, Luís H. Hurtado T.4, Sven Zea1, 3, y Eira R. Madera R.1

1Instituto de Investigaciones Marinas y Costeras, INVEMAR, A. A. 1016, Santa Marta, Colombia. (RGH, ERMR, SZ).
2Universidad Nacional de Colombia, Facultad de Ciencias, Departamento de Matemáticas y Estadística. Ciudad Universitaria, Santafé de Bogotá, Colombia. (JMC).
3Universidad Nacional de Colombia, Facultad de Ciencias, Departamento de Biología. Ciudad Universitaria, Santafé de Bogotá, Colombia. (SZ).
4Universidad del Quindío, Departamento de Matemáticas, Armenia, Colombia (LHHT).


 

RESUMEN

Se realizó una clasificación numérica de 21 estaciones de monitoreo del sistema laguno-estuarino comprendido por la Ciénaga Grande de Santa Marta y el Complejo Pajarales, de acuerdo a su similaridad en el comportamiento de la salinidad del agua. Se utilizó información quincenal comprendida entre enero de 1987 y octubre de 1991. Debido a la estructura de autocorrelación de los datos fue necesario emplear los modelos ARIMA de series de tiempo en primer lugar, y posteriormente aplicar una técnica de clasificación normal con los coeficientes de la representación infinita AR calculados para cada estación. Los resultados del análisis fueron coherentes con las hipótesis planteadas acerca de la distribución de la variable en el sistema.


 

ABSTRACT

A numerical classification of 21 monitoring stations of the lagoonal-estuarine system comprised by the Ciénaga Grande de Santa Marta and Pajarales complex was carried out according to their similarity in water salinity behavior. Biweekly data from January 1987 to Octuber 1991 was used. Due to the autocorrelation structure of the data, it was necessary to use first time series ARIM A models followed by normal cluster analysis of the AR coefficients of infinite representation calculated for each station. The results were coherent with hypotheses concerning the distribution of the variable in the system.


 

INTRODUCCIÓN

La Ciénaga Grande de Santa Marta (CGSM) es una laguna costera tropical con características de estuario, ubicada en la costa norte de Colombia, entre los 10° 43'-11° 00'N y 74° 15'-35'W (IGAC, 1973). Por su gran área (450 km2) y ubicación, es considerada como uno de los ecosistemas laguno-estuarinos más importantes de la cuenca del Caribe, tanto a nivel ecológico como económico. Por el costado occidental limita con el Complejo Pajarales (CP); por el oriente lo hace con la Sierra Nevada de Santa Marta (la serranía costera más alta del mundo) y por el norte con el mar Caribe (figura 1). El CP es un sistema de lagunas costeras localizado entre los 10° 45' - 11° 00'N y 74° 25'- 45'W (IGAC, 1973). Se comunica por el occidente con el Río Magdalena por medio del Caño Clarín, por el oriente lo hace con la CGSM a través de los Caños Clarín y Grande y al norte es separado del mar Caribe por la Isla Salamanca (figura 1).

Este ecosistema presenta un avanzado estado de deterioro ambiental (Mancera y Botero, 1993), debido a lo cual se creo un proyecto Colombo -Alemán que busca mejorar las condiciones del mismo, mediante la ejecución de un plan de manejo ambiental. Uno de los aspectos que involucra el plan en su etapa de diagnóstico es la determinación del comportamiento espacio - temporal de las variables más importantes en el sistema.

En varios trabajos realizados en el sistema CGSM - CP (Botero, 1988; Vidal, 1995), se ha mostrado que la salinidad del agua es una de las variables que más rige los cambios del mismo. Esto, unido a la idea a-priori de que las condiciones de salinidad no son homogéneas dentro de la región de estudio y a la causalidad que se le atribuye a la hipersalinización de algunas zonas en el deterioro ambiental de este ecosistema, justifica la realización de un estudio que permita esbozar diferencias y tener un conocimiento sobre el comportamiento de dicha variable dentro del sistema.

Teniendo en cuenta lo anterior, se planteó como objetivo de este trabajo realizar una clasificación de las estaciones de monitoreo de la CGSM y del CP de acuerdo a su similaridad en el comportamiento de la salinidad del agua, de tal forma que se pueda juzgar estadísticamente la hipótesis de estratificación espacial de dicha variable.

 

MATERIALES Y MÉTODOS

La información utilizada para realizar el trabajo comprende mediciones quincenales de salinidad entre enero de 1987 y marzo 1991 en cada una de 21 estaciones de monitoreo de la CGSM y el CP, obtenida de la base de datos fisicoquímicos y biológicos de la CGSM (Santos - Martínez, 1991). En algunos casos hubo necesidad de efectuar promedios para conservar esta estructura, y las observaciones faltantes fueron cubiertas interpolando mediante funciones polinomiales (SAS Institute Inc, 1988a). La tabla 1 presenta las estaciones, con el respectivo periodo de información utilizado; en esta se nota claramente que se dispone de una serie temporal en cada una de las 21 estaciones de monitoreo, y que el tiempo total de muestreo no es el mismo en todas las estaciones.

De acuerdo con el objetivo planteado, el problema se limita a realizar una clasificación automática de series temporales; sin embargo, las condiciones de autocorrelación y de diferencia en los tiempos de muestreo limitan el uso directo de metodologías clásicas multivariadas como el análisis de clasificación jerárquica. Debido a las consideraciones anteriores, se decidió emplear un método alternativo (Piccolo, 1990), que consistió en modelar la serie de tiempo de salinidad correspondiente a cada estación por medio de los modelos ARIMA, utilizando la metodología de Box - Jenkins (Box y Jenkins, 1976), es decir cada serie fue modelada mediante:

          (1)

(1) se denomina modelo ARIMA (P,D,Q)s x (p, d, q), en donde B es el operador de retardo, D y d indican respectivamente el orden de la diferenciación estacional y regular empleada para convertir la serie en estacionaria, s indica el período estacional, P y p indican el orden de la parte autorregresiva , Q y q indican el orden de la parte de media móvil y at es un proceso de ruido blanco. Los modelos fueron escogidos a través del estudio de las funciones de autocorrelación simple y parcial de las series estacionarias, y sus parámetros fueron estimados mediante el algoritmo de mínimos cuadrados no lineales de Marquardt; empleando para esto programa de computador Statgraphics plus versión 5 - Sgplus ( Statistical Graphics Corporation, 1991).

Una vez modeladas las series de tiempo para cada estación mediante (1), estas fueron expresadas de manera común mediante la representación infinita AR (Box y Jenkins, 1976), es decir para cada estación se calcularon los coeficientes πi de la siguiente expresión:

          (2)

Los coeficientes de la representación infinita AR fueron estimados igualando la expresión anterior a (1) e imponiendo la anulación de las potencias Bi Los cálculos se realizaron empleando el paquete de computador PEST (Brockwell et al., 1990).

Una medida de la distancia o similaridad entre dos estaciones de monitoreo está dada por la distancia euclidiana entre los coeficientes de la representación infinita AR, es decir la distancia entre las estaciones X y Y puede calcularse mediante (Piccolo, 1990):

          (3)

Se puede demostrar que D(X,Y) existe para cualquier proceso invertible y satisface las propiedades clásicas de una métrica, es decir no negatividad, simetría y triangularidad. En Piccolo (1990) se listan algunas propiedades adicionales de (3).

Calculada la matriz de distancia entre las estaciones empleando (3), se procedió a aplicar el análisis de clasificación jerárquico, utilizando la técnica de aglomeración por ligamiento promedio (UPGMA) (Crisci y López, 1983), para obtener finalmente un dendograma de clasificación. La matriz de distancia y el dendograma de clasificación se hallaron empleando el paquete SIMCLUST (Wolfe y Chester, 1990).

Una vez realizados los agrupamientos se realizó un análisis de varianza para detectar diferencias significativas entre los grupos conformados con el análisis de clasificación. Dicho análisis fue realizado con los datos originales, lo que implicaba nuevamente tener en cuenta la estructura de autocorrelación de los datos; por esto se implemento un análisis de varianza de medidas repetidas, tomando como factor principal una variable denominada Zona, con ocho niveles que representan los ocho grupos conformados con la clasificación; se tomaron como réplicas las estaciones dentro de cada grupo, y como factor de medidas repetidas el tiempo (Gurevitch y Chester, 1986). Esta técnica prueba diferencias entre los niveles medios de los tratamientos y entre los patrones de comportamiento a través del tiempo de estos mismos. En el primer caso reduce cada conjunto de medidas dentro de la misma unidad experimental a una simple suma y procede después de manera análoga a un análisis de varianza (ANOVA) univariado, mientras que en el segundo caso toma como variable dependiente la suma ponderada de las observaciones, utilizando como ponderadores a polinomios ortogonales (Gurevitch y Chester, 1986; SAS institute inc, 1988b). Teniendo en cuenta lo anterior se calculó la suma de las mediciones de salinidad dentro de cada estación y posteriormente se realizó un ANOVA a una vía con estos datos para probar diferencias entre los niveles promedios de salinidad de las ocho zonas, adicionalmente se realizó una prueba de comparación múltiple de diferencia mínima significativa (DMS) para determinar efectivamente entre cuales de las zonas había diferencias significativas (Sokal y Rohlf, 1981). Estos cálculos fueron realizados en el paquete Statgraphics Sgplus version 5.2 (Statistical Graphics Corporation, 1991). De acuerdo con los propósitos de este trabajo sólo resultó de interés realizar el análisis de tendencias mediante el contraste lineal, para esto se utilizaron datos mensuales de cada estación en la porción del tiempo común a todas ellas, debido a insuficiencia de memoria computacional para realizar los cálculos con más de treinta niveles para el factor de medidas repetidas. Estos resultados se obtuvieron utilizando el paquete SAS (SAS Institute inc, 1988b). El estudio de tendencias de las zonas fue complementado con los gráficos de las series promedios de salinidad de cada una de las ocho zonas.

 

RESULTADOS Y DISCUSIÓN

En la tabla 2 se presentan los modelos ARIMA ajustados a las series de salinidad de las estaciones tenidas en cuenta en el análisis. En primer lugar las series fueron convertidas en estacionarias, en la mayoría de los casos solo diferenciando estacionalmente; posteriormente la estructura de autocorrelación fue modelada empleando procesos simples AR(1) o MA(1).

Basados en los modelos de la tabla 2, se calcularon para cada estación 50 coeficientes de la representación infinita AR, esto teniendo en cuenta la convergencia de dichas series. Utilizando dichos coeficientes y la medida de distancia (3), se generó una matriz de distancia entre las estaciones de monitoreo. Empleando esta matriz se generó un dendograma de clasificación mediante la técnica de ligamiento promedio (figura 2).

De acuerdo al resultado del dendograma con una distancia menor de 1.61 se forman 8 grupos de estaciones (tabla 3). Este resultado es consistente con las ideas a -priori sobre el comportamiento de la salinidad en la región de estudio.

Teniendo en cuenta los resultados de la tabla 4a podemos concluir de acuerdo con el nivel de significancia asociado a la fuente zona (P < 0.01) que existe diferencia altamente significativa entre los niveles promedios de salinidad de al menos dos de las zonas en que fue clasificado el sistema. Posteriormente en la tabla 5 (Prueba de comparación múltiple de DMS) se muestra que con excepción de las zonas estuario y canales de comunicación, existe diferencia significativa (P < 0.05) entre los grupos de estaciones encontrados.

De la tabla 4b podemos concluir que la tendencia de cambio lineal es diferente entre los grupos observados (P < 0.05 para el factor zona); esto también es evidente en los gráficos de las series promedios de cada zona (figura 3), en donde se observa que las series de salinidad pertenecientes a las zonas del CP presentan una pendiente positiva claramente mayor a la de las restantes zonas.

Los resultados del anova validan el agrupamiento realizado, la única excepción es la no diferencia entre la zona estuarina y la de los canales de comunicación. Sin embargo, estas zonas están muy distantes espacialmente (figura 1) y sus niveles de salinidad son consecuencia de fenómenos diferentes. En el caso de la región estuarina el alto nivel de salinidad es debido a su comunicación directa con el mar, mientras que en el de los canales de comunicación es atribuible a la cercanía de estos con la región de pajarales en donde los altos niveles de salinidad son causados por la interrupción de flujos de agua (Botero, 1990). Lo anterior indica que a pesar de que estas zonas presentan niveles similares de salinidad, deben pertenecer a grupos diferentes, puesto que representan distintas condiciones del ecosistema.

De acuerdo a los grupos conformados podemos decir que la salinidad tiene un gradiente oriente occidente en su comportamiento; las estaciones que están al oriente de la CGSM (estaciones de los ríos canal adentro) son las que tienen niveles más bajos de salinidad, al desplazarnos en sentido oriente - occidente dicho nivel aumenta hasta llegar a las estaciones del complejo pajarales en donde se alcanzan sus máximos valores. Una excepción a este comportamiento es el de la estación La Barra (LBA), que es representativa de la región estuarina y como se mencionó arriba su nivel alto de salinidad es explicable por el intercambio directo de aguas con el mar.

 

AGRADECIMIENTOS

Este trabajo fue realizado como parte del proyecto "Estudio ecológico de la Ciénaga Grande de Santa Marta, 3a. etapa" financiado por el Instituto Colombiano para el Desarrollo de la Ciencia y la Tecnología COLCIENCIAS. Los autores agradecen al Instituto de Investigaciones Marinas y Costeras " José Benito Vives D'Andreis" INVEMAR y especialmente a José Ernesto Mancera, jefe del Programa de Lagunas Costeras, por su colaboración en la formulación del trabajo y en la interpretación de los resultados.

 

BIBLIOGRAFÍA

1 Box G. E. P y G. M. Jenkins. 1976. Time series analysis: forecasting and control. Holden - Day, San Francisco, 575 p.        [ Links ]

2 Botero, L. 1988. Estudio ecológico de la Ciénaga Grande de Santa Marta. Primera etapa. Inf. Proy. INVEMAR, Santa Marta, 47 p.         [ Links ]

3 Botero, L. 1990. Massive mangrove mortality on the caribbean coast of Colombia. Vida Silv. Neotrop., 2(2):77 - 78.         [ Links ]

4 Brockwell, P.J., R.A. Davis, y J.V. Mandarino. 1990. Program PEST versión 3.0. New York.         [ Links ]

5 Crisci, J.V. y M. F. López. 1983. Introducción a la teoría y práctica de la taxonomía numérica. Monogr. 26 Ser. Biol., Secr. Gen. OEA., Washington, 132 p.        [ Links ]

6 Gurevitch, J. y S.T. Chester. 1986. Analysis of repeated measures experiments. Ecology, 67(1):251 - 255.         [ Links ]

7 IGAC. 1973. Monografía del departamento del Magdalena. Inst. Geogr. Agustín Codazzi, Bogotá, 162 p.         [ Links ]

8 Mancera, J. E. y L. Botero. 1993. Estudio ecológico de la Ciénaga Grande de Santa Marta, Delta Exterior del Río Magdalena. Mi etapa. Inf. Proy., INVEMAR, Santa Marta, 128 p.         [ Links ]

9 Piccolo, D. 1990. A distance measure for classifying ARIMA models. Jour. Time Ser. Anal., 11 (2): 153 - 164.         [ Links ]

10 Santos - Martínez, A. 1991. Base de datos físico-químicos y biológicos de la Ciénaga Grande de Santa Marta y el Complejo Pajarales. Inf. Proy., INVEMAR, Santa Marta.         [ Links ]

11 SAS Institute, Inc. 1988a. SAS/ETS user's guide, release 6.03 edition. SAS Institute, Inc., Cary (NC), 441 p.         [ Links ]

12 SAS Institute, Inc. 1988b. SAS/STAT user's guide, release 6.03 Edition. SAS Institute Inc., Cary (NC), 1028 p.         [ Links ]

13 Sokal, R. R. y F. J. Rohlf. 1981. Biometry. The Principies and practiceof statisticsin biológical research, 2a edición. W.H. Freeman and Co., San Francisco, 859 p.         [ Links ]

14 Statistical Graphics Corporation. 1991. Statgraphics plus, versión 5.2. Reference Manual. Statistical Graphics Corporation, Rockville (MD).         [ Links ]

15 Vidal, L. A. 1995. Estudio del fitoplancton en el sistema lagunar estuarino tropical Ciénaga Grande de Santa Marta, Colombia, durante el año 1987. Tesis M. Se. Biol. Mar., Univ. Nacional, Bogotá, 270 p.         [ Links ]

16 Wolfe, N. y A. J. Chester. 1990. Package SIMCLUST user's guide. Nat. Mar. Fish. Ser., New York, 6 p.        [ Links ]