SciELO - Scientific Electronic Library Online

 
 issue25DEPOSITION AND PROPERTY CHARACTERISATION OF TaN COATINGS DEPOSITED WITH DIFFERENT NITROGEN CONTENTSAGRICULTURAL MODERNIZATION POLICIES AND RURAL DEVELOPMENT IN COLOMBIA (1996-2008) author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • On index processCited by Google
  • Have no similar articlesSimilars in SciELO
  • On index processSimilars in Google

Share


Revista EIA

Print version ISSN 1794-1237

Rev.EIA.Esc.Ing.Antioq  no.25 Envigado Jan./June 2016

 

ESTIMACIÓN DE PARÁMETROS EN MODELOS NO LINEALES: ALGORITMOS Y APLICACIONES

ESTIMATION OF PARAMETERS IN NONLINEAR MODELS: ALGORITHMS AND APPLICATIONS

ESTIMATIVA DE PARÂMETROS EM MODELOS NÃO LINEARES: ALGORITMOS E APLICAÇÕES

 

Óscar Cornejo Zúñiga1, Rodrigo Rebolledo Vega1

1 Departamento de Ingeniería Industrial, Facultad de Ingeniería, Universidad Católica de la Santísima Concepción, Concepción-Chile. Alonso de Ribera 2850, Concepción, Chile / Tel.: 56-41-2345548. Correo electrónico: rrebolledo@ucsc.cl.

Artículo recibido: 02-III-2015 / Aprobado: 04-III-2016
Disponible online: 30 de octubre de 2016
Discusión abierta hasta octubre de 2017


RESUMEN

En este artículo se muestran diferentes algoritmos para estimar parámetros en modelos no lineales. Se aplican primeramente a una base de datos de problemas clasificados difíciles. Posteriormente, se muestra el comportamiento de los algoritmos para el estudio de crecimiento de la merluza común en machos y hembras, anchoveta y sardina común ajustando un modelo de Von Bertalanffy. Se aplica el test de Cerrato para la comparación de crecimientos entre géneros para la merluza común. Los algoritmos se implementaron en ambiente MATLAB presentando un buen comportamiento en cuanto a tiempo CPU, número de iteraciones y exactitud de la solución encontrada respecto de valores certificados de los problemas de la base de datos.

PALABRAS CLAVE: Regresión no-Lineal; Métodos Cuasi-Newton; Métodos de Región de Confianza; Modelos de Crecimiento.


ABSTRACT

This article shows different algorithms for estimating parameters in nonlinear models. They are applied primarily to a database of problems classified as difficult. Later, the article shows the behavior of the algorithms for the study of growth in the anchovy and sardine, and males and females of the common hake by adjusting a Von Bertalanffy model. The Cerrato test is applied for growth comparisons between sexes for the common hake. The algorithms are implemented in a MATLAB environment, showing good behavior regarding CPU time, number of iterations and exactitude in the solution found with respect to certified values of the problems in the database.

KEY WORDS: Nonlinear regression; Quasi-Newton methods; Confidence region methods; Growth models.


RESUMO

Neste artigo se mostram diferentes algoritmos para estimar parâmetros em modelos não lineares. Aplica-se primeiro a uma base de dados de problemas classificados difíceis. Subsequentemente, se mostra o comportamento de algoritmos para o estudo do crescimento da Merluza comum em machos e fêmeas, anchova e sardinha comum ajustando um modelo de Von Bertalanffy. Que aplica o teste de Cerrato para a comparação do crescimento entre gêneros para a Merluza comum. Os algoritmos se programaram em ambientes MATLAB apresentando um bom desempenho em termos de tempo de CPU, número de iterações e precisão da solução encontrada sobre valores certificados dos problemas da base de dados.

PALAVRAS-CHAVE: Regressão não linear; Métodos Quasi-Newtown; Métodos da região de confiança; Modelos de crescimento.


1. INTRODUCCIÓN

En la mayoría de los estudios que involucren datos, es necesario realizar estimaciones. Por ejemplo, estimar demandas de ciertos productos, estimar parámetros en modelos biológicos de crecimiento, en reacciones químicas, etc. Las aplicaciones son muy variadas en todos los ámbitos del conocimiento: ciencias de la ingeniería, ciencias sociales, medicina, ecología, botánica, ciencias políticas, finanzas, entre otras. Estas estimaciones se estudian mediante modelos que dependen de un conjunto de parámetros y de datos experimentales. Debemos determinar el mejor modelo bajo un cierto criterio, generalmente mínimos cuadrados. Es por ello que se desea conocer algoritmos que posean ciertas propiedades de convergencia que permitan en un tiempo razonable de cálculo estimar los parámetros, sobretodo si el modelo en estudio es no lineal en los parámetros. En este artículo, mostraremos algunos algoritmos y sus principales características que nos permiten estimar los parámetros en modelos no-lineales. El artículo se organiza como sigue: en sección 2 estudiamos los aspectos más relevantes de algoritmos utilizados en el problema general de estimación de parámetros. En sección 3, se muestra el desempeño de los algoritmos sobre una base de datos de problemas catalogados como difíciles. La sección 4 muestra un estudio en el sector pesquero, donde se desea estimar los parámetros de crecimiento para la Anchoveta, Sardina común y Merluza común. La importancia de esta aplicación radica en poder predecir científicamente ciertos aspectos relacionados con la explotación de este recurso y la posibilidad de conocer tiempos de desove, captura o reclutamiento siendo de vital importancia para el manejo racional del recurso marino. Finalmente, en sección 5, se dan algunas conclusiones sobre este trabajo.

2. FORMA GENERAL DE LOS MODELOS DE REGRESIÓN NO LINEAL

Los modelos de regresión no lineal son muy parecidos en la forma general de los modelos de regresión lineal. Cada observación yi se escribe en términos de f(xi; θ) función respuesta no lineal y un término de error aleatorio εi. Para el término de error εi se asume que es una variable normal independiente con varianza σ2, (Draper y Smith, 1966; Neter et al., 1996). Una diferencia importante de los modelos de regresión no lineal es que el número de parámetros θ de la regresión no se relaciona directamente con el número de variables xi en el modelo. La forma general de un modelo de regresión no lineal será de la forma:

donde, xi(m×1) = [xi1 xi 2 ... xim] ; θ(n×1) = [θ1 θ2 ... θn] corresponde al vector de datos y de parámetros respectivamente; y N(0, σ2) es la distribución de probabilidades normal con media 0 y varianza σ2. Para determinar los parámetros resolvemos el problema de optimización siguiente: minimizar la suma de cuadrados del error, ei, donde definimos ei = yi - f (xi , θ) el i-ésimo término de error

con y = (y1, y2,..., ym)t; fi(θ) = f(xi ); f(θ) = (f1(θ), f2(θ),..., fm(θ))t. Notar que (2) corresponde a un problema de optimización irrestricto, el cual se puede resolver por cualquier método general de optimización; ver, por ejemplo, De la Fuente O'Conor (1995), Fletcher (1980), Nocedal y Wright (1999). Sin embargo, dada la forma particular de (2) se han generado métodos para explotar la estructura especial de este tipo de problemas. La matriz Jacobiano J de S(θ) está dada por

Linealizando fi(θ) en un punto θk se tiene el sistema lineal

con d = θ-θk. En el caso de m = n y J(θk) no singular, el sistema lineal anterior nos lleva al método de Newton-Raphson

Si m n o J(θk) es singular, (4) podría no tener soluciones. Por ello, es natural reemplazar (4) por el problema de mínimos cuadrados lineales

que puede considerarse como una linealización de (2). La solución de norma mínima del subproblema anterior es el paso de Gauss-Newton

donde (J(θk)) es la inversa generalizada de Moore-Penrose de J(θk). Si J(θk) es de rango columna completo, entonces la dirección de Gauss-Newton se escribe como

obteniendo el método de Gauss-Newton (G-N).

Notar que en este caso hemos considerado un tamaño de paso αk = 1,k. Sin embargo, podemos considerar en la iteración anterior un tamaño de paso variable en cada iteración. Para ello se considera un tamaño de paso αk dado por Armijo, Goldstein, Wolfe o Thuente; ver, por ejemplo, Nocedal y Wright (1999) dando origen al método de Gauss-Newton amortiguado.

2.1. Métodos Cuasi-Newton

Los métodos Cuasi-Newton consisten en aproximar la matriz Hessiana de cada iteración mediante fórmulas de recurrencia que la relacionen con el valor que toma en iteraciones precedentes, ver Bonnans et al. (2002). La dirección de búsqueda en el método de Newton requiere del cálculo de la matriz Hessiana y que esta sea invertible, cuestión que no se puede garantizar en el curso de las iteraciones. Esto conlleva de un gran esfuerzo del punto de vista computacional en el cálculo de esta matriz. Con el fin de soslayar estas dificultades los métodos Cuasi-Newton aproximan la matriz 2 f(θk) por una matriz definida positiva B, que se modifica en cada iteración y que converge a la verdadera matriz Hessiana; ver Coleman (1984), Frandsen et al. (2004), Lange (2004). Los métodos Cuasi-Newton han demostrado ser bastante eficientes en optimización no lineal y juegan un papel importante en muchas implementaciones. Además, este tipo de métodos, a diferencia de los de Newton, tienen una tasa de convergencia super lineal, lo que frecuentemente desde el punto de vista computacional resulta ser más eficiente que el método analítico de Newton; ver De la Fuente O'Conor (1995), Luenberger (1984). En estos métodos las iteraciones pueden ser más costosas computacionalmente; sin embargo, la información almacenada en la aproximación del Hessiano podría reducir el número total de iteraciones comparado con otros métodos tradicionales (Nocedal y Wright, 1999). Consideremos la solución del sistema

donde Bk es una matriz cuadrada definida positiva.

Otra forma de presentar los métodos Cuasi-Newton es a través de la aproximación de la inversa del Hessiano, es decir, B = H-1. Como todo método iterativo, y según lo mencionado anteriormente, este necesita de una aproximación inicial. En este caso, además, se necesita una aproximación para el Hessiano, es decir B0 inicial, la que frecuentemente se puede tomar como la matriz identidad B0 = I si no existe más información. También B0 se puede considerar como un múltiplo de la matriz identidad, es decir, B0 = ηI, para un η > 0. La matriz Hessiana se actualiza de acuerdo a la siguiente estructura (Nocedal y Wright, 1999):

donde Uk es la expresión que aproxima a la verdadera matriz Hessiana. Veamos dos estrategias posibles. Una condición para definir Bk es (ver Frandsen et al., 2004; Luenberger, 1984; Nocedal y Wright, 1999):

Esta condición se conoce como la condición secante que se basa en una generalización del método de la secante unidimensional, donde la matriz Hessiana 2f(θk) se reemplaza por una aproximación Bk. Definiendo Sk = θk+1 - θk = αkdk y yk = f(θk+1) - f(θk) se obtiene Bk+1Sk = yk. La condición secante (Kelley, 1995) se satisface si:

que se conoce como Condición de Curvatura1 (Frandsen et al., 2004). La matriz de actualización Bk se puede calcular mediante diferentes métodos. A continuación se presentan dos métodos para la actualización de dicha expresión. Este método fue desarrollado por Broyden, Fletcher, Goldfard y Shanno, conocido como BFGS, y toma la siguiente forma. Ver Fletcher (1980), Frandsen et al. (2004), Luenberger (1984):

Uno de los esquemas más inteligentes para la construcción de la inversa del Hessiano, fue propuesto originalmente por Davidon y más tarde desarrollado por Fletcher y Powell, conocido actualmente como DFP. La actualización está dada por: ver Fletcher (1980), Frandsen et al. (2004), Luenberger (1984);

2.2. Región de Confianza

Los métodos de región de confianza ofrecen un marco para garantizar convergencia de los algoritmos. Fueron utilizados primeramente para resolver problemas de mínimos cuadrados no lineales y posteriormente fueron adaptados para problemas de optimización más generales. Estos métodos hacen referencia explícita a un modelo de la función objetivo. En el método de Newton, este es un modelo cuadrático que se obtiene de la serie de Taylor de f alrededor del punto xk. El método "confiará" en este modelo solo en una vecindad del punto θk, definida por la restricción ||p|| ≤ Δk. Esto servirá para limitar el tamaño del paso desde θk a θk+1. El valor de Δk se ajusta, basado en el compromiso entre el modelo

y la función objetivo f(θk+p). Si el compromiso es bueno, entonces el modelo es confiable y se aumenta Δk. Si no, entonces Δk se disminuye. En la iteración k de un método de región de confianza, se resuelve el subproblema

que corresponde a un problema restringido. Las condiciones de optimalidad muestran que pk será la solución del sistema lineal

con λ > 0, (2f(θk)+λI) es definida positiva, y

Si 2f(θk) es definida positiva y Δk es suficientemente grande, entonces la solución del subproblema es solución de

las ecuaciones de Newton. El método necesita de la razón; ver Borlin (2007), Madsen et al. (2004), Mizutani (1999);

Si ρk es negativo el paso debe ser rechazado. Por otro lado si ρk es cercano a 1 existe acuerdo entre el modelo y la función objetivo por lo que es seguro extender la región de confianza para una próxima iteración. Si ρk es positivo pero no cercano a 1 no se altera la región. En cambio si ρk es cercano a 0 o negativo se disminuye la región de confianza. Es importante hacer notar que la solución del subproblema no tiene que ser exacta, se puede aproximar mediante Punto de Cauchy, Dogleg, Steihaug, entre otras. Ver Borlin (2007), Coleman (1984), Madsen et al. (2004), Mizutani (1999).

2.3. Levenberg-Marquardt

El método de Levenberg-Marquardt (L-M) ha sido una técnica estándar para problemas de mínimos cuadrados no lineales, comúnmente usada en varias disciplinas para el ajuste de datos. Este algoritmo iterativo puede ser visto como una combinación de los métodos de máximo descenso y el método de Gauss-Newton. Cuando la solución actual se encuentra lejos del mínimo local, el algoritmo se comporta como el método del máximo descenso: lento, pero garantiza convergencia. Sin embargo, cuando la solución está cercana al mínimo local, el método presenta un comportamiento parecido a Gauss-Newton exhibiendo una rápida convergencia. Levenbertg-Marquardt surge como una buena alternativa para evitar los problemas que el método de Gauss-Newton presenta cuando la matriz Jacobiana es no singular. Levenberg (1944) y Marquardt (1963) sugirieron calcular la dirección pk=θ-θk, mediante la solución del problema, ver Borlin (2007), Coleman (1984), De la Fuente O'Conor (1995), Madsen et al. (2004), Nocedal y Wright (1999);

Notemos que el parámetro μk controla el tamaño del vector pk. Observar además, que pk está definido inclusive si J(θk) no es de rango completo. Conforme μk ∞, ||pk|| 0 y pk se hace paralela a la dirección de máxima pendiente. El método de Levenberg-Marquardt se puede describir y analizar bajo el marco los métodos de regiones de confianza (en efecto, este método se considera como el precursor de los métodos de regiones de confianza para optimización no restringida). Ver Mizutani (1999). Así definido este subproblema, se puede comprobar que es equivalente al siguiente problema de optimización

onde Δk > 0 es el radio de la región de confianza. En efecto, la función modelo mk(p) será:

Se sabe que cuando la solución de Gauss-Newton pGN cae dentro de los límites de la región de confianza, es decir ||pGN|| < Δ, entonces este se puede considerar como una solución del sub-problema. Por otro lado, existe un escalar λ > 0 tal que la solución p = pLM satisface ||p|| = Δ y

la cual corresponde a la actualización del paso a considerar; ver Berghen (2004).

3. PROBLEMAS DE EVALUACIÓN

En esta sección validamos los algoritmos de G-N, G-N amortiguado, BFGS, DFP y L-M mediante problemas de alto grado de dificultad, conocidos como: Thurber, Boxbod, Rat42, Bennett5, Rat43 y Eckerle4, tomados de Statistical Reference Datsets Project (STRD) desarrollado por el staff Statistical Engineering Division and the Mathematical and Computational Sciences Division del National Institute of Standards and Techonology (NIST), que proporciona bases de datos referenciadas con valores certificados. Se presenta, para cada uno de estos problemas, la función a minimizar, los parámetros a estimar que se denotan por β, y las variables independientes que denotaremos por x. Las Tablas resúmenes muestran los parámetros obtenidos por los diferentes métodos, así como los valores certificados (V.C.), además el número de iteraciones (it), el tiempo de cálculo (CPU) y la suma de cuadrados del error (SCE). La evaluación se realizó en un computador con las siguientes características: Intel(R) Core(TM) i7 CPU X990@ 3.47 GHz, 24 Gb de Memoria RAM, disco duro de 1 Terabyte con sistema operativo Windows 7 Professional de 64 bits.

Tabla 1

Tabla 2

3.1. Problemas de Alto Grado de Dificultad

3.1.1. Thurber

Este problema consta de siete parámetros y 37 observaciones y corresponde a un estudio que implica la movilidad de un electrón de un semiconductor. La variable respuesta es una medida de movilidad de electrones, y la variable independiente es el logaritmo natural de la densidad.

3.1.2. BoxBod

Este problema presenta 2 parámetros y 6 observaciones. La variable respuesta es la demanda bioquímica de oxígeno (BOD), y la variable independiente es el tiempo de incubación en días.

3.1.3. Rat42

Este problema consta de tres parámetros y nueve observaciones y corresponde a datos de un ejemplo de cómo ajustar curvas de crecimiento sigmoidal tomadas de Ratkowsky (1983). La variable respuesta es la producción de pasto, y la variable independiente corresponde al tiempo.

3.1.4. Bennett5

Este problema consta de 3 parámetros y 154 observaciones y corresponde a la modelación de magnetización de superconductividad. La variable respuesta es la fuerza del campo magnético, y la variable independiente es el tiempo en minutos.

3.1.5. Eckerle4

Este problema presenta 3 parámetros y 35 observaciones y corresponde al estudio sobre la transmitancia de interferancia circular. La variable respuesta es la transmitancia, y la variable independiente es la longitud de onda.

3.1.6. Rat43

Este problema consta de 4 parámetros y 15 observaciones y corresponde a un estudio de cómo ajustar curvas de crecimiento sigmoidal (Ratkowsky, 1983). La variable respuesta es el peso seco de bulbos de cebolla y cimas, y la variable independiente corresponde al tiempo.

Los algoritmos implementados presentan un buen comportamiento en general, logrando obtener en la mayoría de los casos los valores certificados dados por Statistical Reference Datasets Project (STRD). Los métodos BFGS, DFP y L-Mno alcanzaron los valores certificados para el modelo Bennet5, de tres parámetros y 154 observaciones, pero solo para el parámetro β1. En un caso se debió a que se alcanzó el número máximo de iteraciones (DFP) y en los otros casos (BFGS y L-M) se estaba en presencia de inestabilidades numéricas.

Tabla 3

Tabla 4

Tabla 5

Tabla 6

Figura 1

Figura 2

4. APLICACIÓN EN EL SECTOR PESQUERO

4.1. Introducción

En Chile la pesca es uno de los sectores industriales más importantes en cuanto a cantidades extraídas de un recurso natural. Esto gracias a la gran abundancia de recursos marinos con la que cuenta Chile, y es por esta razón que los estudios de crecimiento y mortalidad de las diferentes especies que constituyen este importante recurso generan un gran interés por parte de los responsables de la explotación y conservación del mencionado sector. Dichos estudios están principalmente orientados a aportar los conocimientos necesarios para mantener en equilibrio los stocks explotados, de manera de hacerlos sustentables en el tiempo. Se estudiarán y expondrán los resultados obtenidos para el crecimiento de Sardinas, Anchovetas y Merluza. Este fenómeno es uno de los casos más importantes y conocidos mundialmente como ejemplo de un comportamiento no lineal. El crecimiento de un ser vivo se puede dividir en dos o tres etapas muy marcadas, en las cuales es posible observar velocidades o tasas de crecimiento muy diferentes. Por lo general, los seres vivos experimentan un primer periodo de crecimiento a tasas muy elevadas, donde registran un gran tamaño en un tiempo relativamente corto. Posteriormente, comienza una segunda etapa donde dicha tasa disminuye notablemente hasta un cierto nivel de poseer una tasa casi nula y el tamaño tiende a estancarse. Ver Blasco (1999). En este estudio es posible encontrar conceptos relativos al crecimiento que pueden ser de un gran interés, como lo puede ser la velocidad de crecimiento, concepto que puede servir para obtener información con respecto al tiempo óptimo de interés para realizar alguna acción sobre un determinado ser vivo, con el fin de poder obtener algún beneficio de este (tiempo de reproducción, edad de captura, madurez sexual, etc.). También, pueden aparecer conceptos como aceleración del crecimiento, la cual indica la tasa absoluta de variación con el tiempo, o la tasa relativa de crecimiento que puede ser útil para comparar tendencias. Sin embargo, el presente trabajo está orientado al sector pesquero con el interés de obtener los parámetros de crecimiento de un modelo de bastante aplicabilidad en dicha área como lo es la ecuación de Von Bertalanffy.

4.2. Modelo de Von Bertalanffy

Un modelo de crecimiento ampliamente usado en el área pesquera es la ecuación de Von Bertanlanffy, que representa el crecimiento en longitud y en peso, ambos en función del tiempo de vida del pez. Este modelo es de crecimiento individual y se aplica a la gran mayoría de los peces. El modelo de Von Bertalanffy ofrece el atractivo de intentar deducir la ecuación a partir de las tasas de anabolismo y catabolismo del animal, que idealmente se obtendrían mediante experiencias de laboratorio (Blasco, 1999). Se tiene que el crecimiento en longitud se modela por la ecuación

mientras que el crecimiento en peso, se estima mediante

donde t es la edad de la especie, (t) y (t) son la longitud y el peso medio en el tiempo t de la especie, L y W representan la longitud y el peso promedio asintótico para la especie respectivamente, k es el parámetro de curvatura, t0 la edad teórica a longitud cero para una especie en particular (constante, que representa la edad que supuestamente debe tener el pez para que su longitud sea igual a cero), b representa la pendiente de la relación longitud-peso, y t representa el error. Una de las principales aplicaciones del conocimiento de la edad es, junto a la longitud y peso del pez, la estimación de curvas de crecimiento. Además, facilita la construcción de claves edad-talla, que permiten conocer las estructuras por edades de las capturas y stock. Otros parámetros importantes que se pueden estimar son: edad de primera madurez y desove, edad de reclutamiento, edad primera captura, etc. Esto permite estimar las abundancias, biomasas y mortalidades por pesca, fundamentalmente para las asignaciones de cuotas de capturas y mantención del recurso. La Figura 3, muestra el comportamiento del modelo de crecimiento de Von Bertalanffy para diferentes valores del parámetro k. Claramente se puede apreciar la importancia de este parámetro en un modelo de crecimiento, donde un valor de k = 0 indicaría la longitud máxima alcanzada por un pez, por lo que el factor de crecimiento sería nulo. Cuando no es posible contar con información de longitud-edad para individuos juveniles, lo que genera un sesgo en la distribución de tallas, se recurre a la técnica del retrocálculo de longitud a edades pretéritas. Para esto, es necesario establecer una relación de proporcionalidad entre el incremento en longitud del otolito y del pez, representada por una regresión lineal o potencial. Con la expresión resultante es factible calcular las longitudes que tuvo el pez cuando se formó un anillo de crecimiento. Los otolitos constituyen una parte muy importante del oído interno de los peces óseos. Una vez obtenidas las edades, el procedimiento utilizado para determinar los parámetros del modelo de Von Bertalanffy es mediante una expresión linealizada de Beberton y Holt (1957). Este método se ha convertido en una de las piedras angulares de la biología pesquera, ya que se ha usado como submodelo en modelos más complejos que describen la dinámica de la población de peces. Solo para la sardina se obtuvo el modelo para el peso, ya que no en todos los casos se disponía de información al respecto.

Figura 3

4.3. Crecimiento de la Anchoveta (Engraulis ringens)

La Anchoveta es un pez pelágico de amplia distribución geográfica en el pacífico suroriental. Se distribuye desde el norte del Perú, hasta la X Región de Chile. Esta especie presenta un ciclo de vida corto, con tres a cuatro años de longevidad, alcanzando la talla de primera madurez sexual a los 11,5 cm. Además, tiene un rápido crecimiento, una elevada tasa de mortalidad natural, forma cardúmenes densos y es una especie muy afectada por factores ambientales en todas las etapas de su ciclo de vida. La Anchoveta en Chile constituye un recurso pesquero que sustenta importantes industrias pesqueras cuyo destino es, principalmente, la elaboración de harina y aceite de pescado.

4.3.1. Resultados

En el estudio realizado a la Anchoveta se aplicó el modelo de Von Bertalanffy y la estimación se realizó sobre la base de un conjunto observado de 1268 ejemplares entre hembras y machos, ya que el crecimiento para ambos géneros es similar. Tal como se observa en la Figura 4, se presenta una curva de crecimiento casi constante hasta aproximadamente los 4,5 años, edad en la cual alcanza su máximo tamaño de crecimiento. Luego de esta edad la Anchoveta tiende a disminuir su crecimiento alcanzando los 16 cm, aproximadamente. Los datos fueron obtenidos del trabajo de Cisterna (2006) y su estudio estimó los siguientes parámetros para el modelo de Von Bertalanffy:

Figura 4

Con estos parámetros se obtuvo un residuo de R=840,7997954. Al aplicar los algoritmos que se muestran en la Tabla 7, se estimaron los parámetros para el modelo. Así, se obtiene el siguiente modelo

Tabla 7

considerando como valores iniciales; L = 19, k = 0,5 año-1 t0 = -0,5. El residuo obtenido mediante estos parámetros fue de R = 842,6249804, siendo menor al obtenido por Cisterna. La Tabla 7 resume el comportamiento de los métodos programados, así como los tiempos de ejecución.

4.4. Crecimiento de Sardina Común (Strangomera bentinki)

Este recurso es el segundo en importancia de la actividad pesquera en la zona centro-sur de Chile. Para mayor información sobre esta especie, ver Peña Saez, 2008.

4.4.1. Resultados

Para la Sardina Común se aplicó el modelo de Von Bertalanffy y la estimación se realizó para un total observado de 792 ejemplares entre hembras y machos, pues no se distingue mayor diferencia en el crecimiento de ambos géneros. La Figura 5, al igual que en el caso de la Anchoveta, muestra una tendencia de crecimiento casi constante, en este caso hasta los 3 años aproximadamente. Posteriormente, el pez no presenta un crecimiento importante llegando a alcanzar los 17 cm. Los datos fueron obtenidos del estudio realizado por Peña, (2008). Su estudio estimó los siguientes parámetros para el modelo de Von Bertalanffy:

Figura 5

Con estos parámetros obtuvo un residuo de R = 1,536, 21968. Los algoritmos presentados en este estudio obtuvieron iguales resultados para todos los parámetros. Así, el modelo estimado queda:

El residuo obtenido con estos parámetros fue de R = 1,536, 18379. Se utilizaron los siguientes valores iniciales: L = 18, k = 0,45 año-1, t0 = -0,82. En la Tabla 8 se resume el comportamiento de los métodos programados.

Tabla 8

4.5. Crecimiento Merluza Común (Merluccius gayi gayi)

Este recurso es uno de los más importantes de la actividad pesquera en la zona centro-sur de Chile. Para mayor información sobre esta especie, ver Instituto de Investigación Pesquera, 2007.

4.5.1. Resultados

4.5.2. Merluza Común (Machos)

Para los ejemplares machos de la merluza común se observaron 2.019 unidades, las cuales se encuentran reflejados en la Figura 6, que entrega la relación longitud-edad. Los datos se obtuvieron de INPESCA y el modelo propuesto por Neira (2006) estimó los siguientes parámetros para el modelo de Von Bertalanffy:

Figura 6

Con estos parámetros se obtuvo un residuo de: R = 47,808, 50972. Por otra parte, todos los algoritmos programados en este trabajo entregan los mismos valores para todos los parámetros. Obtenemos así el siguiente modelo:

con un residuo de: R = 16,178, 744. El residuo disminuye del orden de tres veces lo que implica un mejor ajuste a los datos experimentales. La Figura 6, muestra los datos y un solo ajuste. Una vez realizada la estimación mediante los métodos de Mínimos Cuadrados, notamos que de los 6 métodos programados, todos obtienen los mismos resultados. Solo los métodos BFGS y DFP no lograron converger; sin embargo, al momento de detenerse, estos convergen a los mismos parámetros de aquellos que sí lo lograron. Los resultados obtenidos por el algoritmo utilizaron los siguientes valores iniciales: L = 52, k = 0,36 año-1, t0 = -0,25. La Tabla 9, resume el comportamiento de los métodos programados.

Tabla 9

4.5.3. Merluza Común (Hembras)

Para los ejemplares hembras de la merluza común se observaron 3.517 unidades, las cuales se encuentran reflejados en la Figura 7, que entrega la relación longitud-edad. Del mismo modo que para los Machos los datos fueron obtenidos de INPESCA, y el modelo de Von Bertalanffy estimado por Neira (2006) es el siguiente:

Figura 7

obteniendo un residuo de R = 46,709,7978. Todos los algoritmos presentados en este estudio obtuvieron los mismos valores para los parámetros del modelo de Von Bertalanffy, así obtenemos el siguiente modelo:

con un residuo de R = 37,860, 5497, utilizando los valores iniciales dados por L = 69, k = 0,19, t0 = -0,65. El algoritmo genera una disminución del residuo del orden de 1,2 veces, implicando un mejor ajuste a los datos experimentales. La Figura 7, muestra los datos y el ajuste mediante el algoritmo. Como se observa, ninguna de las dos curvas representa correctamente el comportamiento de los datos. Esto se puede deber a que el modelo empleado (Von Bertalanffy) no representa correctamente el crecimiento de las hembras de Merluza Común para los datos en estudio. En la Tabla 10, se resume el comportamiento de los métodos programados.

Tabla 10

4.6. Test de Cerrato

Comúnmente la igualdad de parámetros de diferentes sexos se puede analizar realizando test estadísticos que demuestren dicha característica. Esta comparación de curvas se puede realizar mediante un análisis multivariado de comparación de crecimientos de Cerrato (1990), basada en la prueba T2 de Hotelling. El test de Cerrato es un procedimiento utilizado para la comparación de crecimientos entre géneros para una determinada especie. En esta ocasión se aplicó el presente test al crecimiento de la Merluza Común, pues el crecimiento para la Sardina y Anchoveta no presenta diferencias notorias entre ambos sexos. Esto ocurre con la Merluza donde la hembra presenta un mayor desarrollo en longitud que el macho. El procedimiento de la prueba de Cerrato (1990) se puede resumir como sigue: los parámetros bajo comparación se agrupan en vectores columnas definidos por

Luego se define la diferencia de vectores como: δ = θ1 - θ2. Ahora se está en condiciones de establecer la hipótesis nula y alternativa respectivamente:

Con base en los valores estimados definimos: d = 1 - 2. Luego, el test estadístico está dado por la siguiente expresión:

donde U = U1 + U2, y Ui representa la matriz de covarianzas. La expresión para la matriz U viene dada por:

donde

y

representa la suma de cuadrado del error. F(θ) representa la matriz de derivadas parciales con respecto de θj. Continuando con el procedimiento, se hace fi = ni - 3, por lo que f* está determinado por

El valor de f* debiera estar entre el más pequeño de los valores de f1 y f2 y la suma de estos. La hipótesis nula se rechaza si

donde Tα2 (p,m) se define como

Siendo Fαp,m - p+1 el punto percentil superior de la distribución F con p y m - p + 1 grados de libertad. Este test también se puede usar en una comparación bivariable (por ejemplo L y k) o inclusive univariable. Los resultados obtenidos del test para la Merluza Común se resumen en el Tabla 11. Como se puede observar de la Tabla 11, queda de manifiesto que los parámetros de crecimiento no son los mismos para ambos géneros de la Merluza Común, por tanto se certifica que existe diferencia en el crecimiento entre hembras y machos.

5. CONCLUSIONES

Se aplicó el modelo de Von Bertalanffy para el crecimiento de la Merluza Común, Anchoveta y Sardina Común, estimando los parámetros de dicho modelo de crecimiento a través de la aplicación de los distintos algoritmos de estimación de parámetros en modelos no lineales. Los resultados obtenidos por los algoritmos de optimización han sido dados a conocer en sus respectivas sub-aplicaciones, es decir, para la Anchoveta, Sardina y Merluza Común. Según estos, para el estudio realizado para la Anchoveta todos los métodos lograron converger a los valores esperados, según Cisterna (2008). En el caso del estudio para la Sardina Común, los resultados fueron diferentes, debido a que DFP como Levenberg-Marquardt no logran converger completamente a los valores obtenidos en Peña Saez (2008), aunque esto se debió principalmente al esfuerzo computacional que demostraron estos métodos en el proceso de determinar el tamaño del paso. El método Dogleg no logra converger debido a que el algoritmo detecta singularidad en la evaluación de la matriz de aproximación de la matriz Hessiana. En el caso de los estudios realizados para la Merluza Común los resultados obtenidos por los algoritmos implementados fueron bastante diferentes a los presentados por Neira (2006). Los métodos programados entregan resultados idénticos, pero diferentes tanto en el valor de los parámetros como los residuos. Al analizar los parámetros obtenidos para las diferentes especies de peces, podemos concluir que para el parámetro L, es correcto describirlo, en la práctica, como la longitud máxima promedio que podría ser alcanzada para las diferentes especies estudiadas (Schnute, 1981). Es decir, para peces como la Anchoveta y la Sardina este valor sería L = 18,42796 y L = 15,78437, respectivamente. En cuanto al parámetro k, este indica el grado de inclinación de la curva de crecimiento por lo que para valores muy altos indica que el pez tiene un corto período de vida, por lo que su tasa de crecimiento es bastante elevada. Esto ocurre en el caso de la Sardina, cuyo corto tiempo de vida hace necesario un valor para este parámetro de k = 0,68649. Por otra parte, la Merluza (Ojeda y Olivares, 1997) posee un período de vida más extenso por lo que el valor del parámetro k es bastante menor. En cuanto al parámetro t0, este corresponde a un valor ficticio, asociado a un período del pez en el cual no se cuenta con información (Schnute, 1981). Es decir, corresponde al tiempo desde que nace hasta que cumple 1 año de edad. En este período el pez experimenta un crecimiento exponencial el cual se detiene al cumplir 1 año (punto de inflexión) y comienza un decrecimiento exponencial. En otras palabras, este parámetro corresponde a la edad del pez cuando tiene una longitud cero. En general, podemos concluir que los algoritmos implementados se comportan de buena manera en cuanto al tiempo CPU empleado en obtener los parámetros, el número de iteraciones y los valores estimados de los parámetros para los problemas de gran dificultad. En cuanto a la aplicación en el sector pesquero, los algoritmos implemetados obtienen mejores resultados que los reportados en la literatura (suma de cuadrados del error menores) siendo estos una buena opción para resolver problemas en otras áreas.

_____________________________
NOTAS
1 La condición de la secante siempre tiene una solución si la condición de curvatura es válida.

REFERENCIAS

Arancibia, H.; Neira, S. (2006). Proyección de mediano plazo de la biomasa de merluza común de chile central mediante un enfoque ecotrófico multiespecífico. Chile: Concepción University.         [ Links ]

Beverton, R.J.H.; Holt, S. (1957). On the Dynamics of Exploited Fish Populations. London: H.M. Stationery Office. 533 p.         [ Links ]

Berghen, F.V. (2004). Levenberg-Marquardt Algorithms Vs Trust Region Algorithms. Belgium: Université Libre de Bruxelles. [Online]. Disponible en: http://www.applied-mathematics.net/LMvsTR/LMvsTR.pdf.         [ Links ]

Blasco, A. [S.F.] La descripción del crecimiento. Informe técnico ocasional Nº6. Valencia, España: Departamento de Ciencia animal, Universidad Politécnica de Valencia.         [ Links ]

Bonnans, J.F.; Gilbert, J.C.; Lemarechal, C.; Sagastizábal, C.A. (2002). Numerical Optimization: Theoretical and Practical Aspects. New York, U.S.A.: Springer-Verlag New York, Inc.         [ Links ]

Börlin, N. (2007). Nonlinear Optimization: trust-region methods. Umea, Sweden: Department of Computing Science, Umea University. [Online]. Disponible en: https://www8.cs.umu.se/kurser/5DA001/HT07/lectures/trust-handouts.pdf.         [ Links ]

Cerrato, R.M. (2011). Interpretable Statistical Tests for Growth Comparisons Using Parameters in the Von Bertalanffy Equation. Canadian Journal of Fisheries and Aquatic Sciences, 47(7), April, pp. 1416-1426.         [ Links ]

Cisterna A., L. E. (2008). Análisis del Crecimiento y Estimación de la Mortalidad natural de "Engraulis ringens" (Jenyns, 1842) (Clupeiformes, engraulidae) en la zona centro sur de Chile, durante el año 2006, tesis (Biología Marina), Chile, Facultad de Ciencias, U.C.S.C.         [ Links ]

Coleman, T.F. (1984). Large Sparse Numerical Optimization. Springer-Verlag Berlin Heidelberg.         [ Links ]

De la Fuente, J.L. (1995). Tecnologías computacionales para sistemas de ecuaciones, optimización lineal y entera. Editorial Reverte S.A. 762 p.         [ Links ]

Draper, N.R.; Smith, H. (1966). Applied Regression Analysis. U.S.A. John Wiley & Sons.         [ Links ]

Fletcher, R. (1980). Practical Methods of Optimization. U.S.A. John Wiley & Sons.         [ Links ]

Frandsen, P.E.; Jonasson, K.; Nielsen, H.B.; Tingleff, O. (2004). Unconstrained Optimization. Denmark: Technical University of Denmark. [Online]. Disponible en: file:///Users/juanignacioplasenzotti/Downloads/imm3217%20(1).pdf.         [ Links ]

Kelley, C.T. (1995). Frontiers in Applied Mathematics: Iterative Methods for Linear and Nonlinear Equations. North Carolina, U.S.A.: North Carolina State University, Society for Industrial and Applied Mathematics.         [ Links ]

Lange, K. (2004) Optimization. U.S.A. Springer-Verlag New York, Inc.         [ Links ]

Luenberger, D.G. (1984) Linear and Nonlinear Programming. Addison-Wesley Publishing Company.         [ Links ]

Madsen, K.; Nielsen, H.B.; Tingleff, O. (2004). Methods for Non-linear Least Squares Problems. Denmark: Technical University of Denmark. [Online]. Disponible en: http://www.ltu.se/cms_fs/1.51590!/nonlinear_least_squares.pdf.         [ Links ]

Mizutani, E. (1999). Powell's Dogleg Trust-Region Steps with the Quasi-Newton Augmen-Ted Hessian for Neural Nonlinear Least-Squares Learning. Berkeley, CA, U.S.A.: Institute of Electrical and Electronics Engineers.         [ Links ]

Neter, J.; Kutner, M.; Nachtsheim, C.; Wasserman W. (1996). Applied Linear Regression Models. 4th edition. U.S.A.: McGraw-Hill/Irwin.         [ Links ]

Nocedal, J.; Wright, S.J. (1999). Numerical Optimization. Springer-Verlag New York, Inc.         [ Links ]

Ojeda, V.; Olivares, J. (1997). Validación de los métodos aplicados en la estimación de edad y crecimiento y determinación de la mortalidad en Merluza Común en la zona centro-sur. Chile: Informes Técnicos del Fondo de Investigación Pesquera - Proyecto #95-15.         [ Links ]

Peña-Saez, M.E. (2008). Análisis de Crecimiento y Estimación de Mortalidad natural de la "Sardina Común" (Strangomera bentincki, NORMAN 1936) en la zona centro sur de Chile, tesis (Biología Marina), Chile, Facultad de Ciencias, U.C.S.C.         [ Links ]

Ratkowsky, D.A. (1983). Nonlinear Regression Modeling: A Unified Practical Approach. New York, U.S.A.: Marcel Dekker, Inc. 288 p.         [ Links ]

Schnute, J. (1981). A Versatile Growth Model with Statistically Stable Parameters. Canadian Journal of Fisheries and Aquatic Sciences, 38(9), April, pp. 1128-1140.         [ Links ]

Subsecretaría de Pesca (2007). Merluza Común, Merluccius gayi gayi (Guichenot, 1848). Chile: Subsecretaría de Pesca - Gobierno de Chile. [Online]. Disponible en: http://www.fip.cl/documentacion/principalespesquerias/archivo_6.pdf.         [ Links ]

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License