<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0124-5996</journal-id>
<journal-title><![CDATA[Revista de Economía Institucional]]></journal-title>
<abbrev-journal-title><![CDATA[Rev.econ.inst.]]></abbrev-journal-title>
<issn>0124-5996</issn>
<publisher>
<publisher-name><![CDATA[Universidad Externado de Colombia]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0124-59962011000200009</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[INFORMACIÓN Y ENTROPÍA EN ECONOMÍA]]></article-title>
<article-title xml:lang="en"><![CDATA[INFORMATION AND ENTROPY IN ECONOMICS]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Montenegro]]></surname>
<given-names><![CDATA[Álvaro]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Pontificia Universidad Javeriana Departamento de Economía ]]></institution>
<addr-line><![CDATA[Bogotá ]]></addr-line>
<country>Colombia</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>07</month>
<year>2011</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>07</month>
<year>2011</year>
</pub-date>
<volume>13</volume>
<numero>25</numero>
<fpage>199</fpage>
<lpage>221</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_arttext&amp;pid=S0124-59962011000200009&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_abstract&amp;pid=S0124-59962011000200009&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_pdf&amp;pid=S0124-59962011000200009&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[Este artículo explora algunos conceptos de la teoría de la información que se desarrollaron inicialmente en física e ingeniería y que hoy se emplean en muchas disciplinas. La información es inversamente proporcional a la probabilidad de ocurrencia de un evento y la entropía el valor esperado de la información. Algunas aplicaciones económicas de estos conceptos se encuentran en la derivación del coeficiente de desigualdad de Theil, del criterio de información de Akaike y en el método de estimación por máxima entropía. El concepto de información también se aplica en el análisis estadístico de cifras financieras. Se presenta una ilustración empírica de la predicción de los precios bursátiles.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[This document explores various information theoretical concepts initially developed in physics and engineering and used today in many other fields. Information is defined as a quantity inversely proportional to the probability that an event happens and entropy is defined as the expected value of information. Some information applications in economics include Theil's inequality index, Akaike's information criterion, and the maximum entropy estimation method. Also, information theoretical concepts have been applied to the statistical analysis of financial data. This paper includes an empirical illustration relating to stock market price forecasting.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[teoría de la información]]></kwd>
<kwd lng="es"><![CDATA[entropía]]></kwd>
<kwd lng="es"><![CDATA[mensajes]]></kwd>
<kwd lng="es"><![CDATA[economía]]></kwd>
<kwd lng="es"><![CDATA[econometría]]></kwd>
<kwd lng="en"><![CDATA[information theory]]></kwd>
<kwd lng="en"><![CDATA[entropy]]></kwd>
<kwd lng="en"><![CDATA[messages]]></kwd>
<kwd lng="en"><![CDATA[economics]]></kwd>
<kwd lng="en"><![CDATA[econometrics]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[   <font size="2" face="verdana">      <p align="center"><font size="4"><b>INFORMACI&Oacute;N Y ENTROP&Iacute;A EN ECONOM&Iacute;A</b></font></p>     <p align="center"><font size="3"><b>INFORMATION AND ENTROPY IN ECONOMICS</b></font></p>      <p align="center"><i>&Aacute;lvaro Montenegro</i><sup>*</sup></p>      <p><sup>*</sup> Doctor en econom&iacute;a, profesor titular del Departamento de Econom&iacute;a de la Pontificia Universidad Javeriana, Bogot&aacute;, Colombia,  &#91;<a href="mailto:amontene@javeriana.edu.co">amontene@javeriana.edu.co</a>&#93;.</p>      <p>Fecha de recepci&oacute;n: 14 de julio de 2011, fecha de modificaci&oacute;n: 27 de octubre de 2011, fecha de aceptaci&oacute;n: 28 de octubre de 2011.</p>  <hr>     <p><font size="3"><b>RESUMEN</b></font></p>      <p>Este art&iacute;culo explora algunos conceptos de la teor&iacute;a de la informaci&oacute;n que se desarrollaron inicialmente en f&iacute;sica e ingenier&iacute;a y que hoy se emplean en muchas disciplinas. La informaci&oacute;n es inversamente proporcional a la probabilidad de ocurrencia de un evento y la entrop&iacute;a el valor esperado de la informaci&oacute;n. Algunas aplicaciones econ&oacute;micas de estos conceptos se encuentran en la derivaci&oacute;n del coeficiente de desigualdad de Theil, del criterio de informaci&oacute;n de Akaike y en el m&eacute;todo de estimaci&oacute;n por m&aacute;xima entrop&iacute;a. El concepto de informaci&oacute;n tambi&eacute;n se aplica en el an&aacute;lisis estad&iacute;stico de cifras financieras. Se presenta una ilustraci&oacute;n emp&iacute;rica de la predicci&oacute;n de los precios burs&aacute;tiles.</p>     <p>&#91;<b>Palabras clave</b>: teor&iacute;a de la informaci&oacute;n, entrop&iacute;a, mensajes, econom&iacute;a, econometr&iacute;a; JEL: A12, C00, G17.&#93; </p>  <hr>     <p><font size="3"><b>ABSTRACT</b></font></p>     ]]></body>
<body><![CDATA[<P>This document explores various information theoretical concepts initially developed in physics and engineering and used today in many other fields. Information is defined as a quantity inversely proportional to the probability that an event happens and entropy is defined as the expected value of information. Some information applications in economics include Theil's inequality index, Akaike's information criterion, and the maximum entropy estimation method. Also, information theoretical concepts have been applied to the statistical analysis of financial data. This paper includes an empirical illustration relating to stock market price forecasting.</P>      <p>&#91;<b>Keywords</b>: information theory, entropy, messages, economics, econometrics; JEL: A12, C00, G17.&#93;</p>  <hr>     <p>Desde el punto de vista econ&oacute;mico, transmitir, recibir y procesar (entender) un texto o mensaje tiene un costo y exige un esfuerzo que solo se justifica si el beneficio esperado es mayor que el costo. El beneficio depende del nivel de informaci&oacute;n contenido en el mensaje.</p>     <p>La teor&iacute;a de la informaci&oacute;n, tambi&eacute;n conocida como estad&iacute;stica de la informaci&oacute;n o teor&iacute;a de la comunicaci&oacute;n, adem&aacute;s de estudiar las formas m&aacute;s eficientes de almacenar, codificar, transmitir y procesar la informaci&oacute;n, se ocupa de la tarea de definir qu&eacute; es informaci&oacute;n.</p>     <p>El concepto de entrop&iacute;a, cercano al de informaci&oacute;n, y asociado con el caos, tuvo origen en la termodin&aacute;mica, donde describe la variaci&oacute;n de la energ&iacute;a no utilizable de un sistema (la cual crece en los sistemas cerrados), y en estad&iacute;stica mec&aacute;nica, donde el concepto se reformul&oacute; para que fuera proporcional al n&uacute;mero de estados que puede tomar potencialmente un sistema; en este sentido, es similar a un espacio muestral. En una formulaci&oacute;n posterior, la cual se sigue en este art&iacute;culo, el contenido de informaci&oacute;n es funci&oacute;n del inverso de las probabilidades de los eventos del espacio muestral, y la entrop&iacute;a es el promedio o valor esperado de dicha informaci&oacute;n.</p>     <p>Para ilustrar esta definici&oacute;n, relacionada con el grado de sorpresa del contenido de un mensaje, veamos algunos ejemplos. Si recibimos el mensaje "ma&ntilde;ana el sol se elevar&aacute; sobre el horizonte", pensaremos que el mensaje no da mucha informaci&oacute;n y no vale la pena gastar recursos en transmitirlo y procesarlo pues solo reporta el hecho predecible de que la tierra continuar&aacute; girando sobre su eje, trayendo el d&iacute;a y la noche tal como ha ocurrido durante millones de a&ntilde;os. Pero, "ma&ntilde;ana el sol no se elevar&aacute; sobre el horizonte" transmite algo que no esper&aacute;bamos, con un alto grado de sorpresa y de informaci&oacute;n.</p>     <p>Intuimos que cuanto mayor sea la sorpresa de lo que se transmite mayor ser&aacute; la cantidad de informaci&oacute;n que contiene el mensaje, y viceversa. El grado de sorpresa se puede asociar al concepto de probabilidad matem&aacute;tica; la sorpresa es mayor cuanto menor sea la probabilidad de ocurrencia del evento reportado, y viceversa. Espec&iacute;ficamente, la cantidad de informaci&oacute;n es inversamente proporcional a la probabilidad de ocurrencia del evento en cuesti&oacute;n. Si es cercana a 1, es decir, si se anuncia algo esperado, como en "ma&ntilde;ana el sol se elevar&aacute; sobre el horizonte" o "el gobierno lamenta la muerte del Papa", la informaci&oacute;n es cercana a 0. Pero si la probabilidad es m&aacute;s baja, como en "ma&ntilde;ana temblar&aacute; en Bogot&aacute;" o "Colombia invade a Estados Unidos", el contenido de informaci&oacute;n es mayor.</p>     <p>Desde el punto de vista de la eficiencia, es razonable esperar que la transmisi&oacute;n de eventos probables requiera menos tiempo (un menor costo promedio) que la transmisi&oacute;n de eventos sorpresivos. Un ejemplo es el c&oacute;digo Morse, cuyos signos m&aacute;s comunes (m&aacute;s probables) se representan en general con menos caracteres y con m&aacute;s caracteres los que menos se usan (<a href="#cua1">cuadro 1</a>). Los caracteres son rayas y puntos, o sus representaciones binarias. Algunas vocales, especialmente la e, y otras letras muy usadas en ingl&eacute;s, tienen c&oacute;digos cortos de dos o tres caracteres. Hay un mensaje en Morse que contiene una gran cantidad de informaci&oacute;n, compuesto por pocos s&iacute;mbolos f&aacute;ciles de reproducir: el pedido de auxilio, SOS, que se transmite como una secuencia de tres puntos, tres rayas y tres puntos:</p>      <p>    <center><img src="img/revistas/rei/v13n25/v13n25a09i1.jpg"></center></p>     ]]></body>
<body><![CDATA[<p>    <center><a name="cua1"><img src="img/revistas/rei/v13n25/v13n25a09c1.jpg"></a></center></p>     <p>     <p><font size="3"><b>M&Eacute;TRICA DE LA INFORMACI&Oacute;N</b></font></p>     <p>Los primeros intentos de enmarcar el tema de la informaci&oacute;n en una teor&iacute;a formal surgieron en los a&ntilde;os veinte, con el trabajo de Hartley (1928), y luego con el trabajo de Shannon (1948), quien subray&oacute; los conceptos probabil&iacute;sticos en el tratamiento de la informaci&oacute;n y de su transmisi&oacute;n<sup><a name="nu1"></a><a href="#num1">1</a></sup>.</p>     <p>Ya se mencion&oacute; que la cantidad de informaci&oacute;n de un mensaje se relaciona con la probabilidad de ocurrencia del evento reportado: a mayor sorpresa m&aacute;s informaci&oacute;n. En t&eacute;rminos formales, sea I la cantidad de informaci&oacute;n y P la probabilidad del evento. I es entonces una funci&oacute;n &fnof; del inverso de P, I = f(1/P), como se ilustra en la <a href="#gra1">gr&aacute;fica 1</a>.</p>     <p>    <center><a name="gra1"><img src="img/revistas/rei/v13n25/v13n25a09g1.jpg"></a></center></p>      <p>Adem&aacute;s, es razonable suponer que la informaci&oacute;n I es una cantidad positiva, continua en P, y que la informaci&oacute;n contenida en dos eventos independientes es la suma de la informaci&oacute;n individual. Se puede mostrar que la &uacute;nica funci&oacute;n que cumple estas propiedades es la logar&iacute;tmica (ver, p. ej., Chen y Alajaji, 2005, cap. 2). As&iacute;, la cantidad de informaci&oacute;n de un mensaje I se define como:</p>     <p>I = log(1/P) = -logP</p>     ]]></body>
<body><![CDATA[<p>donde I es igual a 0 cuando P es igual a 1 (el evento ya se conoc&iacute;a o la noticia se esperaba con total certeza), y muy grande cuando P tiende a 0 (para eventos sorprendentes, como los milagros).</p>     <p>La probabilidad P depende en gran parte de la frecuencia con la que el evento en cuesti&oacute;n haya ocurrido anteriormente y de la manera como va cambiando la percepci&oacute;n de la gente. En consecuencia, la cantidad de informaci&oacute;n I puede cambiar en el tiempo. Por ejemplo, la probabilidad de que ma&ntilde;ana el sol no se eleve sobre el horizonte es casi 0, pero si ma&ntilde;ana no se eleva, la probabilidad de que no se eleve pasado ma&ntilde;ana aumenta, a la vez que disminuye el contenido de informaci&oacute;n de ese mismo mensaje en el futuro.</p>     <p><font size="3"><b>ENFOQUE T&Eacute;CNICO</b></font></p>     <p>Se puede llegar a una definici&oacute;n t&eacute;cnica del contenido de informaci&oacute;n similar a la que se obtiene de manera intuitiva.</p>     <p>El problema es similar a un problema de optimizaci&oacute;n sujeto a restricciones impuestas por la tecnolog&iacute;a disponible y la naturaleza, como el ruido. Los mensajes se originan en una fuente y deben transmitirse a trav&eacute;s de un medio o canal hasta llegar a su destino o receptor. Esto se debe hacer minimizando la distorsi&oacute;n que puedan causar el medio de transmisi&oacute;n y el ruido y, a la vez, maximizando el n&uacute;mero de mensajes enviados por unidad de tiempo, o costo. Es, en resumen, un problema de eficiencia. Por tanto, la cantidad de informaci&oacute;n de un mensaje es proporcional al costo de transmisi&oacute;n.</p>     <p>Desde el punto de vista t&eacute;cnico, la teor&iacute;a de la informaci&oacute;n se concentra en la transmisi&oacute;n binaria, es decir, en la transmisi&oacute;n de unos y ceros, pulsos y no pulsos, rayas y puntos, etc. Un bit (<i>binary unit</i>) es algo que puede tomar uno de esos dos estados.</p>     <p>Cuando solo hay dos mensajes posibles, por ejemplo, {llovi&oacute;, no llovi&oacute;}, basta enviar un uno o un cero. Uno si llovi&oacute; y cero si no llovi&oacute;, o viceversa; en todo caso, esta asignaci&oacute;n, llamada codificaci&oacute;n, debe ser conocida por el receptor. Este uno o cero enviado es un bit. En otras palabras, para enviar un mensaje con dos posibilidades solo es necesario un bit. Pero si se trata de m&aacute;s posibilidades, por ejemplo, {no llovi&oacute;, llovi&oacute; poco, llovi&oacute; el promedio y llovi&oacute; mucho}, necesitamos dos bits de informaci&oacute;n para transmitir estos cuatro mensajes, un uno o un cero seguido por otro uno o cero. As&iacute; formamos los c&oacute;digos 00, 01, 11 o 10, a los que podemos asignar los cuatro mensajes.</p>     <p>Si fueran ocho mensajes necesitar&iacute;amos tres bits de informaci&oacute;n para formar los ocho c&oacute;digos, 000, 001, 011, 111, 110, 100, 101, 010, necesarios para distinguir los ocho mensajes. En resumen, para enviar 2<sup>i</sup> mensajes se requieren I = log<sub>2</sub>2<sup>i</sup> = i bits de informaci&oacute;n.</p>     <p>Cuando los mensajes tienen diferentes probabilidades de ocurrencia pueden existir esquemas distintos para asignar c&oacute;digos con el mismo n&uacute;mero de d&iacute;gitos binarios a cada mensaje de modo que la transmisi&oacute;n sea m&aacute;s eficiente, es decir, que los mensajes se puedan transmitir con menos de log<sub>2</sub>2<sup>i</sup> bits en promedio. En esta formulaci&oacute;n es conveniente expresar el contenido de informaci&oacute;n directamente en t&eacute;rminos de probabilidades.</p>     <p>Supongamos que podemos enviar uno de 8 mensajes: A, B, C, D, E, F, G, H, los cuales tienen diferente probabilidad de ocurrencia. En principio, como ya se se&ntilde;al&oacute;, se podr&iacute;an codificar con tres d&iacute;gitos binarios asign&aacute;ndoles los c&oacute;digos 000, 001, 011, 111, 110, 100, 101, 010, lo que requerir&iacute;a log2<sup>3</sup> = 3. Pero como los mensajes tienen diferentes probabilidades se puede encontrar un esquema m&aacute;s eficiente (que requiera menos bits). Siguiendo un ejemplo que se encuentra en Touretzky (2004), supongamos que los 8 mensajes tienen probabilidades, 1/2, 1/4, 1/8, 1/16, 1/32, 1/64, 1/128, 1/128, que suman 1. En vez de codificar con tres d&iacute;gitos cada mensaje, usamos un c&oacute;digo de longitud variable. Si enviamos el mensaje A transmitimos 0, si enviamos B transmitimos 10; as&iacute;, 010 representa AB, y as&iacute; sucesivamente, como se muestra a continuaci&oacute;n:</p>     ]]></body>
<body><![CDATA[<p><img src="img/revistas/rei/v13n25/v13n25a09i2.jpg"></p>      <p>En la codificaci&oacute;n anterior no se usan, por ejemplo, los c&oacute;digos 1 para B o 00 para C porque en una secuencia de transmisi&oacute;n no se sabr&iacute;a d&oacute;nde empiezan y d&oacute;nde terminan los c&oacute;digos de cada mensaje, donde el 0 indica el fin de un mensaje (excepto para H, el cual se reconoce f&aacute;cilmente que est&aacute; compuesto por siete unos). La transmisi&oacute;n de cada mensaje individual requiere tantos bits como d&iacute;gitos binarios tenga su c&oacute;digo, pero el valor esperado del esquema de codificaci&oacute;n es menor que 3; seg&uacute;n esta codificaci&oacute;n la transmisi&oacute;n requerir&iacute;a, en promedio:</p>      <p><img src="img/revistas/rei/v13n25/v13n25a09f1.jpg"></p>      <p>menos de 3 bits. El resultado anterior debe entenderse en el contexto de un gran n&uacute;mero de repeticiones, de un promedio o valor esperado, pues la transmisi&oacute;n de un solo mensaje requiere un costo proporcional a la longitud de su c&oacute;digo. Es en la repetici&oacute;n donde se obtienen ahorros en t&eacute;rminos del costo promedio por mensaje. En otras palabras, en el ejemplo anterior la transmisi&oacute;n de 1.000 mensajes requerir&iacute;a 1.980 bits en promedio, en vez de 3.000. El promedio anterior es la entrop&iacute;a que se discute a continuaci&oacute;n.</p>     <p><font size="3"><b>ENTROP&Iacute;A</b></font></p>     <p>El resultado anterior se formaliza partiendo de un conjunto de mensajes independientes {m<sub>1</sub>, m<sub>2</sub>,..., m<sub>n</sub>} llamados alfabeto, con probabilidades {P<sub>1</sub>, P<sub>2</sub>,..., P<sub>n</sub>}. Los mensajes pueden ser las letras A, B,&hellip;, H del ejemplo anterior o los s&iacute;mbolos del alfabeto Morse.</p>     <p>Si se env&iacute;a una serie N de estos mensajes, donde N es grande, habr&aacute; aproximadamente P<sub>1</sub>N mensajes m<sub>1</sub>, P<sub>2</sub>N mensajes m<sub>2</sub> y as&iacute; sucesivamente. Todas las secuencias S tendr&aacute;n la misma probabilidad de ocurrencia porque contendr&aacute;n el mismo n&uacute;mero de mensajes mi, probabilidad que ser&aacute; expresada por el producto de las probabilidades de repetir cada m<sub>i</sub>, donde i = 1, 2,..., n:</p>     <p><img src="img/revistas/rei/v13n25/v13n25a09i0.jpg"></p>      <p>Como ejemplo, supongamos los eventos {llovi&oacute;, no llovi&oacute;} con probabilidades {0,1, 0,9}. Si N es grande la probabilidad de cualquier secuencia ser&aacute; la misma: (0,1)<sup>01N</sup>(0,9)<sup>0,9N</sup>, aunque el orden de env&iacute;o de los mensajes cambia de una serie otra.</p>     <p>Retomando la definici&oacute;n de informaci&oacute;n como el logaritmo del inverso de la probabilidad P(S), podemos escribir la informaci&oacute;n de la secuencia S como:</p> <img src="img/revistas/rei/v13n25/v13n25a09f2.jpg">      ]]></body>
<body><![CDATA[<p>Ahora definimos:</p>     <p><img src="img/revistas/rei/v13n25/v13n25a09f3.jpg"></p>      <p>como el contenido promedio de informaci&oacute;n por mensaje, o sea la esperanza matem&aacute;tica de cada mensaje. Tambi&eacute;n se puede interpretar como el contenido promedio de la incertidumbre asociada a la fuente de mensajes. La variable H fue introducida por Shannon (1948), quien la llam&oacute; entrop&iacute;a, tomando prestado el nombre de un concepto de la mec&aacute;nica estad&iacute;stica que usa la misma f&oacute;rmula. La entrop&iacute;a representa el m&iacute;nimo n&uacute;mero de bits (costo) que se requiere en promedio para transmitir un mensaje.</p>      <p>En la f&oacute;rmula de H se considera que si la probabilidad de uno de los mensajes es 0 su contribuci&oacute;n a la entrop&iacute;a tambi&eacute;n es 0, lo cual se justifica matem&aacute;ticamente porque:</p>     <p><img src="img/revistas/rei/v13n25/v13n25a09f4.jpg"></p>      <p>En general, en t&eacute;rminos de una variable <i>x</i> y su probabilidad, definimos la entrop&iacute;a como el valor esperado del contenido de informaci&oacute;n:</p>     <p><img src="img/revistas/rei/v13n25/v13n25a09f5.jpg"></p>     <p>La entrop&iacute;a H(X) es mayor cuanto m&aacute;s uniforme (m&aacute;s equiprobable) es la distribuci&oacute;n de X, y llega a un m&aacute;ximo cuando todos los elementos de X tienen la misma probabilidad. Si X puede tomar un n&uacute;mero L de valores o estados posibles, se puede demostrar que la entrop&iacute;a est&aacute; acotada como sigue:</p>     <p>0 &le; H ( X) &le; logL</p>     <p>expresi&oacute;n que es igual a 0 si P(x)=1, lo que implica que X es determin&iacute;stica y tiene 0 incertidumbre, e igual a logL si P(x)=1/L para todo x (ver Massey, 1998, cap. 1). Es decir, la m&aacute;xima entrop&iacute;a se alcanza cuando todos los estados posibles tienen la misma probabilidad de ocurrencia.</p>     ]]></body>
<body><![CDATA[<p>Como se se&ntilde;al&oacute; antes, las unidades se denominan bits cuando la base del logaritmo es 2. Pero se puede utilizar una base diferente; para el logaritmo natural las unidades de informaci&oacute;n se denominan nats. En adelante se usa la base 2 salvo que se indique lo contrario.</p>     <p><font size="3"><b>LA ENTROP&Iacute;A EN LA F&Iacute;SICA</b></font></p>     <p>El concepto de entrop&iacute;a se desarroll&oacute; en la segunda mitad del siglo XIX, primero en termodin&aacute;mica por Rudolf Clausius, quien acu&ntilde;&oacute; el t&eacute;rmino, y luego en mec&aacute;nica estad&iacute;stica por Ludwig Boltzmann, quien la present&oacute; en t&eacute;rminos probabil&iacute;sticos. En f&iacute;sica, la entrop&iacute;a es una variable de estado, como la temperatura, el volumen, la presi&oacute;n o la energ&iacute;a interna, que describe el estado del sistema en un momento dado, en contraste con variables como velocidad, posici&oacute;n o masa que pueden describir las condiciones individuales de las mol&eacute;culas que conforman el sistema.</p>     <p>En termodin&aacute;mica, y de manera informal, la entrop&iacute;a tiene que ver con el hecho de que no toda la energ&iacute;a que entra en un proceso (p. ej., el accionar de un motor) se aprovecha para realizar trabajo ya que parte se pierde en forma de calor o ruido. Si bien la energ&iacute;a se conserva, parte se transforma en formas menos &uacute;tiles para realizar trabajo. La f&oacute;rmula derivada en termodin&aacute;mica relaciona el cambio en la entrop&iacute;a con la transferencia de calor Q realizada a una temperatura T, y se expresa como:</p>     <p><img src="img/revistas/rei/v13n25/v13n25a09f6.jpg"></p>      <p>Se puede demostrar que esta formulaci&oacute;n es compatible con la definici&oacute;n de entrop&iacute;a en mec&aacute;nica estad&iacute;stica:</p>     <p><img src="img/revistas/rei/v13n25/v13n25a09f7.jpg"></p>      <p>en apariencia m&aacute;s cercana a la f&oacute;rmula de Shannon que a la f&oacute;rmula termodin&aacute;mica. En la formulaci&oacute;n de mec&aacute;nica estad&iacute;stica k es la constante de Boltzmann y &Omega; es el n&uacute;mero de estados que puede tomar un sistema. Por ejemplo, si se lanza un dado, &Omega; es 6; si se lanzan dos y se registra el resultado de las caras, &Omega; es 36. En f&iacute;sica, un sistema puede contener billones de mol&eacute;culas, cada una de las cuales puede ser descrita con la ayuda de varias coordenadas de manera que &Omega; alcanza f&aacute;cilmente el orden de billones de billones. Si suponemos estados equiprobables y notamos que, en esencia, el inverso de &Omega; es la probabilidad de cada uno de ellos (P = 1/Q) y hacemos k = 1, nos acercamos a la noci&oacute;n de entrop&iacute;a de la informaci&oacute;n:</p>     <p><img src="img/revistas/rei/v13n25/v13n25a09f8.jpg"></p>     <p>En f&iacute;sica, la entrop&iacute;a es una medida del desorden o del caos del sistema. En teor&iacute;a de la informaci&oacute;n, es una medida de la incertidumbre asociada a la fuente de mensajes. No hay consenso sobre si hay o no hay relaci&oacute;n entre ambos tipos de entrop&iacute;a, excepto que tienen f&oacute;rmulas similares.</p>     ]]></body>
<body><![CDATA[<p>La primera ley de la termodin&aacute;mica dice que la energ&iacute;a se conserva. La segunda ley de la termodin&aacute;mica, o ley de la entrop&iacute;a, implica que, si bien la energ&iacute;a se conserva, el tipo de energ&iacute;a utilizable para hacer trabajo disminuye o al menos no aumenta en un sistema cerrado. La entrop&iacute;a en un sistema cerrado mide la cantidad de energ&iacute;a inutilizable. La segunda ley implica que el calor fluye del cuerpo con m&aacute;s temperatura al cuerpo con menos temperatura y no al contrario. Hoy es menos popular la definici&oacute;n de entrop&iacute;a como aumento del desorden o caos y m&aacute;s popular la definici&oacute;n de dispersi&oacute;n espont&aacute;nea de energ&iacute;a o como medida de procesos irreversibles.</p>      <p><font size="3"><b>ENTROP&Iacute;A MULTIVARIADA</b></font></p>     <p>La definici&oacute;n de entrop&iacute;a puede extenderse a vectores de variables. Para el vector X, Y, caracterizado por la distribuci&oacute;n de probabilidad conjunta P(x, y), la entrop&iacute;a conjunta se escribe:</p>     <p><img src="img/revistas/rei/v13n25/v13n25a09f9.jpg"></p>      <p>Para variables independientes, cuya distribuci&oacute;n conjunta se puede expresar como P(x, y) = P(x)P(y), la entrop&iacute;a es aditiva:</p>     <p>H(X, Y) = H(X) + H(Y)</p>     <p>De manera similar, se puede definir la entrop&iacute;a condicional como una cantidad que indica el comportamiento de la informaci&oacute;n o incertidumbre de una variable cuando se conoce otra:</p>     <p><img src="img/revistas/rei/v13n25/v13n25a09f10.jpg"></p>      <p>Recordemos que estamos escribiendo el valor esperado de P(x/y), que es una funci&oacute;n de <i>x</i> y <i>y</i>, de modo que la distribuci&oacute;n de probabilidad apropiada es la distribuci&oacute;n conjunta de <i>x</i> y <i>y</i>, P(x, y). Si X puede tomar un n&uacute;mero de L valores o estados posibles, se puede demostrar que:</p>     <p>0 &le; H(X/Y) &le; logL</p>     ]]></body>
<body><![CDATA[<p>igual a 0 si P(x/y) = 1 para alg&uacute;n <i>x</i> e igual a logL si P(x/y) = 1/L para todo <i>x</i>.     <p>Haciendo uso de P(x, y) = P(x)P(y/x) = P(y)P(x/y), la entrop&iacute;a conjunta puede relacionarse con la entrop&iacute;a condicional a trav&eacute;s de:</p>     <p>H(X, Y) = H(X) + H(Y/X) = H(Y) + H(X/Y)</p>     <p>Se puede demostrar que H(X/Y) &le; H(X), cumpliendo la igualdad cuando X y Y son independientes (ver Chen y Alajaji, 2005); el conocimiento de Y da informaci&oacute;n adicional que puede reducir la incertidumbre sobre X (pero nunca aumentarla). En el extremo, H(X/Y) = 0 indicar&iacute;a que X se torna determin&iacute;stica luego de conocer Y. De lo anterior se deduce que H(X, Y) &le; H(X) + H(Y), cumpliendo la igualdad cuando X y Y son independientes.</p>     <p>El concepto de informaci&oacute;n mutua se define como:</p>     <p><img src="img/revistas/rei/v13n25/v13n25a09f11.jpg"></p>      <p>donde el &uacute;ltimo t&eacute;rmino de la derecha carece de signo negativo porque equivale a H(X/Y) - H(X). N&oacute;tese que la expresi&oacute;n es sim&eacute;trica, es decir, I(X; Y) = I(Y; X). La informaci&oacute;n mutua refleja la informaci&oacute;n que una variable proporciona acerca de la otra; mide la dependencia entre X y Y. En general:</p>      <p>0 &le; I(X; Y) &le; min&#91;H(X), H(Y)&#93;</p>      <p>que es igual a 0 cuando X y Y son independientes e igual a min&#91;H(X), H(Y)&#93; cuando X y Y se relacionan determin&iacute;sticamente. Otra formulaci&oacute;n es:</p>     <p>I(X; Y) = H(X) + H(Y) - H(X, Y)</p>     ]]></body>
<body><![CDATA[<p>denotando la informaci&oacute;n mutua como la intersecci&oacute;n de H(X) y H(Y).</p>     <p>Otro concepto muy &uacute;til es el de entrop&iacute;a relativa de Kullback-Leibler, que mide la divergencia o distancia entre dos distribuciones de probabilidad definidas sobre los mismos valores de x:</p>     <p><img src="img/revistas/rei/v13n25/v13n25a09f12.jpg"></p>      <p>Se puede demostrar que D<sub>KL</sub>(P, Q) &ge; 0 e igual a 0 si ambas distribuciones son iguales para todo x (ver, p. ej., Massey, 1998, cap. 1). Por otro lado, la entrop&iacute;a relativa de Kullback-Leibler no es sim&eacute;trica, D<sub>KL</sub> (P, Q) &ne; D<sub>KL</sub>(Q, P); si P(x) es diferente de 0 mientras alg&uacute;n Q(x) es 0, D<sub>KL</sub>(P, Q) = &infin; pero D<sub>KL</sub>(Q, P) no. N&oacute;tese que la informaci&oacute;n mutua puede expresarse como:</p>     <p>I(X; Y) = D<sub>KL</sub> (P(x, y), (P(x)P(y))</p>     <p>La <a href="#gra2">gr&aacute;fica 2</a>, tomada de Chen y Alajaji (2005, 37), muestra un diagrama de Venn que ilustra la interrelaci&oacute;n de estos conceptos.</p>     <p>    <center><a name="gra2"><img src="img/revistas/rei/v13n25/v13n25a09g2.jpg"></a></center></p>      <p>Tambi&eacute;n existen versiones de entrop&iacute;a para variables continuas:</p>     <p><img src="img/revistas/rei/v13n25/v13n25a09f13.jpg"></p>     ]]></body>
<body><![CDATA[<p>las cuales no necesariamente son positivas porque las funciones de densidad continuas pueden tomar valores mayores de 1.</p>     <p><font size="3"><b>APUESTAS</b></font></p>     <p>Una de las primeras aplicaciones de estos conceptos de informaci&oacute;n y entrop&iacute;a a un campo distinto de la codificaci&oacute;n y transmisi&oacute;n de informaci&oacute;n se encuentra en un art&iacute;culo de Kelly (1956) sobre las apuestas con informaci&oacute;n privilegiada. Kelly trata varios casos. En todos, un apostador obtiene informaci&oacute;n sobre el resultado de una apuesta a trav&eacute;s de un canal de comunicaci&oacute;n contaminado por ruido que puede inducir errores. El apostador recibe la informaci&oacute;n antes que el p&uacute;blico en general.</p>     <p>El primer caso trata de dos posibles resultados, es decir, un resultado binario donde el mensaje transmitido tiene una probabilidad p de ser transmitido con error y una probabilidad 1 - p de ser transmitido sin error. Si el apostador apuesta todo su capital (a todo o nada) en cada una de las N rondas, maximiza su valor esperado:</p>     <p>EV<sub>N</sub> = &#91;2(1 - p)&#93;<sup>N</sup>V<sub>0</sub></p>     <p>donde V<sub>0</sub> es el capital inicial y V<sub>N</sub> el final. Sin embargo, si N es grande el apostador perder&aacute; todo en alg&uacute;n momento con una probabilidad igual a 1. Si en vez de apostar todo apuesta una fracci&oacute;n <font face="palatino Linotype" size="3"><i>l</i></font> de su capital tenemos:</p>     <p>V<sub>N</sub> = (1+<font face="palatino Linotype" size="3"><i>l</i></font>)<sup>W</sup> (1-<font face="palatino Linotype" size="3"><i>l</i></font>)<sup>L</sup>V0</p>     <p>donde W es el n&uacute;mero de veces que gana y L es el n&uacute;mero de veces que pierde en las N rondas. La tasa de ganancia exponencial ser&aacute;:</p>      <p><img src="img/revistas/rei/v13n25/v13n25a09f14.jpg"></p>     <p>donde G es la ganancia por per&iacute;odo en 2<sup>GN</sup> = V<sub>N</sub>/V<sub>0</sub> (si en vez del logaritmo en base 2 usamos el logaritmo natural, la expresi&oacute;n es e<sup>GN </sup>= V<sub>N</sub>/V<sub>0</sub>). Esta expresi&oacute;n se maximiza con respecto a <font face="palatino Linotype" size="3"><i>l</i></font> derivando e igualando a 0, y se obtiene:</p>      ]]></body>
<body><![CDATA[<p><img src="img/revistas/rei/v13n25/v13n25a09f15.jpg"></p>     <p>Remplazando en G, obtenemos:</p>     <p>G<sub>max</sub> = (1 - p)log2(1 - p)+plog2p = 1 + (1 - p) log(1 - p)+plogp</p>     <p>que depende de la entrop&iacute;a de la transmisi&oacute;n. N&oacute;tese que, por ser una entrop&iacute;a binaria, la cantidad (1 - p)log(1 - p)+plogp var&iacute;a entre 0 y -1, con lo cual 0 &le; G<sub>max</sub> &le; 1. Kelly muestra que, en el largo plazo, un apostador que escoja la fracci&oacute;n <font face="palatino Linotype" size="3"><i>l</i></font> as&iacute; obtenida, superar&aacute; a otro que invierta una fracci&oacute;n diferente.</p>     <p>Generalizando, en el segundo caso Kelly supone varios mensajes de entrada excluyentes, s, y no necesariamente equiprobables. La informaci&oacute;n privilegiada -en el sentido de que al apostador se le transmite el resultado (de una carrera de caballos, p. ej.) antes que el p&uacute;blico en general lo conozca- puede estar distorsionada por ruido o porque el apostador no conf&iacute;a plenamente en su fuente. Por ello se involucran probabilidades condicionales en el c&aacute;lculo. Kelly supone que el apostador mantiene invertido todo su capital:</p>     <p><img src="img/revistas/rei/v13n25/v13n25a09f16.jpg"></p>     <p>donde a(s/r) es la proporci&oacute;n del capital que apuesta a s despu&eacute;s de recibir el mensaje r. El capital del apostador evoluciona as&iacute;:</p>     <p><img src="img/revistas/rei/v13n25/v13n25a09f17.jpg"></p>     <p>donde W es el n&uacute;mero de veces que se transmite s y se recibe r, y <font face="palatino Linotype" size="3">&alpha;</font><sub>s </sub>son relaciones de probabilidades <i>(odds ratio), </i>esto es, el n&uacute;mero de veces que se multiplica el valor apostado si ocurre s.</p>     <p>Al final de la primera ronda, V<sub>1</sub> ser&aacute; igual a V<sub>0</sub> multiplicado por a(s/r)<font face="palatino Linotype" size="3">&alpha;</font><sub>s</sub> (con los datos del s que haya ganado en esa ronda); al final de la segunda ronda, <i>V<sub>2</sub> </i>ser&aacute; igual a <i>V<sub>1</sub> </i>multiplicado por a(s/r)<font face="palatino Linotype" size="3">&alpha;</font><sub>s</sub> (con los datos del s que haya ganado en la segunda ronda), y as&iacute; sucesivamente.</p>      ]]></body>
<body><![CDATA[<p>Para el s ganador, el capital aumenta en las rondas donde a(s/r)<font face="palatino Linotype" size="3">&alpha;</font><sub>s</sub> &gt; 1 y disminuye en las rondas donde a(s/r)a<sub>s</sub> &lt; 1.</p>     <p>Tomando logaritmos y un N grande, obtenemos la tasa de ganancia exponencial:</p>     <p><img src="img/revistas/rei/v13n25/v13n25a09f18.jpg"></p>     <p>donde P(s,r) es la probabilidad conjunta de s y <i>r, </i>y P(s) es la probabilidad de s.</p>     <p>Suponiendo que las apuestas sean justas (<i>fair odds</i>)<i>, </i>esto es <font face="palatino Linotype" size="3">&alpha;</font><sub>s</sub> = 1/P(s) , tenemos: </p>     <p><img src="img/revistas/rei/v13n25/v13n25a09f19.jpg"></p>     <p>donde <img src="img/revistas/rei/v13n25/v13n25a09f20.jpg"> es la entrop&iacute;a de la fuente.</p>     <p>Dado un resultado recibido r, la ganancia G se maximiza escogiendo a(s/r). La expresi&oacute;n del lagrangiano <img src="img/revistas/rei/v13n25/v13n25a09i00.jpg"> sujeto a <img src="img/revistas/rei/v13n25/v13n25a09f20a.jpg">, es:</p> <img src="img/revistas/rei/v13n25/v13n25a09f21.jpg">     <p>cuyas condiciones de primer orden son:</p> <img src="img/revistas/rei/v13n25/v13n25a09f22.jpg">     <p>De la primera condici&oacute;n se obtiene:</p> <img src="img/revistas/rei/v13n25/v13n25a09f23.jpg">     ]]></body>
<body><![CDATA[<p>Y sustituy&eacute;ndola en la segunda se llega a:</p> <img src="img/revistas/rei/v13n25/v13n25a09f24.jpg">     <p>As&iacute;, la primera se transforma en:</p> <img src="img/revistas/rei/v13n25/v13n25a09f25.jpg">     <p>Finalmente, despejando a (s/r) obtenemos:</p> <img src="img/revistas/rei/v13n25/v13n25a09f26.jpg">     '</p>     <p>lo que implica que el apostador maximiza su ganancia escogiendo cada a(s/r) de manera proporcional a la probabilidad de s dado el mensaje recibido r. El valor m&aacute;ximo de la tasa de ganancia ser&aacute;:</p> <img src="img/revistas/rei/v13n25/v13n25a09f27.jpg">     <p>donde H(X) - H(X/Y) = I(X; Y) es la informaci&oacute;n mutua antes descrita, que mide la dependencia entre variables y tiende a 0 cuando hay independencia total y es mayor que 0 seg&uacute;n el grado de dependencia.</p>      <p>Aun si <font face="palatino Linotype" size="3">&alpha;</font><sub>s</sub> &ne; 1/P(s), lo que quiere decir que las probabilidades no corresponden a las apuestas hechas por el p&uacute;blico <i>(unfair odds), </i>Kelley demuestra que la ganancia G se m&aacute;xima escogiendo a(s/r) = P(s/r), es decir, que el apostador ignora las probabilidades impl&iacute;citas en las apuestas que hace el p&uacute;blico <font face="palatino Linotype" size="3">&alpha;</font><sub>s</sub>,</p> <img src="img/revistas/rei/v13n25/v13n25a09f28.jpg">                               <p>donde <img src="img/revistas/rei/v13n25/v13n25a09f29.jpg"></p>     <p>En otros contextos, las apuestas p&uacute;blicas <i>(odds) </i>podr&iacute;an corresponder a las predicciones de los analistas del mercado burs&aacute;til, mientras que las probabilidades condicionales P(s/r) podr&iacute;an ser las que surgen del an&aacute;lisis propio del inversionista, incluyendo informaci&oacute;n privilegiada.</p>     <p><font size="3"><b>ALGUNAS APLICACIONES ECON&Oacute;MICAS</b></font></p>     <p>En econom&iacute;a, el concepto de entrop&iacute;a se aplica en dos &aacute;reas: aquellas que tienen semejanzas con la termodin&aacute;mica, como la degradaci&oacute;n de las habilidades productivas, y aquellas que se refieren al contenido de la informaci&oacute;n y su utilizaci&oacute;n en el an&aacute;lisis de datos.</p>     ]]></body>
<body><![CDATA[<p>El creciente inter&eacute;s en la combinaci&oacute;n de conceptos econ&oacute;micos y f&iacute;sicos se aprecia en publicaciones como la revista <i>Physica A</i>, cuya secci&oacute;n permanente titulada "Econophysics" incluye estudios que analizan variables econ&oacute;micas desde la &oacute;ptica de la mec&aacute;nica estad&iacute;stica y usando conceptos te&oacute;ricos de la f&iacute;sica: entrop&iacute;a, leyes de potencia, movimiento browniano, etc.</p>     <p>Georgescu-Roegen (1971) examina los l&iacute;mites que la entrop&iacute;a impone al crecimiento econ&oacute;mico; su analog&iacute;a del reloj de arena ilustra c&oacute;mo un sistema cerrado, sin intercambio de energ&iacute;a con el exterior, pierde capacidad para hacer trabajo productivo. La arena que va cayendo pierde su energ&iacute;a potencial o habilidad para realizar trabajo. Puede argumentarse que nuestro sistema no es cerrado ya que recibe energ&iacute;a del sol. Sin embargo, esta energ&iacute;a fluye a una tasa fnita, como la arena que cae por la restricci&oacute;n en la mitad del reloj. El autor subraya que este concepto de restricci&oacute;n en la tasa de transmisi&oacute;n de energ&iacute;a est&aacute; ausente en los modelos neocl&aacute;sicos, empezando por el diagrama tradicional del flujo circular de la producci&oacute;n y la distribuci&oacute;n.</p>     <p>Samuelson (1986) y Smith y Foley (2002) encuentran analog&iacute;as entre la teor&iacute;a econ&oacute;mica neocl&aacute;sica y las leyes de la termodin&aacute;mica. En un estudio de la sostenibilidad del crecimiento econ&oacute;mico, Mc-Mahon y Mrozek (1997) aceptan que la teor&iacute;a neocl&aacute;sica incluye el efecto de la primera ley de la termodin&aacute;mica sobre la conservaci&oacute;n de la materia y la energ&iacute;a, pero consideran necesario complementarla con el concepto de entrop&iacute;a o segunda ley de la termodin&aacute;mica, seg&uacute;n la cual los procesos son irreversibles en el tiempo. Esto implica que si bien la energ&iacute;a y la materia se conservan en un sistema cerrado, como el sistema solar, la calidad y el tipo de insumos nunca se recuperan a partir del producto, degradando paulatinamente el acervo de recursos.</p>     <p>Por otra parte, la econom&iacute;a de la informaci&oacute;n estudia la informaci&oacute;n y el conocimiento como bienes econ&oacute;micos; su calidad, su mercado, y c&oacute;mo afectan las decisiones de los agentes. La econom&iacute;a de la informaci&oacute;n tiene or&iacute;genes en los trabajos de Hayek (1945), donde se diferencia la informaci&oacute;n que se mantiene en las torres de marfil y la informaci&oacute;n econ&oacute;micamente &uacute;til, y c&oacute;mo opera esta &uacute;ltima a trav&eacute;s del sistema de mercado. En este sentido, difere del enfoque de la teor&iacute;a de la informaci&oacute;n que se expone en este art&iacute;culo, porque la informaci&oacute;n como inverso de la probabilidad y la entrop&iacute;a como informaci&oacute;n promedio son conceptos m&aacute;s adecuados para medir la cantidad de informaci&oacute;n que la calidad, el uso o el tipo de informaci&oacute;n, y m&aacute;s apropiados para estudios estad&iacute;sticos. Con un enfoque m&aacute;s semejante al de Hayek, Domenech (1989) presenta una visi&oacute;n filos&oacute;fica del papel de la informaci&oacute;n en la sociedad, y c&oacute;mo se restringe y se filtra seg&uacute;n el sistema pol&iacute;tico-econ&oacute;mico.</p>     <p><b>Aplicaciones en finanzas</b></p>     <p>Se han hecho intentos para adaptar los conceptos asociados a la medici&oacute;n del contenido de informaci&oacute;n al estudio de temas financieros y burs&aacute;tiles. La hip&oacute;tesis de que los mercados responden al nivel de incertidumbre o al elemento sorpresa tiene analog&iacute;a con la entrop&iacute;a.</p>     <p>Darbellay y Wuertz (2000) recuerdan que las series de rendimientos financieros no siguen distribuciones normales sino distribuciones con colas gruesas, de mayor probabilidad, y que es dif&iacute;cil aplicar el teorema del l&iacute;mite central a estas series por la dependencia serial de los rendimientos (p. ej., en sus cuadrados, como en los modelos ARCH) . El concepto de entrop&iacute;a es &uacute;til para estudiar esta dependencia porque no se limita a la dependencia lineal. Estos autores estudian, por separado, dos series de rendimientos financieros: la tasa de cambio d&oacute;lar-marco entre octubre de 1992 y mayo de 1997 registrada cada 30 minutos y el &iacute;ndice diario Dow Jones en el periodo 1901-1998. Usando diversos rezagos &#964; en cada serie, observan pocas diferencias entre la estimaci&oacute;n de la informaci&oacute;n mutua I(r(t); r(t - &#964;)) y la estimaci&oacute;n de la informaci&oacute;n mutua del valor absoluto I(|r(t)|;|r(t - &#964;)|), y concluyen que pr&aacute;cticamente toda la informaci&oacute;n de los rendimientos en t se encuentra en los valores absolutos de los rendimientos pasados y no en sus signos, excepto para rezagos muy cortos. Este ejercicio es similar a la estimaci&oacute;n de la funci&oacute;n de autocorrelaci&oacute;n, ACF, pero difere en que recoge todo tipo de dependencia, no solo la lineal. Algunos autores se refieren a la informaci&oacute;n mutua acerca de la misma serie como funci&oacute;n de autoinformaci&oacute;n.</p>     <p>En un estudio similar, Maasoumi y Racine (2002) aplicaron la entrop&iacute;a para encontrar dependencias no lineales de los rendimientos de los precios burs&aacute;tiles y sus predicciones. Por su parte, Chen (2002) discute la similitud entre los conceptos de teor&iacute;a de la informaci&oacute;n y el valor econ&oacute;mico de la informaci&oacute;n con respecto a los mercados. La cantidad de informaci&oacute;n recibida por un inversionista depende de su entrenamiento, y entenderla es un proceso de aprendizaje que toma tiempo, por lo cual, aunque la informaci&oacute;n est&eacute; p&uacute;blicamente disponible, su difusi&oacute;n, evaluaci&oacute;n y uso apropiado no son inmediatos como supone la hip&oacute;tesis del mercado eficiente.</p>      <p><b>La medida de desigualdad de Theil</b></p>     <p>La entrop&iacute;a se presta como medida de heterogeneidad. Theil (1967) la adapt&oacute; para construir su conocido &iacute;ndice de desigualdad del ingreso:</p> <img src="img/revistas/rei/v13n25/v13n25a09f30.jpg">     ]]></body>
<body><![CDATA[<p>Para ello,  en la f&oacute;rmula de la entrop&iacute;a remplaz&oacute; la probabilidad por y<sub>i</sub>, la proporci&oacute;n del ingreso total correspondiente al individuo i. Con esta notaci&oacute;n, la entrop&iacute;a del ingreso es:</p> <img src="img/revistas/rei/v13n25/v13n25a09f31.jpg">     <p>La m&aacute;xima equidad se alcanza cuando todos los y<sub>i</sub> son iguales, digamos y<sub>i</sub> = 1/N , donde N es el n&uacute;mero de individuos de la sociedad, que al reemplazar en la f&oacute;rmula anterior da:</p> <img src="img/revistas/rei/v13n25/v13n25a09f32.jpg">     <p>La medida de desigualdad de Theil, T, es la entrop&iacute;a m&aacute;xima menos la entrop&iacute;a de la distribuci&oacute;n del ingreso:</p> <img src="img/revistas/rei/v13n25/v13n25a09f33.jpg">     <p>Y puesto que <img src="img/revistas/rei/v13n25/v13n25a09f34.jpg"> se llega a f&oacute;rmula usual:</p> <img src="img/revistas/rei/v13n25/v13n25a09f35.jpg">     <p><b>El m&eacute;todo de estimaci&oacute;n de m&aacute;xima entrop&iacute;a</b></p>     <p>Sea {x, y<sub>i</sub>} una muestra de tama&ntilde;o N, donde x<sub>i</sub> es un vector de variables explicativas y y<sub>i</sub> la variable dependiente. El objetivo es estimar la funci&oacute;n de probabilidad condicional P(y/x). La distribuci&oacute;n emp&iacute;rica es:</p> <img src="img/revistas/rei/v13n25/v13n25a09f36.jpg">     <p>Supongamos adem&aacute;s que se conocen las condiciones o caracter&iacute;sticas espec&iacute;ficas de algunos de los N eventos. Por ejemplo, si es frecuente que y aumente cuando x<sub>1</sub> es mayor que x . Estas condiciones, compatibles con la muestra y &uacute;tiles para la estimaci&oacute;n, se pueden expresar por medio de variables <i>dummy </i>R(x, y). Por ejemplo, R(x, y) = 1 si y y x cumplen la condici&oacute;n, y R(x, y) = 0 si no la cumplen. A partir de la muestra se construye el valor esperado de R(x, y):</p> <img src="img/revistas/rei/v13n25/v13n25a09f37.jpg">     <p>el cual hacemos igual a la probabilidad que debe arrojar el modelo, es decir, imponemos la restricci&oacute;n:</p> <img src="img/revistas/rei/v13n25/v13n25a09f38.jpg">     <p>donde <img src="img/revistas/rei/v13n25/v13n25a09f38a.jpg"> (x) es la distribuci&oacute;n de x en la muestra.</p>     <p>El criterio de m&aacute;xima entrop&iacute;a elije, sujeto a las restricciones, la distribuci&oacute;n condicional P(y/x) m&aacute;s cercana a la distribuci&oacute;n uniforme, porque implementa el criterio b&aacute;sico del m&eacute;todo: no suponer lo que no se sabe. Recordando que la entrop&iacute;a es proporcional a la uniformidad de una distribuci&oacute;n (cuanto m&aacute;s uniforme mayor la entrop&iacute;a), maximizamos la entrop&iacute;a condicional encontrando P(y/x) en la siguiente funci&oacute;n objetivo:</p> <img src="img/revistas/rei/v13n25/v13n25a09f39.jpg">     ]]></body>
<body><![CDATA[<p>donde <font face="palatino Linotype" size="3">&lambda;</font> y <font face="palatino Linotype" size="3">&gamma;</font> son multiplicadores de Lagrange.</p>     <p>Una comparaci&oacute;n de los m&eacute;todos de m&aacute;xima entrop&iacute;a y de m&iacute;nimos cuadrados ordinarios se encuentra en Eruygur (2005). En Colombia, Morley et al. (1998) utilizan este m&eacute;todo para estimar la movilidad de ingresos.</p>     <p><b>Otras aplicaciones econom&eacute;tricas</b></p>     <p>El conocido criterio de informaci&oacute;n de Akaike para identificar modelos se basa en el concepto de informaci&oacute;n de Kullbak-Leibler<sup><a name="nu2"></a><a href="#num2">2</a></sup>. Para una densidad &fnof; que representa el modelo verdadero y una densidad g del modelo que se va a probar, la entrop&iacute;a relativa de Kullback-Leibler puede escribirse como:</p> <img src="img/revistas/rei/v13n25/v13n25a09f40.jpg">     <p>Suponiendo que el modelo que representa la realidad es desconocido pero constante ante los modelos alternativos, la expresi&oacute;n anterior se simplifica:</p>     <p>D<sub>KL</sub> = C - E<sub>f</sub>&#91;log g(x)&#93;</p>     <p>donde C es una constante. La idea es entonces probar modelos g para minimizar la p&eacute;rdida con respecto al verdadero &fnof;. Al minimizar el valor esperado de la p&eacute;rdida de informaci&oacute;n dado por D<sub>KL</sub>, se deriva la expresi&oacute;n del criterio de Akaike, <img src="img/revistas/rei/v13n25/v13n25a09f38b.jpg">, donde <font face="palatino Linotype" size="3"><i>l </i></font>es la verosimilitud logar&iacute;tmica maximizada, k el n&uacute;mero de par&aacute;metros estimados y n el n&uacute;mero de observaciones utilizadas en la estimaci&oacute;n (ver Burnham, 2004).</p>     <p>El concepto de Kullback-Leibler tambi&eacute;n se ha aplicado a la interpretaci&oacute;n del R<sup>2</sup> como contenido de informaci&oacute;n, es decir, de la incertidumbre explicada por el modelo estimado. Cameron y Windmeijer (1995) proponen un seudo R<sup>2</sup> para modelos de regresi&oacute;n no lineales basado en la reducci&oacute;n de la incertidumbre generada por la inclusi&oacute;n de variables explicativas, donde dicha reducci&oacute;n es medida por la divergencia de Kullback-Leibler.</p>     <p><b>Ejercicio econom&eacute;trico</b></p>     <p>El siguiente ejercicio ilustra el uso de las variables relacionadas con el contenido de la informaci&oacute;n en la predicci&oacute;n de los precios burs&aacute;tiles. Para ellos se toman las variaciones porcentuales del precio de cierre de la acci&oacute;n de Alcoa, la empresa productora de aluminio que es el primer componente de los 30 que forman el &iacute;ndice Dow Jones. La serie se muestra en la <a href="#gra3">gr&aacute;fica 3</a>. En el ejercicio se hace una regresi&oacute;n de la variaci&oacute;n de los precios contra sus rezagos, sus rezagos al cuadrado y los rezagos de una variable derivada del contenido de informaci&oacute;n de la serie de variaciones porcentuales del precio.</p>      ]]></body>
<body><![CDATA[<p>    <center><a name="gra3"><img src="img/revistas/rei/v13n25/v13n25a09g3.jpg"></a></center></p>      <p>La raz&oacute;n para incluir el cuadrado de la variaci&oacute;n del precio es que la variable de informaci&oacute;n tiene un comportamiento similar al del cuadrado de los precios (a mayor varianza mayor contenido de informaci&oacute;n) y que, en presencia de estos cuadrados, podr&iacute;a ser redundante. As&iacute;, la inclusi&oacute;n del cuadrado de los precios en las regresiones hace m&aacute;s exigente la prueba de la variable de informaci&oacute;n.</p>      <p>Como las variaciones de los precios pueden ser positivas o negativas, mientras que la informaci&oacute;n es positiva, la variable de informaci&oacute;n que se utiliza es el producto de la informaci&oacute;n por la variaci&oacute;n porcentual del precio de la acci&oacute;n. Si d<sub>t</sub> es la variaci&oacute;n porcentual del precio de la acci&oacute;n, la variable de informaci&oacute;n es:</p>     <p>d<sub>t</sub>(-logP(d<sub>t</sub>))</p>     <p>La <a href="#gra4">gr&aacute;fica 4</a> muestra la estimaci&oacute;n de la distribuci&oacute;n de probabilidad de la serie de la variaci&oacute;n porcentual del precio de Alcoa, la <a href="#gra5">gr&aacute;fica 5</a> el contenido de informaci&oacute;n -logP(d<sub>t</sub>) y la <a href="#gra6">gr&aacute;fica 6</a> la variable de informaci&oacute;n d<sub>t</sub>(-logP(d<sub>t</sub>)).</p>     <p>    <center><a name="gra4"><img src="img/revistas/rei/v13n25/v13n25a09g4.jpg"></a></center></p>     <p>    <center><a name="gra5"><img src="img/revistas/rei/v13n25/v13n25a09g5.jpg"></a></center></p>     ]]></body>
<body><![CDATA[<p>    <center><a name="gra6"><img src="img/revistas/rei/v13n25/v13n25a09g6.jpg"></a></center></p>      <p>Los datos se tomaron de la p&aacute;gina financiera de Yahoo y corresponden a observaciones diarias del 25 de septiembre de 2006 al 14 de septiembre de 2010. La regresi&oacute;n se representa as&iacute;:</p>     <p><img src="img/revistas/rei/v13n25/v13n25a09f41.jpg"></p>      <p>La significancia conjunta de los coeficientes de los 40 rezagos de las tres variables explicativas se prob&oacute; con el estad&iacute;stico F. Adem&aacute;s, se prob&oacute; la significancia de los 40 coeficientes de la variable de informaci&oacute;n. Los resultados fueron los siguientes:</p>     <p>    <center><img src="img/revistas/rei/v13n25/v13n25a09i3.jpg"></center></p>      <p>La regresi&oacute;n es estad&iacute;sticamente significativa, como indican las columnas 4 y 5. Por su parte, la variable de informaci&oacute;n es estad&iacute;sticamente significativa para predecir el precio de la acci&oacute;n, como muestra la columna 6. A manera de contraste, la columna 7 muestra el resultado de la repetici&oacute;n de la regresi&oacute;n a&ntilde;adiendo 40 rezagos de una serie de ruido blanco como variable explicativa, los cuales no resultaron significativos.</p>     <p><font size="3"><b>CONCLUSI&Oacute;N</b></font></p>     <p>El concepto de informaci&oacute;n, aunque tiene diferentes interpretaciones seg&uacute;n la disciplina, se puede interpretar en t&eacute;rminos de costo-beneficio. Transmitir, recibir y entender textos o mensajes requiere un esfuerzo que se justifica si el beneficio esperado es superior al costo. El beneficio depende del nivel de informaci&oacute;n contenido en el mensaje y este, a su vez, se relaciona con el grado de sorpresa del mensaje transmitido. Cuanto m&aacute;s baja es la probabilidad de ocurrencia del evento comunicado, mayor es su contenido de informaci&oacute;n, y viceversa; de modo que existe una relaci&oacute;n inversa entre probabilidad e informaci&oacute;n. Esta relaci&oacute;n probabil&iacute;stica tiene muchas aplicaciones. En econom&iacute;a, por ejemplo, para modelar el desarrollo y sus limitaciones; en econometr&iacute;a, para dise&ntilde;ar &iacute;ndices y m&eacute;todos de estimaci&oacute;n, y en el campo financiero, para explicar el comportamiento de los mercados burs&aacute;tiles.</p>  <hr>     ]]></body>
<body><![CDATA[<p><font size="3"><b>PIE DE P&Aacute;GINA</b></font></p>      <p><sup><a name="num1"></a><a href="#nu1">1</a></sup>Para mayores detalles de la formalizaci&oacute;n de estos conceptos, ver Lathi (1974), Thomas (1975), Krippendorff (1986), Br&eacute;maud (1988), Chen y Alajaji (2005), y Gray (2009). Para una extensi&oacute;n del concepto de informaci&oacute;n a documentos p&uacute;blicos y noticias, ver Montenegro (1995).    <br> <sup><a name="num2"></a><a href="#nu2">2</a></sup>Ver Akaike (1974) o Anderson et al. (2000).</p>  <hr>     <p><font size="3"><b>REFERENCIAS BIBLIOGR&Aacute;FICAS</b></font></p>     <!-- ref --><p>1.  Akaike, H. "A New Look at the Statistical Model Identification", <i>Transactions on Automatic Control </i>19, 1974, pp. 716-723.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000197&pid=S0124-5996201100020000900001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>2.  Anderson D., K. Burnham y W. Thompson. "Null hypothesis testing: Problems, prevalence and an alternative", <i>Journal of Wildlife Management </i>64, 4, 2000, pp. 912-923.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000198&pid=S0124-5996201100020000900002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>3.  Br&eacute;maud, P. <i>An introduction to probabilistic modeling</i>, Springer-Verlag, 1988.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000199&pid=S0124-5996201100020000900003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>4.  Burnham, K. "Multimodel inference: Understanding AIC and BIC in model selection", paper presented at the Amsterdam Workshop on Model Selection, August 27-29, 2004.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000200&pid=S0124-5996201100020000900004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>5.  Cameron C. y F. Windmeijer. "An R squared measure of goodness of fit for some common nonlinear regression models", Department of Economics, University of California, Davis, 1995.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000201&pid=S0124-5996201100020000900005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>6.  Chen, J. "Information, entropy and evolutionary finance", Working Paper, School of Business, University of Northern British Columbia, 2002.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000202&pid=S0124-5996201100020000900006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>7.  Chen P. y F. Alajaji. "Lecture notes on information theory", Department of Communications Engineering, National Chiao Tung University, and Department of Mathematics &amp; Statistics, Queen's University, 2005.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000203&pid=S0124-5996201100020000900007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>8.  Darbellay G. y D. Wuertz. "The entropy as a tool for analyzing statistical dependence in financial time series", <i>Physics A </i>287, 2000, pp. 429-439.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000204&pid=S0124-5996201100020000900008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>9.  Domenech, A. <i>De la &eacute;tica a la pol&iacute;tica</i>, Barcelona, Editorial Cr&iacute;tica, 1989.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000205&pid=S0124-5996201100020000900009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>10. Eruygur, O. "Generalized maximum entropy (GME) estimator: Formulation and a Monte Carlo study", <i>MPRA Paper </i>12459, 2005.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000206&pid=S0124-5996201100020000900010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>11. Georgescu-R. N. <i>The entropy law and the economic process</i>, Cambridge, Harvard University Press, 1971.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000207&pid=S0124-5996201100020000900011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>12. Gray, R. <i>Entropy and information theory</i>, New York, Springer-Verlag, 2009.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000208&pid=S0124-5996201100020000900012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>13. Hartley, R. "Transmission of information", <i>Bell System Technical Journal </i>7, 1928, pp. 535-563.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000209&pid=S0124-5996201100020000900013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>14. Hayek, F. "The use of knowledge in society", <i>American Economic Review </i>35, 4, 1945, pp. 519-530.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000210&pid=S0124-5996201100020000900014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>15. Krippendorff, K. <i>Information theory: Structural models for qualitative data</i>, Beverly Hills, Sage Publications, 1986.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000211&pid=S0124-5996201100020000900015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>16. Kelly, J. L. "A new interpretation of information rate", <i>Bell System Technical Journal </i>35, 1956, pp. 917-926.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000212&pid=S0124-5996201100020000900016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>17. Lathi, B. P. <i>Sistemas de comunicaci&oacute;n</i>, M&eacute;xico, Limusa, 1974.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000213&pid=S0124-5996201100020000900017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>18. Maasoumi, E. y J. Racine. "Entropy and predictability of stock market returns", <i>Journal of Econometrics </i>107, 2002, pp. 291-312.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000214&pid=S0124-5996201100020000900018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>19. Massey, J. "Applied digital information theory", Lecture Notes, ETH (Instituto Federal de Tecnolog&iacute;a), Z&uuml;rich, 1998.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000215&pid=S0124-5996201100020000900019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>20. McMahon G. y J. Mrozek. "Economics, entropy and sustainability", <i>Hydrological Sciences Journal </i>4, 24, 1997, pp. 501-512.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000216&pid=S0124-5996201100020000900020&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>21. Montenegro, &Aacute;. "El contenido de informaci&oacute;n en documentos y mensajes", <i>Documentos CEDE </i>95-06, 1995.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000217&pid=S0124-5996201100020000900021&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>22. Morley, S., S. Robinson y R. Harris. "Estimating income mobility in Colombia using maximum entropy econometrics", <i>TMD Discussion Paper </i>26, 1998.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000218&pid=S0124-5996201100020000900022&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>23. Samuelson, P. <i>Collected economics papers</i>, vol. 5, Cambridge, MIT Press, 1986.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000219&pid=S0124-5996201100020000900023&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>24. Shannon, C. "A mathematical theory of communication", <i>The Bell System Technical Journal </i>27, 1948, pp. 379-423 y 623-656.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000220&pid=S0124-5996201100020000900024&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>25. Smith, D. y D. Foley. "Is utility theory so different from thermodynamics?", <i>SFI Working Paper </i>02-04-016, 2002.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000221&pid=S0124-5996201100020000900025&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>26. Theil, H. <i>Economics and information theory</i>, Amsterdam, North Holland, 1967.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000222&pid=S0124-5996201100020000900026&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>27. Thomas, J. "Information, communication, noise and interference", D. Fink, ed., <i>Electronics engineers handbook</i>, New York, McGraw-Hill, 1975.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000223&pid=S0124-5996201100020000900027&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>28. Touretzky, D. S. "Basics of information theory", 2004, &#91;<a href="http://www.cs.cmu.edu/~dst/Tutorials/Info-Theory/" target="_blank">http://www.cs.cmu.edu/~dst/Tutorials/Info-Theory/</a>&#93;, consulta en diciembre de 2009.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000224&pid=S0124-5996201100020000900028&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Akaike]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA["A New Look at the Statistical Model Identification"]]></article-title>
<source><![CDATA[Transactions on Automatic Control]]></source>
<year>1974</year>
<volume>19</volume>
<page-range>716-723</page-range></nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Anderson]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Burnham]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[Thompson]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Null hypothesis testing: Problems, prevalence and an alternative]]></article-title>
<source><![CDATA[Journal of Wildlife Management]]></source>
<year>2000</year>
<volume>64</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>912-923</page-range></nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Brémaud]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<source><![CDATA[An introduction to probabilistic modeling]]></source>
<year>1988</year>
<publisher-name><![CDATA[Springer-Verlag]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Burnham]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
</person-group>
<source><![CDATA[Multimodel inference: Understanding AIC and BIC in model selection]]></source>
<year>Augu</year>
<month>st</month>
<day> 2</day>
</nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cameron]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Windmeijer]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
</person-group>
<source><![CDATA["An R squared measure of goodness of fit for some common nonlinear regression models"]]></source>
<year>1995</year>
<publisher-name><![CDATA[Department of Economics, University of California]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chen]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA["Information, entropy and evolutionary finance"]]></source>
<year>2002</year>
<publisher-name><![CDATA[Working Paper, School of Business, University of Northern British Columbia]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chen]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Alajaji]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
</person-group>
<source><![CDATA["Lecture notes on information theory"]]></source>
<year>2005</year>
<publisher-name><![CDATA[Department of Communications Engineering, National Chiao Tung University, and Department of Mathematics & Statistics, Queen's University]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B8">
<label>8</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Darbellay]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[Wuertz]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA["The entropy as a tool for analyzing statistical dependence in financial time series"]]></article-title>
<source><![CDATA[Physics A]]></source>
<year>2000</year>
<volume>287</volume>
<page-range>429-439</page-range></nlm-citation>
</ref>
<ref id="B9">
<label>9</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Domenech]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[De la ética a la política]]></source>
<year></year>
<publisher-loc><![CDATA[Barcelona ]]></publisher-loc>
<publisher-name><![CDATA[Editorial Crítica]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B10">
<label>10</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Eruygur]]></surname>
<given-names><![CDATA[O]]></given-names>
</name>
</person-group>
<source><![CDATA[Generalized maximum entropy (GME) estimator: Formulation and a Monte Carlo study]]></source>
<year>2005</year>
<publisher-name><![CDATA[MPRA Paper]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B11">
<label>11</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Georgescu-R]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
</person-group>
<source><![CDATA[The entropy law and the economic process]]></source>
<year>1971</year>
<publisher-loc><![CDATA[Cambridge ]]></publisher-loc>
<publisher-name><![CDATA[Harvard University Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B12">
<label>12</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gray]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<source><![CDATA[Entropy and information theory]]></source>
<year>2009</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Springer-Verlag]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B13">
<label>13</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hartley]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA["Transmission of information"]]></article-title>
<source><![CDATA[Bell System Technical Journal]]></source>
<year>1928</year>
<volume>7</volume>
<page-range>535-563</page-range></nlm-citation>
</ref>
<ref id="B14">
<label>14</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hayek]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA["The use of knowledge in society"]]></article-title>
<source><![CDATA[American Economic Review]]></source>
<year>1945</year>
<volume>35</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>519-530</page-range></nlm-citation>
</ref>
<ref id="B15">
<label>15</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Krippendorff]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
</person-group>
<source><![CDATA[Information theory: Structural models for qualitative data]]></source>
<year>1986</year>
<publisher-loc><![CDATA[Beverly Hills ]]></publisher-loc>
<publisher-name><![CDATA[Sage Publications]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B16">
<label>16</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kelly]]></surname>
<given-names><![CDATA[J. L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA["A new interpretation of information rate"]]></article-title>
<source><![CDATA[Bell System Technical Journal]]></source>
<year>1956</year>
<volume>35</volume>
<page-range>917-926</page-range></nlm-citation>
</ref>
<ref id="B17">
<label>17</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lathi]]></surname>
<given-names><![CDATA[B. P]]></given-names>
</name>
</person-group>
<source><![CDATA[Sistemas de comunicación]]></source>
<year>1974</year>
<publisher-loc><![CDATA[México ]]></publisher-loc>
<publisher-name><![CDATA[Limusa]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B18">
<label>18</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Maasoumi]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[Racine]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA["Entropy and predictability of stock market returns"]]></article-title>
<source><![CDATA[Journal of Econometrics]]></source>
<year>2002</year>
<volume>107</volume>
<page-range>291-312</page-range></nlm-citation>
</ref>
<ref id="B19">
<label>19</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Massey]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA["Applied digital information theory"]]></source>
<year>1998</year>
<publisher-loc><![CDATA[Zürich ]]></publisher-loc>
<publisher-name><![CDATA[Instituto Federal de Tecnología]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B20">
<label>20</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[McMahon]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[Mrozek]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA["Economics, entropy and sustainability"]]></article-title>
<source><![CDATA[Hydrological Sciences Journal]]></source>
<year>1997</year>
<volume>4</volume>
<numero>24</numero>
<issue>24</issue>
<page-range>501-512</page-range></nlm-citation>
</ref>
<ref id="B21">
<label>21</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Montenegro]]></surname>
<given-names><![CDATA[Á]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA["El contenido de información en documentos y mensajes"]]></article-title>
<source><![CDATA[Documentos CEDE]]></source>
<year>1995</year>
</nlm-citation>
</ref>
<ref id="B22">
<label>22</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Morley]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Robinson]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Harris]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA["Estimating income mobility in Colombia using maximum entropy econometrics"]]></article-title>
<source><![CDATA[TMD Discussion Paper]]></source>
<year>1998</year>
<volume>26</volume>
</nlm-citation>
</ref>
<ref id="B23">
<label>23</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Samuelson]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<source><![CDATA[Collected economics papers]]></source>
<year>1986</year>
<volume>5</volume>
<publisher-loc><![CDATA[Cambridge ]]></publisher-loc>
<publisher-name><![CDATA[MIT Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B24">
<label>24</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Shannon]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA["A mathematical theory of communication"]]></article-title>
<source><![CDATA[The Bell System Technical Journal]]></source>
<year>1948</year>
<volume>27</volume>
<page-range>379-423</page-range><page-range>623-656</page-range></nlm-citation>
</ref>
<ref id="B25">
<label>25</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Smith]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Foley]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA["Is utility theory so different from thermodynamics?"]]></article-title>
<source><![CDATA[SFI Working Paper]]></source>
<year>2002</year>
</nlm-citation>
</ref>
<ref id="B26">
<label>26</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Theil]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<source><![CDATA[Economics and information theory]]></source>
<year>1967</year>
<publisher-loc><![CDATA[Amsterdam ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B27">
<label>27</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Thomas]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA["Information, communication, noise and interference"]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Fink]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<source><![CDATA[Electronics engineers handbook]]></source>
<year>1975</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[McGraw-Hill]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B28">
<label>28</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Touretzky]]></surname>
<given-names><![CDATA[D. S]]></given-names>
</name>
</person-group>
<source><![CDATA["Basics of information theory"]]></source>
<year>2004</year>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
