Extensión del concepto de utopía para el problema de la agregación de rankings sin empates

Reyna-Hernández, Randy; Rosete, Alejandro; Reyna-Hernández, Randy; Rosete, Alejandro

doi:10.22430/22565337.1788

Services on Demand

Journal

Article

Indicators

Cited by SciELO
Access statistics

TecnoLógicas

Print version ISSN 0123-7799On-line version ISSN 2256-5337

TecnoL. vol.24 no.51 Medellín May/Aug. 2021 Epub Oct 04, 2021

https://doi.org/10.22430/22565337.1788

Artículo de investigación

Extensión del concepto de utopía para el problema de la agregación de rankings sin empates

Extension of the Concept of Utopia for Rank Aggregation Problem Without Ties

Randy Reyna-Hernández¹^*
http://orcid.org/0000-0003-1481-9546

Alejandro Rosete²
http://orcid.org/0000-0002-4579-3556

^¹Universidad de Matanzas, Matanzas, Cuba, randyrh91@gmail.com

^²Universidad Tecnológica de La Habana José Antonio Echeverría, La Habana, Cuba, rosete@ceis.cujae.cu

Resumen

El uso de los rankings y la forma de agregarlos o resumirlos ha recibido una atención creciente en diversos campos: bibliometría, búsquedas web, minería de datos, estadística, calidad educativa y biología computacional. Para el Problema de Ordenamiento Óptimo con empates fue introducido recientemente el concepto de Matriz Utópica: una solución ideal y no necesariamente factible con una calidad insuperable para las soluciones factibles del problema. Este trabajo propone una extensión de la noción de Matriz Utópica para el Problema de Agregación de Rankings en que no se permiten empates entre elementos en el ranking de salida. Más allá de la extensión que es directa, el trabajo se centra en estudiar su valor como idealización o solución súper óptima. Como el Problema de Agregación de Rankings puede resolverse de forma exacta a partir de su definición como Problema de Programación Lineal Entera, se presenta un estudio experimental donde se analiza la relación que existe entre los valores utópicos (y anti utópicos) y la solución óptima en instancias resueltas con la ayuda del software de código abierto SCIP. Entre las 47 instancias analizadas, en 19 el Valor Utópico resultó ser igual al valor óptimo (40,43 % de factibilidad) y en 18 el Valor Anti Utópico también resultó ser factible (38,00 %). Este estudio experimental demuestra la utilidad de los valores utópicos y anti utópicos para ser considerados como valores extremos en el Problema de Agregación de Rankings, pudiendo así encontrase muy rápidamente cotas superiores e inferiores para la optimización.

Palabras Claves: Agregación de rankings; programación lineal entera; minería de datos; algoritmos de optimización

Abstract

The use of rankings and how to aggregate or summarize them has received increasing attention in various fields: bibliometrics, web search, data mining, statistics, educational quality, and computational biology. For the Optimal Bucket Order Problem, the concept of Utopian Matrix was recently introduced: an ideal and not necessarily feasible solution with an unsurpassed quality for the feasible solutions of the problem. This work proposes an extension of the notion of Utopian Matrix to the Rank Aggregation Problem in which ties are not allowed between elements in the output ranking. Beyond the extension that is direct, the work focuses on studying its usefulness as an idealization or super optimal solution. As the Rank Aggregation Problem can be solved exactly based on its definition as an Integer Linear Programming Problem, an experimental study is presented where it is analyzed the relationship that exists between utopian (and anti utopian) values and the optimal solution in several instances solved by using the open source software SCIP. Among the 47 instances analyzed, in 19 the Utopian Value turned out to be equal to the optimal value (40.43 % feasibility) and in 18 the Anti Utopian Value also turned out to be feasible (38.00 %). This experimental study demonstrates the usefulness of utopian and anti utopian values to be considered as extreme values in the Rank Aggregation Problem, thus being able to find higher and lower bounds for optimization very quickly.

Keywords: Rank aggregation; integer linear programming; data mining; approximation algorithms

1. INTRODUCCIÓN

En la actualidad se generan grandes cantidades de datos a cada segundo. Las técnicas para el manejo de grandes volúmenes de información surgen con el nombre de minería de datos y se constituyen como la alternativa ideal en estos casos.

La minería de datos comprende un conjunto de técnicas tendientes a “realzar” o descubrir comportamientos y patrones presentes dentro de un conjunto de datos con la finalidad de generar conocimiento que proporcione soluciones a un problema determinado ^[¹^]. Como gran parte de estos datos son presentados siguiendo algún orden de preferencia, temas como la agregación de rankings han llamado la atención de numerosos investigadores y ya cuentan con diferentes aplicaciones en variados temas que van desde la calidad educativa ^[²^] hasta la biología computacional ^[³^]-^[⁷^].

Debido a su popularidad en la comunidad científica, y la amplia gama de aplicaciones que presenta el tema, se han desarrollado además numerosas herramientas para facilitar su uso ^[⁸^], ^[⁹^].

Dado un conjunto de elementos (u objetos), para ser ordenados por jueces, según su criterio de preferencias (por ejemplo, los mejores delante y los peores al final), los rankings proporcionados por cada juez, que ordenan todos los elementos, (o algunos de ellos), podrían ser combinados para obtener un ranking de consenso (agregación). El problema de encontrar dicho ranking es conocido en la literatura como Problema de Agregación de Rankings (RAP, por sus siglas en inglés) ^[¹⁰^].

Existen diferentes tipos de RAP. Por ejemplo, cuando los rankings a agregar no tienen empates ni ausencias de algún elemento, entonces los rankings son permutaciones (rankings completos sin empates) y el RAP se reduce al Problema de Kemeny (KRP) ^[¹¹^].

Una variante más reciente del RAP es el Problema de Ordenamiento Óptimo de Rankings con Empates (OBOP, por sus siglas en ingles), cuya solución consiste en un ranking con empates, a diferencia del KRP ^[¹²^] - ^[¹⁴^].

En el RAP, para instancias de gran tamaño no es posible, en general, obtener la solución exacta. Sin embargo, se puede abordar mediante el uso de algoritmos heurísticos codiciosos (por ejemplo, Borda), los cuales encuentran una solución aproximada del problema. Estos algoritmos son rápidos, pero las soluciones así obtenidas están lejos de ser óptimas. Las metaheurísticas han mostrado un buen equilibrio entre la eficiencia y la precisión en problemas de este tipo ^[¹⁵^], ^[¹⁶^].

En ^[¹⁴^] se introducen dos nuevo conceptos, la Matriz Utópica y la Anti Utópica, que se asocian a una matriz de orden de pares que representa las precedencias en un conjunto de rankings. Siguiendo la investigación presentada en ^[¹⁴^], en este trabajo se replantean los conceptos de Matriz Utópica y de Matriz Anti Utópica para RAP. De esta forma, estas idealizaciones constituyen soluciones súper-óptimas para el RAP, que se pueden utilizar como valores extremos. Además, se muestran los resultados experimentales de la relación entre el Valor Utópico y la solución óptima de 47 modelos de Programación Lineal Entera (PLE) resueltos con la ayuda del software de código abierto SCIP.

El resto del documento está estructurado de la siguiente manera. A continuación, se definen el RAP y OBOP, así como se presentan los conceptos de Matriz Utópica, Matriz Anti utópica, Valor Utópico y Valor Anti Utópico para OBOP planteados en ^[¹⁴^]. Seguidamente, se introducen los conceptos nuevos relacionados con los Valores Utópicos y Anti Utópicos para RAP. Posteriormente se muestran los resultados de los experimentos realizados. Finalmente, se dan a conocer las conclusiones del presente trabajo.

2. ANTECEDENTES

2.1 Problema de Agregación de Rankings (RAP)

Informalmente, el Problema de Agregación de Rankings (RAP) consiste en combinar varios rankings (que ordenan el mismo conjunto de candidatos, o alternativas), para obtener un ordenamiento que exprese un consenso entre todos ellos. La agregación de rankings se ha estudiado en muchas disciplinas, principalmente en el contexto de la teoría de la elección social, donde existe una rica literatura que data de la segunda mitad del siglo XVIII ^[¹⁷^].

Entonces, formalmente, dado un conjunto [[n]] = {1, ..., n} de elementos, un ranking π es un orden de preferencia de estos (o algunos de estos) elementos. Los rankings que ordenan todos los elementos de [[n]] se denominan completos, mientras que los que ordenan los elementos de un subconjunto de [[n]] se denominan rankings parciales. Por otro lado, los rankings que establecen una preferencia entre cada par de elementos ordenados se denominan sin empates, mientras que los que presentan empates son rankings con empates.

Conceptualmente, un empate puede entenderse como una falta de información de preferencia entre algunos elementos clasificados. Los elementos empatados forman un bucket. Entonces, un ranking también puede entenderse como un orden de preferencia (disjunto) entre sus buckets ^[¹⁸^].

Para identificar el ranking que será el que mejor represente ese conjunto, es importante medir cuan diferentes son dos de ellos ^[⁴^]. Las distancias son la forma común de medir la diferencia entre dos rankings.

A pesar de existir diferentes formas de calcular la distancia entre dos rankings, la más popular es la distancia de Kendall-Tau.

La distancia de Kendall ^[¹⁹^], entre dos rankings π y σ, se define en (1) como el número total de pares de elementos en desacuerdo. Hay desacuerdo sobre un par de elementos (i; j) si el orden relativo de i y j es diferente en π y. σ Más precisamente:

Donde σ(i) y π (i) indican la posición del elemento i dentro de las permutaciones σ y π, respectivamente. Además, debe notarse que los rankings se expresan como permutaciones y no hay empates entre los elementos.

Una propiedad interesante de la Distancia de Kendall es que su valor máximo entre dos rankings de n elementos es .

Entonces, según ^[²⁰^] dado un conjunto de N rankings, Σ= {σ₁, σ₂, …, σ_N } que ordenan n elementos 1, 2, …, n, con σ_i ∈ S_n, donde S_n es un grupo que contiene todas las permutaciones de los n elementos, el RAP consiste en encontrar la permutación π ₀ que satisface (2):

K(σ_i , π,) corresponde a la distancia Kendall-Tau entre los rankings σ_i y la permutación π.

2.2 Problema de Ordenamiento Óptimo de Rankings con Empates (OBOP)

Nuevamente, el objetivo del OBOP es encontrar un ranking de consenso que ordene cada uno de los rankings de entrada, pero en este caso la respuesta puede contener empates entre varios elementos del ranking.

Más formalmente, dado un conjunto de elementos [[n]] = {1, ..., n}, un ranking completo con empates β es una partición ordenada de [[n]] ^[¹⁴^]. Más precisamente, se trata de una ordenación lineal de subconjuntos disjuntos (buckets) B₁, B₂, ...,B_k de [[n]], 1 ≤ k ≤ n, con ⋃^k _i =1^B _i =[[n]]. Por lo tanto, teniendo en cuenta dos buckets Bi, B_j en β,se escribe B_i ≺_β B_j , para indicar que B_j precede a B_j de acuerdo con el orden de bucket β. Análogamente, dados dos objetos u ∈ B_i , v ∈ B_j , se escribe u≺_β v si B_i ≺β B_j . Todos los elementos que pertenecen al mismo bucket se consideran empatados. Por lo tanto, si u y v están empatados con respecto a B, se escribe u ~_β v ^[¹⁴^].

Se puede representar B como una matriz C n x n, donde C(u, v) = 1 si u ≺_B v, C(u, v) = 0 si v ≺_B u y C(u, v) = 0,5 si u ∼_B v. Debe notarse, además, que C(u, v)+ C(v, u) = 1 ^[²¹^].

La entrada del problema es un conjunto de rankings (completos o parciales) que se representan en una matriz de precedencias P de dimensiones n x n con valores en el intervalo [0,1] tal que P(u, v) + P(v, u) = 1 para todo u, v ∈ [[n]], u ≠ v, y P(u, u) = 0,5 para todo u ∈ [[n]]. Usualmente P (u, v) es interpretado como la fracción de permutaciones de la muestra en las que el elemento u ha sido ordenado antes del elemento v ^[¹⁴^].

Entonces, el objetivo del OBOP consiste encontrar el orden de buckets tal que la distancia entre las matrices C y P sea mínima. En otras palabras, el valor óptimo del OBOP para la matriz P consiste en encontrar una Matriz de Bucket C n x n que minimice la función (3):

Esto quiere decir, que la distancia D(C, P) es el valor modular o absoluto de las diferencias sumadas entre cada par de elementos de la matriz de entrada (matriz de precedencias) y la forma matricial de representar un ranking usada en el OBOP.

Es importante notar que la matriz de precedencia puede representar tanto rankings completos, incompletos como con empates. En ^[²²^] se demuestra que la distancia D(C, P) es en realidad una extensión de la distancia de Kendall, formulada en (1) con anterioridad, con la diferencia que permite la comparación entre cualquier par de rankings.

Por lo tanto, el OBOP tiene una matriz de entrada P y una salida formada por la permutación de los conjuntos de partición. Así, se clasifican los elementos del ranking inicial en buckets que contienen subconjuntos con propiedades homogéneas, y proporciona la permutación de buckets que mejor los represente ^[²¹^].

2.3 La Matriz Utópica (UP) y el Valor Utópico (uP) para OBOP

Según ^[¹⁴^], dada una Matriz de Precedencia P, la Matriz Utópica asociada a P es la matriz n × n definido en (4) como:

Donde:

Debe notarse que cada celda de la Matriz Utópica toma uno de los valores posibles de precedencia cuando se permiten empates (0, 0,5 o 1) escogiendo el que está más cerca de la matriz de precedencia de entrada.

Siendo así, no puede existir ninguna representación matricial de un ranking que tenga una celda con distancia menor a la matriz de precedencia que el valor presente en la Matriz Utópica. Entonces el Valor Utópico U_P asociado con P es u_P =D(UP, P).

Con base en lo anterior, el Valor Utópico U_P es una cota del valor óptimo del problema OBOP asociada a la matriz de precedencia P. Debe notarse que no siempre la Matriz Utópica representa una solución factible para el OBOP ^[¹⁴^].

Debe tenerse en cuenta además que:

- Para cualquier Matriz de Precedencia P, la distancia máxima entre una salida en particular y la correspondiente en la Matriz Utópica es 0,25, y sucede cuando el valor en la matriz de precedencia de entrada es 0,25 o 0,75.
- P(u , u)= U_P (u, u)=0,5
- Para una matriz de dimensión n, el mayor Valor Utópico es u (n)=0,25n(n-1). Este valor de utopía corresponde a una matriz P con valores en {0,25, 0,75} en todas las celdas, excepto en las de la diagonal principal.
- Si P(u, v)= U_P (u, v) ∈{0 , 0,5, 1} para todo u, v ∈ M entonces el Valor Utópico u_P asociado a P es 0. Es los demás casos, no es posible encontrar una solución con distancia 0.

Por otro lado, la utopicidad U(P) de una matriz P se puede definir como se muestra en (5):

La utopicidad U(P) puede considerarse como una normalización en el intervalo [ 0,1 ] de la similitud entre P y su Matriz Utópica U_P . En particular, si U(P)=1 entonces U_P =P. Es decir, P es utópica.

2.4 La Matriz Anti Utópica (AP) y el Valor Anti Utópico (AP) para OBOP

Según ^[¹⁴^], dada una Matriz de Precedencia P, la Matriz Anti Utópica asociada a P es la matriz n × n definido en (6):

Donde:

Entonces el Valor Anti Utópico a_P asociado con P es a_P =D(A_P , P).

Definido de esta manera, es una idealización a la peor solución posible al OBOP, y podría ser útil como límite superior para D(•, P). En otras palabras, dado una Matriz de Precedencia arbitraria P, D(B, P) está en el intervalo [u_P , a_P ] para cualquier orden de bucket B. Esto quiere decir que con los conceptos anteriores es posible determinar cotas superiores e inferiores para el problema OBOP. En la sección siguiente se mostrará cómo pueden extenderse estos conceptos para el problema RAP donde no es posible que haya empates en el ranking de consenso que brinda como salida.

3. EXTENSIÓN DEL CONCEPTO DE UTOPÍA PARA RAP

3.1 La Matriz Utópica (URP) y el Valor Utópico (urP) para RAP

Dada una Matriz de Precedencia P, la Matriz Utópica asociada a P es la matriz n × n definida como (7):

Donde:

Entonces el Valor Utópico ur_P asociado con P es ur_P =D(UR_P , P).

Debe notarse que, para una matriz E, no se puede obtener una solución que tenga valor de función objetivo menor que ur_P , pues es una cota inferior que solo se alcanza en algunos casos.

3.2 La Matriz Anti Utópica (ARP) y el Valor Anti Utópico (arP) para RAP

Análogamente a la Matriz Anti Utópica y al Valor Anti Utópico del OBOP, se pueden definir estos conceptos para RAP, entonces, dada una Matriz de Precedencia P, la Matriz Anti Utópica asociada a P es la matriz n × n definida como (8):

Donde:

Entonces el Valor Anti Utópico ar_P asociado con P es ar_P = D(AR_P , P).

Definido de esta manera, es una idealización a la peor solución posible al RAP, y podría ser útil como límite superior para D(•, P). En otras palabras, dado una Matriz de Precedencia arbitraria P, D(B, P) está en el intervalo [ur_P ,ar_P ] para cualquier ranking sin empates.

Es interesante notar que el espacio de solución del problema RAP es un subconjunto del espacio de soluciones del problema OBOP. Por esta razón, no es posible encontrar una solución del RAP que no sea solución del OBOP. De esta manera, el intervalo [ur_P , ar_P ] de los posibles valores de las soluciones del RAP está contenido en el intervalo [u_P , a_P ] de posibles soluciones para el OBOP. Así, las cotas definidas por el intervalo [ur_P , ar_P ] para el RAP están más ajustadas. Esto resalta la importancia la extensión del concepto de Utopía para el RAP, ya que permite un mejor ajuste que si se usara el intervalo [u_P , a_P ].

4. RESULTADOS Y DISCUSIÓN

En esta sección se presenta un estudio experimental de la relación entre el Valor Utópico del RAP y los valores óptimos reales para esas instancias. Esto es posible, debido a la existencia de una formulación de PLE para el problema RAP que fue presentada en ^[¹⁰^].

Por esta razón, dada una matriz de precedencia es posible encontrar su solución óptima usando una herramienta de solución de problemas de PLE. En este caso, se empleará la herramienta libre SCIP.

SCIP es un framework para la Programación Entera con Restricciones (CIP), un novedoso paradigma que integra la Programación con Restricciones (CP), la Programación Mixta-Entera (MIP) y las técnicas de modelado y solución de satisfacción (SAT) ^[²³^]. SCIP está disponible gratuitamente en código fuente para uso comercial y se puede descargar desde ^[²⁴^].

Es importante estudiar la relación que existe entre la solución óptima y la solución utópica en problemas en los cuales es posible encontrar su solución óptima en un tiempo prudencial, ya que puede servir de referencia para estimar lo que ocurriría en instancias mayores cuya solución óptima se desconozca, aprovechando que la obtención de las cotas utópicas es computable en muy poco tiempo.

Todos los experimentos fueron realizados en un ordenador personal con un procesador Intel i7 - 4790, 3,60 GHz, 4 núcleos y 4GB de memoria RAM.

Para los experimentos se usaron 47 conjuntos de datos (dataset) de rankings reales disponibles en ^[²⁵^]. En particular, se descargaron ficheros pwg asociados a los siguientes conjuntos de “Datos de Elección”: ED-00006-Skate Data(3-4, 11-12, 18, 28, 46, 48), ED-00011-Web Search(1), ED-00014-Sushi Data(1) and ED-00015-Clean Web Search (1-2, 7, 9,12, 14, 16-20, 23-25, 27, 29-30, 32, 34, 40-42, 44, 46, 48, 50, 54, 55,57, 59, 65-66, 67, 69, 73, 74, 77). Estos ficheros han sido utilizados previamente en experimentos de OBOP publicados en ^[¹⁴^].

Todos los ficheros pws usados para los experimentos, así como los modelos de PLE y las herramientas con las que se ejecutaron los modelos ^[²⁶^] para poder ser analizados y replicados. Una descripción general de los 47 conjuntos de datos utilizados se muestra en la Tabla 1.

Tabla 1 Descripción de los conjuntos de rankings usados en los experimentos

Fuente: elaboración propia.

Por cada conjunto de datos, se muestra el promedio (Pro), la mediana (Med), los valores mínimos (Min) y máximos (Max) y la desviación estándar (Des Est.) del número de elementos del conjunto de rankings a agregar (n), cantidad de votantes (v), Valor Utópico para OBOP (u_P ) y el Valor Utópico para RAP (ur_P ).

4.1 Relación entre el Valor Utópico y el valor óptimo en el RAP

La Tabla 2 muestra una comparación entre los valores utópicos para RAP (ur) para cada instancia y su valor óptimo real (vor_min). Además, se muestra la diferencia entre ambos valores. A partir de la Tabla 2 se puede apreciar que entre el valor óptimo real y su Valor Utópico correspondiente, normalizado teniendo en cuenta el tamaño de cada instancia, existe un desfasaje promedio de aproximadamente 0,083.

Tabla 2 Relación Valor Utópico - valor óptimo real

Fuente: elaboración propia.

Como se muestra en la Figura 1, fue factible el Valor Utópico en 19 de los 47 modelos, resultando un 40,43 % de factibilidad aproximadamente.

Fuente: elaboración propia.

Figura 1 Comportamiento del desfasaje entre el Valor Utópico y el valor óptimo real según crecen los elementos a ordenar

Además, se puede apreciar que, en varios modelos, ambos valores coinciden porque la solución utópica es factible y por tanto la mínima diferencia proporcional es 1, sin embargo, es más interesante notar que el promedio es de 1,01 y el mayor valor es 1,10. Esto quiere decir que nunca en los modelos la solución óptima fue más de 10 % peor que el Valor Utópico.

La Figura 2 muestra un gráfico con la diferencia proporcional. Es interesante notar que en estos resultados la matriz utópica fue factible (se correspondió con la solución óptima) en una cantidad de instancias mucho mayor que las reportadas en ^[¹⁴^]. Aunque este resultado merece un estudio a fondo, creemos que hay aspectos que favorecen esta diferencia.

Fuente: elaboración propia.

Figura 2 Diferencia proporcional entre el Valor Utópico y el valor óptimo real

Por una parte, aquí se ha usado un algoritmo exacto que garantiza el óptimo, mientras que en ^[¹⁴^] se reporta el resultado promedio de algoritmos aproximados.

Adicionalmente, el problema OBOP tiene un espacio de búsqueda mucho mayor que el del RAP y con una mayor complejidad en las restricciones a cumplir. Por ejemplo, el primer ejemplo mostrado en ^[¹⁴^] cuya solución utópica para el OBOP no es factible, sí tiene una solución utópica que se corresponde con el ranking 1|2|3 que es factible para el RAP. Estos aspectos pueden explicar las diferencias.

4.2 Relación entre el Valor Anti Utópico y el valor óptimo en el RAP

Para obtener la relación entre los valores anti utópicos y el valor óptimo real en el RAP se maximizó la función objetivo. La Tabla 3 muestra una comparación entre los valores anti utópicos para RAP (aur) para cada instancia y su valor óptimo real (vor_max). Además, se muestra la diferencia entre ambos valores.

Tabla 3 Relación Valor Anti Utópico - valor óptimo real

Fuente: elaboración propia.

En la Tabla 3 se pueden apreciar los resultados obtenidos para el valor óptimo real, en general, se encuentran muy próximos a su Valor Anti Utópico correspondiente, existiendo un desfasaje promedio aproximado de tan solo 0,37, normalizado teniendo en cuenta el tamaño de cada instancia.

Para una mejor comprensión se muestra la Figura 3. Además, fue factible el Valor Anti Utópico en 18 de los 47 modelos, resultando un 38 % de factibilidad aproximadamente.

Fuente: elaboración propia.

Figura 3 Comportamiento del desfasaje entre Valor Anti Utópico - valor óptimo real, maximizando, según crecen los elementos a ordenar

Además, se puede apreciar que, como promedio, el óptimo es 0,98 del anti utópico por tanto se logró una muy buena estimación del óptimo. La Figura 4 muestra estos resultados.

Fuente: elaboración propia.

Figura 4 Diferencia proporcional entre el Valor Anti Utópico y el valor óptimo real

La Figura 5 representa la relación entre los valores utópicos, anti utópico y óptimos reales.

Fuente: elaboración propia.

Figura 5 Relación entre Valor Utópico, Valor Anti Utópico, valor óptimo real minimizando y valor óptimo real maximizando

En la Figura 6 se realiza una proporción llevando los valores utópicos, anti utópicos y reales a una escala [0,1], donde 0 es el Valor Utópico, 1 el anti utópico y ubica según la proporción el valor óptimo, lo cual permite ver con claridad que están acotados bien con respecto a los valores utópicos.

Fuente: elaboración propia.

Figura 6 Relación entre Valor Utópico, Valor Anti Utópico y valor óptimo real a escala [0,1]

5. CONCLUSIONES

En este trabajo, se extiende la investigación realizada en ^[¹⁴^] y se realizó una nueva reformulación de los conceptos de Matriz Utópica y Anti Utópicas para el problema RAP.

En los experimentos se compararon los valores obtenidos de la matrices utópicas y anti utópicas con los valores óptimos del problema, donde se pudo demostrar la efectividad de los valores utópicos y anti utópicos como valores óptimos extremos (mínimos y máximos), y en ocasiones factibles, para medir el valor de calidad de la solución (ranking de consenso) del RAP sin empates.

La Matriz Utópica y la Matriz Anti Utópica son conceptos que se puede utilizar para evaluar las matrices de precedencia, que son la entrada de los RAP, por tanto, obtener una solución factible a partir de una matriz utópica es un problema interesante y abierto.

Además, es necesario conocer los casos en los que la Matriz Utópica y la Matriz Anti Utópica no son factibles, ya que ambos factores se vinculan directamente a la toma de decisiones, con el objetivo de ayudar a seleccionar los algoritmos correctos de acuerdo con las instancias del problema a resolver.

Además, encontrar rápidamente, con solo recorrer la matriz de entrada, una buena cota de los valores óptimos es muy interesante cuando se quiere resolver este tipo de problemas.

El hecho de que en algunos casos la Matriz Utópica refleje una matriz factible tiene varias implicaciones, y una importante es que el proceso de construir la Matriz Utópica se convierte en algunos casos en un algoritmo de solución del RAP, lo cual debe analizarse a profundidad en trabajos futuros.

6. AGRADECIMIENTOS

El trabajo no es producto de un proyecto económicamente soportado. Los autores agradecen a los revisores por todos los comentarios y sugerencias que han permitido mejorar el trabajo.

REFERENCIAS

[1] H. Ramírez-Murillo; C. A. Torres-Pinzón; E. F. Forero-García, “Photovoltaic Potential Estimation by Means of Data Mining in Four Colombian Cities,” TecnoLógicas, vol. 22, no. 46, pp. 65-85, Sep. 2019. https://doi.org/10.22430/22565337.1345 [ Links ]

[2] F. Ganga-Contreras; J. López-Nunez; W. Sáez, “Portal de ranking de universidades iberoamericanas: una propuesta para facilitar procesos decisionales,” Rev. Ibérica Sist. e Tecnol. Informação, no. E25, pp. 472-488, Jan. 2020. https://www.proquest.com/docview/2350120514/fulltextPDF/5AB1DDD5F6D34FFDPQ/1 [ Links ]

[3] C. Dwork; R. Kumar; M. Naor; D. Sivakumar, “Rank Aggregation Methods for the Web,” in Proceedings of the 10th International Conference on World Wide Web, New York, 2001, pp. 613-622. https://doi.org/10.1145/371920.372165 [ Links ]

[4] L. J. Pérez Lugo, “Método para la agregación de rankings a partir de dos grupos con intereses contrapuestos,” (Tesis Doctorado), Facultad de Matemática, Física y Computación. Departamento de Ciencias de la Computación, Universidad Central “Marta Abreu” de Las Villas, 2015. https://dspace.uclv.edu.cu/handle/123456789/7315 [ Links ]

[5] D. Sculley, “Rank Aggregation for Similar Items,” in Proceedings of the Seventh SIAM International Conference on Data Mining, April 2007, Minneapolis, Minnesota, USA, 2007, pp. 587-592. https://doi.org/10.1137/1.9781611972771.66 [ Links ]

[6] S. Chaudhuri; G. Das; V. Hristidis; G. Weikum, “Probabilistic Ranking of Database Query Results,” in Proceedings of the Thirtieth International Conference on Very Large Data Bases, VLDB 2004, Toronto, Canada, 2004, pp. 888-899. https://doi.org/10.1016/B978-012088469-8.50078-4 [ Links ]

[7] G. Dahl; H. Minken, “A note on permutations and rank aggregation,” Math. Comput. Model., vol. 52, no. 1-2, pp. 380-385, Jul. 2010. https://doi.org/10.1016/j.mcm.2010.02.052 [ Links ]

[8] H. L. Turner; J. van Etten; D. Firth; I. Kosmidis, “Modelling rankings in R: the PlackettLuce package,” Comput. Stat., vol. 35, no. 3, pp. 1027-1057, Feb. 2020. https://doi.org/10.1007/s00180-020-00959-3 [ Links ]

[9] V. Pihur; S. Datta; S. Datta, “RankAggreg, an R package for weighted rank aggregation,” BMC Bioinform., vol. 10, no. 62, Feb. 2009. https://doi.org/10.1186/1471-2105-10-62 [ Links ]

[10] A. Ali; M. Meila, “Experiments with Kemeny ranking: What works when?,” Math. Soc. Sci., vol. 64, no. 1, pp. 28-40, Jul. 2012. https://doi.org/10.1016/j.mathsocsci.2011.08.008 [ Links ]

[11] A. Rosete, “Reformulación eficiente del problema de programación lineal de agregación de rankings.,” Ing. Ind., vol. 39, no. 3, Dic. 2018. http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1815-59362018000300250 [ Links ]

[12] J. Feng; Q. Fang; W. Ng, “Discovering bucket orders from full rankings,” in Proceedings of the ACM SIGMOD International Conference on Management of Data, SIGMOD 2008, Vancouver 2008, pp. 55-66. https://doi.org/10.1145/1376616.1376625 [ Links ]

[13] A. Gionis; H. Mannila; K. Puolamäki; A. Ukkonen, “Algorithms for discovering bucket orders from data,” in Proceedings of the Twelfth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Philadelphia, PA, USA, August, 2006, pp. 561-566. https://doi.org/10.1145/1150402.1150468 [ Links ]

[14] J. A. Aledo; J. A. Gámez; A. Rosete, “Utopia in the solution of the Bucket Order Problem,” Decis. Support Syst., vol. 97, pp. 69-80, May. 2017. https://doi.org/10.1016/j.dss.2017.03.006 [ Links ]

[15] J. A. Aledo; J. A. Gámez; A. Rosete, “Approaching rank aggregation problems by using evolution strategies: the case of the optimal bucket order problem,” Eur. J. Oper. Res., vol. 270, no. 3, pp. 982-998, Nov. 2018. https://doi.org/10.1016/j.ejor.2018.04.031 [ Links ]

[16] J. A. Aledo; J. A. Gámez; D. Molina, “Approaching the rank aggregation problem by local search-based metaheuristics,” J. Comput. Appl. Math., vol. 354, pp. 445-456, Jul. 2019. https://doi.org/10.1016/j.cam.2018.03.014 [ Links ]

[17] C. Dwork; R. Kumar; M. Naor; D. Sivakumar, “Rank aggregation revisited.” Manuscript, 2001. http://web.cse.msu.edu/~cse960/Papers/games/rank.pdf [ Links ]

[18] J. A. Aledo; J. A. Gámez; D. Molina; A. Rosete, “Consensus-based journal rankings: A complementary tool for bibliometric evaluation,” J. Assoc. Inf. Sci. Technol., vol. 69, no. 7, pp. 936-948, 2018. https://doi.org/10.1002/asi.24040 [ Links ]

[19] J. A. Aledo; J. A. Gámez; D. Molina, “Tackling the rank aggregation problem with evolutionary algorithms,” Appl. Math. Comput., vol. 222, pp. 632-644, Oct. 2013. https://doi.org/10.1016/j.amc.2013.07.081 [ Links ]

[20] D. Molina García, “Contribuciones al problema de agregación de rankings. Aplicaciones al aprendizaje automático.,” (Tesis Doctorales), Departamento de Matemáticas, Universidad de Castilla-La Mancha, 2015. https://ruidera.uclm.es/xmlui/handle/10578/7191 [ Links ]

[21] E. M. García Nové, “Nuevos problemas de agregación de rankings: Modelos y algoritmos,” (Tesis Doctorales), Departamento de Estadística, Matemáticas e Informática, Universidad Miguel Hernández de Elche, 2018. http://dspace.umh.es/bitstream/11000/4816/1/TD%20Garc%C3%ADa%20Nov%C3%A9%2C%20Eva%20Mar%C3%ADa%20.pdf [ Links ]

[22] W. D. Cook; M. Kress; L. M. Seiford, “An axiomatic approach to distance on partial orderings,” RAIRO-Operations Res., vol. 20, no. 2, pp. 115-122, 1986. http://www.numdam.org/item/?id=RO_1986__20_2_115_0 [ Links ]

[23] T. Achterberg, “SCIP: solving constraint integer programs,” Math. Program. Comput., vol. 1, no. 1, pp. 1-41, 2009. https://doi.org/10.1007/s12532-008-0001-1 [ Links ]

[24] Z. I. Berlin, “SCIP: solving constraint integer programs,” 2017. https://www.scipopt.org/ [ Links ]

[25] N. Mattei; T. Walsh, “PrefLib: A Library for Preferences http://www.preflib.org,” in Algorithmic Decision Theory - Third International Conference, ADT 2013, Bruxelles, 2013, vol. 8176, pp. 259-270. https://doi.org/10.1007/978-3-642-41575-3_20 [ Links ]

[26] R. Reyna-Hernández, “Herramientas y ficheros para replicar y analizar los experimentos.” 2021. https://drive.google.com/drive/folders/18WoyFQaipbpblZs4P7yo_YOZ1m6L5r53 [ Links ]

Cómo citar / How to cite R. Reyna-Hernández; A. Rosete, “Extensión del concepto de utopía para el problema de la agregación de rankings sin empates”, TecnoLógicas, vol. 24, nro. 51, e1788, 2021. https://doi.org/10.22430/22565337.1788

CONTRIBUCIÓN DE LOS AUTORES

Randy Reyna-Hernández: Conceptualización, curación de datos, análisis formal, investigación, metodología, administración del proyecto, software, recursos, validación, visualización y redacción.

Alejandro Rosete: Conceptualización, análisis formal, investigación, metodología, administración del proyecto, recursos, supervisión, validación y redacción.

Recibido: 22 de Octubre de 2020; Aprobado: 16 de Febrero de 2021

^* randyrh91@gmail.com

^{CONFLICTOS DE INTERÉS DE LOS AUTORES}

Los autores reconocen no tener algún conflicto de intereses respecto al trabajo.

Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons

Services on Demand

Journal

Article

Indicators

Related links

Share

TecnoLógicas

Print version ISSN 0123-7799On-line version ISSN 2256-5337

TecnoL. vol.24 no.51 Medellín May/Aug. 2021 Epub Oct 04, 2021

https://doi.org/10.22430/22565337.1788