SciELO - Scientific Electronic Library Online

 
 issue50Social Science Research in Graduate Programs in ColombiaBiocoloniality: A Decolonial Genealogy author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • On index processCited by Google
  • Have no similar articlesSimilars in SciELO
  • On index processSimilars in Google

Share


Nómadas

Print version ISSN 0121-7550

Nómadas  no.50 Bogotá Jan./June 2019

https://doi.org/10.30578/nomadas.n50a4 

Tema monográfico

Dinámica de innovación en culturas y humanidades digitales: los corpus como fuente de innovación*

Dinâmica da inovação em culturas e humanidades digitais: o corpus como fonte de inovação

Innovation Dynamics in Digital Cultures and Humanities: Corpus as a Source of Innovation

Dominique Vinck** 

Alexandre Camus*** 

** Profesor de planta en estudios sociales de ciencia y tecnología (CTS) en el Instituto de Ciencias Sociales de la Universidad de Lausana (Suiza), donde además dirige el STSLab. Profesor invitado en la Universidad de los Andes, Bogotá (Colombia). PhD. en Socioeconomía de la innovación de la Ecole des Mines, París. E-mail: dominique.vinck@unil.ch

*** Estudiante de doctorado en Ciencias Sociales en la Universidad de Lausana (Suiza). E-mail: alexandre.camus@unil.ch


RESUMEN

El texto analiza el hecho de que con el surgimiento de las humanidades digitales, el patrimonio cultural se vuelve un campo de interés para disciplinas e instituciones que no lo estaban considerando antes. A través de un estudio de caso -la digitalización de 5.000 horas de grabación de un festival de jazz durante 50 años-, este artículo identifica que la constitución de un corpus cultural se vuelve un recurso mayor para sostener una dinámica innovadora científica. La tesis es que el patrimonio cultural, a través de su digitalización, se está convirtiendo en un recurso competitivo en las ciencias de la computación y la ingeniería.

Palabras clave: humanidades digitales; patrimonio cultural; festivales de jazz; digitalización; innovación

RESUMO

O texto analisa que em decorrência do surgimento das humanidades digitais, o patrimônio cultural torna-se um campo de interesse para disciplinas e instituições que antes não o consideravam. Mediante um estudo de caso -a digitalização de 5.000 horas de gravação de um festival de jazz durante 50 anos-, este artigo identifica que a constituição de um corpus cultural se torna um recurso importante para sustentar uma dinâmica científica inovadora. A tese é que o patrimônio cultural, por meio de sua digitalização, está se tornando um recurso competitivo nas ciências da computação e da engenharia.

Palavras-chave: humanidades digitais; patrimônio cultural; festivais de jazz; digitalização; inovação

ABSTRACT

The article analyzes the fact that with the emergence of digital humanities, the resulting cultural heritage turns into a field of interest for disciplines and institutions that had not considered it before. Through a case study -the digitization of5,000 hours of recorded music at a jazz festival taking place for 50 years- this article identifies how the construction of a cultural corpus results in a major resource for sustaining an innovative scientific dynamic. The argument is that cultural heritage, through its digitization, is becoming a competitive resource for computer science and engineering.

Keywords: Digital Humanities; Cultural Heritage; Jazz Festivals; Digitization; Innovation

Introducción

La innovación está asociada con una retórica instrumentalista que impulsa a los países a alinear su desarrollo con el crecimiento económico. Esto ocurre ahora también en el sector del desarrollo cultural en el cual las instituciones del patrimonio cultural y las humanidades en el medio académico están invitadas a aprovecharse de las nuevas tecnologías digitales para innovar y valorizar la herencia cultural. Se supone que las otras finalidades de las sociedades tales como el desarrollo social se cumplirían como efectos del desarrollo económico. El impulso hacia la competitividad se extiende entonces a nuevos campos de acción tales como el desarrollo humano. Ya no se presentan como dos objetivos en oposición (Cozzens et al., 2007) sino alineados. La inversión en investigación y desarrollo (I+D) sería entonces la solución también para las humanidades.

Hasta hace relativamente poco, las políticas públicas hacia la innovación no se preocupaban mucho por el sector cultural en tanto patrimonio cultural del pasado o las culturas emergentes. El tema de la brecha digital y de la e-inclusión surgió sólo en los debates (Valderrama, 2012), y su solución se pensaba en términos de multiplicación de computadores y extensión de la red Internet. Diversos programas de acceso y uso de tecnologías digitales (Plan Ceibal en Uruguay, Conectar Igualdad en Argentina, Computadores para Educar en Colombia, E-Mexico, etcétera) se plantean como impulso a la innovación pero no se conectan ni con el tema del patrimonio cultural ni con el de las culturas vigentes. La cultura sería sólo algo que adaptar y alinear (política educativa y formación de una mano de obra calificada) con la dinámica tecnoeconómica para sostenerla, o al menos no frenarla. No sería fuente de innovación. El interés por el patrimonio cultural sería interesante sólo como mercado de bienes culturales para consumidores ricos y letrados.

En la literatura sobre los determinantes de la innovación tampoco la cultura es tenida en cuenta. Los determinantes tienen más que ver con la creatividad técnica, el impulso científico o empresarial y las presiones que vienen del mercado (las preferencias y exigencias de los consumidores, su capacidad y su predisposición a pagar). Otros determinantes vienen de la sociedad y de comunidades particulares, pero se presentan más como limitaciones que como fuente de innovación, excepto a nivel de expectativas o valores generales como la preocupación por un desarrollo sostenible.

Revisando los procesos de innovación en las empresas, la literatura económica y la gestión se preocupan por identificar las fuentes de innovación (Von Hippel, 1988; Di Stefano et al., 2012). Entre los años sesenta y setenta hubo un debate entre economistas para determinar si el motor del proceso de innovación era sobre todo el desarrollo científico y técnico (el technology push) o el cambio en la demanda del mercado (el demand pull) (Freeman y Soete, 1997). De todos los factores analizados, los esfuerzos de I+D parecen los factores clave. Invertir en la generación y apropiación de conocimientos y en la exploración de nuevas tecnologías permite mejorar los procesos de producción e inventar nuevos productos para el mercado. Las empresas que invierten en actividades de vigilancia (a veces gracias a las asesorías externas), de imitación crítica y de apropiación logran tomar ideas y conocimientos de la adaptación de soluciones que vienen de la competencia, los proveedores o de sus clientes. La otra fuente es interna para la empresa cuando su política empresarial logra valorar los aportes de su personal calificado o no. La expectativa de recibir el fruto de su labor e ingenio también apoya las dinámicas innovadoras. Por fin, la literatura identifica el papel de los clientes y de los usuarios (Vinck, 2010) como fuente de ideas, de especificaciones y de soluciones, pero no el patrimonio cultural de las comunidades. Se valoriza el conocimiento tácito de cada uno dentro de la empresa y los aprendizajes colectivos, se promueve la circulación de conocimiento entre integrantes de manera que se desarrolle la creatividad y se obtengan ventajas competitivas. Sin embargo, la literatura se limita al nivel de la organización y no analiza la sociedad o la cultura de forma más extensa. Sólo la literatura que trata del desarrollo territorial o de las ciudades innovadoras integra estos aspectos hablando de modelos endógenos de crecimiento y articulando la educación, la fluidez de las comunicaciones y las redes sociales, dando poco espacio a la cultura.

Así, la cultura ha sido restringida en algunas ocasiones al ámbito social, humanístico y de las ciencias blandas. Pero la realidad nos demuestra que ese rol ha cambiado y está variando a pasos agigantados. Con lo digital, las humanidades muestran una nueva faceta. Actores del ámbito científico y tecnológico sondean nuevas posibilidades en el campo de las humanidades y del patrimonio cultural: centros de investigación e institutos de gran renombre en ingeniería, por ejemplo, se sienten atraídos hacia este sector, desarrollando así proyectos con un objetivo cultural (por ejemplo, facilitar el acceso a nuestro pasado), pero a la vez cuentan con un trasfondo tecnológico (inventar nuevas tecnologías) y económico (entre otros asuntos, crear un número de startups o transferir sus creaciones hacia el sector empresarial).

Analizando lo que pasa ahora con el surgimiento de las humanidades digitales, vemos que el patrimonio cultural se está volviendo un campo de interés para disciplinas e instituciones que no lo estaban considerando antes. Un cambio está ocurriendo para las humanidades y vale la pena cuestionarlo. A través de un estudio de caso, la digitalización de 5.000 horas de grabación de un festival de jazz durante 50 años, identificamos que la constitución de un corpus cultural se vuelve un recurso mayor para sostener una dinámica innovadora. El artículo en mención evidencia el fenómeno y ayuda a entender lo que pasa de forma concreta. La tesis es que el patrimonio cultural, a través de su digitalización, se está volviendo un recurso competitivo en ciencias de la computación e ingeniería. El análisis nos conduce a poner en evidencia una competición entre actores, privados y públicos, alrededor de la constitución de nuevos territorios de datos y corpus, y allí surgen cuestiones con respecto a los recursos de los unos y los otros para sostener esa competición. Se trata de ingeniería versus ciencias sociales y humanas, pero también de diferencias entre instituciones, regiones o países.

El caso de las humanidades digitales

Algo pasa en el sector cultural (Vinck, 2018). Desde el inicio de la primera década del siglo, entes estatales, como la US National Endowment for the Humanities (NEH), se presentan como constructoras de "una nueva frontera" para las humanidades y financian a los investigadores norteamericanos para que desarrollen rupturas científicas y tecnológicas en disciplinas como la historia, la lingüística, la antropología, entre otras. Hablando de forma irónica de un "Secret plan to replace human scholars with robots" (Kolowich, 2011), el director de la oficina para las humanidades digitales de la NEH invita a innovar en términos de análisis, interpretación y representación de enormes cantidades de datos culturales heterogéneos. En julio del 2012, la NEH anunció la asignación de 39 millones de dólares para proyectos en ciencias humanas que impulsaran el desarrollo de herramientas digitales. También se han unido organismos prestigiosos de varios países para crear un programa internacional de investigación (Digging into Data) que se dedica a preguntas como ¿qué hacer con un millón de libros, o periódicos, o fotografías?

Observamos una proliferación de invenciones de herramientas de todo tipo tal como el Main Street, Carolina1, o DH Press2, un sistema para el diseño y desarrollo de proyectos digitales de historia de una calle o una ciudad, que combina centenares de mapas antiguos y georreferenciados con una variedad de material digital (imágenes, textos, videos) para que los usuarios los conecten con su situación actual, para organizar un paseo, un debate sobre la urbanización o una exposición.

Si el movimiento de las humanidades digitales3 reivindica el libre acceso a los datos y metadatos así como la circulación y el "libre enriquecimiento de los métodos, del código, de los formatos y de los resultados de la investigación" (Dacos, 2011), genera a su vez también nuevos productos y aplicaciones que se pueden valorizar en algunos mercados (planificación urbana y diseño de una oferta turística, nuevas herramientas de tratamiento de datos masivos, etcétera). Las humanidades y la cultura se convierten en un sector para la invención de nuevas herramientas e innovaciones, no solamente de parte del medio académico y de las instituciones culturales, sino también de parte de grandes empresas como Google, Apple, Amazon, Twitter, Facebook, Flickr, etcétera. ¿Por qué Google está digitalizando un gran número de libros en bibliotecas si no es para diseñar nuevos productos y servicios (tal como el Google Ancient Places4) que pueden generar un valor económico a partir de este patrimonio cultural? Google, en el 2011 y el 2012, se involucró con un millón de dólares para financiar el campo de las humanidades digitales. Y vendiendo miles de palabras (a partir del análisis de las palabras que utilizamos en Internet y de su fondo de millones de libros digitalizados), ya genera un ingreso de cinco millones de dólares por hora (Kaplan, 2014). Más allá de inventar algunos algoritmos y ofrecer nuevos servicios en línea, esta empresa creó un modelo de negocio que se basa en la venta de palabras a través de la organización de millones de subastas por minuto, y un mercado lingüístico mundial. Más allá de una innovación que explota nuestras prácticas culturales en línea, Google impulsó un capitalismo lingüístico (Kaplan, 2014) y demostró que es un negocio lucrativo. Una gran parte de las otras aplicaciones que Google pone a disposición de los usuarios contribuye a este negocio. Las expresiones culturales son la fuente para las dinámicas económicas. Inventar algoritmos para tratar ese patrimonio cultural fortalece su modelo de negocio.

Lo que pasa con el surgimiento de las humanidades digitales nos lleva a pensar que hay más posibilidades, desde inventar herramientas, proponer servicios, desarrollar empresas y modelos de negocio, hasta construir nuevos mercados. El patrimonio cultural se está volviendo una fuente para la innovación. Un laboratorio como el DHLab del Profesor Kaplan de la Escuela Politécnica Federal de Lausana (Suiza) participa en esa dinámica. Se presenta como impulsador de nuevos enfoques informáticos para descubrir de nuevo el pasado y para anticipar el futuro. Su proyecto, The Venice Time Machine, tiene la ambición de digitalizar 1.000 años de archivos históricos (diseño de un robot para escanear 1.000 páginas por hora) con el fin de transformar los documentos en datos (desarrollo de algoritmos para reconocer las palabras y transcribir los manuscritos de varias épocas, indexación) que se puedan tratar de forma más o menos automatizada: diseño de nuevos algoritmos para analizarlos (por ejemplo, procesamiento de textos, minería de datos y de textos, construcción de redes dentro y entre documentos, conexión con georreferencias y mapas) y visualizarlos (reconstitución tridimensional de una ciudad con la posibilidad de caminar por sus calles y a través del tiempo, pasando, por ejemplo, del siglo XVIII al siglo XII; mapas interactivos, etcétera).

Un corpus cultural como fuente de innovación

Para profundizar esta reflexión sobre la cultura como fuente para la innovación, estudiamos el caso de un patrimonio cultural y su digitalización. Una fundación privada está a cargo de proteger y valorizar el patrimonio cultural que representan los archivos audiovisuales hechos de un famoso festival de jazz. Desde su inicio, se hicieron grabaciones de los conciertos (jazz, rock y blues) con las mejores tecnologías de cada época. Como resultado, hoy existe un archivo de 5.000 horas de grabaciones hechas con una gran variedad de técnicas, formatos y soportes (15 formatos de grabación audiovisuales como U-matic Video and Audio, 1" y 2" video, Betacam Digital, etcétera), los cuales han ido evolucionando a lo largo de los últimos 50 años. Los equipos para escuchar esas grabaciones están desapareciendo poco a poco y los soportes se están degradando, el riesgo consistía en que pronto este acervo cultural, inscrito en el patrimonio de la humanidad de la Unesco, se perdiera y ya no fuese accesible para nadie. Además, como estos archivos pertenecen a una fundación privada, el riesgo consistía en que no fuera sostenible económicamente a largo plazo. Entonces, para salvar este patrimonio, una empresa y una escuela politécnica tomaron la decisión de digitalizarlo en alta definición para preservar y valorizar este archivo. Para la escuela politécnica, ocuparse del archivo de un festival tan famoso, con artistas del mundo entero, aporta un poco del prestigio del festival. Se beneficia del capital simbólico del festival y de sus artistas, mientras que el festival se beneficia del prestigio de esta famosa escuela politécnica.

Una primera etapa de trabajo fue la realización de una base de datos: el archivo contiene 10.000 grabaciones en 18 formatos diferentes (algunas veces existen varios formatos de grabación para el mismo concierto). Para identificar los conciertos y los formatos, se atribuye a cada uno un código y en cada grabación se asigna un código de barras. La base de datos registra cada grabación y su contenido (un concierto se puede encontrar por partes en varias grabaciones, una cinta puede contener varios conciertos y un concierto se puede encontrar en varias cintas de formatos diferentes). Cada cinta se debe examinar para inventariar lo que contiene. Para la realización de esta base de datos, se hizo una investigación para encontrar, recolectar e integrar una gran variedad de informaciones que se encuentran en los documentos del Festival y en bases de datos que se hicieron anteriormente. La base de datos se hizo utilizando un lenguaje de programación (Sca-la) que fue creado por el grupo de un profesor de la escuela politécnica. Introducen entonces en la base de datos, informaciones sobre los conciertos, los grupos, los artistas, los instrumentos, las canciones, los formatos de la grabación original, los soportes (tipo y número de cinta), el proceso de digitalización (incluso los reportes sobre la evaluación de la cualidad), así como información sobre los derechos (de difusión, de distribución, de uso para la investigación y la enseñanza) que se negociaron con los organizadores del festival. Así se agrega al archivo existente, una base de datos unificada del archivo y una interfaz para la gestión y la búsqueda de información, lo que aumenta el valor y el interés del archivo. Esta base de datos se vuelve el punto de referencia de los múltiples actores involucrados en el proyecto de digitalización. Conectada a otros eventos de los conciertos, se vuelve la base de una plataforma para los que quieren trabajar con este material en la investigación o la enseñanza. Se enriquece con nuevos datos (por ejemplo, el orden de los eventos durante los conciertos) y materiales como lo veremos más adelante.

La digitalización se hace con una definición mejor que la de la televisión de alta definición. Esto abre la posibilidad de aprovechar las nuevas técnicas que pueden aparecer en el futuro; así, la preservación se piensa de una forma que permite la constitución de un corpus de alta calidad para sostener nuevas formas de valorización. Para reducir el costo de la digitalización, se inventan nuevas soluciones técnicas. De igual forma, mejorar las grabaciones originales, tal como colorear las películas en blanco y negro, espacializar el sonido monofónico, igualar el nivel audiofónico de un concierto al otro, de un año al otro, de un equipo de grabación o de un formato al otro, implica inventar e innovar. También se encuentran con muchos problemas que deben ser corregidos. El equipo encargado armó entonces varios proyectos para diseñar algoritmos de detección y corrección automática de los defectos audiofónicos y visuales que vienen de la degradación normal del material magnético, de interferencias en el momento de la grabación, de una mala configuración del equipo de grabación, de copia o de edición, de problemas ocurridos durante la digitalización, de la superimposición del logo de la emisora de televisión a cargo de la grabación inicial. En todos los casos, aplican esas correcciones y mejoramientos sobre una copia digital por si surgiese el caso de tener que volver a la digitalización original.

Este trabajo de corrección de defectos, de mejoramiento de las grabaciones y la elección de trabajar con una definición mejor que la de la televisión de alta definición, imponen desafíos técnicos y científicos a los investigadores e ingenieros de la escuela politécnica. Esto les llevó a plantear 25 proyectos de investigación, inventar soluciones técnicas y probar nuevos conceptos, con la idea de valorizarlos (registrándolos, patentándolos, creando startups, etcétera). La escuela politécnica anima a sus jóvenes investigadores a crear empresas que vendan soluciones de digitalización de archivos. Se hizo necesaria también una inversión en equipos (tienen 1,2 petabytes de archivos en servidores), armar un grupo de expertos (60 estudiantes, 3 expertos internos, 35 profesores e investigadores que vienen de una decena de laboratorios de la escuela politécnica) y desarrollar una red de empresas con las cuales trabajar. Como resultado, ahora cuentan con un centro de tratamiento de documentos digitales (sonido, video), que se ha convertido en uno de los más importantes del mundo en términos de equipamiento y de saber-hacer. Poco a poco están desarrollando y capitalizando un conociminento práctico que les permite atraer a otros socios y archivos.

Tener acceso a un corpus tan grande de conciertos les da una ventaja en la competición científica y tecnológica. Los conciertos digitalizados del festival se archivan en cintas en un lugar protegido, pero también existe una copia en discos duros para facilitar la investigación cuando se toma como base este corpus, como en el caso de diseñar herramientas para la búsqueda de patrones musicales o probar los algoritmos de tratamiento automático que los investigadores de la escuela politécnica puedan inventar. Igualmente, negociaron los derechos de tal forma que el corpus sea accesible para los investigadores dentro de la escuela politécnica en lugares específicos y que el público lo pueda explorar y escuchar, pero no habrá acceso libre ni por Internet. Una empresa ligada al festival se encarga de comercializar parte de los archivos en formato CD y DVD. En consecuencia, el acceso al corpus está restringido a los investigadores de la escuela politécnica o a los que participan en proyectos de investigación con esta institución. Se construyó así una forma de renta monopolística ligada a la digitalización de un corpus cultural. El proyecto y el corpus se vuelven atractivos para investigadores de otras instituciones y disciplinas, como en ciencias humanas, ciencias sociales y musicología, que construyen acuerdos de colaboración y generan publicaciones en colaboración con la escuela politécnica.

Diseño y desarrollo para enriquecer el archivo digital

La digitalización del archivo lo transforma en una fuente de muchos datos (5 petabytes) que anima a investigadores en ingeniería y computación. Con tantos datos se podrían hacer diferentes cosas: investigación, diseño de algoritmos originales, demostradores de nuevos conceptos tecnológicos. Así, esa fuente de datos se vuelve un recurso para la escuela politécnica y sus laboratorios de investigación, porque permite identificar desafíos científicos y técnicos e incentivar a los investigadores a inventar soluciones. Entrar en la posesión de un archivo cultural como éste es como acceder a un material que tiene un gran potencial. De hecho, varios grupos de investigaciones lo consideran y empiezan a imaginar proyectos, entre otros, para enriquecer el archivo con metadatos que le agregan valor. Así, se estimularon varios proyectos que condujeron a los investigadores inventar soluciones y publicar el conocimiento:

  • El diseño de un algoritmo de detección automática de los aplausos para facilitar la detección de las canciones y la indexación de las 5.000 horas de conciertos. Con esta herramienta, se facilita la transformación de los conciertos en colecciones de canciones. El desafío científico y técnico es grande. El corpus se vuelve un material para imaginar, diseñar y probar conceptos tecnológicos.

  • De la misma manera, el diseño de un algoritmo de detección de solos (batería, saxofón, guitara, cantante) anima a los investigadores a inventar soluciones para extraer performances musicales individuales y cualificar automáticamente ciertos contenidos, en particular el tipo de instrumento. Un proyecto como éste contribuye a reconfigurar los conciertos que ya no son tanto conciertos como colecciones de canciones de las cuales una parte son solos, transformadas en un material musical con nuevas propiedades a las cuales se pueden agregar otras informaciones tales como metadatos. Los solos nutren entonces un inventario en el cual se vuelve fácil buscar y extraer piezas de música.

  • El diseño y la realización de una base de datos y su limpieza. Muchos datos ya existen, a saber: programas de cada edición del festival, listas de artistas en cada concierto, listas de canciones, etcétera. Pero la recopilación de esos datos en un archivo genera errores y confusión. Una limpieza es necesaria para que los archivos estén listos para las búsquedas: completar los datos que faltan (por ejemplo, los nombres abreviados); aclarar las ambigüedades (dos artistas que tienen el mismo nombre y apellido); corregir los nombres mal escritos; quitar la información que se repite; asegurar la coherencia de los datos; relacionar cada concierto con la lista completa y controlada de los grupos, artistas, canciones e instrumentos. Para un tercio de los conciertos ya introducidos en la base de datos, la limpieza llegó a pasar de 43.000 nombres de artistas a 30.000. Esto parece un trabajo normal en la construcción de una base de datos que sea útil, pero este corpus en el contexto de una institución de investigación en ingeniería llevó a la idea de diseñar un algoritmo de limpieza automática (eliminación de espacios, puntos y mayúsculas; fusión de apellidos en dos partes).

  • La indexación de las canciones también se ha vuelto un desafío científico y técnico para identificar cada evento (canción, aplauso, introducción del concierto, introducción de la canción, interludio, silencio, come back, etcétera) dentro de cada concierto, introducir marcadores relevantes para el inicio y el final de cada canción, cortar en los conciertos y extraer las canciones, y luego agregar los metadatos relevantes a cada canción (nombre de la canción, de los artistas). En realidad, el desafío fue tan grande que el trabajo se hizo movilizando muchos estudiantes durante varios años. El resultado fue un archivo ya no constituido por conciertos sino por canciones, sin discursos ni aplausos (o muy poco de ello) agregando las canciones en playlists.

  • La digitalización de fotos: además de las grabaciones, el archivo tiene 80.000 fotos de parte de los fotógrafos oficiales del festival de jazz desde su inicio, y aparecen nuevas colecciones de fotos que se agregan al proyecto. Este trabajo y el corpus que genera constituyen también una oportunidad para inventar métodos y técnicas que se pueden valorizar después para otros corpus.

  • La indexación de las fotos: cada foto se identifica y se describe con categorías generales, como nombre del fotógrafo (algunos son muy famosos), derechos ligados a la foto, lugar, fecha y concierto, artista fotografiado y ambiente. Se agregan a los ficheros metadatos para facilitar su búsqueda en la base de fotos. Se inició un proyecto de investigación para diseñar un motor de búsqueda que podría indexar las fotos de forma más automatizada.

Así, vemos que entrar en la posesión de un corpus cultural tan grande y rico (varios materiales y tipos de datos) abre oportunidades para la investigación y la creatividad técnica. Historias similares ya ocurrieron en otros campos como el de las ciencias biomédicas con el desarrollo de la bioinformática. El hecho de que sea un corpus cultural se ha vuelto interesante para la escuela politécnica porque tiene muchos datos heterogéneos, auditivos y visuales, con música y otros registros (aplausos, palabras). Ya se entiende mejor por qué los ingenieros se interesan en algunos patrimonios culturales y en temas de humanidades en relación con lo digital. La escuela politécnica, de hecho, abrió un instituto de las humanidades digitales con dos proyectos gigantes de este tipo (el otro se enfoca en la digitalización y el tratamiento de kilómetros de archivos manuscritos que representan 1.000 años de historia).

Los proyectos que acabamos de presentar se desarrollaron gracias a la oportunidad de crear y entrar en la posesión de un archivo digital único, y lograron una base de datos extensa y coherente que se vuelve un nuevo recurso: una plataforma multimedia de este patrimonio cultural para buscar informaciones a partir de los metadatos y acceder y consultar el contenido, ya sea documentos, imágenes (los afiches de los festivales, por ejemplo), fotos o videos.

Invención, diseño y desarrollo de productos y servicios innovadores

A partir y alrededor de este gigante corpus, los investigadores e ingenieros de la escuela politécnica van más allá de la invención de soluciones frente a ciertos desafíos científicos. También imaginan productos y servicios que podrían diseñar, desarrollar y promover a partir de este corpus. Aquí presentamos brevemente algunos de éstos para precisar cómo inventan nuevas alternativas a partir del corpus en su posesión y se lanzan dentro la aventura de la innovación, eso quiere decir desarrollar, adaptar e integrar las novedades en situaciones tales que otros actores empiezan a adoptarlas. Así, el corpus cultural se vuele un recurso para innovar. Les genera ideas de lo que se podría imaginar como nuevos productos y su uso. Se lanzan en varios proyectos para inventar productos que valorizan el archivo de este festival, utilizan este corpus para probar los nuevos conceptos tecnológicos y los prototipos. Varias de estas invenciones, en realidad, pueden servir con otros corpus, pero este sirve para entrenarse y probar antes de proponer el producto a otros. Se diseñaron así varios productos gracias a la movilización de diferentes grupos de investigación de la escuela politécnica en temas como acústica, tratamiento de señal, comunicación audiovisual, pero también con grupos de otras instituciones (por ejemplo, la escuela de arte y diseño) y se tradugeron en la creación de startups.

Un primer producto es un algoritmo innovador que genera recomendaciones y constituye listas de canciones para escuchar tomando en cuenta los gustos del usuario5 pero sin pasar por metadatos agregados por humanos. Esta herramienta de recomendación analiza las características (ritmo, notas, timbre) de cada canción que escucha el oyente (la idea es acercarse a las emociones, gustos y el perfil del usuario) y busca en tiempo real en su base de datos, sobre la cual hace un mapeo de las similitudes entre canciones, las piezas parecidas que le podrían gustar al usuario. Genera luego una lista de obras organizadas de tal forma que haya una transición suave entre éstas. Otro desarrollo de esta aplicación se relaciona con las redes sociales en Internet, para analizar las tendencias y generar recomendaciones al usuario en la misma orientación. Así también se alinearán las sugerencias con respecto a la industria musical. Innovaciones similares surgieron en el mercado en relación con el streaming y se abandonó este desarrollo.

Un segundo producto es una aplicación digital que se instala en los iPad para explorar en el archivo digital6: buscar un concierto, un artista, una canción pero también fotos, afiches e informaciones. La aplicación también sugiere escuchar otras cosas similares (proposición de una balada musical), gracias al algoritmo anterior. Esta aplicación es el resultado integrado de varios proyectos y algoritmos que completan el trabajo de limpieza e indexación. Está muy ligado a este corpus cultural pero podría valorizarse para otros patrimonios culturales similares.

El tercer proyecto es muy distinto porque no es específico para este archivo cultural, pero el corpus se utilizó para probar la tecnología. Se trata de un tipo de paraguas, el SounDDots7, debajo del cual se puede escuchar un sonido orientado de alta calidad. Se basa en el desarrollo de una tecnología (un ensamblaje de parlantes con un control de la distribución del sonido) que permite crear un ambiente musical local (en el interior de un círculo de dos metros de diámetro) dentro un espacio abierto. Se podría utilizar, por ejemplo, en cada mesa de un restaurante para escuchar una música diferente sin molestar a las otras mesas, o bajo una obra dentro de un museo donde se mantendría un ambiente silencioso. Varios prototipos fueron diseñados y probados con usuarios durante varias ediciones del festival, valorizando a la vez el corpus con sus metadatos. Este equipo contribuye a revitalizar el archivo del festival.

Un cuarto producto tiene que ver con el diseño de un espacio original para la audición íntima de conciertos, con una pantalla especial (con microperforaciones para la acústica) incurvada para producir un trompe l'oeil: el Cocon8. Es un módulo (7x8 m) hasta para cuatro personas que les permite sumergirse en el ambiente para mirar, escuchar, explorar e interactuar con el archivo digital. Cuando el módulo está abierto, se puede dirigir hacia un auditorio más amplio. Una mesa interactiva permite a los espectadores navegar manipulando los gráficos del archivo. Este equipo también contribuye a revitalizar el archivo del festival y explorar lo que se puede hacer con archivos digitales más allá de sólo repetir un concierto, para, por ejemplo, enfocarse en algunos detalles de un sonido (instrumento, formato o equipo antiguos, etcétera) o probar una posición diferente (alejarse de la pantalla, mirar desde arriba). El proyecto resulta de desarrollos tecnológicos en términos de ingeniería de sonido, y utiliza una tecnología de audiofónicos 3D desarrollada por una startup que surgió de un laboratorio de la escuela politécnica. El Cocon sirve también para estudiar cómo los usuarios interactúan entre ellos (gracias a la interfaz táctil) y con la inmersión en sonido y video de alta calidad (estudio de las percepciones del espectador y de la posibilidad de tomar en cuenta su visión). La idea es imaginar y probar nuevos usos para las tecnologías y abrir nuevas perspectivas para su diseño. De nuevo, esta invención se podría utilizar con otros corpus, pero la posesión de un corpus permite probar el equipo y también atraer a usuarios para testearlo.

El quinto desarrollo es un karaoke instrumental. Gracias a la grabación con pistas múltiples (una para cada instrumento) se puede quitar un instrumento del concierto para que un músico reemplace, en vivo, al artista original de la grabación, y toque con el concierto acompañándolo. Para las grabaciones anteriores al uso de pistas múltiples, se hace el diseño de un algoritmo de identificación de la posición, del timbre y del ritmo de cada instrumento de forma que se puedan extraer y así generar una grabación con pistas múltiples, y luego volver a mezclar las pistas gracias a la interfaz. De este modo, se puede quitar un instrumento de cualquier grabación y generar un karaoke para los músicos aficionados. Se trata igualmente de una invención que no es específica de este corpus musical, pero el hecho de tener un corpus de esa amplitud y cualidad da a los investigadores una ventaja grande para desarrollar y probar el producto.

Finalmente, se están desarrollando algoritmos para la modelación del sonido en tres dimensiones que permite simular varios tipos de acústica, por ejemplo, la de una sala de conciertos que desapareció9. Se puede así escuchar un concierto con la acústica de una sala que no es la propia del concierto o con la acústica de otra época.

Varias de esas invenciones se probaron con usuarios (aficionados, artistas, expertos en sonido, periodistas, ingenieros, personas mayores que asistieron a los conciertos hace algunas décadas) en un bar dedicado al archivo del festival.

Con esta lista de casos se demuestra la amplitud de las investigaciones, invenciones e innovaciones que se impulsaron gracias a la posesión de un corpus que no sólo tiene un importante acervo de datos, sino al tiempo, heterogéneos y de gran valor cultural. Los problemas de su conservación y su gestión, las posibilidades de mejorarlo y enriquecerlo y la fuente de datos que representa el archivo para imaginar nuevas maneras de tratarlo y valorizarlo, pero también para probar nuevas tecnologías frente a un corpus real, todo esto hace que la inversión en un corpus cultural se convierta en un recurso estratégico para una institución politécnica y una fuente para la innovación.

Competición para la constitución de territorios de datos

El caso que analizamos conduce a evidenciar el papel de los corpus en la innovación, en particular los corpus culturales, por su riqueza, su amplitud, los desafíos distintos que representan (no son iguales a los de la bioinformática, de la gestión industrial, de las especulaciones en bolsa, etcétera). En consecuencia, los patrimonios culturales digitalizados se vuelven un recurso para generar nuevas ideas, enfrentarse a nuevos desafíos científicos y técnicos y desarrollar nuevos productos y servicios. Este hecho es tan importante que se observa una competición entre actores, privados y públicos, alrededor de la constitución o de la captación de corpus. Los corpus se convierten en los nuevos territorios de la competición innovadora, son territorios de datos.

Este fenómeno se observa en una institución educativa prestigiosa como la escuela politécnica analizada con la inversión en el archivo del festival de jazz que la condujo a poner en marcha un centro de tratamiento multimedia y a capitalizar un saber-hacer que ahora le permite atraer a otros socios y archivos; de este modo recuperaron los archivos de la radio y televisión nacional suiza (son 32.000 horas de programas audiovisuales) y tuvieron contactos con el Comité Internacional Olímpico (COI) para encargarse de sus archivos, aunque en esos dos casos los expertos en esos corpus son académicos de ciencias sociales y humanas de otras instituciones, los cuales deben pasar desde ahora por la institución que tiene el corpus digital. También lanzaron el proyecto Venice Time Machine10 para tratar, con la Universidad Ca'Foscari, 1.000 años de historia. La importancia del acceso a tales corpus es tan grande para la escuela politécnica que su presidente asume las negociaciones él mismo. Construir y tener gigantes corpus digitales se ha vuelto una preocupación estratégica para instituciones que tienen una visión y una ambición para su futuro como actores de la investigación, de la innovación y del emprendimiento. Se escucha, en la escuela politécnica, que las humanidades digitales sirven para ayudar al desarrollo de la inteligencia artificial; además, si esos corpus ya tienen un prestigio, permiten a la institución que invierte en éstos ganar de su prestigio. El hecho de que sea un corpus cultural también tiene alguna importancia para una escuela de ingeniería porque le permite mostrar su interés por las humanidades, y defenderse de trabajar sólo en asuntos técnicos.

También se desarrollan empresas paralelas alrededor del corpus, tal como Google Books que digitaliza decenas de millones de libros en bibliotecas públicas (lo que les permite generar algunos corpus importantes, por ejemplo, de libros antiguos o de mapas) o el corpus de los rastros de las acciones que dejan los usuarios en Internet. Las empresas atraen a los investigadores ofreciéndoles acceso a partes del corpus (documentos escaneados en forma de imágenes y texto, datos derivados) además de un aporte financiero y del acceso a sus tecnologías y experticia. De la misma forma, una empresa como Twitter se reserva el derecho de elegir quiénes son los investigadores, éstos serán seleccionados por agencias nacionales de investigación, basándose en los proyectos que proponen y el acceso a sus corpus.

Si la digitalización de corpus culturales abre muchas posibilidades en términos de acceso al patrimonio cultural, en realidad actores privados y públicos se están posicionando para tener y acceder a tales corpus. De hecho, se está generando una competición creciente. La digitalización de contenidos refuerza la posición de los actores que manejan o poseen los medios de di-gitalización, almacenamiento y acceso a la información digitalizada, mientras que los expertos del contenido patrimonial se vuelven más dependientes de los expertos de la tecnología y sus corpus digitales.

Riesgo y desafíos

La creación de bases de datos digitales de patrimonios culturales y su explotación para generar representaciones y conocimientos, además de incrementar la comprensión de las culturas, juega un papel importante en el desarrollo de comunidades y regiones. Hasta hace poco se trataba de las bibliotecas y patrimonios del Norte. Por ejemplo, el proyecto Gutenberg, hasta el 201111, digitalizó 30.768 libros en inglés y solamente 1.834 en francés, 516 en portugués, 308 en español y 51 en tagalo (Filipinas). Pero es probable que poco a poco, los actores que buscan corpus vuelvan su mirada hacia el patrimonio cultural de otras sociedades. La competición entre actores alrededor de la constitución de nuevos territorios de datos ya se hace muy evidente en los países desarrollados. Un riesgo para otras regiones del mundo es que se conviertan en nuevos campos de batalla para capturar patrimonios y crear corpus y datos. Las culturas se vuelven cada vez más una cuestión de geopolítica (surge el tema del acceso, de la inclusión /exclusión) que influye en la construcción de las identidades regionales y de los grupos sociales. Podría ser un problema si el paso a lo digital se limita a una reducción del patrimonio cultural accesible, conformado por lo que se digitaliza en Estados Unidos y Europa, y en el dominio de los corpus culturales del mundo por un número reducido de instituciones y empresas. Como esos corpus son fuentes no sólo para la innovación sino también para la producción de bienes culturales (palabras e idiomas, narrativas digitales colectivas12, gestos y costumbres, eventos, obras, etcétera), su circulación y acceso, la constitución de territorios de datos a partir de los patrimonios culturales y el paso obligado a través de aquéllos que digitalizan los corpus debería ser una preocupación de política científica, cultural y de innovación para los países no hegemónicos (Arellano et al., 2012).

Los saberes indígenas, las habilidades de grupos profesionales en vía de extinción, las contraculturas y el conocimiento no científico empiezan a interesar a movimientos sociales como los del open access, y a empresas que perciben y preparan la constitución de nuevos mercados para bienes culturales. Pensamos, por ejemplo, en Google haciendo una explotación del mapeo en Brasil, realizado por los habitantes de las favelas para darlas a conocer (Connors, 2014).

Académicos en América Latina se preocupan por la digitalización de sus archivos. En el 2012 en México se llevó a cabo el Encuentro de Humanistas Digitales que dibujó un panorama de los proyectos latinos (Directorio Digital de Fondos Antiguos de México, Biblioteca Digital del Pensamiento Novohispano del siglo XVII, Biblioteca Digital Nacional con los fondos reservados de las bibliotecas de distintas instituciones). Poco a poco grupos profesionales como los bibliotecólogos y archivistas, los museólogos y las editoriales reflexionan sobre la naturaleza de su trabajo y su papel en la sociedad, entre otros, para la recuperación de la memoria institucional o cultural. Grupos sociales se involucran también, tal como algunos pueblos indígenas, porque esos archivos digitales pueden volverse un recurso para diseñar y desarrollar tecnologías sociales (Thomas, 2012). Es el caso del Corpus del Nuevo Diccionario Histórico del Español13 a cargo del Grupo de Ingeniería Lingüística de la Universidad Autónoma de México (UNAM), que brinda herramientas para su exploración y análisis. Surgen también colectivos contraculturales que usan y transforman las tecnologías para desarrollar nuevas prácticas y formas de participación política (Fonseca y Rueda, 2012) tal como movimientos feministas e indigenistas en Internet (Rueda, 2005) o una red de telecentros que introduce una metodología de narración para la transmisión de experiencias y conocimientos locales o generar versiones alternativas al conflicto en el caso del Sistema de Comunicación para la Paz en Colombia (Sipaz). Esos movimientos y los corpus que los constituyen pueden ser apropiados por algunos actores y volverse fuente de innovación. Hasta ahora se hace con la idea del pueblo global (abrir el acceso al conocimiento), de dar existencia a grupos invisibles o de modificar la percepción de grupos o lugares mal vistos tal como el caso de las favelas. Pero esos corpus también se vuelven recursos para las dinámicas tecnoeconómicas, la invención de nuevos productos y servicios, y son fuente de valor comercial. Actores inesperados, como escuelas de ingeniería y empresa, se movilizan para invertir en este sector y apropiarse de los corpus porque descubrieron su utilidad en el fomento de la invención de nuevas tecnologías, la innovación y el emprendimiento de startups.

Conclusión

Si las políticas públicas hacia la innovación no hicieron gran caso de las humanidades, con la digitalización del patrimonio cultural se encuentran nuevos actores (entre otros, en la ingeniería) que invierten en corpus culturales porque descubrieron que construyen una base de trabajo y una fuente de nuevos proyectos y desarrollos, no sólo en sentido social por las potencialidades de investigación que ofrecen, sino también de carácter tecnológico, por las herramientas y proyectos que se generan a su alrededor. Si la perspectiva es a veces la innovación con el lanzamiento de nuevos productos en el mercado y el emprendimiento, el proceso no se reduce a una dinámica económica. Las instituciones de enseñanza e investigación, con su inversión en corpus culturales, buscan también mejorar su reputación y su reconocimiento, a través de publicaciones, patentes, prueba de conceptos y creación de startups. Se aprecia así que la apropiación del patrimonio cultural y su digitalización tienen metas variadas. Ya se ve en el caso de una escuela de ingeniería, pero es aún más evidente si se consideran otras instituciones académicas (para las cuales la inversión en corpus culturales está más ligada a preguntas analíticas de las humanidades y las ciencias sociales), patrimoniales o a los movimientos sociales, tal como el de las humanidades digitales a nivel internacional14. Sin embargo, la sorpresa es observar el interés grande de escuelas de ingeniería en relación con lo cultural. Con el presente artículo se entiende mejor por qué los corpus culturales se han vuelto fuente de desafíos científicos y técnicos, recursos para diseñar y probar conceptos tecnológicos y lugares para la innovación. En consecuencia, con la digitalización se ha generado también una competición por constituir territorios de datos sobre el patrimonio cultural. El patrimonio cultural se está volviendo un recurso competitivo en ciencias de la computación y la ingeniería, pero los recursos de los unos y los otros para sostener esa competición son desiguales entre ingeniería y ciencias sociales y humanas, entre instituciones, regiones y países.

Por estas razones, las políticas públicas deberían preocuparse más de sus archivos y de su patrimonio cultural. Hasta hace poco, éstos no entraban en las prioridades usuales con respecto al impulso del desarrollo científico y de las innovaciones, y se daba menos importancia a lo cultural como variable para el progreso económico, excepto para evitar resistencias al cambio. Ahora, con la digitalización, cuando las políticas públicas se preocupan por las humanidades digitales, están apuntando al desarrollo de tecnologías. Pero mostramos que más allá de las tecnologías hay que analizar lo que pasa con los corpus. Como éstos se convierten en fuente de innovación, sus contenidos, transformaciones y apropiación se vuelven metas estratégicas. Las políticas de innovación, en consecuencia, deberían comenzar las discusiones, reflexiones, investigaciones y experimentaciones para fomentar nuevas dinámicas innovadoras conectadas a recursos específicos de su país, región o colectivo. Es también un desafío en términos de equidad social y de posicionamiento en dinámicas internacionales.

Referencias bibliográficas

1. ARELLANO, Antonio, Rigas Arvanitis y Dominique Vinck, 2012, "Circulación y conexión mundial de saberes: elementos de antropología de los conocimientos en América Latina", en: Revue d'Anthropologie des Connaissances, Vol. 6, No. 3, pp. I-XXVIII. [ Links ]

2. CONNORS, Will, 2014, "Google, Microsoft Expose Brazil's Favelas: Tech Companies Seek to Map Previously Uncharted Slums in Rio, Tapping New Web Users", en: The Wall Street Journal, tomado de: <http://online.wsj.com/articles/google-microsoft-expose-brazils-fave-las-1411659687>. [ Links ]

3. COZZENS, Susan, Sonia Gatchair, Kyung-Sup Kim, Gonzalo Ordóñez y Anupit Supnithadnaporn, 2007, "Knowledge and Development", en: Edward Hackett, Olga Amsterdamska, Michael Lynch y Judy Wacjman (eds), Handbook of Science and Technology Studies, Cambridge, MA, MIT Press, pp. 787-811. [ Links ]

4. DACOS, Marin, 2011, "Manifiesto por unas Humanidades Digitales", en: That Camp Paris, tomado de: <http:// tcp.hypotheses.org/487>. [ Links ]

5. DI STEFANO, Giada, Alfonso Gambardellab y Gianmario Verona, 2012, "Technology Push and Demand Pull Perspectives in Innovation Studies: Current Findings and Future Research Directions', en: Research Policy, No. 41, pp. 1283-1295. [ Links ]

6. FONSECA, Andrés y Rocío Rueda, 2012, "Subjectividades, ciudadanías y tecnologías digitales", en: Diálogos, enero-junio, pp. 1-25. [ Links ]

7. FREEMAN, Chris y Luc Soete, 1997, The Economics of Industrial Innovation, Londres, Pinter. [ Links ]

8. KAPLAN, Frederic, 2014, "Linguistic Capitalism and Algorithmic Mediation", en: Representations, Vol. 127, No. 1, pp. 57-63. [ Links ]

9. KOLOWICH, Steve, 2011, "The Promise of Digital Humanities", en: Inside Higher Ed, septiembre, tomado de: <https://www.insidehighered.com/news/2011/09/28/promise-digital-humanities>. [ Links ]

10. RUEDA, Rocío, 2005, "Apropiación social de las tecnologías de la información: ciberciudadanías emergentes", ponencia presentada en el congreso Colombia: Diálogo Cultural y Tecnologías de la Información y la Comunicación para el fortalecimiento de los Procesos Comunitarios, Universidad Autónoma de Occidente, Cali, Colombia. [ Links ]

11. SWISSINFO, 2007, "Archivage High-Tech pour le Festival de Jazz de Montreux", tomado de: <http://www.swissinfo.ch/fre/archivage-high-tech-pour-le-festival-de-jazz-de-montreux/5387606>. [ Links ]

12. THOMAS, Hernán, 2012, "Tecnologías para la inclusión social en América Latina: de las tecnologías apropiadas a los sistemas tecnológicos sociales: problemas conceptuales y soluciones estratégicas", en: Hernán Thomas, Guillermo Santos y Mariano Fressoli (eds.), Tecnología, desarrollo y democracia: nueve estudios sobre dinámicas socio-técnicas de exclusión/inclusión social, Buenos Aires, MINCyT, pp. 25-78. [ Links ]

13. VALDERRAMA, Carlos, 2012, "Sociedad de la información: hegemonía, reduccionismo tecnológico y resistencias", en: Nómadas, No. 36, pp. 13-25. [ Links ]

14. VINCK, Dominique, 2010, "Innovación: el papel de los usuarios y de la sociedad", en: Pedro Bejarano, Álvaro Zerda y Carlos Cortés (eds.), Innovación: desafío para el desarrollo en el Siglo XXI, Bogotá, Prensa UNAL, pp. 543-552. [ Links ]

15. ______, 2018, Humanidades digitales: la cultura frente a las nuevas tecnologías, Barcelona, Gedisa. [ Links ]

16. VON HIPPEL, Eric, 1988, The Sources of Innovation, Nueva York, Oxford University Press. [ Links ]

* Este artículo se basa en una investigación doctoral de Alexandre Camus, asistente en la Universidad de Lausana (Suiza), la cual inició en el 2014 y Analizó en junio del 2019.

2Véase: <http://dhpress.org>.

3Existen muchas definiciones de las humanidades digitales. Algunas son muy extensivas (por ejemplo, the big tent) y las definen como el encuentro entre las ciencias sociales y humanas con ciencias y tecnologías de la computación para diseñar conceptos, recursos (entre otros corpus), métodos y herramientas para tratar corpus culturales y generar un nuevo conocimiento.

7Véase: <http://www.hidacs.com>.

10Véase: <http://vtm.epfl.ch/>.

12"[...] narrativas que cuando brotan, revitalizan las memorias de los barrios y de las subjetividades, memorias menores que han estado en la periferia, saberes olvidados de la contracultura y la rebeldía, expresiones de resistencia y de creación ante una percepción fragmentada de la ciudad y de los procesos comunitarios" (Fonseca y Rueda, 2012: 16).

14El movimiento académico internacional de las humanidades digitales sostiene una variedad de perspectivas y no se reduce a una lectura utilitarista de los corpus culturales. Pero su desarrollo está muy ligado a la idea de salvar a las humanidades valorizando su trabajo para atraer a nuevos estudiantes y públicos.

Recibido: 04 de Diciembre de 2018; Aprobado: 22 de Febrero de 2019

Creative Commons License Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons