4–6 de agosto de 2026
America/Costa_Rica zona horaria

De la apertura a la relevancia: valoración archivística en la gestión de datos de investigación

5 ago 2026, 11:05
5m
Charla relámpago Conocimiento científico en abierto Charlas relámpago

Descripción

¿Qué datos de investigación merecen conservarse a largo plazo? Esta pregunta, aparentemente simple, no tiene respuesta sistemática en la literatura especializada ni en las prácticas institucionales. Los modelos dominantes, las políticas de ciencia abierta y los estándares técnicos responden cómo preservar; ninguno orienta sobre qué seleccionar ni con base en qué criterios. Este vacío es el punto de partida de esta propuesta.
Una revisión crítica del estado del arte en gestión de datos de investigación, valoración archivística y preservación digital permite identificar que este vacío no es marginal, sino estructural, y tiene consecuencias directas sobre la sostenibilidad, la calidad y la gobernanza de los sistemas de ciencia abierta. En primer lugar, se evidencia una asimetría persistente entre preservación y selección. Los modelos dominantes —como OAIS, los marcos del Digital Curation Centre y las guías del Research Data Alliance— han sido diseñados para responder con precisión cómo preservar datos, pero no cuáles preservar. Estos modelos operan bajo el supuesto implícito de que los objetos digitales que ingresan a los sistemas ya han sido seleccionados, dejando fuera del alcance metodológico el momento crítico de decisión sobre su valor.
En segundo lugar, la literatura muestra una tendencia hacia el supuesto de preservación indefinida o de largo plazo como norma general. Aunque esta orientación responde al riesgo de pérdida irreversible de datos, también invisibiliza los costos acumulativos de conservar información que carece de valor científico, presenta limitaciones de calidad o no tiene potencial de reutilización. En este sentido, la preservación indefinida no constituye una estrategia, sino la evidencia de la ausencia de criterios explícitos de valoración.
Un tercer elemento identificado es la débil articulación entre la archivística y la gestión de datos de investigación. Mientras la archivística ha desarrollado durante décadas marcos teóricos y metodológicos sólidos para la valoración documental —incluyendo conceptos como valor primario y secundario, procedencia, unicidad y contexto de producción—, estos aportes son escasamente incorporados en la literatura y en las prácticas de gestión de datos. Esta desconexión limita la capacidad de las instituciones para tomar decisiones informadas sobre la selección, retención o eliminación de datos, y conduce a la reiteración fragmentaria de enfoques ya desarrollados en otros campos.
En cuarto lugar, los criterios existentes para evaluar el valor de los datos de investigación aparecen dispersos y poco sistematizados. Aunque diversos estudios han propuesto listas de criterios —como la relevancia científica, la unicidad, la calidad, el potencial de reutilización o los requisitos legales—, estos no se articulan en marcos operativos que permitan su aplicación consistente, comparable y transparente en distintos contextos institucionales. Predominan, en cambio, guías de buenas prácticas o listas de verificación que orientan, pero no estructuran la toma de decisiones.
Finalmente, se identifica una tensión significativa entre los principios FAIR y la evaluación del valor de los datos. Si bien FAIR se ha consolidado como un estándar global para promover la apertura y reutilización, no ofrece lineamientos para determinar la relevancia o pertinencia de los datos a preservar. En consecuencia, la adopción acrítica de estos principios puede conducir a priorizar la accesibilidad técnica sobre la evaluación sustantiva del valor, generando repositorios con altos niveles de disponibilidad, pero con baja densidad de información significativa.
Estas tensiones configuran un escenario en el que los desarrollos técnicos han avanzado más rápido que los marcos conceptuales para la toma de decisiones. Para las instituciones latinoamericanas, esta brecha adquiere una dimensión crítica: sus repositorios de datos están en etapas fundacionales y las decisiones que se tomen hoy sobre qué conservar definirán la calidad de esos sistemas por años. Un diagnóstico realizado en 22 centros de investigación de la Universidad de Antioquia (Colombia) lo confirma: la mayoría elimina datos por falta de espacio, no por criterio científico; solo 3 de 22 cuentan con algún documento que oriente la valoración; y los criterios FAIR menos reconocidos por el personal son precisamente los que garantizan la preservación a largo plazo —persistencia e interoperabilidad—. Lo que estos datos muestran no es una excepción local, sino un patrón estructural del ecosistema regional.
Frente a este panorama, esta ponencia propone reintroducir la valoración archivística como un enfoque estratégico para la gestión de datos de investigación, situándola no como un proceso accesorio, sino como una etapa previa y necesaria a la preservación. El argumento central es que antes de decidir cómo conservar, las instituciones deben contar con criterios explícitos, transparentes y comparables para determinar qué conservar: criterios que integren dimensiones científicas, técnicas, legales y contextuales, y que puedan aplicarse de manera consistente en distintos entornos institucionales con recursos desiguales.
La contribución de esta ponencia no es técnica, sino conceptual: desplazar el enfoque desde la acumulación hacia la decisión. Se argumenta que la ciencia abierta ha construido infraestructuras sofisticadas para preservar y compartir datos sin resolver la pregunta que las precede. Sin mecanismos explícitos de valoración, los repositorios acumulan costos sin garantizar calidad, abren datos sin asegurar valor y construyen sistemas sin bases para gobernarlos. El debate que se abre es urgente: ¿cómo incorporar la lógica de la selección en ecosistemas diseñados, casi exclusivamente, para la apertura?

Autor

LINA PINO (Universidad de Antioquia)

Materiales de la presentación