Ir al contenido principal

Gestión de datos de investigación

Esta guía permite conocer a los investigadores y comunidad educativa de la Universidad Distrital Francisco José de Caldas y en general en qué consiste la gestión de datos de investigación, sus procesos y las prácticas alrededor de la misma.

¿Qué es el Plan de Gestión de Datos?

¿Qué es el Plan de Gestión de Datos de Investigación (PGDI)?

El plan de gestión de datos de investigación PGDI es un documento definido por la institución financiadora o la propia institución del investigador que garantiza la gestión de todos los procesos del ciclo de vida de la gestión de datos de investigación. El PGDI suele ser un documento que solicita la entidad, organización o institución financiadora, pues le permite asegurar de manera idónea los datos utilizados en la investigación. EL PGDI debe:

  • Definir los pasos que necesitas para gestionar tus datos a lo largo de la investigación.
  • Establecer principios éticos sobre el uso de datos sensibles.
  • Garantizar los requerimientos pedidos por el ente financiador.
  • Asegurar la localización, accesibilidad, interoperabilidad y reutilización de los datos a lo largo del tiempo.
  • Generar impacto para los investigadores y la Universidad Distrital Francisco José de Caldas.

 

¿Cómo hacer el PGDI?

¿Cómo hacer el PGDI?

El PGDI es un documento formal definido por la institución en la cual el investigador describe lo que hará con los datos de su investigación durante todo el ciclo de vida. Este formato, que suele ser un formulario, un formato en .Word o .PDF, debe describir por lo menos los siguientes elementos que pueden variar de las exigencias o requisitos de las becas, convocatorias y postulaciones, si la entidad financiadora es pública o privada, colombiana, norteamericana, europea, etc. A continuación, los elementos básicos:

  • Información general de la investigación: investigadores, financiadores, grupo de investigación, instituciones representadas, 
  • Tipo de datos: observación, experimental, simulación, etc.; 
  • Forma de los datos: número, alfabético,  audiovisual, etc.; 
  • Formatos de archivo: .CSV, .xlsx, .PDF, .TIFF o estándares de acuerdo a las disciplinas, etc.; 
  • Tamaño de los datos: dónde deben ser almacenados; 
  • Datos sensibles: seguridad de los datos, aspectos jurídicos, etc.; 
  • Metadatos: documentación de los datos como el contenido, acceso, aspectos técnicos, etc.
  • Identificadores persistentes: fundamentales para la recuperación, citación e identificador del data set. Algunos ejemplos de ellos son: ARK (Archival Resource Key), DOI (Digital Object Identifier), Handle, PURL (Persistent Uniform Resource Locator); identificadores persitentes por disciplina: InChI (IUPAC International Chemical Identifier), LSID (Life Sciences Identifier), URL (Uniform Resource Locator), URN (Uniform Resource Name).
  • Seguridad y almacenamiento: seguridad de los datos, encriptación y comprensión de datos, back-ups y almacenamiento, preservación digital de datos.
  • Difusión: tener en cuenta dónde se espera que sean recuperados los datos: journals, directorio de datos, bases de datos, etc.
  • Datos para la citación: definir la mayor cantidad de datos para la referenciación bibliográfica. Dentro de los datos deben incluir: autores, títulos de los datos, publicación fuente de los datos, identificador(es) persistentes, afiliación, locación, fechas, formato de citación, etc.
  • Derechos de autor: definir en apoyo del personal jurídico de la institución el alcance de los derechos de autor, las licencias definidas y demás. Frente a esto, la Universidad Distrital Francisco José de caldas se encuentra trabajando en la definición del formato o template para el PGDI.

De acuerdo a la Australian Research Data Commons, un Plan de gestión de datos de investigación (PGDI en adelante) debe incluir:

  • una estrategia de respaldo
  • una encuesta de datos existente
  • esquema de datos a crear
  • guía de formato de archivo
  • instrucciones de metadatos
  • propiedad, acceso y seguridad de la información
  • organización de datos y convenciones de nomenclatura
  • información sobre la gestión de transferencias de datos y sincronización entre máquinas
  • pautas para la escritura colaborativa con colegas
  • control de versiones
  • ubicaciones de almacenamiento de datos
  • presupuesto de hardware e información de gestión
  • herramientas de gestión de bibliografía
  • instrucciones para compartir, publicar, archivar y otorgar licencias de datos
  • reglas de destrucción de datos
  • asignaciones de responsabilidad
  • un presupuesto para el PGDI general.

Algunos ejemplos de formatos o templates para el PGDI de otras instituciones pueden ser consultados en los siguientes enlaces:

 

Formatos & templates

Formatos & templates para el PGDI

A continuación, se presentan diferentes formato utilizados para la definir el PGDI en instituciones externas a la Universidad Distrital Francisco José de Caldas:

 

Herramientas para el PGDI

Algunas bibliotecas e instituciones del mundo han automatizado la creación del Plan de Gestión de Datos de Investigación:

  • DMP Assistant (Canadá): DMP Assistant es una herramienta de planificación de gestión de datos bilingüe, en línea y nacional desarrollada por Digital Research Alliance of Canada (la Alianza) en colaboración con la institución anfitriona University of Alberta para ayudar a los investigadores a preparar planes de gestión de datos (DMP) . Esta herramienta está disponible gratuitamente para todos los investigadores y desarrolla un DMP a través de una serie de preguntas clave de gestión de datos, respaldado por ejemplos y orientación de mejores prácticas.

 

  • DMP Tool (Estados Unidos): DMPTool es una aplicación en línea gratuita y de código abierto que ayuda a los investigadores a crear planes de gestión de datos (DMP). Estos planes ahora son requeridos por muchas agencias de financiamiento como parte del proceso de presentación de propuestas de subvención. DMPTool proporciona un asistente de clic para crear un DMP que cumpla con los requisitos del financiador. También tiene enlaces directos a sitios web de patrocinadores, texto de ayuda para responder preguntas y recursos de mejores prácticas de gestión de datos.

 

  • DMP Online (Reino Unido): DMPonline se basa en el código base DMPRoadmap de código abierto, desarrollado conjuntamente por el Digital Curation Center (DCC) y el University of California Curation Center (UC3). El DCC y la UC3 trabajan en estrecha colaboración con los financiadores de la investigación y las universidades para producir una herramienta que genere DMP activos y se adapte a todo el ciclo de vida de un proyecto, desde la etapa de preparación de la oferta hasta su finalización.