¿En qué repositorios de datos de investigación recomiendan los editores publicar datos?
En este artículo se han estudiado las prácticas y enfoques para la publicación de datos promovidos por los repositorios de datos científicos generales, los repositorios que aceptan la publicación de cualquier tipo de conjunto de datos. El estudio se ha realizado en los repositorios que son recomendados por las revistas de datos: 3TU.Datacentrum, CSIRO Data Access Portal, Figshare, Zenodo, Dryad.
Se presentan las prácticas actuales de los repositorios seleccionados y un análisis de acuerdo a ocho funciones claves en la publicación de los datos: formato del conjunto de datos, documentación, licencias, gastos de publicación, validación, disponibilidad, descubrimiento y acceso, y la cita. Dos observaciones importantes han surgido claramente cuando se analiza la contribución a los repositorios ‘para la publicación de datos desde estas diferentes perspectivas: (a) el legado de la publicación de artículos y (b) la falta de una comunidad determinada.
Algunas de las conclusiones:
Los repositorios aún no están diseñados para recoger, poner a disposición de manera útil y explotar la información recopilada de manera de proporcionar, por ejemplo, mejores servicios de descubrimiento y validación.
Los repositorios tendrán que abordar las limitaciones impuestas por la extrema heterogeneidad de los conjuntos de datos que gestiona. Tales cómo: mejorar la especificación de los registros, revisión de formatos que soportan nativamente, procedimientos de validación ofrecidos y licencias de los datos.
Todos los repositorios analizados, como muchos otros, han tomado la decisión de entrar en el mercado en esta etapa inicial, proponiendo un producto tradicional que cumple sólo parcialmente las necesidades de los que quieren validar y reutilizar datos. Se espera que en los próximos años, se inviertan más recursos en soluciones innovadoras que proporcionan servicios más ricos, para ayudar a la publicación de datos.