{"id":219,"date":"2016-11-28T15:10:10","date_gmt":"2016-11-28T14:10:10","guid":{"rendered":"http:\/\/www.curatore.es\/thor\/?p=219"},"modified":"2016-11-28T15:10:10","modified_gmt":"2016-11-28T14:10:10","slug":"thor-bootcamp-y-open-data-infinitas-posibilidades","status":"publish","type":"post","link":"http:\/\/www.curatore.es\/thor\/blog-posts\/thor-bootcamp-y-open-data-infinitas-posibilidades\/","title":{"rendered":"THOR Bootcamp y Open Data: infinitas posibilidades"},"content":{"rendered":"<p>La idea de ciencia abierta, <em>Open Science<\/em>, gana relevancia a nivel institucional, pero sigue siendo <em>esa gran desconocida<\/em> para muchos investigadores; especialmente en un pa\u00eds, el nuestro, que no consigue quitarse de encima la vieja idea de que la informaci\u00f3n, toda ella, es un activo cuyo valor depende directamente del nivel de confidencialidad con el que se maneje. Sin embargo, nadie podr\u00e1 arg\u00fcir que, desde nuestra Universidad, no se est\u00e9n poniendo todos los medios posibles para tratar de darle visibilidad y hacer que vaya formando parte, progresivamente, de la cultura cient\u00edfica de sus miembros; empezando por nosotros, los doctorandos.<\/p>\n<p>Es el segundo a\u00f1o consecutivo que tengo la oportunidad de asistir a un evento relacionado con este tema, despu\u00e9s de la experiencia del pasado a\u00f1o con el seminario <a href=\"http:\/\/www.curatore.es\/foster\/\">Winning Horizon2020 with OpenScience<\/a>. Y, antes de proseguir, quiero agradecer a los organizadores de estos seminarios su iniciativa porque, en mi opini\u00f3n, encajan perfectamente con los objetivos de la formaci\u00f3n transversal prevista en nuestros programas de doctorado. Se trata de competencias necesarias pero, parad\u00f3jicamente, ninguneadas de forma sistem\u00e1tica a lo largo de nuestra carrera en la universidad. Adem\u00e1s, el formato de charlas cortas elegido en esta ocasi\u00f3n me parece muy acertado, porque logr\u00f3 mantener el inter\u00e9s de un p\u00fablico poco familiarizado, en general, con el tema.<\/p>\n<p>Mi opini\u00f3n sobre el concepto general de <em>Open Science <\/em>ya qued\u00f3 reflejada en <a href=\"http:\/\/www.curatore.es\/foster\/todos\/winning-horizon2020-with-open-science-una-oportunidad\/\">el post que escrib\u00ed el pasado a\u00f1o<\/a> con motivo del citado seminario. Dieciocho meses despu\u00e9s, comparto el grueso de las opiniones que all\u00ed plasm\u00e9; de hecho, si algo ha cambiado desde entonces en mi punto de vista, ha sido en el sentido de incrementar el valor que concedo a las posibilidades ofrecidas por la publicaci\u00f3n de conocimiento cient\u00edfico en abierto.<\/p>\n<p>Este a\u00f1o, el THOR Bootcamp objeto de este blog se ha centrado en la problem\u00e1tica particular de la compartici\u00f3n de los datos, yendo un paso m\u00e1s all\u00e1 de las publicaciones, que son las que, habitualmente, concentran toda la atenci\u00f3n. Es el concepto de <em>Open Data<\/em>, una particularizaci\u00f3n de la idea gen\u00e9rica de <em>Open Science<\/em>. En el post que enlazo en el p\u00e1rrafo anterior, ya expresaba mis dudas sobre dos cuestiones que se pueden plantear a la hora de compartir datos. La primera era el valor que aporta al investigador dedicar sus recursos a la tarea de compartir sus datos; evidentemente, el primer requisito para que \u00e9ste no sea nulo es que est\u00e9 bien establecido el mecanismo de atribuci\u00f3n. El segundo aspecto que me resultaba dubitativo eran los instrumentos que ser\u00edan necesarios, principalmente desde el punto de vista t\u00e9cnico, para generalizar la compartici\u00f3n de datos de distintas caracter\u00edsticas y disciplinas en repositorios de acceso p\u00fablico. Mi asistencia a este seminario me ha permitido adquirir una visi\u00f3n m\u00e1s amplia sobre estos aspectos, complementando los conceptos ya adquiridos el a\u00f1o pasado, y ofreciendo respuestas a las cuestiones que entonces me planteaba.<\/p>\n<h3>El mundo de los datos abiertos<\/h3>\n<p>En resumen, el seminario nos introdujo el concepto de <em>Open Data<\/em> dentro del contexto general de <em>Open Science<\/em>, y despu\u00e9s nos present\u00f3 toda una panoplia de herramientas que est\u00e1n a disposici\u00f3n de los investigadores para compartir el material que se genera durante la labor cient\u00edfica, y tambi\u00e9n para identificarlo correctamente. La cuesti\u00f3n, como vimos, no est\u00e1 solo en facilitar su uso por parte de personas ajenas a nuestro trabajo, sino tambi\u00e9n, especialmente, de garantizar que el material pueda ser citado correctamente y pase a formar parte de nuestro acervo investigador.<\/p>\n<p>Voy a tratar de resumir, de forma poco precisa y, desde luego, nada exhaustiva, las que, para m\u00ed, fueron las ideas generales del seminario: los investigadores tenemos la opci\u00f3n de crearnos un identificador \u00fanico, el <a href=\"http:\/\/orcid.org\/\">ORCID<\/a>, que tiene la capacidad de contener todo lo que \u00abhemos hecho\u00bb en investigaci\u00f3n hasta el momento y que podemos utilizar como credencial de nuestro trabajo. Cada uno de los productos que se generan durante la labor investigadora, incluyendo literatura (art\u00edculos), datos, etc. puede identificarse, tambi\u00e9n de forma \u00fanica, con un <a href=\"https:\/\/www.doi.org\/\">DOI<\/a> (aunque tambi\u00e9n puede usarse PURL, LSID, ARK, etc.). Los datos en s\u00ed pueden alojarse en p\u00e1ginas como <a href=\"https:\/\/github.com\/\">Github<\/a> (aunque podr\u00edamos citar tambi\u00e9n <a href=\"https:\/\/bitbucket.org\/\">BitBucket<\/a> o <a href=\"https:\/\/about.gitlab.com\/\">GitLab<\/a>) si se trata de c\u00f3digo fuente, o bien en repositorios preparados para aceptar todo tipo de datos, como <a href=\"https:\/\/zenodo.org\/\">Zenodo<\/a> (o <a href=\"http:\/\/dataverse.org\/\">Dataverse<\/a>, o <a href=\"https:\/\/figshare.com\/\">Figshare<\/a>, &#8230;). Hay servicios que intentan facilitar la tarea de encontrar estos datos, que no es precisamente balad\u00ed, como <a href=\"http:\/\/www.re3data.org\/\">re3data<\/a>. Y <a href=\"https:\/\/www.datacite.org\/\">DataCite<\/a> (y <a href=\"http:\/\/www.crossref.org\/\">Crossref<\/a> en el caso de los art\u00edculos) ayuda a mantener todo en orden, vinculado y actualizado.<\/p>\n<p>Todos estos conceptos conforman un panorama, ciertamente, algo abrumador. Sin haber manejado anteriormente ninguno de estos servicios, salvo Github, la duda que me surgi\u00f3 fue si no resulta ineficiente tener que navegar en este marem\u00e1gnum de logotipos, siglas y nombres para llegar a lo verdaderamente importante que son, conviene no olvidarlo, los datos. Afortundamente, muchos de estos servicios pueden conectarse entre s\u00ed con un golpe de clic, y, de hecho, en ello reside, al menos en parte, la potencia de ORCID, pero&#8230; \u00bfest\u00e1n realmente todos conectados? \u00bfcu\u00e1l de las alternativas me conviene utilizar? \u00bfqu\u00e9 gano y qu\u00e9 pierdo en cada caso?<\/p>\n<p>Decid\u00ed hacer un <em>experimento:<\/em> intentar encontrar en re3data los datos que utilizamos diariamente miles de investigadores de visi\u00f3n por computador para aplicaciones en veh\u00edculos: el <a href=\"http:\/\/www.cvlibs.net\/datasets\/kitti\/\">KITTI Benchmark Suite<\/a>, del <a href=\"https:\/\/www.kit.edu\/english\/\">Karlsruhe Institute of Technology (KIT)<\/a> y <a href=\"http:\/\/www.ttic.edu\/\">Toyota Technological Institute<\/a>. Casualmente, uno de los promotores de este servicio es la biblioteca del KIT, as\u00ed que todo parec\u00eda indicar que resultar\u00eda f\u00e1cil, \u00bfverdad? Pues no. No hay ni rastro. El problema, por supuesto, no est\u00e1 en re3data, sino en que los autores de la base de datos del KITTI no le asignaron un DOI ni se preocuparon por indexarla correctamente. La cuesti\u00f3n, no obstante, es que no parece posible que, a d\u00eda de hoy, uno pueda limitarse a utilizar un subconjunto de estos servicios, sino que probablemente se vea abocado a manejarlos todos, si no quiere arriesgarse a perderse los \u00faltimos avances de su l\u00ednea de investigaci\u00f3n. Utilizando el mismo recurso que Laura Rueda en su presentaci\u00f3n, mi impresi\u00f3n al respecto queda resumida en <a href=\"https:\/\/xkcd.com\/927\/\">esta famosa vi\u00f1eta de xkcd<\/a>.<\/p>\n<p>Esta variedad de herramientas supone algo m\u00e1s: cada uno de los citados servicios est\u00e1 gestionado, y financiado, por una entidad distinta. Seg\u00fan la informaci\u00f3n que he ido recopilando, la mayor\u00eda de ellas son sin \u00e1nimo de lucro (ORCID, Inc., International DOI Foundation, etc.), pero no tiene por qu\u00e9 ser siempre as\u00ed (p. ej., Github, Inc.). No hay motivo para desconfiar de estas organizaciones, que realizan un trabajo encomiable, pero es dif\u00edcil tener garant\u00eda de que los objetivos de todas ellas van a estar permanentemente alineados con las necesidades de sus usuarios.<\/p>\n<p>Con todo esto, quiero poner de manifiesto la decepci\u00f3n que me produce ver c\u00f3mo estamos perdiendo una oportunidad \u00fanica, ahora que la idea de <em>Open Data<\/em> se encuentra todav\u00eda en sus primeras etapas, para unificar nuestros esfuerzos a nivel global; en lugar de eso, parece que estamos replicando algunos de los errores del modelo cl\u00e1sico de difusi\u00f3n de literatura cient\u00edfica.<\/p>\n<h3>Una primera aproximaci\u00f3n<\/h3>\n<p>Todo lo anterior no ha sido \u00f3bice para que, como investigador que cree en la <em>Open Science<\/em>, haya aprovechado la oportunidad para recuperar y actualizar mi <a href=\"http:\/\/orcid.org\/0000-0003-1300-3879\">ORCID<\/a> (que me cre\u00f3 autom\u00e1ticamente la Universidad en 2014) y usarlo para crear una cuenta de Zenodo, asoci\u00e1ndola a mi ya existente <a href=\"https:\/\/github.com\/cguindel\/\">Github<\/a>. Por supuesto, activ\u00e9 tambi\u00e9n la caracter\u00edstica de actualizaci\u00f3n autom\u00e1tica del ORCID que ofrece DataCite.<\/p>\n<p><span id=\"orcid-id\" class=\"orcid-id shortURI\">Es evidente que poner datos a disposici\u00f3n del p\u00fablico implica, siempre que se desee hacer correctamente, dedicar tiempo a completar, organizar y documentar esos datos de forma que sea factible su utilizaci\u00f3n pr\u00e1ctica. En mi caso, dispon\u00eda de contenido relevante desde el punto de vista de mi investigaci\u00f3n, pero no del tiempo necesario para aplicarles el tratamiento adecuado. Coincido plenamente, en este sentido, con la primera ponente cuando afirmaba que publicar los datos puede ayudar a ser m\u00e1s organizado, si se adopta la decisi\u00f3n desde el principio. Por otro lado, en Github tengo \u00fanicamente, por ahora, <em>forks<\/em> de proyectos de otros autores. Por ello, decid\u00ed publicar simplemente una presentaci\u00f3n que utilic\u00e9 hace unos meses en los encuentros doctorales que se organizan anualmente en mi grupo de investigaci\u00f3n. La intenci\u00f3n era aprender el procedimiento para poder aplicarlo, en ocasiones posteriores, a material de mayor enjundia. Este es el DOI de la presentaci\u00f3n alojada en Zenodo:<br \/>\n<\/span><\/p>\n<p><a href=\"https:\/\/doi.org\/10.5281\/zenodo.167820\"><img decoding=\"async\" class=\"aligncenter\" src=\"https:\/\/zenodo.org\/badge\/DOI\/10.5281\/zenodo.167820.svg\" alt=\"DOI\" \/><\/a><\/p>\n<p>El proceso, en su conjunto, resulta muy sencillo. Zenodo funciona muy bien y deja muy claro como rellenar los metadatos. En cambio, no he conseguido que me ofrezca una lista con mis publicaciones, para recopilar, en el futuro, los distintos objetos que he ido subiendo. El buscador de DataCite ha tardado un d\u00eda en indexar el objeto y, en el momento en que escribo estas l\u00edneas, a\u00fan no se ha incorporado a mi perfil de ORCID, que aprovecho para dejar aqu\u00ed:<\/p>\n<div class=\"orcid-id-info\" style=\"text-align: center;\"><a href=\"http:\/\/orcid.org\/0000-0003-1300-3879\"><strong><span id=\"orcid-id\" class=\"orcid-id shortURI\">http:\/\/orcid.org\/0000-0003-1300-3879<\/span><\/strong><\/a><\/div>\n<p>Sin duda, despu\u00e9s de esta experiencia, tengo claro que voy a utilizar estas herramientas a partir de ahora; en primer lugar, porque son c\u00f3modas y \u00fatiles&#8230; especialmente para el que publica el material. Y porque abrir nuestros datos no es solo un requisito para acceder a proyectos europeos; es tambi\u00e9n una forma de poner en valor todo lo que hacemos, que no siempre puede traducirse en publicaciones. Si, adem\u00e1s, somos capaces de mirar m\u00e1s lejos, las ventajas van mucho m\u00e1s all\u00e1. Probablemente, saber utilizar esta filosof\u00eda a nuestro favor no es una opci\u00f3n, sino una necesidad en un mundo cada vez m\u00e1s competitivo.<\/p>\n<div class=\"likebtn_container\" style=\"\"><!-- LikeBtn.com BEGIN --><span class=\"likebtn-wrapper\"  data-identifier=\"post_219\"  data-bg_c_v=\"\"  data-style=\"\"  data-unlike_allowed=\"\"  data-show_copyright=\"\"  data-item_url=\"http:\/\/www.curatore.es\/thor\/blog-posts\/thor-bootcamp-y-open-data-infinitas-posibilidades\/\"  data-item_title=\"THOR Bootcamp y Open Data: infinitas posibilidades\"  data-item_date=\"2016-11-28T15:10:10+01:00\"  data-engine=\"WordPress\"  data-plugin_v=\"2.6.60\"  data-event_handler=\"likebtn_eh\" ><\/span><!-- LikeBtn.com END --><\/div>","protected":false},"excerpt":{"rendered":"<p>La idea de ciencia abierta, Open Science, gana relevancia a nivel institucional, pero sigue siendo esa gran desconocida para muchos investigadores; especialmente en un pa\u00eds, el nuestro, que no consigue quitarse de encima la vieja idea de que la informaci\u00f3n, toda ella, es un activo cuyo valor depende directamente del nivel de confidencialidad con el [&hellip;]<\/p>\n<div class=\"likebtn_container\" style=\"\"><!-- LikeBtn.com BEGIN --><span class=\"likebtn-wrapper\"  data-identifier=\"post_219\"  data-bg_c_v=\"\"  data-style=\"\"  data-unlike_allowed=\"\"  data-show_copyright=\"\"  data-item_url=\"http:\/\/www.curatore.es\/thor\/blog-posts\/thor-bootcamp-y-open-data-infinitas-posibilidades\/\"  data-item_title=\"THOR Bootcamp y Open Data: infinitas posibilidades\"  data-item_date=\"2016-11-28T15:10:10+01:00\"  data-engine=\"WordPress\"  data-plugin_v=\"2.6.60\"  data-event_handler=\"likebtn_eh\" ><\/span><!-- LikeBtn.com END --><\/div>","protected":false},"author":25,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[13],"tags":[],"class_list":["post-219","post","type-post","status-publish","format-standard","hentry","category-blog-posts"],"_links":{"self":[{"href":"http:\/\/www.curatore.es\/thor\/wp-json\/wp\/v2\/posts\/219","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/www.curatore.es\/thor\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.curatore.es\/thor\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.curatore.es\/thor\/wp-json\/wp\/v2\/users\/25"}],"replies":[{"embeddable":true,"href":"http:\/\/www.curatore.es\/thor\/wp-json\/wp\/v2\/comments?post=219"}],"version-history":[{"count":18,"href":"http:\/\/www.curatore.es\/thor\/wp-json\/wp\/v2\/posts\/219\/revisions"}],"predecessor-version":[{"id":442,"href":"http:\/\/www.curatore.es\/thor\/wp-json\/wp\/v2\/posts\/219\/revisions\/442"}],"wp:attachment":[{"href":"http:\/\/www.curatore.es\/thor\/wp-json\/wp\/v2\/media?parent=219"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.curatore.es\/thor\/wp-json\/wp\/v2\/categories?post=219"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.curatore.es\/thor\/wp-json\/wp\/v2\/tags?post=219"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}