Open Science – Plucking a leaf from Open-Source Software

On morning of Wednesday, 13th May, 2015, a seminar on Open Science was held at Leganes campus of UC3M. The seminar started with an introduction on what Open Science is and what the state of accessibility to scientific material is outside of the academic bubble we live in. One of the main speakers of the day, Dr. Ivo Grigorov, started his part of the talk by asking how many in the audience have journal publications, followed by, how many of those articles are accessible by the respective author’s family. He went on to reveal that only about 50% of all published material, via conferences and journals, are accessible for free, which was revelating and mind boggling to most in the audience, including me.

I had no more than basic knowledge about current state of accessibility to publicly funded research, and the issues discussed during the seminar. In my opinion, Open Science and open-access is very important, if not crucial, for making rapid progress in the state of research and innovation across all fields of science and technology. There is no incentive in recreating the wheel, if the objective is to make rapid progress in any field of research. Science need to borrow from the concept of Open-Source Software, where more and more complex software libraries/applications are written based on existing, well documented, open-source software. So, it should be mandated by academic/research institutes to create and maintain an open access repository of all publications that are created under the organization.

In research and academics, the quality of research is quantified by total number of publications in top journals and conferences, and by the number of citations a publication receives. By providing open access to one’s publications, research data, software, etc. incentives future research to be conducted by others based on the research finding. This would lead to more citations and in turn more viability to the researcher and/or the research topic, in the scientific community.

For H2020 program, which is publicly funded, Open Science ensures sustainability of the research finding and knowledge acquired, that can be transferred to the society and startup incubators, through which the newly acquired knowledge can be used for creating social and economical impacting products/services. Open Science also facilitates in producing assessable research through transparency, reproducibility and transferability of newly acquired knowledge.

In my research, I produce some data which is used for training automated systems. I also create a lot of software code that can be seamlessly integrated into other projects or applications. The vast majority of software code I have written, as part of my research, is well documented, and available as open-source software for other to use. In the future I wish to make the data I have created through my research, open and freely available as well.

Google Code, GitHub and Bitbucket have made it very easy for individuals and teams to provide their software code for other to audit, use or contribute back to the open-source community. There is a need for a similar central open-access platform for sharing research data. In the Machine Learning community, there are some University/Research-team maintained repositories for sharing and maintaining data relevant to this field of research. But a more general repositories, with a structure and a list of guidelines, for maintaining well documented data is needed. There is an opportunity for a startup to evaluate this field and create a repositories similar to a GitHub, but for sharing and enhancing research data.

I have always known the importance of well documenting and open-sourcing my software code, for reusability, and providing open-access to my research results. But I now feel that I should provide open-access to as much of my research material as possible, along with my publications. This would encourage continuing or even branching off or forking off my research results to progress the topic of my research, by other in the future, which would only impact my scientific finding and my scientific career in a positive way.

Universities are some of the oldest institutions that have stood the test of time. If not the only place, Universities do need to play a vital role in providing space for supporting open-access. Thanks to a well planned and implemented short course on accessing and utilizing resources available at the University’s library, I was made aware of the services provided by the library, and how I could use the same in research review. I do not expect my thesis director to provide me such a well informed guidance on what is available, how to search for and utilize the resources available at the library.

Finally, I would like to say that #IamAnOpenScientistBecause I want my research to be a cog in the complex machine of tomorrow

Resumen-Percepción del Workshop – Lidia Muñoz Fdez

Anteriormente a la asistencia al seminario no tenía ningún conocimiento previo de en qué consistía la “ciencia abierta”, ni siquiera tenía claro el propio concepto de “Open Science”.

En principio, ese fue uno de los principales motivos para cursar el seminario: conocer en qué consiste la “ciencia en abierto”, ya que actualmente, estoy en mi primer año de doctorado, pero mi experiencia laboral ha estado en relación directa con la ciencia durante los últimos seis años, por lo tanto, tenía curiosidad por descubrir este nuevo ámbito.

Gracias al seminario he aprendido que el concepto de “ciencia en abierto” se basa en una filosofía o metodología de trabajo que pretende situar la ciencia en particular y el conocimiento en general, al alcance de toda la sociedad. Por tanto, he comprendido que la “open science” empieza con la compartición de información desde el momento de la creación y la generación de datos (e incluso, de las propias ideas), pasando por la descripción de la metodología y los procedimientos utilizados durante el proceso de obtención de datos (equipos, materiales, softwares y cualquier herramienta utilizada) y continuando con la difusión de los resultados, las teorías y las conclusiones obtenidos. De tal manera, que toda esta información pase a formar parte de grandes bases de datos cuyo acceso sea público de manera automática y global.

También he conocido que existe el programa FOSTER (Facilitate Open Science Training for European Research), el cual trabaja con el objetivo de ayudar a los distintos miembros de la comunidad científica y educativa (estudiantes, investigadores,…) a promover la ciencia de acceso abierto, tratando de mantener una concordancia con las metodologías investigadoras que existen en la actualidad.

Por otra parte, he comprobado que existen multitud de plataformas, blogs y webs para compartir datos, algunos de las que recuerdo (a modo de ejemplo) son: http://es.creativecommons.org/blog/,  http://cienciabierta.blogspot.com.es/, open science framework (https://osf.io/). En especial, me resultó muy curioso un trabajo titulado “Open Science: One Term, Five Schools of Thought” de los autores B. Fecher y S. Friesike (http://ratswd.de/dl/RatSWD_WP_218.pdf), que se basa en una revisión bibliográfica que tiene como propósito clasificar las distintas habilidades, aspectos o disciplinas científicas, incluyéndolas dentro de cinco escuelas del pensamiento: i) escuela de la infraestructura (que se ocupa de la “technological architecture”), la escuela pragmática (que domina la “collaborative research”), la escuela democrática (que se refiere a la “access to knowledge”), la escuela de medición (que se centra en la “alternative impact measurement”) y la escuela pública (que trata la “accessibility of knowledge creation”).

Además, he aprendido conceptos que desconocía, como por ejemplo: “repositorio de datos (depósito o archivo en el que de forma centralizada, se almacena y se conserva información digital, por ejemplo el http://www.opensciencedirectory.net/)” o “data mining (consiste en la extracción de información en grandes bases de datos)”. Desde mi punto de vista, los repositorios de datos son una opción ideal para almacenar trabajos como Proyectos Fin de Grado, Trabajos Fin de Máster y Tesis Doctorales, entre otros, ya que son documentos de carácter público y estos depósitos permiten su conservación y su continua recuperación.

En cuanto a mi opinión a la hora de practicar la “ciencia abierta”, me parece que a pesar de sus ventajas (dar solución a problemas o desafíos actuales, encontrar conexiones y colaboraciones, obtener impacto y reconocimiento social, contribuir al crecimiento de la economía,…), el principal riesgo que corre un “open scientist” es claramente la posibilidad de plagio (causando con ello la falta de reconocimiento del trabajo realizado). Como comentaron en el seminario, los “datos” y las “ideas” no están amparados por la ley de propiedad intelectual, por lo que para evitar dicho plagio, la actuación más reservada sería generar los datos, analizarlos y compartir los resultados únicamente entre grupo de investigación que sean afines, complementarios y sobretodo colaboradores, asegurando una actuación de protección y confidencialidad hacia los mismos.

Tras la generación de esos datos y la discusión de los resultados, existen dos posibilidades para publicar: “cerrado” / “abierto”.

  1. a) Si se escoge la opción “cerrado”, en el seminario se explicó que algunas revistas tiene el documento “retenido” durante un tiempo y tras un plazo establecido, lo ponen en acceso “abierto”.
  2. b) Si se escoge la opción “en abierto”, existen dos alternativas:

– publicar el archivo “pre-print”: documento que se envía a la revista para que lleven a cabo su evaluación.

– publicar el archivo “post-print”: documento en el que se evalúan las aclaraciones, sugerencias y/o correcciones de los “reviewers”. En muchas revistas, permiten publicar este documento, de manera paralela a la publicación del “paper” en la propia revista.

El principal problema que podemos encontrar muchos investigadores si se desea llevar a cabo la publicación en abierto son los costes de la misma (los cuales suelen ser muy superiores en comparación con el formato “cerrado”). Sin embargo, en el curso aclararon que existen proyectos europeos que ayudan con dichos costes.

Como persona que trabaja en investigación, opino que el concepto de “ciencia abierta” es por un lado, un gran avance desde el punto de vista de publicar los artículos “en abierto” y compartir datos con grupos colaboradores (favoreciendo una mayor difusión de los resultados y aprendiendo de los trabajos anteriores), pero por otro, una utopía si se trata de compartir las ideas y los datos (pues a pesar de confiar en la honestidad y la moralidad de los integrantes de la comunidad científica, siempre existe el riesgo de plagio, que supone el fracaso de un largo periodo de tiempo de trabajo).

Por todo ello, me  gustaría concluir con la reflexión final:

#IamAnOpenScientistBecause I would like that everybody knows the science, at the same time, I would like protect my work and my effort, in order to avoid the plagiarism in an innovative research.

Lidia Muñoz Fernández

Reinventando la forma de hacer ciencia

Es el viernes 8 de Mayo de 2015 y recibo la confirmación de mi plaza para el seminario “Winning Horizon2020 with Open Science”, organizado por la universidad Carlos III de Madrid. Hasta ahora poco había oído sobre la ciencia abierta y me parece interesante ponerme a investigar sobre el tema.

Como no podía ser de otra manera mi primera visita es la Wikipedia donde encuentro la siguiente definición: movimiento cuyo objetivo es la accesibilidad de las investigaciones científicas para todos los ciudadanos. Mi primera pregunta es clara: ¿puede existir alguien en contra de tan noble objetivo?

Sigo investigando y voy encontrando que no sólo sabía más del tema de lo que pensaba, sino que ya había utilizado algunos de los recursos de la ciencia abierta, los famosos OpenCourseWare. Estos cursos hacen accesibles a personas de todo el mundo las clases y materiales de algunas de las más prestigiosas universidades.

Mi opinión previa parece clara, una ciencia abierta facilita la creatividad al estar disponible para todo tipo de perfiles, favorece la igualdad de oportunidades entre los que tienen menos recursos, ahorra esfuerzos y nos permite llegar más lejos.

Por cierto se me había olvidado presentarme, mi nombre es Daniel Serrano y me encuentro realizando el doctorado en ingeniería eléctrica  en la universidad Carlos III de Madrid. Mi tesis está encaminada al diseño de nuevos sistemas de alimentación en tracción eléctrica ferroviaria. El sector ferroviario es un sector muy hermético a la hora de compartir información por lo que no resulta necesario resaltar el papel de la ciencia abierta.

Es el miércoles 13 de Mayo de 2015 y por fin comienza el seminario. La gente empieza a sentarse mientras los ponentes ocupan sus posiciones con ganas de empezar a debatir. Pocos asientos libres, parece que la ciencia abierta levanta expectación.

La primera ponencia nos permite colocarnos en situación. Definiciones y marcos regulatorios se suceden cuando de repente sale el tema de los datos. Hasta ahora sólo había pensado que lo importante eran los resultados y el método, pero. ¿Cuánto trabajo me habrían ahorrado disponer de datos fiables de sistemas de tracción para realizar mis simulaciones? Probablemente y sin exagerar diría que meses.

Primer propósito claro, todos los datos mi tesis estarán disponibles cuando los haya presentado claro está. Y de aquí enlazo el tema siguiente que me llamó la atención, compartir mis resultados mientras los obtengo. Me resulta complicado poder llevar a cabo este aspecto fuera de mi grupo de investigación. Al final de todo, nuestros puestos de trabajo dependen en gran medida de nuestros resultados y de ahí que hasta que no se inventen nuevos mecanismos que aseguren la autoría de los mismos me permito la opción de reservarlos hasta concluir la investigación.

Finalmente aparece otro tema interesante: las editoriales. En mi corta carrera investigadora he tenido la suerte de poder publicar dos artículos y mi experiencia ha sido clara, las editoriales no tienen la misión de divulgar y promover la ciencia sino el objetivo de ganar dinero. Por lo tanto la idea de un repositorio independiente me parece imprescindible.

Empieza la segunda ponencia y no lo podía hacer de mejor manera: ¿Cómo mejorar el índice de impacto? , ¿A quién no le gusta aumentar el número de citas de sus artículos?  Sin embargo el enfoque es diferente al que habría supuesto.  La clave está en la reproducibilidad de los resultados, lo que pensándolo bien tiene todo el sentido.  Es bastante común, al menos en mi campo, querer realizar algún experimento llevado a cabo por otro investigador y en muchas ocasiones resulta imposible, bien porque se omiten datos o porque el procedimiento no está demasiado claro. Segundo propósito a cumplir, en mis próximas investigaciones pondré especial énfasis en que el procedimiento sea claro.

La tercera y última ponencia nos introduce a los procedimientos de gestión y de compartición de los datos.  Me siento un poco abrumado, me había comprometido a compartir mis datos pero todos estos procedimientos parecen consumir demasiado tiempo.  Espero encontrar alguien que me ayude en el en el camino.

Tras tres mesas de debate concluye el seminario. Mucha información en la que pensar y analizar. Un tema importante en las conclusiones es el papel  de fundamental de las instituciones. Por mucho que las personas tengamos la voluntad de cambio, mientras no se englobe dentro de un marco regulatorio que lo apoye, el cambio puede iniciarse pero la velocidad será  muy lenta.

Por último no quería terminar este post sin decir que cada vez me asombra más el papel de la biblioteca en la universidad. Cuando eres alumno básicamente la utilizas para estudiar, pero cuando empiezas a investigar te das cuenta de la cantidad de recursos que brinda y del papel central que juega. Muchas Gracias.

#IamAnOpenScientistBecause together we can go further

Open Science: Opinión y Crítica

Hola a todos, mi nombre es Francisco Javier Pérez Sanjurjo y actualmente trabajo en mi tesis doctoral en el departamento de Tecnología Electrónica en la Universidad Carlos III de Madrid. El pasado 13 de Mayo atendí un workshop impartido en la universidad llamado «Winning Horizon 2020 with Open Science«. A continuación paso a exponer mi opinión sobre el mismo:

En primer lugar debo destacar que mis conocimientos sobre el Open Science eran nulos, desconocía totalmente que hubiera un movimiento que tratara de cambiar algunos aspectos en el mundo investigador. Tras este workshop me muestro totalmente a favor del Open Science. Me parece que hay aspectos principales por los que supone un gran avance:

– En primer lugar, la posibilidad de crear un repositorio global de artículos evitaría la duplicidad de la información y facilitaría la búsqueda de esta. Por otro lado evita la aprobación de artículos copiados o cualquier tipo de fraude de este tipo.

– Además el progreso en cada línea de investigación se vería impulsado por la gran base de datos e información de la que dispondríamos los investigadores. Hoy en día la mayoría de las publicaciones importantes se encuentran en revistas de pago, y las demás no se enfocan en transmitir los datos y el «know how» de las investigaciones, si no en mostrar resultados, los cuales son difícilmente reproducibles con la información de las publicaciones.

– Actualmente, toda la investigación que queda fuera de los artículos se acaba perdiendo a lo largo del tiempo, ya sean datos no mostrados en los artículos o líneas de investigación que no dieron resultados deseables. Es, desde el punto de vista científico, absurdo que se deseche esta información. Cualquier tipo de análisis, estudio o experimento tiene su aportación en el desarrollo de cualquier ciencia sea de una manera directa (con resultados favorables) o indirecta (con resultados no deseados). Con un repositorio de datos y publicaciones globales, esta información seria accesible para todos, lo que evitaría que los investigadores tropezásemos dos veces con la misma piedra.

Por estas ideas y otras muchas expuestas en el workshop queda claro que el Open Science es bueno para todos. Sin embargo, desde el punto de vista de la viabilidad encuentro serias dificultades que no fueron tratadas o por lo menos no entendí y pienso que sería importante sacarlas a la luz con objetivo de hacer este proyecto viable:

– En primer lugar no me quedó claro que organismo se encargaría de tomar el papel de «Biblioteca Virtual». Me parece que la logística de crear semejante base de datos es de una dificultad muy elevada, y sobre todo si se quiere hacer bien para conseguir los objetivos de accesibilidad y trasparencia. Por otro lado habría que tener en cuenta que organismo sería el encargado de financiar la creación de esta base de datos y su mantenimiento. Creo que no se comentó, pero entiendo que sería con fondos públicos y quizá con una pequeña cuota anual de los investigadores que hiciéramos uso de ella.

Por otro lado veo una barrera importante para que este proyecto salga adelante, y es el motivo por el cual muchos investigadores publican y donde publican, y no es otra que la carrera profesional de cada uno. Por ejemplo un investigador senior que quiera acceder a un puesto de funcionario español en una universidad o un puesto similar en el marco europeo necesita ganar puntos como investigador publicando sus trabajos en revistas de prestigio, que por «casualidades» suelen ser revistas de pago. De esta manera, aunque un investigador este concienciado y a favor del Open Science es muy posible que siga realizando sus publicaciones de una manera tradicional por su propio bien, ya que los investigadores (y sobre todo los del sector público), como todo el mundo, tienen que comer. Creo que este cambio es el más complicado de realizar y el que necesitará alguna ayuda extra a parte del movimiento Open Science.

Para terminar me gustaría resaltar que todo esto es una opinión personal, y que por supuesto puedo estar equivocado, y si así fuera, estaría encantado en que cualquiera me contestara enseñándome la realidad a mí y a todos los que tengamos la misma duda.

#IamAnOpenScientistBecause Science must be clear and free

OPEN SCIENCE: un paradigma cargado de futuro

Mi nombre es Jorge A. Alcusón y estoy realizando el doctorado en el programa de Fusión Nuclear y Física de Plasmas del departamento de Física en la Universidad Carlos III de Madrid. Mi trabajo consiste en estudiar el transporte anómalo en reactores de fusión tipo Stellarator con quasi-simetrías. Dicho trabajo, como se entiende, es de tipo teórico y computacional.

Antes de realizar el presente curso, tenía una vaga idea acerca de lo que la Ciencia en Abierto (0.S.) podía ofrecerme a mi y a mi trabajo. Si bien es cierto que no he compartido nunca mis estudios, es algo que llevaba un tiempo planteándome y que precisamente por desconocimiento acerca de cómo hacerlo tampoco había valorado en exceso. Conocía repositorios como ArchivX, y lugares en los que publicar trabajos de acceso libre al público. Sin embargo no sabia que la comunidad científica hubiese empezado a compartir datos directamente en abierto.

En mi opinión, que el conocimiento quede atrapado y vetado a la mayoría de la gente por no disponer de una suscripción a revistas es un problema bastante grave. Máxime cuando además dichas revistas se lucran con ello sin remunerar a los propios autores. En este sentido, creo que actualmente es un modelo caduco que carece de sentido en el contexto digital en el que nos encontramos. Internet ha revolucionado la forma en que trabajamos, compartimos y colaboramos con más gente. Precisamente aquí es donde la O. S. se adapta y encaja a la perfección en el actual paradigma de comunicación en el que nos encontramos.

En concreto, creo que de mi trabajo lo más interesante sería compartir los códigos y datos que he ido generando para que otros investigadores puedan emplearlos. De este modo no tendrían que repetir complicadas y tediosas simulaciones, que se generan en super-ordenadores a los que no todo el mundo tiene acceso. He de decir que me han sorprendido gratamente las webs que se recomendaron para compartir información y trabajos de todo tipo. No obstante, creo que dichas plataformas y el sistema implantado aun deja mucho que desear. Actualmente toda la responsabilidad de la gestión y la citación de los datos recae final y únicamente en la ética de los investigadores que descargan esos datos. Si bien es cierto que en general la comunidad científica es bastante honorable y “legal” en este sentido, siempre hay casos en los que esto no es cierto. En mi opinión deberían implementarse sistemas de seguridad como por ejemplo registrar el nombre y datos de las personas que se descargan tu trabajo. Esto ayudaría no solamente a poder saber quien los emplea, también nos daría una herramienta en caso de que se publique algo con nuestros datos sin reconocerse.

Desde mi punto de vista, compartir los datos una vez han sido analizados y utilizados puede ser bastante beneficioso para la comunidad. Sin embargo, realizarlo antes como se llego a sugerir en varias ocasiones durante el curso me parece no solo una locura, sino una insensatez. En primer lugar porque todos sabemos que los datos pueden contener errores. En segundo lugar, porque te pueden pisar la idea y la publicación. Creo que compartir puede ayudar a que la ciencia avance más rápido. Sin embargo, compartir por compartir, cualquier cosa y sin ningún tipo de filtro es completamente infantil e ineficaz. Para que unos datos sean interesantes han de contrastarse primero, cerciorarse de que están bien y se corresponden con lo que pretendemos (en varias ocasiones se llego a hablar de compartir en tiempo real de adquisición de datos).

Una de las ideas del curso que más ha llamado mi atención ha sido el empleo de la O. S. con un factor determinante, diferenciador y ganador a la hora de solicitar proyectos. En concreto, uno de los principales hándicaps a los que nos enfrentamos los investigadores de carácter más teórico al solicitar un proyecto es el poder justificar un impacto directo en los mercados y la sociedad. Dicho apartado, que se encuentra actualmente en cualquier propuesta, es a veces complicado de justificar pues nuestras actividades pueden ser de carácter más académico. En este sentido la O. S. permite que nuestro trabajo llegue directamente a la sociedad y por tanto nos ayuda a que nuestros proyectos tengan las mismas posibilidades que otros.

En definitiva, #Imanopenscientistbecause en una sociedad digital donde compartir e interactuar es sencillo y necesario, la O. S. es el modelo que encaja mejor y con el que la comunidad científica avanza más rápido generando colaboraciones, maximizando la visibilidad de nuestro trabajo y haciendo llegar nuestras ideas y resultados a mucha más gente.

Open Science for Open Minds

In the beginning, I would like to say that unfortunately I didn’t have any idea about the Open Science Project. Actually, the fact that there was not enough information given to us about this workshop or seminar was a bit of a turn off to me, as I was expecting that we will be given a general idea or the main topics that will be discussed. However, when I got to know what was the Open Science Project was all about when I attended, I was very interested in knowing more about it. I believe that the initiative of Open Science Project could contribute in the evolution of the research world on many levels. However, I think that it doesn’t have to be a mandatory request when publishing any research paper. I think that the idea of sharing all the information about someone’s research should be governed by privacy limits or laws first before making it obligatory. Moreover, I suggest that it could be left as a choice for the publisher or the researcher while maintaining on encouraging them to be participants of the Open Science Project.

To emphasis more about my opinion, I think that this initiative would help very much my career and the career of many other people. As a PhD student, I am faced daily with many published papers that are some way or another related to my topic of research. Unfortunately, not all of these research documents supply enough information about their source of data for their results or contributions. The idea of mutual cooperation of researchers from all over the world who are working on the same research line could save a lot of time, effort and money. Not only this, it will speed up the progress level of our world of research and contribute in the technological prosperity. This initiative will inspire many researchers on seeking their goals as it will facilitate the road to connecting them with each other.

In my topic of research, there isn’t any kind of measurements that I use or any bulk of data or information that I obtain from the internet. On the other hand, I have a lot of software coding that I do on daily basis. The kinds of data I use in these codes are not available on the internet as much as they are available on already published researches. And that what makes things very difficult because almost all the authors do not present the full information or data about their work. I would really like if my attempts of coding would be stored for a year after I am done with my studies. I am positively sure that researchers who would be working on the same topic would be interested to study my code and maybe make it even better in their own work. Thus we will be creating a snow ball that will grow bigger and bigger in years to come. If the data can’t be stored in my computer or the department server computer, then there should be an open worldwide research repository where researches can store their data or codes in it and it can be shared with researchers all over the world and to be open for editing and making it better.

Definitely, if I am able to publish my research results along with the data or information I used, this would affect very much my scientific impact. It will show a very high level of transparency that is needed nowadays. Moreover, it will give a huge opportunity for further improvement and development. I will support my university if it chooses to go for the Open Science Project. Unfortunately, I am not fully aware of the services that the university’s library offers. All I know is that, this kind of project such as the Open Science would help me and my fellow researchers a lot.

In conclusion, I am fully behind this promising initiative and I would really like to be a part of it in the future.

#IamAnOpenScientistBecause I believe that worldwide collaboration will get us somewhere better than individuals working by themselves.

Open Science vista desde un doctorando…

Hola soy Juan Carlos Cobos, estudio el Doctorado en Ingeniería Eléctrica, Electrónica y Automática,  debo decir que soy muy adepto a la formación transversal, pues a pesar de la percepción que he tenido de algunos otros compañeros, que para ellos solo es un gasto, pues para mi este tipo de seminarios, nos ayudan a formarnos en áreas que son desconocidas y esto me queda aun mas claro después de leer la mayoría de entradas, la mayoría de nosotros teníamos poco conocimiento del tema o incluso era inexistente…

En todo caso volviendo al tema, en mi caso, mi interés siempre a sido publicar en Abierto, el problema es el costo económico, claro existen alternativas como nos las presentaron en el Workshop pero es aquí cuando aparecen los peros, aclaro mi idea, querer pensar que no debe importar el nivel de impacto de mi publicación es muy complicado, lamentablemente en este mundo globalizado para cualquier puntaje en un concurso, reconocimiento de superación académica y  todo lo que yo al menos conozco la publicación tiene que ser en una revista de alto impacto, incluso durante los estudios de doctorando si no estoy mal se debe presentar al menos una publicación dentro de una revista de alto impacto en el área de estudio (si no estoy mal y si lo estoy me corrigen dentro de los dos primeros cuartiles)…

En todo caso en mi opinión luchar contra corriente no se puede, pero si se puede seguir las recomendaciones que nos dieron ese día, pues no solo debemos contentarnos con el nivel de impacto de nuestra publicación sino siempre buscar destacar la idea y como tal debemos buscar los medios para poder hacer visible esta idea en Open, ya sea hablando con las editoriales de las revistas, etc. y publicando los review de nuestras publicaciones en repositorios, como el de nuestra Universidad que en mi caso era desconocido. Yo soy de Ecuador y allí estamos dando grandes pasos en Open Science, tanto así que mi tesis de Máster esta en el rraae (red de repositorios de acceso abiertos del Ecuador).

Algo que también me gusto mucho fue la idea que trataron de plasmar y espero quede en nuestra mente, voy a tratar de citarlo textualmente:

«La investigación afecta a todos los ámbitos, es un bien publico»

Esto es algo fundamental en nuestra formación como investigadores, y a ese recelo por compartir nuestros resultados, existen demasiadas publicaciones que no cuentan con los pasos necesarios para ser replicadas, solo con supuestos estadísticos y tablas que respaldan dicha información y aquí justo viene otra idea muy importante de ese día:

«El conocimiento debe ser moldeado, no algo fijo»

Con lo cual nuestra ideas tienen que ser publicadas con la idea de ser replicadas y mejoradas de ser el caso, ser útiles a la sociedad a la cual servimos.

En todo caso para no seguir alargando mi entrada, pues es un tema muy interesante, no querría dejar de agradecer a todos los involucrados en la preparación y ejecución de este WorkShop, mi sinceros reconocimientos a todos por su interés de compartirnos grandes ideas, y rogar que para la próxima arreglen la ventilación o cambien de auditorio, pues fue muy molestoso el calor…

Saludos.

 

Open Science: algunas reflexiones

Buenos días, me llamo Eric Gutiérrez y actualmente trabajo en mi tesis doctoral en el departamento de Tecnología Electrónica de la Universidad Carlos III de Madrid. En este post pretendo comentar las ideas fundamentales de las que se habló el pasado 13 de mayo en el workshop “Winning Horizon 2020 with Open Science” y al mismo tiempo expresar lo que opina acerca de las mismas, a ver qué os parecen.

En general, la temática presentada durante el workshop no era completamente nueva para mí, pero únicamente la conocía a grandes rasgos, por lo que me resultó extremadamente interesante conocer las iniciativas propuestas desde la Unión Europea y cómo funcionarían los procedimientos relacionados con el “Open Science”.

El objetivo fundamental que se pretendía transmitir en el Workshop consistía en una introducción al concepto de “Open Science”, una descripción sobre los objetivos que se han planteado desde la Unión Europea en este ámbito y una serie de tablas redondas en las cuales se discutieron las ventajas y desventajas de este concepto. El término “Open Science” se refiere a la idea de un conocimiento de dominio público, publicado en repositorios libres y que puedan ser consultados por todo aquel que lo requiera sin necesidad de pagar ninguna cuota por acceder a dicho conocimiento.

En primer lugar, es necesario distinguir los pilares básicos sobre los que se sustenta la idea de “Open Science”. No solo se refiere a un acceso libre a todo aquel conocimiento generado por la comunidad científica, sino que además son necesarios ciertos niveles de calidad en cuanto a los contenidos publicados (veracidad, no duplicidad u originalidad). Para ello es imprescindible que todo aquello publicado se rija por términos de reproducibilidad y transparencia, es decir, que todo aquel que desee repetir una serie de resultados realizados por personas ajenas sea capaz de hacerlo con la información publicada en los repositorios y sin demasiadas dificultades. Para mí, este es un paso fundamental a llevar a cabo tanto en el ámbito de “Open Science” como en el ámbito actual en el cual la mayor parte de publicaciones importantes se realizan en revistas privadas no accesibles libremente. Uno de los principales problemas que existen actualmente es la omisión de datos relacionados con la reproducibilidad. Muy pocos artículos se centran en cómo se ha implementado una determinada idea; la mayor parte de ellos se centran en los resultados finales, omitiendo el proceso de desarrollo, es por ello que el conocimiento se limita de forma que, en ocasiones, es muy difícil reproducir los resultados de otros y comprobar que realmente son correctos. La reproducibilidad es un parámetro fundamental en el proyecto europeo Winning Horizon 2020, que pretende fomentar tanto la actividad relacionada con “Open Science” como el desarrollo de la infraestructura necesaria para llevarlo a cabo. En el ámbito de “Open Science” también es necesario establecer criterios de elaboración de repositorios, de referencias y de revisión de los artículos recibidos.

Me sorprendió durante el seminario los procedimientos que poseía la biblioteca de la Universidad Carlos III de Madrid para la publicación de los resultados de las investigaciones y su apuesta por  “Open Science”. No conocía que se pudieran enviar nuestros artículos para que se publiquen libremente en el repositorio de la biblioteca, apoyo estos procedimientos y haré uso de ellos en el futuro.

En mi opinión, la idea de “Open Science” es muy importante si se desea realizar una investigación de calidad en cualquier ámbito de la ciencia o de la sociedad. El conocimiento es un bien público y no deben existir tasas que se deban pagar para acceder a él. Estas tasas limitan el acceso a la investigación de grupos que no posean recursos económicos y se pierden potenciales ideales que sean provechosas en un ámbito concreto. Según el artículo 19 de la Declaración Universal de los Derechos Humanos: “Todo individuo tiene derecho a la libertad de opinión y de expresión; este derecho incluye … el de investigar y recibir informaciones y opiniones, y el de difundirlas, sin limitación de fronteras, por cualquier medio de expresión.”; de acuerdo con él, el actual sistema de difusión de resultados a través de revistas privadas de publicación supone una barrera que cierra las puertas de la investigación a grupos sin recursos, no debiendo ser así. Sin embargo, si se desean establecer repositorios públicos de calidad en investigación es necesario un compromiso entre todos los investigadores, de forma que cada uno realice su aportación y cumpla con los criterios de reproducibilidad y de no plagio de ideas. Por otro lado, la idea de “Open Science” se pone en conflicto con las investigaciones de determinadas empresas llevadas a cabo con el objetivo de revolucionar sus respectivos ámbitos de trabajo, desarrollando ideas innovadoras con el objetivo de obtener una ventaja comercial con respecto a sus competidores. En este caso, ¿es posible alcanzar una buena relación de convivencia entre “Open Science” y el ámbito corporativo? La respuesta es complicada ya que, en principio, una empresa se va a oponer a la difusión pública de cualquier resultado que pueda derivar en un beneficio económico mayor que el que le pueda ofrecer publicar los resultados libremente. En el workshop se planteó esta cuestión y se comentó la idea de alcanzar acuerdos entre el grupo investigador y la empresa que financia la investigación para concretar qué se puede publicar y qué no se puede publicar una vez finalizada la investigación.  Estoy de acuerdo, y no se me ocurre otra forma de conseguir una convivencia adecuada entre empresa y ciencia. A pesar de ello, pienso que realizar cualquier tipo de investigación con financiación privada va en perjuicio del propio investigador (como es mi caso), se pierden los principios básicos de la investigación: el saber por el simple hecho de saber, investigar por simple curiosidad o buscar nuevas formas de mejorar la vida de la todas las personas y no solo de unas pocas. Por ello, me gustaría una mayor inversión por parte de las entidades gubernamentales tanto nacionales como internacionales con las que se puedan sufragar las buenas ideas con las que se puede presentar un estudiante que quiera realizar un doctorado, por ejemplo. “Open Science” se enmarca dentro de la tendencia de hacer ciencia de calidad. “Open Science” es posible, pero tenemos que cuidarlo para que crezca fuerte y se haga mayor cuanto antes, ¿algunas dudas acerca de su funcionamiento?, a continuación expreso mis ideas:

  • ¿Quién podría publicar?

Todo aquel que presente una investigación original, no realizada hasta entonces en donde muestre, de forma detallada, todo el proceso de investigación: desde la idea hasta los resultados pasando por el proceso de desarrollo (reproducibilidad). Se publican tanto resultados positivos como resultados negativos (ya que cómo NO se debe hacer algo resulta enormemente práctico para investigaciones futuras).

  • ¿Cómo se controlan las publicaciones que deben ser publicadas o no?

Revisiones similares a las de las revistas actuales realizadas por la comunidad científica de forma desinteresada, que al mismo tiempo aprende lo que están realizando otras personas y recibirá revisiones de sus artículos cuando pretenda publicar algo.

  • ¿Índice de impacto?

Índice de impacto basado en las referencias que recibe un artículo desde otros artículos publicados en el repositorio público. El prestigio de un artículo dependería exclusivamente de la cantidad de investigadores que lo toman como referencia. Si todos los investigadores comenzamos a usar este tipo de repositorios es posible generar un banco de conocimiento de calidad y con prestigio en poco tiempo.

  • ¿Mantenimiento de repositorios?

Similar al que se realiza actualmente en sitios tipo Web of Knowledge.

La idea de “Open Science” es un primer paso muy interesante hacia la ciencia desinteresada, sin embargo todavía nos queda un largo camino por andar hasta llegar a la meta, aunque con ayuda de todos estoy convencido de que conseguiremos llegar.

#IamAnOpenScientistBecause Creo en un conocimiento de tod@s y para tod@s

Open Science: menos individualismo y más co-creación

Estimados compañeros, me llamo Eduardo Herranz y en la actualidad estoy embarcado en el doctorado en Ciencia y Tecnología Informática del departamento de Informática de la Universidad Carlos III de Madrid.

El propósito de este post no es más que hacer un breve resumen de lo que considero más relevante del seminario y aportar mi humilde opinión en cuanto a las implicaciones de este movimiento en el entorno actual.

En primer lugar, dejar patente mi desconocimiento del Open Science antes del seminario y, sinceramente, lo interesante del tema en cuestión.

A pesar de lo que inicialmente alguno pudiera creer (el que escribe, por ejemplo), el movimiento Open Science no sólo implica hacer accesibles todas las publicaciones, sino que aspira a mucho más. En esta línea, Open Science pretende cubrir todo el ciclo de vida de una investigación, desde la generación de ideas hasta la difusión de los resultados, incluyendo, eso sí, el ciclo de vida de los datos.

El acceso a los datos fuente es básico. No basta con disponer de los datos que se muestran en las tablas o figuras de cualquier publicación, sino que es imprescindible una plena compartición de datos para facilitar la reutilización de la investigación y, en muchos casos, reiniciarla con distintos resultados. Para ello, se antepone como necesario disponer de un DMP (Data Management Plan) realista, dinámico, abordado desde el inicio de la investigación y creado de manera conjunta con los colegas de investigación.

Independientemente de las distintas escuelas de pensamiento, los principales argumentos por los que abrazar esta nueva disciplina aperturista están relacionados, entre otros, con el incremento en el alcance de las investigaciones y sus resultados. Asimismo, se trata de reducir duplicidades y el tiempo de publicación para, en consecuencia, acelerar el ciclo de investigación de la comunidad científica. Sólo de esta manera, se podrán llevar en tiempo las ideas al mercado y generar innovación que contribuya a la mejora de la sociedad.

En el actual entorno investigador, es plausible la priorización de factores en la investigación que poco tienen que ver con la contribución de la investigación a la sociedad, al menos como objetivo principal. El factor de impacto de las publicaciones y la obligatoriedad de publicaciones JCR parecen estar distorsionando el objetivo final. Para intentar reconducir el asunto, el movimiento Open Science plantea una serie de métricas alternativas a la hora de evaluar el impacto de una investigación. Ya no se trata de ir sumando publicaciones con un determinado factor de impacto, sino de considerar otro tipo de métricas, como, por ejemplo, el número de citas. Centrarse en el factor de impacto distorsiona claramente la reproducibilidad de una investigación.

Con buen criterio, el programa marco Horizon 2020 de la Unión Europea no se ha quedado al margen de este movimiento Open Science e incluye recomendaciones al respecto para maximizar el impacto de los resultados de investigación. Para ello, se hace imprescindible un planteamiento de Open Access, mientras que es recomendable una gestión correcta de los datos a través del Open Data, aún en versión piloto. Es esencial llevar la innovación al mercado y que no se quede en el laboratorio.

A pesar de los beneficios que se anticipan, parece que la implantación del Open Science se verá las caras con muchos agentes. Por un lado tenemos a las instituciones universitarias y al personal institucionalizado, generalmente poco proclives al cambio, sea cual sea su naturaleza. Parece que sólo a través de la imposición y de los incentivos, los investigadores, sus grupos y la universidad en su conjuntos pondrán en marcha los mecanismos necesarios para contar, por ejemplo, con una canal de financiación para publicaciones en abierto o con una infraestructura común para disponer de un buen Data Management Plan (DMP). Efectivamente, esto no quiere decir que uno mismo (yo mismo, en mi tesis) no pueda disponer de un DMP, pero se trata de acercar la ciencia abierta reduciendo barreras, no levantándolas.

Ahora, la guinda en el pastel se la lleva el sistema de evaluación del personal docente e investigador. No hay lugar a dudas que los sistemas de evaluación deberán cambiar en línea con la ciencia abierta y tener en cuenta otro tipo de métricas ajenas a las publicaciones y su factor de impacto (número de citas, contactos con empresas, …). Si esto no cambia, misión imposible, al menos con el alcance que debiera. Y ya no sólo a nivel de carrera universitaria, sino también en los criterios a la hora de poder defender tu tesis en determinados programas de doctorado. El “JCR power” está muy extendido.

En resumidas cuentas, la percepción tras el seminario es de ilusión y, también, de cierta incredulidad. Empiezo por el final. Incredulidad porque este movimiento no cobre, y haya cobrado, más presencia y fuerza, en el ámbito investigador. Tras conocer las implicaciones y sus beneficios, no entiendo otro camino. Incredulidad también por el poco apoyo institucional (tanto de universidad como de Ministerio) sin el cual será muy complicada su materialización. Si no cambian los criterios de evaluación del personal docente e investigador, se minimizará el incentivo para publicar en abierto y el foco seguirá siendo publicar, cuanto más mejor, en revistas con un determinado factor de impacto. Que tengan, más o menos, impacto real en la sociedad, será un objetivo secundario. Y, por fin, ilusión porque los valores sobre los que se sustenta el movimiento parecen sólidos y válidos a todas luces. Ilusión porque dos de sus principales pilares (Open Access y Open Data), la primera de ellas –Open Access- sea ya una obligación en el marco del Horizon 2020. Al final, o se incentivan estas prácticas abiertas o todo quedará en un buen propósito.

#IamAnOpenScientistBecause debe primar la co-creación frente al individualismo.

Workshop Winning Horizon2020 with Open Science

Mi nombre es Jonathan Crespo Herrero y estoy haciendo el doctorado en Ingeniería Eléctrica, Electrónica y Automática en el departamento de Sistemas y Automática de la Universidad Carlos III de Madrid. Soy ingeniero informático e investigo en sistemas de navegación para robots móviles. He asistido al seminario de Open Science con la expectativa de informarme sobre el tema en el que ya tenía previamente ciertas dudas, aparte de para cumplir con el crédito de formación transversal.

La idea preconcebida que tenía venía del conocimiento de fuentes de software libre, que extrapolé para entender el concepto de ciencia abierta. En el tiempo que llevo investigando en robótica para mi tesis doctoral, he trabajado y trabajo con ROS y su comunidad de usuarios. ROS es lo que podríamos llamar un “sistema operativo para robots” y la filosofía es compartir el código de los nodos que se desarrollan. Esto es una ventaja impresionante para los doctorandos y para la comunidad científica en general. La idea es que si alguien ha desarrollado un pequeño programa o nodo para, por ejemplo, reconocer personas con Inteligencia Artificial, cualquiera que necesite reconocer personas para (otro ejemplo) investigar en interacción humano-robot, puede bajarse ese nodo y a partir de ese trabajo hecho, avanzar en su propio tema de investigación. Esto evita el reinventar la rueda y el tener que resolver cada uno de los problemas de la robótica de forma individual, lo que ralentizaría enormemente el avance de la investigación. En mi caso concreto, investigando en sistemas de navegación a alto nivel, puedo partir directamente de una navegación a bajo nivel, puesto que no es objetivo de mi tesis. Si los investigadores encerraran sus códigos bajo llave, implicaría tener que resolver todo desde cero. Pero en mi opinión y la de una gran comunidad de usuarios, si algo ya existe y funciona, no merece la pena perder el tiempo en volver a desarrollarlo. Esto se consigue con esta filosofía de software libre, que entra dentro de la filosofía expuesta en el seminario de Open Science.

Por lo tanto, mi opinión va a favor de la ciencia abierta, de publicar y de compartir conocimiento. Se evita duplicidad, se fomenta la colaboración, se mejora la calidad de la investigación y se generan más referencias y citaciones. Creo que el resultado de cada investigación publicada en una revista sí debería ser depositado en un repositorio institucional. Opino que el acceso abierto a la información es una de las claves para llegar al máximo nivel de producción científica y avance tecnológico de la Humanidad, de lo contrario estamos limitando nuestra capacidad. En el tiempo que llevo dedicándome a la investigación, he llegado en algunas ocasiones a encontrar artículos que me parecieron interesantes y sin embargo, una vez leídos, su utilidad para mí fue nula. ¿La razón de esto? No eran reproducibles sin un pseudocódigo al menos o información detallada sobre el sistema que tan buenos resultados decían que proporcionaba. Y si un artículo no es útil por esta razón, creo que algo estamos haciendo mal.

La naturaleza tecnológica de mi área de investigación hace que normalmente no se busque obtener unos datos relevantes, más allá de los que demuestren que el sistema desarrollado mejora o encuentra una nueva solución a un problema existente. Pero sí que produzco código que guardo tanto en el disco del robot con el que trabajo, como en el disco de mi propio portátil y en la nube. Al programar en ROS, mi código es perfectamente reutilizable por cualquier robot que pueda moverse y tenga sensores adecuados. En mi caso, no sólo voy a tratar de que el resultado de mi tesis una vez leída y publicados los resultados sean utilizables por futuras generaciones de investigadores, sino que confieso que sería un orgullo comprobar que mi trabajo sirvió de punto de partida para que otras investigaciones tuvieran lugar.

También creo que publicar en acceso abierto puede ser útil para mejorar el impacto científico del autor. En mi caso, puede servir para que una tercera persona que utilice mi código se dé cuenta de algún fallo o particular incompatibilidad con un sistema concreto.
No estaba enterado en detalle del servicio que proporcionaba la biblioteca, pues no conocía la posibilidad de publicar en acceso abierto (más allá de los repositorios de software anteriormente mencionados), pero entiendo todas las necesidades de directores de tesis, de la comunidad universitaria, de los departamentos de administración y los servicios de investigación, y espero que en el futuro se llegue a una ciencia abierta.

#IamAnOpenScientistBecause la Humanidad alcanzará su máxima velocidad de avance científico y tecnológico cuando el acceso a la información sea absolutamente libre.