Código y datos en Ciencias Sociales: guía de buenas prácticas

El documento traslada las ideas y experiencias de expertos sobre código y datos en términos prácticos para los científicos sociales. Entendiendo que los investigadores de esta disciplina, no son ingenieros de software, ni administradores de bases de datos, o científicos de la computación. El manual se propone ayudar a los investigadores de esta área, planteando los problemas más frecuentes y sus soluciones.  Algunos de los siguientes ejemplos pueden orientar respecto de su contenido.

• Al tratar de replicar las estimaciones de un primer borrador de un documento,  se descubre que el código que producen las estimaciones ya no funciona porque llama a los archivos que ya se han movido. Cuando finalmente se localizan los archivos y se ejecuta el código, los resultados son diferentes de los anteriores.
• En el medio de un proyecto se dan cuenta de que el número de observaciones en una de las regresiones es sorprendentemente bajo. Después de mucho trabajo detectivesco, te encuentras con que muchas observaciones se dejaron caer en una fusión de tablas. Cuando corregimos el error y se incluyen las observaciones, los resultados cambian drásticamente.
• Un árbitro sugiere cambiar la definición de la muestra. El código que define la muestra ha sido copiado y pegado en todo el  directorio de proyecto, y hacer el cambio requiere la actualización de docenas de archivos. Al hacer esto, se dan cuenta que en realidad estaban utilizando diferentes definiciones en diferentes lugares, por lo que algunos de los resultados se basan en muestras inconsistentes.

Gentzkow, M., & Shapiro, J. M. (2014). Code and data for the social sciences: A practitioner’s guide. Chicago University.

También te podría gustar...