Para entender la realidad social

Hace unos años disfruté mucho leyendo un librito del politólogo Ignacio Sánchez-Cuenca titulado La desfachatez intelectual. En él critica sin ambages y con abundancia de citas a escritores e intelectuales españoles muy conocidos que se dedican a pontificar en los medios de comunicación sobre cómo resolver todo tipo de asuntos de la realidad social, sin tener especiales conocimientos del tema ni haberse documentado sobre él.

Para entender los fenómenos sociales hay que hacer exactamente lo contrario: ver qué dicen los datos, intentar detectar las causas y solo entonces apuntar, con humildad, posibles remedios. En otras palabras, sin datos no somos nadie.

Hace un año señalé aquí que hoy la frontera de la investigación, aparte de los megadatos (big data) que recopilan las empresas, está en la explotación de la ingente cantidad de datos que obtienen las Administraciones Públicas sobre todos nosotros. En ese momento me pareció prometedor que un par de altos cargos públicos, el Presidente de la Autoridad Independiente de Responsabilidad Fiscal (AIReF) y el Gobernador del Banco de España hubieran destacado la importancia del acceso de investigadores independientes a datos de alta calidad para avanzar en el conocimiento económico y que manifestaran su intención de contribuir a facilitarlo. Por una vez y sin que sirva de precedente, un año después las noticias son buenas.

BELab: la megabase de microdatos de las empresas

En julio pasado se lanzó el Laboratorio de datos del Banco de España. El BELab proporciona a los investigadores el acceso a los datos individuales (microdatos) de las empresas no financieras que operan en nuestro país recogidas en la Central de Balances.

Contiene dos tipos de datos: una muestra más pequeña, pero muy rica en información de empresas que aportan voluntariamente información detallada sobre sus cuentas anuales, y una muestra enorme, con una información más limitada, que proviene del depósito obligatorio de cuentas anuales en los registros mercantiles. Según el BE, el laboratorio da acceso a datos desde 1995 (23 años) de más de 2 millones de empresas, lo que supone un total de 16 millones de cuentas anuales. Hay datos sobre la producción y el empleo de las empresas, sus ingresos y gastos y sus balances (para más detalles ver la documentación en español y en inglés).

Es una base de datos maravillosa. Hablo por experiencia propia, pues la vengo usando desde hace más de un cuarto de siglo. Gracias a ella he podido estudiar asuntos como el impacto de los contratos temporales sobre el empleo y sobre los salarios, la inversión empresarial o, actualmente, el efecto de las características de las empresas de prácticas en la formación profesional sobre el empleo juvenil. Confieso que siempre me he sentido avergonzado por tener acceso privilegiado a estos datos, por mi relación con el BE, y es una gran alegría saber que ahora están disponibles para cualquier investigador.

Actualmente, BELab solo permite el acceso presencial a los datos en un entorno seguro, un laboratorio in situ en instalaciones del BE en Madrid. No obstante, el propio BE reconoce que es una experiencia piloto y anuncia su intención de explorar la ejecución de programas estadísticos en remoto y el acceso de forma remota a los datos, así como dar también acceso a otras bases de datos que posee. Creo que estas importantes mejoras sucederán, más pronto que tarde. No en vano el BE pertenece, junto con otros 5 bancos centrales europeos, a una red internacional para el intercambio de experiencias en el manejo estadístico de datos granulares (INEXDA).

Otras novedades en el uso de microdatos

Hay otras potenciales buenas noticias. Por una parte, el Instituto Nacional de Estadística aparentemente acaba de decidir usar muchos más datos de las Administraciones Públicas con el fin de mejorar sus estadísticas, dependiendo menos de censos y encuestas. Aparte de aliviar la carga que supone para los ciudadanos y las empresas contestar encuestas, esta medida debería elevar la fiabilidad de las estadísticas y permitir al INE dedicar a otros fines los recursos que antes dedicaba a hacer encuestas. El INE ha sido pionero en dar acceso a microdatos como los de la Encuesta de Población Activa. Por ello, espero que los nuevos datos administrativos puedan estar pronto también accesibles para los investigadores.

En segundo lugar, la AIReF ha organizado desde el año pasado 7 ejercicios de revisión del gasto público (spending reviews) sobre políticas tan importantes como la concesión de subvenciones, las políticas activas de empleo o las becas universitarias. Para ello la AIReF ha recopilado un gran número de microdatos administrativos, que ha puesto a disposición de los investigadores externos que han llevado a cabo las evaluaciones. Sería muy deseable que se ampliara el acceso al resto de investigadores; me consta que la AIReF ha estado en o con académicos e instituciones españolas y extranjeras para explorar las vías para hacerlo y está trabajando en un documento sobre este asunto.

Por último, el Ministerio de Trabajo ha recibido el apoyo de la Unión Europea, bajo un programa de apoyo a las reformas estructurales, para un proyecto que pretende, entre otros objetivos, mejorar el acceso a los microdatos para el análisis y la investigación. La UE ha encargado la ejecución del proyecto, actualmente en curso, a la OCDE. A fe mía que este proyecto es muy necesario pues, si bien el Ministerio proporciona de forma ágil una base de datos excelente, la Muestra Continua de Vidas Laborales, obtener otros microdatos es un proceso lento, difícil y a veces infructuoso.

Todas estas iniciativas están aún empezando, pero es concebible que se alcance una masa crítica que lleve a la generalización del uso en la investigación de los microdatos administrativos. De momento, España está perdiendo este tren. Para muestra, bien vale un botón. Seis centros de datos de cuatro países europeos han creado una red internacional (IDAN) para facilitar el uso de microdatos administrativos para la investigación. Como primer paso, están trabajando en permitir a los investigadores acceder, en un centro de datos ubicado en su propio país, a datos proporcionados por los centros de los demás países.

Y ahora viene la prueba de agudeza visual: adivine en menos de cinco segundos qué país grande del suroeste de Europa no tiene ningún centro en dicha red internacional:

 

Hay 4 comentarios
  • "adivine en menos de cinco segundos qué país grande del suroeste de Europa no tiene ningún centro en dicha red internacional"

    ¡Lo sé! ¡Italia!

    🙂

    Gracias por la entrada. Siempre es agradable leer entradas de buenas noticias.

  • Tenga cuidado con el "ingeniero" Sánchez-Cuenca, Samuel, suele confundir sus deseos (confederales) con la realidad. Por poner solo un ejemplo, criticó a Rajoy y a Rubalcaba por no dar a los nacionalistas lo que la Constitución no les permite dar: ceder a la Generalidad catalana la competencia para realizar un referéndum sobre la independencia en Cataluña.

  • Puede tener Vd. todos los datos y la tecnología quequiera; éste no es el problema; el quid es la Teoría ; los datos en si mismos no son nada, por la sencilla razón de que no hay hechos carentes de presupuestos o sin carga sin carga teórica previa; esto vale, para todas las Ciencias; no digamos ya para el campo de la Acción Humana; toda la Sociología y buena parte de la investigación económica, mainstream, son completamente holísticas e Historicistas; quienes razonan e interaccionan son los seres humanos individuales y el resultado de esa interacción es lo que se llama Sociedad; la técnica de las regresiones significa tratar a los Humanos como partículas físicas completamente determinadas por leyes físicas y no por ideas; el Behariovísmo es una imposibilidad lógica. Un saludo.

Los comentarios están cerrados.