Las instituciones públicas como los bancos centrales necesitan de información no anonimizada para generar estadísticas de interés. Esa fue una de las conclusiones a las que llegó Paul Schreyer, jefe de Estadística y director de la Dirección de Estadísticas y Datos de la Organización para la Cooperación y el Desarrollo Económicos (OCDE).
Schreyer habló sobre el tema de uso de microdatos del público en un seminario organizado por el Banco Central de Costa Rica (BCCR) este viernes 6 de octubre. La actividad se dio en el marco de la polémica generada alrededor de la solicitud de datos crediticios sin anonimizar que le hizo el BCCR a la Superintendencia General de Entidades Financieras (Sugef) y a los cuatro bancos más grandes del país.
LEA MÁS: Conflicto Sugef-BCCR-bancos: le resumimos qué ha pasado con los datos de deudores
Según la experiencia de Schreyer en la OCDE, hoy en día la generación de estadísticas de interés público depende en un alto nivel no solo del análisis de los microdatos (registros individuales) de un tema en particular, sino de la capacidad de poder cruzar información de diferentes fuentes para poder llegar a conclusiones más claras.
“La política es transversal. Los retos que enfrentamos en nuestra economía no se limitan a un área en particular. Por ejemplo, no podemos pensar en políticas de cambio climático si no consideramos a la vez las consecuencias sociales de las políticas ambientales. No se puede considerar todo por aparte, tenemos que verlo como un todo. Si quisiéramos hacer estas conexiones necesitamos de alguna especie de microdatos y, más a menudo que no, necesitamos microdatos de diferentes fuentes”, explicó el directivo.
Este cruce, considera, es prácticamente imposible a menos que las bases de datos tengan un identificador en común que permita hacer el enlace.
“En los otros países que mencioné (Dinamarca y Portugal) enlazan estos microdatos de manera natural. Esto se hace con datos no anonimizados, con un identificador, un número de seguridad social o algún otro que permita enlazar los diferentes datos de las diferentes fuentes. De lo contrario sería totalmente imposible responder las preguntas que se quieran responder (para hacer política pública)”, mencionó.
Esto no significa, sin embargo, que no sean válidas las preocupaciones alrededor de los riesgos que conlleva el almacenamiento y vinculación de este tipo de datos, especialmente por temas de protección a la privacidad de los ciudadanos y las empresas, reconoce Schreyer.
En ese sentido, ve vital tener un ordenamiento legal, institucional y técnico que resguarde la privacidad de los datos que necesitan los creadores de estadísticas públicas.
“Es importante pensar en la comunicación y participación con todos los grupos de interés, el público y los medios, sobre qué está ocurriendo (con los datos). Esto nos lleva a tener una buena política de confidencialidad pública. Es posible tener evaluaciones de impacto sobre la privacidad, se pueden tener estás evaluaciones privadas a través de revisar ciertos proyectos para asegurar que no haya una violación a la privacidad”, explicó el directivo de OCDE.
Schreyer enfatizó en que la información que se obtenga por medio de estos cruces no debería tener la intención de detallar las características de una persona en particular. Dado esto, ve importante que la información que se anonimice lo antes posible en el proceso de generación de la estadística. ¿Cuándo es eso? Dependerá de cuál es el fin de la investigación, consideró.
“En mi opinión, debe tener un identificador cuando sea necesario y luego se anonimiza a la brevedad posible. En cuanto el vínculo (entre bases de datos) se logra o la pregunta (de investigación) se responde, entonces el identificador puede desaparecer y los datos quedan anonimizados. Pero aún si quitamos el identificador o el nombre de empresas individuales hay casos en los que hay un solo productor, por ejemplo, de carne vacuna, y entonces habrá que eliminar ese detalle para anonimizar la información. Pero el objetivo analítico debe ser aclarado y la anonimización debe ocurrir a la brevedad posible”, detalló el experto en datos.
Schreyer mencionó que el uso de esta información tan detallada debe tener como fin la formulación de políticas públicas basadas en evidencia y no en opiniones.
Conflicto por los datos
Actualmente la procedencia de la solicitud de datos crediticios que le hizo el Central a las entidades financieras está siendo analizada por la Sala IV luego de que la Asociación Bancaria Costarricense (ABC) presentara una acción de inconstitucionalidad en contra del BCCR. Según la ABC, el ente emisor estaría violentando derechos a la confidencialidad al poder identificar individualmente a los deudores.
Expresamente, el Central le ordenó a la Sugef el acceso a la información integral de todas las operaciones de crédito que los intermediarios financieros supervisados (bancos, cooperativas, mutuales, financieras) le remiten incluyendo necesariamente el número de identificación (cédula física, jurídica, dimex, u otros) de los deudores. La Sugef no entregó la información por temor a quebrantar posibles derechos a la confidencialidad, según consideró su asesoría jurídica.
Parte de la discusión ha girado alrededor de si los datos que pidió el BCCR pueden ser considerados como “sensibles” y, por ende, estar protegidos según las leyes del Sistema de Estadística Nacional y de protección de datos.
Durante el seminario Madrigal mostró su preocupación de que la polémica derive en que el ente emisor termine con un menor músculo para generar estadísticas.
“Lo que el Banco ha sostenido, de acuerdo con la normativa vigente y las decisiones de Sala Constitucional y la Procuraduría General de la República (PGR), es que hay una categoría de datos sensibles que está claramente definida, si nosotros ampliamos esa definición, obviamente tiene el poder de destruir la capacidad de crear estadísticas. Si existe ese riesgo y por eso la insistencia de entender lo que es sensible y lo que no es sensible de acuerdo con la ley en Costa Rica”, mencionó Madrigal.
La PGR mencionó en un dictamen del 3 de julio pasado que los datos crediticios no pueden ser categorizados como sensibles, además de que son datos personales de interés público.
El Banco Central ha explicado que solicitó la información crediticia con número de identificación para poder ubicar geográficamente los préstamos y así generar estadísticas sobre los riesgos hidrometeorológicos a los que está expuesta la cartera crediticia del país. Estos fenómenos son, básicamente, exceso de lluvias y sequías. El número de identificación de los deudores es la variable que, según Madrigal, necesitan para precisar la ubicación correcta del crédito. Una vez se hace este cruce el identificador no se utilizará más ni tampoco se hará público, según han mencionado las autoridades del Central.