Las turbulentas aguas del uso de datos en Colombia
El Ministerio de las TIC aseguró estar “ad portas” de publicar un proyecto de ley para convertir a Colombia en una fábrica de datos. La iniciativa, más allá de las palabras rimbombantes, debe ser considerada con cuidado, pues este tema tiene cargas de profundidad que pueden no resultar tan evidentes.
Juan Diego Castañeda *
El ministro de las TIC, Mauricio Lizcano, dijo en una rueda de prensa a mediados de marzo pasado que quieren que “Colombia sea un país productor de datos” y que su Ministerio presentaría un proyecto de ley para “obligar a las entidades del Estado a producir datos”. El énfasis parece ser el crear repositorios de datos y permitir su explotación para fomentar el desarrollo de la inteligencia artificial en Colombia. Qué significa exactamente el anuncio y cómo quedará el proyecto de ley prometido está por verse.
El objetivo de impulsar a que el Estado sea productor de datos para su explotación no es nuevo. Cuando hablar de big data a nivel estatal estaba de moda, el Departamento Nacional de Planeación (DNP) impulsó el Conpes 3920 de 2018 para cumplir estos mismos objetivos. Dos años antes, en un reporte que hicimos en la Fundación Karisma sobre el tema, recordábamos que para el DNP “el objetivo de usar big data en el Estado es hacer un mejor uso de un activo gigantesco que ya tiene el Estado y que está subutilizado: sus datos. La estrategia de big data debe construirse sobre una buena infraestructura de datos de calidad, abiertos, y en donde los diferentes entes estatales tengan acceso a datos producidos por otras entidades”.
No nos han faltado leyes, decretos, documentos Conpes, manuales y guías para realizar los ideales del gobierno electrónico, el Estado como productor de datos y promotor de su explotación.
Entre 2002 y 2021 rastreé 41 documentos Conpes que hablan de la importancia y la necesidad de asegurar la interoperabilidad de los datos a nivel estatal. Estas políticas tocan temas de ciencia, gobierno, hacienda, justicia, paz, seguridad social, salud, sistemas de información, tierras, entre otros. Desde la Agenda de Conectividad de 2002 (Documento Conpes 3072) no hay prácticamente ningún plan nacional de desarrollo que no mencione la necesidad de hacer interoperables los datos del Estado.
Es llamativa esa mención constante a la interoperabilidad. Justamente conseguir el objetivo de hacer del Estado un productor de datos parece olvidar que no todos los datos tienen la misma calidad ni les aplica el mismo régimen jurídico y tampoco tienen, en últimas, la misma utilidad.
Producir “datos”, como una forma de materia prima para la toma de decisiones o el impulso de la inteligencia artificial implica un trabajo de estandarización que permita asegurar su calidad.
La visión predominante de los datos como recurso ejemplificada en la popular frase “los datos son el nuevo petróleo”, al insistir en que son en verdad una materia prima lista para su explotación económica, insiste en que una vez puesta ahí afuera, esta información no tiene nada que ver con las personas, instituciones y procesos que los produjeron. Para bien o para mal, esto no es así.
Y acá se encuentran críticos y hacedores de política pública. El famoso libro de Soshana Zuboff, en el que explica la idea de “capitalismo de vigilancia”, parte del mismo presupuesto. En él denuncia que, en desarrollo de la explotación capitalista, los datos son una “materia prima” que se mueve en lo que ella denomina el “ciclo de reinversión del valor conductual”.
Este ciclo implica el uso de datos como materia prima por parte de las empresas para su análisis y el suministro de retroalimentación a sus sistemas. Esta concepción clave de los datos es lo que explica su insistencia y explicación de por qué “los usuarios no son el producto” de las empresas de medios sociales y tecnología, sino la fuente de la materia prima que los capitalistas explotan en lo que ella considera una forma radicalmente diferente de economía.
No obstante, los datos siempre están moldeados por el contexto de su recogida y análisis. En este sentido, el concepto de “datos brutos” es una paradoja o contradicción, ya que los datos siempre están interpretados y moldeados por los sistemas sociales y tecnológicos que los producen.
También hay que asumir que los datos, sea cual sea su presente, siempre han sido modificados o procesados y han sido transformados deliberada o accidentalmente. En otras palabras, que se ha hecho lo necesario para “limpiar” u “olvidar” todas esas formas diversas que resultaron en el dato.
Por otra parte, la posibilidad de “enlatar” los datos para su consumo y explotación fácil no depende tanto de la ley. Aun así, estas intenciones levantan algunas alertas.
Por ejemplo, con la salida del documento Conpes que establece el Sisbén IV, encontramos que el DNP permitió a Experian el acceso a datos no confidenciales para crear servicios que ayuden a bancos a ofrecer crédito a las personas más pobres, permitiéndole a este servicio desarrollar perfiles de riesgo y explotar sus datos. En ese caso, el DNP actuó como proveedor de información, priorizando la calidad de sus bases sobre los riesgos del perfilamiento. Por supuesto, ninguna de las personas en el Sisbén supieron que iban a usar sus datos para estos fines.
Es evidente que una ley que permita usar todos los datos (personales y no personales) que tiene el Estado para su explotación es problemática.
Hay que evaluar el tipo de datos y el tratamiento que se les da para determinar en qué casos esto es conveniente y en cuáles es perjudicial.
Imagino que la propuesta no solo habla de datos personales, sino que puede incluir datos que el Estado está en una posición especial para producir. Sin embargo, para la explotación de información personal, sin duda, hay que considerar los límites de la protección de datos como un derecho fundamental. Por ejemplo, ¿cómo asegurar que las personas consientan el uso de sus datos si el objetivo es ofrecerlos para cualquier propósito?
Incluso así, en la propuesta del Ministerio de las TIC puede haber algunas oportunidades. Respondiendo a una pregunta, el ministro mencionó en una rueda de prensa que el objetivo de su propuesta es que “todas las entidades del Estado puedan usar los datos” y, en últimas, democratizar su uso y reducir las asimetrías en su acceso y explotación.
La regulación de la concentración de datos es un tema que toma fuerza, específicamente a través de medidas como la portabilidad e interoperabilidad como incentivos para incrementar la competencia. Este tema eventualmente tendrá que discutirse en el país.
Es cierto que es necesario reformar algunas leyes para conseguir un acceso justo a los datos. Por ejemplo, en la Fundación Karisma encontramos que en ningún país de la región hay una excepción al derecho de autor que cubra adecuadamente las metodologías de investigación modernas, incluyendo las técnicas de minería de textos y datos, y machine learning.
Como lo había mencionado en una columna a comienzos del año, la discusión sobre la democratización de los datos debe tener en cuenta iniciativas como la declaración de soberanía de datos del pueblo maorí o los planes y políticas digitales de Barcelona, enfocados en el uso de datos para el bien social como alternativas a la explotación de datos entendida solo como explotación comercial.
Ya es costumbre pedir que las iniciativas se tramiten a través de un diálogo público y abierto antes incluso de que sus promotores las presenten en el Congreso. Este caso no es la excepción. Ojalá el Ministerio publique el texto de la ley para poder dar la discusión que este tema se merece.
* Codirector Fundación Karisma.
💰📈💱 ¿Ya te enteraste de las últimas noticias económicas? Te invitamos a verlas en El Espectador.
El ministro de las TIC, Mauricio Lizcano, dijo en una rueda de prensa a mediados de marzo pasado que quieren que “Colombia sea un país productor de datos” y que su Ministerio presentaría un proyecto de ley para “obligar a las entidades del Estado a producir datos”. El énfasis parece ser el crear repositorios de datos y permitir su explotación para fomentar el desarrollo de la inteligencia artificial en Colombia. Qué significa exactamente el anuncio y cómo quedará el proyecto de ley prometido está por verse.
El objetivo de impulsar a que el Estado sea productor de datos para su explotación no es nuevo. Cuando hablar de big data a nivel estatal estaba de moda, el Departamento Nacional de Planeación (DNP) impulsó el Conpes 3920 de 2018 para cumplir estos mismos objetivos. Dos años antes, en un reporte que hicimos en la Fundación Karisma sobre el tema, recordábamos que para el DNP “el objetivo de usar big data en el Estado es hacer un mejor uso de un activo gigantesco que ya tiene el Estado y que está subutilizado: sus datos. La estrategia de big data debe construirse sobre una buena infraestructura de datos de calidad, abiertos, y en donde los diferentes entes estatales tengan acceso a datos producidos por otras entidades”.
No nos han faltado leyes, decretos, documentos Conpes, manuales y guías para realizar los ideales del gobierno electrónico, el Estado como productor de datos y promotor de su explotación.
Entre 2002 y 2021 rastreé 41 documentos Conpes que hablan de la importancia y la necesidad de asegurar la interoperabilidad de los datos a nivel estatal. Estas políticas tocan temas de ciencia, gobierno, hacienda, justicia, paz, seguridad social, salud, sistemas de información, tierras, entre otros. Desde la Agenda de Conectividad de 2002 (Documento Conpes 3072) no hay prácticamente ningún plan nacional de desarrollo que no mencione la necesidad de hacer interoperables los datos del Estado.
Es llamativa esa mención constante a la interoperabilidad. Justamente conseguir el objetivo de hacer del Estado un productor de datos parece olvidar que no todos los datos tienen la misma calidad ni les aplica el mismo régimen jurídico y tampoco tienen, en últimas, la misma utilidad.
Producir “datos”, como una forma de materia prima para la toma de decisiones o el impulso de la inteligencia artificial implica un trabajo de estandarización que permita asegurar su calidad.
La visión predominante de los datos como recurso ejemplificada en la popular frase “los datos son el nuevo petróleo”, al insistir en que son en verdad una materia prima lista para su explotación económica, insiste en que una vez puesta ahí afuera, esta información no tiene nada que ver con las personas, instituciones y procesos que los produjeron. Para bien o para mal, esto no es así.
Y acá se encuentran críticos y hacedores de política pública. El famoso libro de Soshana Zuboff, en el que explica la idea de “capitalismo de vigilancia”, parte del mismo presupuesto. En él denuncia que, en desarrollo de la explotación capitalista, los datos son una “materia prima” que se mueve en lo que ella denomina el “ciclo de reinversión del valor conductual”.
Este ciclo implica el uso de datos como materia prima por parte de las empresas para su análisis y el suministro de retroalimentación a sus sistemas. Esta concepción clave de los datos es lo que explica su insistencia y explicación de por qué “los usuarios no son el producto” de las empresas de medios sociales y tecnología, sino la fuente de la materia prima que los capitalistas explotan en lo que ella considera una forma radicalmente diferente de economía.
No obstante, los datos siempre están moldeados por el contexto de su recogida y análisis. En este sentido, el concepto de “datos brutos” es una paradoja o contradicción, ya que los datos siempre están interpretados y moldeados por los sistemas sociales y tecnológicos que los producen.
También hay que asumir que los datos, sea cual sea su presente, siempre han sido modificados o procesados y han sido transformados deliberada o accidentalmente. En otras palabras, que se ha hecho lo necesario para “limpiar” u “olvidar” todas esas formas diversas que resultaron en el dato.
Por otra parte, la posibilidad de “enlatar” los datos para su consumo y explotación fácil no depende tanto de la ley. Aun así, estas intenciones levantan algunas alertas.
Por ejemplo, con la salida del documento Conpes que establece el Sisbén IV, encontramos que el DNP permitió a Experian el acceso a datos no confidenciales para crear servicios que ayuden a bancos a ofrecer crédito a las personas más pobres, permitiéndole a este servicio desarrollar perfiles de riesgo y explotar sus datos. En ese caso, el DNP actuó como proveedor de información, priorizando la calidad de sus bases sobre los riesgos del perfilamiento. Por supuesto, ninguna de las personas en el Sisbén supieron que iban a usar sus datos para estos fines.
Es evidente que una ley que permita usar todos los datos (personales y no personales) que tiene el Estado para su explotación es problemática.
Hay que evaluar el tipo de datos y el tratamiento que se les da para determinar en qué casos esto es conveniente y en cuáles es perjudicial.
Imagino que la propuesta no solo habla de datos personales, sino que puede incluir datos que el Estado está en una posición especial para producir. Sin embargo, para la explotación de información personal, sin duda, hay que considerar los límites de la protección de datos como un derecho fundamental. Por ejemplo, ¿cómo asegurar que las personas consientan el uso de sus datos si el objetivo es ofrecerlos para cualquier propósito?
Incluso así, en la propuesta del Ministerio de las TIC puede haber algunas oportunidades. Respondiendo a una pregunta, el ministro mencionó en una rueda de prensa que el objetivo de su propuesta es que “todas las entidades del Estado puedan usar los datos” y, en últimas, democratizar su uso y reducir las asimetrías en su acceso y explotación.
La regulación de la concentración de datos es un tema que toma fuerza, específicamente a través de medidas como la portabilidad e interoperabilidad como incentivos para incrementar la competencia. Este tema eventualmente tendrá que discutirse en el país.
Es cierto que es necesario reformar algunas leyes para conseguir un acceso justo a los datos. Por ejemplo, en la Fundación Karisma encontramos que en ningún país de la región hay una excepción al derecho de autor que cubra adecuadamente las metodologías de investigación modernas, incluyendo las técnicas de minería de textos y datos, y machine learning.
Como lo había mencionado en una columna a comienzos del año, la discusión sobre la democratización de los datos debe tener en cuenta iniciativas como la declaración de soberanía de datos del pueblo maorí o los planes y políticas digitales de Barcelona, enfocados en el uso de datos para el bien social como alternativas a la explotación de datos entendida solo como explotación comercial.
Ya es costumbre pedir que las iniciativas se tramiten a través de un diálogo público y abierto antes incluso de que sus promotores las presenten en el Congreso. Este caso no es la excepción. Ojalá el Ministerio publique el texto de la ley para poder dar la discusión que este tema se merece.
* Codirector Fundación Karisma.
💰📈💱 ¿Ya te enteraste de las últimas noticias económicas? Te invitamos a verlas en El Espectador.